Autonomous navigation for large Unmanned Aerial Vehicles (UAVs) is fairlystraight-forward, as expensive sensors and monitoring devices can be employed.In contrast, obstacle avoidance remains a challenging task for Micro AerialVehicles (MAVs) which operate at low altitude in cluttered environments. Unlikelarge vehicles, MAVs can only carry very light sensors, such as cameras, makingautonomous navigation through obstacles much more challenging. In this paper,we describe a system that navigates a small quadrotor helicopter autonomouslyat low altitude through natural forest environments. Using only a single cheapcamera to perceive the environment, we are able to maintain a constant velocityof up to 1.5m/s. Given a small set of human pilot demonstrations, we use recentstate-of-the-art imitation learning techniques to train a controller that canavoid trees by adapting the MAVs heading. We demonstrate the performance of oursystem in a more controlled environment indoors, and in real natural forestenvironments outdoors.
translated by 谷歌翻译
在从个人智能手机到边境安全的不同领域中,可靠地确定个人身份的需求至关重要;从自动驾驶汽车到电子投票;从追踪儿童便利到预防人口贩运;从犯罪现场调查到客户服务个性化。生物识别技术需要使用诸如面部,指纹和语音之类的生物属性来识别人,这种生物识别技术正在越来越多地用于几种此类应用中。虽然生物识别技术在过去十年中取得了快速发展,但仍有一些基本问题尚未得到令人满意的解决。在本文中,我们将讨论其中的一些问题,并列举该领域的一些激动人心的挑战。
translated by 谷歌翻译
我们设计了一种级联GAN方法来生成会话面部视频,该视频面向不同的面部形状,视角,面部特征和噪声条件。我们建议首先将音频传输到高级结构(即面部标志),然后生成以标记为条件的视频帧,而不是学习从音频到视频帧的直接映射。与直接的音频到图像方法相比,我们的级联方法可以拟合与语音内容相关的视听信号之间的虚假相关性。我们人类对视频中的temporaldiscontinuities和微妙的人工制品很敏感。为了避免这些像素抖动问题并强制网络专注于视听相关区域,我们提出了一种具有注意力机制的新型动态可调节像素损失。此外,为了生成具有良好同步的面部运动的更清晰的图像,我们提出了一种新的基于回归的鉴别器结构,其考虑了序列级信息以及帧级信息。对几个数据集和现实样本的多次实验表明获得了显着更好的结果。在定量和定性比较中,我们的方法比最先进的方法。
translated by 谷歌翻译
行人轨迹的可靠预期对于自动驾驶车辆的操作是必不可少的,并且可以显着增强先进驾驶员辅助系统的功能性。虽然在行人检测领域取得了重大进展,但由于行人的不可预测性和潜在有用特征的巨大空间,预测行人住宅仍然是一个具有挑战性的问题。在这项工作中,我们提出了一种深度学习方法,用于使用单个车载摄像头进行行人轨迹预测。已经彻底改变计算机视觉领域的深度学习模型在轨迹预测方面的应用有限,部分原因在于缺乏丰富的注释训练数据。通过引入可扩展的机器注释方案来解决缺少训练数据的问题,该方法使我们的模型能够使用大型数据集进行训练而无需人工注释。此外,我们提出动态轨迹预测器(DTP),这是一种预测未来一秒钟的行人轨迹的模型。 DTP使用人工和机器注释数据进行训练,并预测线性模型未捕获的动态运动。实验评估证实了所提出模型的好处。
translated by 谷歌翻译
Alt-Right是一个新法西斯白人至上主义运动,涉及不可侵犯的极端主义,并在广泛的虚假信息手册中显示出参与的迹象。通过使用社交媒体数据挖掘,本研究对这种有针对性的虚假宣传活动及其发展方式有了更深入的了解。它还增加了有关美国最右边的内生和外生影响的现有文献,以及推动虚假宣传活动的激励因素,如地缘政治战略。本研究将作为初步分析,以指出未来的方法和后续研究,这将有助于形成一种综合方法,以理解现代法西斯运动的战略和联想。
translated by 谷歌翻译
现代数字时代的隐私问题促使研究人员开发出一种技术,允许用户有选择地抑制所收集数据中的某些信息,同时允许提取其他信息。在这方面,最近出现了半对抗网络(SAN)作为一种方法,用于模拟面向图像的软生物识别隐私。 SAN允许修改输入面部图像,使得所得到的面部图像仍然可以被任意传统的面部匹配器可靠地用于识别目的,而属性分类器(例如性别分类器)被混淆。然而,SAN在任意性别分类器中的普遍性仍然是一个令人关注的问题。在这项工作中,我们提出了一种新方法FlowSAN,允许SANsto概括为多个看不见的性别分类器。我们建议结合使用一组SAN模型来弥补彼此的弱点,从而形成具有改进的泛化能力的强大模型。使用不同的看不见的性别分类器和面部匹配器的广泛实验证明了所提出的范例在向面部图像传授性别隐私方面的功效。
translated by 谷歌翻译
HLAI技术领域的唯一系统映射是在2009年的一次研讨会上进行的[Adams等,2012]。然而,它的结果并不是组织者所希望的[Goertzel 2014,2016],只是一系列的里程碑,其中高达50%可以说已经完成了。我们考虑最近的两篇文章概述了人类的路径类智能[Mikolov等,2016; Lake et al。,2017]。这些提供了对HLAI要求的技术和更精确的评估,而不仅仅是里程碑。虽然有用,但它们也有局限性。为了解决这些限制,我们建议使用替代技术来更新HLAI路径的系统映射。新提出的替代技术可以使用复杂的有向图来模拟未来技术的复杂路径。具体而言,我们考虑了两类替代技术:通过数字平台和众包获取专家意见的场景映射方法和技术。我们评估了先前技术和替代技术的可行性和实用性,发现所提出的替代技术可能非常有利于在创建HLAI的合理框架中推进现有的知识体系。最后,我们鼓励进行讨论,以开始努力使用这些提出的技术来形成HLAI的途径。
translated by 谷歌翻译
我们介绍了一组九个挑战任务,测试理解功能词。这些任务是通过结构化突变数据集的句子来创建的,以便能够理解特定类型的功能词(例如,介词,wh-words)。使用这些探测任务,我们探索了各种预训练目标对句子编码器(例如,语言建模,CCG超级标准和自然语言推理(NLI))对学习代表的影响。我们的结果表明,对CCG进行预训练 - 我们最常用的语法 - 在我们的探究任务中平均表现最佳,这表明句法知识有助于词汇理解。语言建模也显示出强大的性能,支持其广泛用于预训练最先进的NLP模型。总的来说,没有预训练目标支配董事会,我们的功能词探测任务突出了预训练目标之间的几个直观差异,例如,NLI有助于理解否定。
translated by 谷歌翻译
腿式机器人需要姿势和速度的知识,以保持稳定性并执行步行路径。目前的解决方案要么依赖于视觉数据,视觉数据易受环境和照明条件的影响,要么依赖于运动学和接触数据与来自惯性测量单元(IMU)的测量结果的融合。在这项工作中,我们使用李群理论和不变观测器设计开发了接触辅助不变扩展卡尔曼滤波器(InEKF)。该滤波器将接触惯性动力学与正向运动校正相结合,以估计姿态和速度以及所有当前接触点。我们证明了误差动力学遵循对数线性自治微分方程,其中有几个重要结果:(a)可观察状态变量可以与吸引域相融合,而吸引域与系统的轨迹无关; (b)与标准EKF不同,线性化误差动力学和线性化观测模型都取决于当前状态估计,其中(c)导致改进的收敛性质和(d)与基础非线性系统一致的局部可观测矩阵。此外,我们演示了如何包含IMU偏差,添加/删除联系人,以及制定以世界为中心和以机器人为中心的转变。我们通过对卡西系列双足机器人的模拟和实验,比较了所提出的InEKF与常用的基于四元数的EKF的收敛性。使用运动捕捉分析滤波器精度,而LiDAR映射实验提供实际用例。总的来说,与基于四元数的EKF相比,开发的接触辅助InEKF提供了更好的性能,因为利用了系统的对称性。
translated by 谷歌翻译
无人监督的人员重新识别(Re-ID)方法包括使用经过仔细标记的源数据集进行训练,然后对未标记的目标数据集进行推广,即人员身份信息不可用。受域调整技术的启发,这些方法避免了代价高昂,繁琐且经常难以承受的贴标签过程。本文研究了摄像机索引信息的使用,即哪个摄像机捕获了哪个图像,用于监督人员Re-ID。更准确地说,受领域适应对抗方法的启发,我们开发了一个对抗框架,其中特征提取器的输出应该对人Re-ID有用,同时应该欺骗相机鉴别器。我们将所提出的方法称为摄像机对偶传输(CAT)。我们评估对抗性变体,以及每种变体实现的相机稳健性。我们报告了交叉数据集ReIDperformance,我们将我们的方法的变体与几种最先进的方法进行比较,从而表明了在无人监督的人Re-ID的对抗框架内利用相机索引信息的兴趣。
translated by 谷歌翻译