SLAM的直接方法在测距任务中表现出了非凡的性能。然而,它们仍然受到动态照明/天气变化以及大基线上的不良初始化的影响。为了减轻这两种影响,我们提出了一种方法,它为每个像素提供深度视觉描述符作为SLAM系统的输入。在这项工作中,我们介绍了GN-Net:一个用新颖的Gauss-Newton损失优化的网络,用于训练深层特征。它旨在最大化高斯 - 牛顿算法内正确像素对应的概率。与通常在基于SLAM的方法中使用的单通道灰度图像相比,这导致具有更大会聚面的特征。我们的网络可以通过不同图像之间的地面实况像素对应进行训练,这些图像可以通过任何最先进的SLAM算法从模拟数据或生成。我们表明,我们的方法更能够抵御错误的初始化,白天的变化以及天气变化,从而超越了最先进的直接和间接方法。此外,我们发布了一个评估基准,用于我们所谓的本地化跟踪。它是使用CARLA模拟器创建的,以及取自Oxford RobotCar Dataset的序列。
translated by 谷歌翻译
最近已证明无模型强化学习成功地从原始传感器数据中获取导航策略。在这项工作中,我们解决了高保真仿真器中自主代理的学习驾驶策略的问题。基于最近将深度加固学习应用于导航问题的研究,我们提出了一种模块化深度加固学习方法,用于从原始图像预测汽车的转向角。第一模块提取图像的低维潜在语义表示。通过强化学习训练的控制模块将潜在向量作为输入来预测正确的转向角。实验结果表明,我们的方法能够学习在没有人为控制信号的情况下操纵汽车。
translated by 谷歌翻译
尽管端到端监督学习已经显示出有希望的结果,但仍然可以控制自动驾驶汽车,但是它的性能受到受到训练的天气条件的极大影响,显示出对于看不见的条件的不良概括。在本文中,我们展示了如何使用语义地图将知识转移到新的天气条件,而无需获得新的地面实况数据。为此,我们建议将车辆控制任务分为两个独立的模块:一个控制模块,仅在一个天气条件下训练,标记的转向数据可用,以及一个感知模块,用作新天气条件和新天气条件之间的接口。固定控制模块。为了生成训练感知模块所需的语义数据,我们建议使用基于生成对抗网络(GAN)的模型以无监督的方式检索新条件的语义信息。我们引入了一个master-servantarchitecture,其中主模型(可用的语义标签)训练了theservant模型(语义标签不可用)。我们表明,我们提出的用于单个天气条件的地面实况数据训练的方法能够在转向角预测任务上获得类似的结果,作为用15种不同天气条件的地面实况数据训练的端到端模型。
translated by 谷歌翻译
我们提出了一个结合了分层规划和机器学习的思想的导航系统。该系统使用传统的全局规划器来计算朝向目标的最佳路径,并使用深度局部轨迹规划器和速度控制器来计算运动命令。系统的后者组件通过注意机制调整机器人的行为,使其朝向目标移动,避开障碍物,并尊重近距离行人的空间。所提出的深度模型的结构和使用注意机制都使得系统的执行可以解释。我们的仿真实验表明,所提出的架构优于基线,可以将全局计划信息和传感器数据直接映射到velocitycommands。与手工设计的传统导航系统相比,所提出的方法表现出更一致的性能。
translated by 谷歌翻译
We propose to learn a hierarchical prior in the context of variational autoencoders to avoid over-regularisation resulting from a standard normal prior distribution. To incentivise an informative latent representation of the data by learning a rich hierarchical prior, we formulate the objective function as the Lagrangian of a constrained-optimisation problem and propose an optimisation algorithm inspired by Taming VAEs. To validate our approach, we train our model on the static and binary MNIST, Fashion-MNIST, OMNIGLOT, CMU Graphics Lab Motion Capture, 3D Faces, and 3D Chairs datasets, obtaining results that are comparable to state-of-the-art. Furthermore, we introduce a graph-based interpolation method to show that the topology of the learned latent representation correspond to the topology of the data manifold.
translated by 谷歌翻译
本文介绍了Stanford Doggo,这是一种准直驱四驱动的动力运动。该机器人匹配或超过最先进的腿式机器人的常见性能指标。在垂直跳跃敏捷性(平均垂直速度的衡量标准)方面,斯坦福Doggo与最佳表现的动画匹配超过之前的最佳机器人22%。我们的整体设计架构着重于我们的准直接驱动设计方法。复制这个机器人的硬件和软件是开源的,只需要手工工具进行制造和组装,成本不到3000美元。
translated by 谷歌翻译
本文介绍了一种全方位的空中操纵平台,用于对非结构化环境进行鲁棒性和响应性交互,以实现基于接触的检测。完全驱动的倾转旋翼天线系统配备了一个刚性安装的末端执行器,能够施加6度的自由力和扭矩,解耦系统的平移和旋转动力学,并在保持稳定性的同时实现与环境的精确互动。具有选择性表观惯性的阻抗控制器被配制成允许在一定自由度下的顺应性,同时在其它自由度中实现精确的轨迹跟踪和干扰抑制。实验证明了干扰抑制,推 - 滑相互作用以及具有深度伺服的板载状态估计以与局部相互作用。该系统也被验证为基于接触的混凝土基础设施无损检测的工具。
translated by 谷歌翻译
我们用i.i.d中的squareloss函数分析了多智能体分散非参数回归的概念下分布式梯度下降的学习性能。样本分配给代理。我们证明了ifagents在网络规模方面拥有足够多的样本,然后分布梯度下降通过多次迭代实现最佳统计速率,这些迭代可以通过八卦矩阵的频谱差的倒数除以样本数来扩展到阈值。每个代理人拥有一个依赖于问题的权力。门槛的存在来自统计学。它编码存在“大数据”机制,其中所需迭代的数量不依赖于网络拓扑。在这种情况下,分布式梯度下降实现了最佳统计速率,迭代次数与网络中所有样本的梯度下降一致。如果通信延迟足够小,则与单机协议相比,分布式协议在运行时产生线性加速。这与分散的优化算法形成对比,后者不利用统计数据,仅产生线性加速图,其中光谱间隙远离零。我们的结果利用了代理人持有的数量的统计集中,并为分散方法中的统计和通信之间的相互作用提供了新的视角。在具有源/容量假设的标准非参数设置中给出了边界。
translated by 谷歌翻译
尽管过去已经建立了许多用于自动驾驶的研究车辆平台,但硬件设计,源代码和经验教训尚未提供给下一代示范者。这为研究界提供了基于实际评估的结果的努力,因为建立和维护研究车辆的工程知识丢失了。在本文中,我们分析了我们将开源驱动堆栈转移到研究工具的方法。我们将硬件和软件设置放在其他演示器的上下文中,并指出了导致我们选择的硬件和软件设计的标准。具体来说,我们讨论了Apollo驱动堆栈到我们研究工具的系统布局的映射,包括与执行器的通信通过在实时硬件平台上运行的控制器和传感器设置的集成。通过我们收集的经验教训,我们鼓励其他研究小组在未来更快地设置此类系统。
translated by 谷歌翻译
人类做出决定并与其他人一起行动,以实现短期和长期目标。由于计算科学和自动化等领域的不断进步,人类现在还与不同复杂程度的非人类进行交互,作为日常活动的一部分;正在开展大量工作,将越来越智能的机器人整合到人类工作中。玩。随着这些药剂的认知,感官和运动能力的增加,合理地认为用于人类援助的智能机器与人类共同行动 - 即,两个或更多的代理人适应他们的行为和他们对彼此的理解以及进步共同的目标或目标。人机伙伴关系中熟练联合行动的机制,条件和机会对多个社区都很有意义。尽管如此,人机联合行动尚未得到充分研究,尤其是在人类和智能机器在实时,日常生活体验过程中以持续的方式相互作用的情况下。在这项工作中,我们贡献了一个虚拟现实环境,其中人和代理人可以调整他们的预测,设计和他们的沟通,以便进行简单的觅食任务。在与单个参与者的acase研究中,我们提供了一个人 - 代理协调和决策的例子,涉及人和机器代理的预测学习,并控制机器代理部分的学习,其中音频通信信号用于提示它的人类伙伴,为获得共同的奖励服务。这些比较表明了在虚拟现实环境中研究人机协调的有效性,并确定了进一步的研究,这些研究将扩展我们对持久的人机联合行动的理解。
translated by 谷歌翻译