策略梯度方法是强大的强化学习算法,并且已被证明可以解决许多复杂的任务。然而,这些方法也是数据无效的,受到高方差梯度估计的影响,并且经常陷入局部最优。这项工作通过将最近改进的非政策数据的重用和参数空间的探索与确定性行为政策相结合来解决这些弱点。由此产生的目标适用于标准的神经网络优化策略,如随机梯度下降或随机梯度哈密顿蒙特卡罗。通过重要性抽样对以前的推出进行大量提高数据效率,而随机优化方案有助于逃避局部最优。我们评估了一系列连续控制基准测试任务的建议方法。结果表明,该算法能够使用比标准策略梯度方法更少的系统交互成功可靠地学习解决方案。
translated by 谷歌翻译
机器学习的许多实际应用需要数据有效的黑盒功能优化,例如,识别超参数或过程设置。然而,容易获得的算法通常被设计为通用优化器,因此对于特定任务而言通常是次优的。因此,提出了一种学习优化器的方法,该优化器自动适应于给定类别的目标函数,例如,在sim-to-realapplications的上下文中。所提出的方法不是从头开始学习优化,而是基于着名的贝叶斯优化框架。只有采集函数(AF)被学习的神经网络所取代,因此得到的算法仍然能够利用高斯过程的经过验证的广义化能力。我们在几个模拟以及模拟到真实传输任务上进行实验。结果表明,学习的优化器(1)在一般函数类上始终表现优于或与已知AF相媲美,并且(2)可以使用廉价模拟自动识别函数类的结构属性并转换该知识以快速适应实际硬件任务,从而显着优于现有的与问题无关的AF。
translated by 谷歌翻译
Generative Adversarial Networks have shown remarkable success in learning a distribution that faithfully recovers a reference distribution in its entirety. However, in some cases, we may want to only learn some aspects (e.g., cluster or manifold structure), while modifying others (e.g., style, orientation or dimension). In this work, we propose an approach to learn generative models across such incomparable spaces, and demonstrate how to steer the learned distribution towards target properties. A key component of our model is the Gromov-Wasserstein distance, a notion of discrepancy that compares distributions relationally rather than absolutely. While this framework subsumes current generative models in identically reproducing distributions, its inherent flexibility allows application to tasks in manifold learning, relational learning and cross-domain learning.
translated by 谷歌翻译
本文介绍了自动驾驶汽车的算法和系统架构。引入的车辆由设计用于鲁棒性,可靠性和可扩展性的软件栈提供动力。为了自主地绕过先前未知的轨道,所提出的解决方案结合了来自不同机器人领域的技术的状态。具体而言,感知,估计和控制被合并到一个高性能自主车辆中。这个复杂的机器人系统由AMZ Driverless和ETHZurich开发,在我们参加的每个比赛中获得第一名:Formula StudentGermany 2017,Formula Student Italy 2018和Formula Student Germany 2018. Wediscuss这些比赛的结果和学习,并对每个模块进行实验评估我们的解决方案
translated by 谷歌翻译
我们提出了一个替代和统一的决策框架,通过使用量子力学,提供更广泛的认知和决策模型,能够代表比经典模型更多的信息。这个框架可以容纳和预测里德和格里菲斯报告的几个认知偏差,而不会过度依赖关于启发式的,也不是关于心智计算资源的假设。
translated by 谷歌翻译
临床诊断决策和基于人群的研究通常依赖于嘈杂且不完整的多模态数据。最近,一些工作提出了几何深度学习方法来解决疾病分类,通过将患者建模为图中的节点,以及多模态特征的图形信号处理。这些方法中的许多方法受到假设模态和特征完整性以及转换推理的限制,转导推理需要对每个新测试样本重新训练整个模型。在这项工作中,我们提出了一种新颖的基于感应图的方法,可以推广到样本外的患者,尽管缺少整个病房的特征。我们提出了多模态图融合,它是经过端到端的节点级分类训练。我们在简化的MNIST玩具数据集上展示了该方法的基本工作原理。在医学数据实验中,我们的方法在多模态疾病分类中优于单一静态图方法。
translated by 谷歌翻译
已知香草卷积神经网络不仅在图像识别任务中而且在自然语言处理和时间序列分析中提供优异的性能。卷积层的优势之一是能够使用各种参数化卷积核来学习输入域中空间关系的特征。然而,在时间序列分析中,学习这种空间关系并不一定需要无效。在这种情况下,建议使用具有更宽空间分辨率的时间依赖性或内核建模的内核,以便通过扩张内核提供更有效的训练。然而,扩张必须先于先前固定,这限制了内核的灵活性。我们提出了广义扩张网络,它在两个方面概括了初始扩张。首先,我们推导出扩张层的端到端可学习架构,同时也可以学习扩张速率。其次,我们打破了严格的扩张结构,因为我们开发了在输入空间中独立运行的内核。
translated by 谷歌翻译
本地化和跟踪是机器人,自动化和物联网两个非常活跃的研究领域。准确跟踪大量设备通常需要部署大量基础设施(红外线跟踪系统,摄像机,无线天线等),这对于不可访问或受保护的环境来说并不理想。本文源于这样的环境所带来的挑战:覆盖大量小房间的大量单元,只需要最少的本地化基础设施。 Theidea旨在准确跟踪手持设备或移动机器人的位置,而不会干扰其架构。使用超宽带(UWB)设备,我们利用我们在分布式和协作机器人系统方面的专业知识,开发出一种新型解决方案,需要最少数量的固定锚。 Wediscuss分享UWB网络的策略以及扩展卡尔曼滤波器推导,以协作定位和跟踪配备UWB的设备,并显示我们在法国Chambordcastle跟踪访客的实验活动的结果。
translated by 谷歌翻译
我们提出了一种基于立体的密集映射算法,用于大规模动态城市环境。与其他现有方法相比,我们同时分别构建静态背景,移动对象和可能移动但当前静止的对象,这对于高级移动机器人任务(例如拥挤环境中的路径规划)是理想的。我们使用实例感知语义分割和稀疏场景流将对象分类为背景,移动或潜在移动,从而确保系统能够对具有从静态到动态的潜在过渡的对象建模,例如停放的汽车。给定从视觉里程计算估计的相机姿势,通过融合从立体声输入计算的深度图,分别重建背景和(可能)移动物体。除了视觉里程计,稀疏场景流也用于估计检测到的移动物体的3D运动,以便准确地重建它们。进一步开发了一种地图修剪技术,以提高重建精度并减少内存消耗,从而提高可扩展性。我们在着名的KITTI数据集上彻底评估我们的系统。我们的系统能够在大约2.5Hz的PC上运行,主要瓶颈是实例感知语义分段,这是我们希望在未来工作中解决的限制。源代码可从项目网站(http://andreibarsan.github.io/dynslam)获得。
translated by 谷歌翻译
有效的探索性数据分析系统必须考虑用户知道和想知道的两个问题。本文通过对用户当前知识和目标的最具信息性的观点,提出了一个用于数据关系的交互式视觉探索的原则框架。用户可以输入预先存在的数据关系知识,并形成特定的勘探兴趣,然后在探索中考虑。 Theidea将引导探索过程以实现用户的利益,而不是显示无趣或已知的关系。用户的知识通过由数据的行和列的子集参数化的数据集的分布来建模,称为瓦片约束。我们基于约束随机化提供了这种概念的计算有效实现。此外,我们描述了一种新颖的降维方法,用于查找对用户最有用的视图,这些视图在nobackground知识的极限和通用目标减少到PCA。我们证明该方法适用于交互使用,对噪声具有鲁棒性,优于标准投影追踪可视化方法,并且在分析实际数据时给出了可理解和有用的结果。我们已经发布了该框架的开源实现。
translated by 谷歌翻译