使用高斯过程的贝叶斯优化是处理昂贵的黑盒功能优化的流行方法。然而,由于经典GaussianProcesses的协方差矩阵的平稳性的先验,该方法可能不适用于优化问题中涉及的非平稳函数。为了克服这个问题,提出了一种新的贝叶斯优化方法。它基于深度高斯过程的assurrogate模型而不是经典的高斯过程。该建模技术通过简单地考虑静态高斯过程的功能组合来提高表示的能力以捕获非平稳性,从而提供多层结构。本文提出了一种新的全局优化算法,通过耦合深度高斯过程和贝叶斯优化算法。通过学术测试案例讨论并突出了这种优化方法的特殊性。所提出的算法的性能在分析测试用例和航空设计优化问题上进行评估,并与最先进的固定和非静态贝叶斯优化方法进行比较。
translated by 谷歌翻译
高效全局优化(EGO)广泛用于优化计算上昂贵的黑盒功能。它使用基于高斯过程(克里金法)的替代建模技术。然而,由于使用了静态协方差,克里金不太适合近似非平稳函数。本文探讨了深度高斯过程(DGP)在EGO框架中的整合,以处理非平稳问题,并研究诱发的挑战和机遇。对分析问题进行数值实验以突出DGP和EGO的不同方面。
translated by 谷歌翻译
对抗训练显示出有希望成为训练模型的方法,这种模型对于对抗性扰动是强有力的。在本文中,我们探讨了对抗性训练的一些实际挑战。我们提出了一种敏感性分析,说明对抗性训练的有效性取决于一些显着的超参数的设置。我们表明,在这些显着参数中出现的鲁棒性表面可能令人惊讶地复杂,因此没有有效的“一刀切”参数设置。然后我们证明我们可以使用相同的显着超参数抖动旋钮来导航稳健性和准确性之间可能出现的张力。基于这些发现,我们提出了一种实用的方法,该方法利用超参数优化技术来调整对抗训练,以最大限度地提高鲁棒性,同时在精确预算内保持准确性的损失。
translated by 谷歌翻译
我们提出了零资源语音挑战2019,它建议在没有任何文本或语音标签的情况下构建aspeech合成器:因此,没有T的TTS(没有文本的文本到语音)。我们以未知语言(语音数据集)为目标语音提供原始音频,但没有对齐,文本或标签。参与者必须以无人监督的方式发现子词单元(使用UnitDiscovery数据集)并以某种方式将它们与语音记录对齐最有效的方法是从新颖的扬声器中合成新颖的话语,类似于目标说话者的声音。我们描述了用于评估的指标,一个基线系统,包括无监督的子字单元发现和标准TTS系统,以及使用黄金电话转换的顶线TTS。我们概述了11个团队提交的19个系统并讨论了主要结果。
translated by 谷歌翻译
在本文中,我们解决了利用许多可移动物体进行视觉引导的重新布置规划的问题,即,找到一系列动作以将一组物体从初始布置移动到期望的布置,同时直接依赖于来自相机的视觉输入。我们引入了一种有效且可扩展的重排规划方法,解决了大多数现有方法的基本限制,这些方法不能很好地扩展对象的数量。这种提高的效率使我们能够在闭环中使用规划,通过可视工作空间分析来构建一个可以重现的强大重排框架从错误和外部扰动。这项工作的贡献有三个方面。首先,我们开发了类似AlphaGo的重排计划策略,使用重排计划示例训练的apolicy提高蒙特卡罗树搜索(MCTS)的效率。我们凭经验证明,所提出的方法可以很好地适应对象的数量。其次,为了展示计划器在真实机器人上的效率,我们采用了最先进的无校准视觉识别系统,该系统输出单个物体的位置并对其进行扩展以估计包含多个物体的工作空间的状态。第三,我们通过在真实的UR-5机器人手臂上进行几项实验来验证整个管道,解决了具有多个可移动物体的重排计划问题,并且仅需要几秒钟的计算来计算计划。我们还凭经验证明机器人可以成功地从工作空间中的错误和扰动中恢复。我们工作的源代码和预训练模型可以通过以下网址获得://github.com/ylabbe/rearrangement-planning
translated by 谷歌翻译
图表分类是一个难题,在过去几年中引起了机器学习界的广泛关注。这主要是因为与欧几里德向量相反,图结构的固有复杂性对于传统分类器来说可能很难编码和处理。尽管在文献中已经提出了内核,但是数据集大小的增加极大地限制了内核方法​​的使用,因为内核矩阵的计算和存储变得不可行。在本文中,我们建议使用扩展持久性图来有效地编码图结构。更准确地说,我们表明,使用所谓的热内核签名来计算这些扩展的持久性图表,可以快速有效地总结图形结构。然后,webuild最近开发了用于点云的神经网络,以定义(扩展的)持久性图的架构,这种架构是模块化的,易于使用。最后,我们通过在几个图形数据集上验证我们的体系结构来证明我们的方法的有用性,其中获得的结果与图形分类的最新技术相当。
translated by 谷歌翻译
尽管在过去十年中四足机器人技术取得了巨大进步,但在高度不平整和杂乱的环境中选择良好的接触(立足点)仍然是一个开放的挑战。本文以最先进的方法为基础,已成功用于人形机器人,并将其应用于我们的机器人平台;四足机器人ANY-mal。所提出的算法将问题解耦为两个子问题:首先生成机器人的引导轨迹,然后沿着该轨迹创建接触。两个子问题都需要调整近似和启发式。这项工作的主要贡献是解释如何使用ANY-mal重新调整此算法,并在实际动态模拟中显示该方法与各种测试的相关性。
translated by 谷歌翻译
本立场文件介绍了共现的比较研究。根据研究领域(例如语言学,NLP,计算机科学),定义中存在某些相似性和差异。本文讨论了这些观点,并讨论了方法论方面,以便在多学科范式中识别共生现象。
translated by 谷歌翻译
本文讨论了“物理互联网”的概念,即构建大型物流系统的想法,如非常成功的数字互联网网络。我们的想法是处理移动资源,例如容器,就像互联网数据包一样。因此,可以使用封装和布线的原理来优化运费。问题是移动资源(例如容器)与数据包不太相似,因为它们是真实的而不是非物质化的。因此,诸如集装箱之类的移动资源的处理和存储将在后勤网络中产生不平衡,导致后勤网络节点的饥饿或积压。我们在本文中提出了一项研究,解决了导致某些问题的问题。
translated by 谷歌翻译
相对于机器人准确地定位对象是机器人操纵的关键步骤。在这项工作中,我们建议解决这个任务,只知道机器人和物体的3D模型,在特定情况下,从未校准的摄像机观察景点 - 这种情况在不受控制的环境中是典型的,例如在建筑工地上。我们证明了这种定位可以非常精确地执行,毫米级的误差,而不使用单个真实图像进行训练,因为获取代表性训练数据是一个漫长而昂贵的过程,因此具有很强的优势。我们的方法依赖于使用训练的分类卷积神经网络(CNN)数十万个具有随机参数的合成渲染场景。为了定量评估我们的方法并使其与其他方法相比,我们使用精确定位的块构建了一个新的丰富的真实机器人图像数据集。
translated by 谷歌翻译