在过去的几十年中,已经针对各种监督学习任务提出了许多损失函数,包括回归,分类,排序和更一般的结构化预测。了解支撑这些损失的核心原则和理论属性是正确解决正确问题的关键,并创造新的损失,并结合其优势。在本文中,我们介绍了Fenchel-Younglosses,一种为正则预测函数构造凸损失函数的通用方法。我们在非常广泛的环境中提供他们的属性的深入研究,涵盖所有上述监督学习任务,并揭示稀疏性,广义熵和分离边缘之间的新联系。我们证明Fenchel-Young损失统一了许多众所周知的损失函数,并允许轻松创建有用的新函数。最后,我们得出了有效的预测和训练算法,使Fenchel-Young在理论和实践中都有所损失。
translated by 谷歌翻译
结构化预测需要搜索组合数量的结构。为了解决这个问题,我们引入了SparseMAP:一种新的sparsestructured推理方法及其自然损失函数。 SparseMAP仅自动选择少数全局结构:它位于MAP推理(选择单个结构)和边际推理之间,边际推理为所有结构(包括难以置信的结构)分配概率质量。重要的是,可以仅使用对MAP oracle的调用来计算SparseMAP,使其适用于具有难以处理的边际推断的问题,例如线性对齐。稀疏性使梯度反向传播无论结构如何都有效,使我们能够利用通用和稀疏结构的隐藏层来增强深度神经网络。依赖性解析和自然语言推理中的实验揭示了竞争准确性,改进的可解释性以及捕获自然语言模糊性的能力,这对于管道系统是有吸引力的。
translated by 谷歌翻译
Scikit-learn是一个Python模块,集成了各种最先进的机器学习算法,适用于中等规模的监督和无监督的问题。该软件包侧重于使用通用高级语言将机器学习引入非专业人员。重点放在易用性,性能,文档和API一致性上。它具有最小的依赖性,并在简化的BSD许可下分发,鼓励其在学术和商业环境中使用。可以从http://scikit-learn.org下载源代码,二进制文件和文档。
translated by 谷歌翻译
对抗训练显示出有希望成为训练模型的方法,这种模型对于对抗性扰动是强有力的。在本文中,我们探讨了对抗性训练的一些实际挑战。我们提出了一种敏感性分析,说明对抗性训练的有效性取决于一些显着的超参数的设置。我们表明,在这些显着参数中出现的鲁棒性表面可能令人惊讶地复杂,因此没有有效的“一刀切”参数设置。然后我们证明我们可以使用相同的显着超参数抖动旋钮来导航稳健性和准确性之间可能出现的张力。基于这些发现,我们提出了一种实用的方法,该方法利用超参数优化技术来调整对抗训练,以最大限度地提高鲁棒性,同时在精确预算内保持准确性的损失。
translated by 谷歌翻译
内窥镜伪影是促进中空器官疾病的诊断和治疗的核心挑战。精确检测特定伪像,如像素饱和度,运动模糊,镜面反射,气泡和碎片,对于高质量的帧恢复至关重要,对于实现可靠的计算机辅助工具以改善患者护理至关重要。目前,由于视频帧中存在大量的多类伪像,目前大多数内窥镜检查视频尚未进行分析。通过内窥镜伪影检测(EAD 2019)的挑战,我们通过解决内窥镜框架伪影的准确识别和定位来解决这一关键瓶颈问题,从而能够对不可用的视频帧进行进一步的关键定量分析,例如镶嵌和3D重建,这对于提供改善的患者护理至关重要。本文总结了挑战任务,并描述了在EAD 2019挑战中建立的数据集和评估标准。
translated by 谷歌翻译
使用高斯过程的贝叶斯优化是处理昂贵的黑盒功能优化的流行方法。然而,由于经典GaussianProcesses的协方差矩阵的平稳性的先验,该方法可能不适用于优化问题中涉及的非平稳函数。为了克服这个问题,提出了一种新的贝叶斯优化方法。它基于深度高斯过程的assurrogate模型而不是经典的高斯过程。该建模技术通过简单地考虑静态高斯过程的功能组合来提高表示的能力以捕获非平稳性,从而提供多层结构。本文提出了一种新的全局优化算法,通过耦合深度高斯过程和贝叶斯优化算法。通过学术测试案例讨论并突出了这种优化方法的特殊性。所提出的算法的性能在分析测试用例和航空设计优化问题上进行评估,并与最先进的固定和非静态贝叶斯优化方法进行比较。
translated by 谷歌翻译
我们提出了零资源语音挑战2019,它建议在没有任何文本或语音标签的情况下构建aspeech合成器:因此,没有T的TTS(没有文本的文本到语音)。我们以未知语言(语音数据集)为目标语音提供原始音频,但没有对齐,文本或标签。参与者必须以无人监督的方式发现子词单元(使用UnitDiscovery数据集)并以某种方式将它们与语音记录对齐最有效的方法是从新颖的扬声器中合成新颖的话语,类似于目标说话者的声音。我们描述了用于评估的指标,一个基线系统,包括无监督的子字单元发现和标准TTS系统,以及使用黄金电话转换的顶线TTS。我们概述了11个团队提交的19个系统并讨论了主要结果。
translated by 谷歌翻译
在本文中,我们解决了利用许多可移动物体进行视觉引导的重新布置规划的问题,即,找到一系列动作以将一组物体从初始布置移动到期望的布置,同时直接依赖于来自相机的视觉输入。我们引入了一种有效且可扩展的重排规划方法,解决了大多数现有方法的基本限制,这些方法不能很好地扩展对象的数量。这种提高的效率使我们能够在闭环中使用规划,通过可视工作空间分析来构建一个可以重现的强大重排框架从错误和外部扰动。这项工作的贡献有三个方面。首先,我们开发了类似AlphaGo的重排计划策略,使用重排计划示例训练的apolicy提高蒙特卡罗树搜索(MCTS)的效率。我们凭经验证明,所提出的方法可以很好地适应对象的数量。其次,为了展示计划器在真实机器人上的效率,我们采用了最先进的无校准视觉识别系统,该系统输出单个物体的位置并对其进行扩展以估计包含多个物体的工作空间的状态。第三,我们通过在真实的UR-5机器人手臂上进行几项实验来验证整个管道,解决了具有多个可移动物体的重排计划问题,并且仅需要几秒钟的计算来计算计划。我们还凭经验证明机器人可以成功地从工作空间中的错误和扰动中恢复。我们工作的源代码和预训练模型可以通过以下网址获得://github.com/ylabbe/rearrangement-planning
translated by 谷歌翻译
图表分类是一个难题,在过去几年中引起了机器学习界的广泛关注。这主要是因为与欧几里德向量相反,图结构的固有复杂性对于传统分类器来说可能很难编码和处理。尽管在文献中已经提出了内核,但是数据集大小的增加极大地限制了内核方法​​的使用,因为内核矩阵的计算和存储变得不可行。在本文中,我们建议使用扩展持久性图来有效地编码图结构。更准确地说,我们表明,使用所谓的热内核签名来计算这些扩展的持久性图表,可以快速有效地总结图形结构。然后,webuild最近开发了用于点云的神经网络,以定义(扩展的)持久性图的架构,这种架构是模块化的,易于使用。最后,我们通过在几个图形数据集上验证我们的体系结构来证明我们的方法的有用性,其中获得的结果与图形分类的最新技术相当。
translated by 谷歌翻译
尽管在过去十年中四足机器人技术取得了巨大进步,但在高度不平整和杂乱的环境中选择良好的接触(立足点)仍然是一个开放的挑战。本文以最先进的方法为基础,已成功用于人形机器人,并将其应用于我们的机器人平台;四足机器人ANY-mal。所提出的算法将问题解耦为两个子问题:首先生成机器人的引导轨迹,然后沿着该轨迹创建接触。两个子问题都需要调整近似和启发式。这项工作的主要贡献是解释如何使用ANY-mal重新调整此算法,并在实际动态模拟中显示该方法与各种测试的相关性。
translated by 谷歌翻译