在过去的几十年中,已经针对各种监督学习任务提出了许多损失函数,包括回归,分类,排序和更一般的结构化预测。了解支撑这些损失的核心原则和理论属性是正确解决正确问题的关键,并创造新的损失,并结合其优势。在本文中,我们介绍了Fenchel-Younglosses,一种为正则预测函数构造凸损失函数的通用方法。我们在非常广泛的环境中提供他们的属性的深入研究,涵盖所有上述监督学习任务,并揭示稀疏性,广义熵和分离边缘之间的新联系。我们证明Fenchel-Young损失统一了许多众所周知的损失函数,并允许轻松创建有用的新函数。最后,我们得出了有效的预测和训练算法,使Fenchel-Young在理论和实践中都有所损失。
translated by 谷歌翻译
结构化预测需要搜索组合数量的结构。为了解决这个问题,我们引入了SparseMAP:一种新的sparsestructured推理方法及其自然损失函数。 SparseMAP仅自动选择少数全局结构:它位于MAP推理(选择单个结构)和边际推理之间,边际推理为所有结构(包括难以置信的结构)分配概率质量。重要的是,可以仅使用对MAP oracle的调用来计算SparseMAP,使其适用于具有难以处理的边际推断的问题,例如线性对齐。稀疏性使梯度反向传播无论结构如何都有效,使我们能够利用通用和稀疏结构的隐藏层来增强深度神经网络。依赖性解析和自然语言推理中的实验揭示了竞争准确性,改进的可解释性以及捕获自然语言模糊性的能力,这对于管道系统是有吸引力的。
translated by 谷歌翻译
Scikit-learn是一个Python模块,集成了各种最先进的机器学习算法,适用于中等规模的监督和无监督的问题。该软件包侧重于使用通用高级语言将机器学习引入非专业人员。重点放在易用性,性能,文档和API一致性上。它具有最小的依赖性,并在简化的BSD许可下分发,鼓励其在学术和商业环境中使用。可以从http://scikit-learn.org下载源代码,二进制文件和文档。
translated by 谷歌翻译
相对于机器人准确地定位对象是机器人操纵的关键步骤。在这项工作中,我们建议解决这个任务,只知道机器人和物体的3D模型,在特定情况下,从未校准的摄像机观察景点 - 这种情况在不受控制的环境中是典型的,例如在建筑工地上。我们证明了这种定位可以非常精确地执行,毫米级的误差,而不使用单个真实图像进行训练,因为获取代表性训练数据是一个漫长而昂贵的过程,因此具有很强的优势。我们的方法依赖于使用训练的分类卷积神经网络(CNN)数十万个具有随机参数的合成渲染场景。为了定量评估我们的方法并使其与其他方法相比,我们使用精确定位的块构建了一个新的丰富的真实机器人图像数据集。
translated by 谷歌翻译
为深层卷积神经网络(CNN)提供可解释性的标准方法包括可视化其特征图,或对预测贡献最大的图像区域。在本文中,我们介绍了一种解释CNN结果的替代策略。为此,我们利用网络中的一袋视觉词表示,并通过使用生成对抗网络将视觉和语义含义与相应的码本元素相关联。然后,可以通过查看最高度激活的代码字的视觉表示来解释对新样本进行预测的原因。然后,我们建议开发我们可解释的BoW网络以进行对抗性示例检测。最后,我们建立在直觉上,即虽然对抗性样本看起来与真实图像非常相似,但是产生不正确的预测,它们应该激活具有明显不同视觉表示的代码字。因此,我们将对抗性示例检测问题描述为将inputimage与最高度激活的可视代码字进行比较。正如实验证明的那样,这使得我们能够在标准基准测试中优于最先进的adversarialexample检测方法,而不受攻击策略的影响。
translated by 谷歌翻译
小波散射变换是一种不变的信号表示,适用于许多信号处理和机器学习应用。我们推出了Kymatio软件包,这是一种易于使用的高性能Python实现,可在1D,2D和3D中实现散射变换,与现代深度学习框架兼容。所有变换都可以在GPU上执行(除CPU之外),相对于CPU实现提供了相当快的速度。该软件包的内存占用量也很小,因此可以节省大量内存。源代码,文档和示例均可通过https://www.kymat.io/获取。
translated by 谷歌翻译
深度图像生成正在成为提高艺术家和设计师创造力潜力的工具。在本文中,我们的目标是使生成过程更容易理解和交互。受矢量图形系统的启发,我们提出了一种新的深度生成范例,其中图像由简单层组成,由颜色和参数透明蒙板定义。与常用的卷积网络架构相比,这提供了许多优点。特别是,我们的分层分解允许简单的用户交互,例如更新给定的蒙版,或更改所选图层的颜色。从紧凑的代码,我们的架构还生成具有几乎无限分辨率的图像,图像中每个点的颜色是其坐标的参数函数。我们通过在CIFAR10,CelebAand ImageNet数据集上给出类似内存资源的比较重建与最新基线来验证自动编码框架中的ourapproach的可行性,并演示了几个应用程序。我们还显示了与通用方法获得的遗传对抗性网络(GAN)结果的定性不同。
translated by 谷歌翻译
在这项工作中,我们提出了一种基于CNN的方法来估计表面的光谱反射率和V形表面的单个RGB图像的光谱功率分布。在aconcave表面发生的相互反射导致其区域上的RGB值的梯度。这些梯度可以获得有关表面和光源物理特性的大量信息。我们的网络仅使用基于物理的互反射模型构建的模拟数据进行训练。通过深度学习耦合互反射效应有助于在未知光下检索光谱反射率并且还估计该光的光谱功率分布。此外,它比图像噪声更经常存在图像噪声。我们的结果表明,所提出的方法优于基于模拟数据的艺术学习方法。此外,与其他基于互反射的方法相比,它在实际数据上提供更好的结果。
translated by 谷歌翻译
我们在VariationalAuto-Encoders(VAEs)中通过将其作为潜在表征的\ emph {分解}来展开广泛的解开概念,其特征在于i)在数据的潜在编码中强制适当的重叠水平,以及ii)正则化通过先验表示的平均编码到期望的结构。我们通过证明a)$ \ beta $ -VAE纯粹通过潜在编码中的重叠的规范化,以及通过其平均(高斯)编码器方差来解开,并且b)解开,因为独立性之间的独立性,可以被视为正则化先前具有特定特征的总和。我们通过展示这些因素的简单操作来验证这种表征,例如使用旋转变异驱动器,可以帮助改善解缠结,并讨论这种特征如何提供一个更通用的框架来结合分解的概念,而不仅仅是潜伏之间的独立性。
translated by 谷歌翻译
Autodock是一种广泛使用的分子建模工具,可预测小分子如何与已知3D结构的受体结合。当前版本的AutoDock使用元启发式算法结合本地搜索方法来进行构象搜索。在这些算法中适当设置高参数非常重要,特别是对于经常发现难以识别最佳配置的新手来说。在这项工作中,我们设计了一个基于代理的多目标算法,通过自动调整超参数设置来帮助这些用户。所提出的方法迭代地使用径向基函数模型和非支配排序来评估搜索阶段期间的采样配置。我们使用Autodock的实验结果表明,引入的组件是实用和有效的。
translated by 谷歌翻译