高效全局优化(EGO)广泛用于优化计算上昂贵的黑盒功能。它使用基于高斯过程(克里金法)的替代建模技术。然而,由于使用了静态协方差,克里金不太适合近似非平稳函数。本文探讨了深度高斯过程(DGP)在EGO框架中的整合,以处理非平稳问题,并研究诱发的挑战和机遇。对分析问题进行数值实验以突出DGP和EGO的不同方面。
translated by 谷歌翻译
相对于机器人准确地定位对象是机器人操纵的关键步骤。在这项工作中,我们建议解决这个任务,只知道机器人和物体的3D模型,在特定情况下,从未校准的摄像机观察景点 - 这种情况在不受控制的环境中是典型的,例如在建筑工地上。我们证明了这种定位可以非常精确地执行,毫米级的误差,而不使用单个真实图像进行训练,因为获取代表性训练数据是一个漫长而昂贵的过程,因此具有很强的优势。我们的方法依赖于使用训练的分类卷积神经网络(CNN)数十万个具有随机参数的合成渲染场景。为了定量评估我们的方法并使其与其他方法相比,我们使用精确定位的块构建了一个新的丰富的真实机器人图像数据集。
translated by 谷歌翻译
变分自动编码器(VAE)模型已经广泛流行,作为一种学习生成高维空间观察的生成模型和嵌入的方法。在现实世界中,许多这样的观察可以被认为是分层结构的,例如通过进化树相关的生物有机体数据。此外,从理论上证明,具有分层结构的数据可以有效地嵌入双曲空间。因此,我们赋予VAE双曲线几何学,并且凭经验证明它可以比欧几里德对应物更好地推广到看不见的数据,并且可以定性地恢复等级结构。
translated by 谷歌翻译
在过去的几十年中,已经针对各种监督学习任务提出了许多损失函数,包括回归,分类,排序和更一般的结构化预测。了解支撑这些损失的核心原则和理论属性是正确解决正确问题的关键,并创造新的损失,并结合其优势。在本文中,我们介绍了Fenchel-Younglosses,一种为正则预测函数构造凸损失函数的通用方法。我们在非常广泛的环境中提供他们的属性的深入研究,涵盖所有上述监督学习任务,并揭示稀疏性,广义熵和分离边缘之间的新联系。我们证明Fenchel-Young损失统一了许多众所周知的损失函数,并允许轻松创建有用的新函数。最后,我们得出了有效的预测和训练算法,使Fenchel-Young在理论和实践中都有所损失。
translated by 谷歌翻译
为深层卷积神经网络(CNN)提供可解释性的标准方法包括可视化其特征图,或对预测贡献最大的图像区域。在本文中,我们介绍了一种解释CNN结果的替代策略。为此,我们利用网络中的一袋视觉词表示,并通过使用生成对抗网络将视觉和语义含义与相应的码本元素相关联。然后,可以通过查看最高度激活的代码字的视觉表示来解释对新样本进行预测的原因。然后,我们建议开发我们可解释的BoW网络以进行对抗性示例检测。最后,我们建立在直觉上,即虽然对抗性样本看起来与真实图像非常相似,但是产生不正确的预测,它们应该激活具有明显不同视觉表示的代码字。因此,我们将对抗性示例检测问题描述为将inputimage与最高度激活的可视代码字进行比较。正如实验证明的那样,这使得我们能够在标准基准测试中优于最先进的adversarialexample检测方法,而不受攻击策略的影响。
translated by 谷歌翻译
小波散射变换是一种不变的信号表示,适用于许多信号处理和机器学习应用。我们推出了Kymatio软件包,这是一种易于使用的高性能Python实现,可在1D,2D和3D中实现散射变换,与现代深度学习框架兼容。所有变换都可以在GPU上执行(除CPU之外),相对于CPU实现提供了相当快的速度。该软件包的内存占用量也很小,因此可以节省大量内存。源代码,文档和示例均可通过https://www.kymat.io/获取。
translated by 谷歌翻译
深度图像生成正在成为提高艺术家和设计师创造力潜力的工具。在本文中,我们的目标是使生成过程更容易理解和交互。受矢量图形系统的启发,我们提出了一种新的深度生成范例,其中图像由简单层组成,由颜色和参数透明蒙板定义。与常用的卷积网络架构相比,这提供了许多优点。特别是,我们的分层分解允许简单的用户交互,例如更新给定的蒙版,或更改所选图层的颜色。从紧凑的代码,我们的架构还生成具有几乎无限分辨率的图像,图像中每个点的颜色是其坐标的参数函数。我们通过在CIFAR10,CelebAand ImageNet数据集上给出类似内存资源的比较重建与最新基线来验证自动编码框架中的ourapproach的可行性,并演示了几个应用程序。我们还显示了与通用方法获得的遗传对抗性网络(GAN)结果的定性不同。
translated by 谷歌翻译
在这项工作中,我们提出了一种基于CNN的方法来估计表面的光谱反射率和V形表面的单个RGB图像的光谱功率分布。在aconcave表面发生的相互反射导致其区域上的RGB值的梯度。这些梯度可以获得有关表面和光源物理特性的大量信息。我们的网络仅使用基于物理的互反射模型构建的模拟数据进行训练。通过深度学习耦合互反射效应有助于在未知光下检索光谱反射率并且还估计该光的光谱功率分布。此外,它比图像噪声更经常存在图像噪声。我们的结果表明,所提出的方法优于基于模拟数据的艺术学习方法。此外,与其他基于互反射的方法相比,它在实际数据上提供更好的结果。
translated by 谷歌翻译
我们在VariationalAuto-Encoders(VAEs)中通过将其作为潜在表征的\ emph {分解}来展开广泛的解开概念,其特征在于i)在数据的潜在编码中强制适当的重叠水平,以及ii)正则化通过先验表示的平均编码到期望的结构。我们通过证明a)$ \ beta $ -VAE纯粹通过潜在编码中的重叠的规范化,以及通过其平均(高斯)编码器方差来解开,并且b)解开,因为独立性之间的独立性,可以被视为正则化先前具有特定特征的总和。我们通过展示这些因素的简单操作来验证这种表征,例如使用旋转变异驱动器,可以帮助改善解缠结,并讨论这种特征如何提供一个更通用的框架来结合分解的概念,而不仅仅是潜伏之间的独立性。
translated by 谷歌翻译
估计刚性物体的6D姿态的最新趋势是使深度网络直接从图像中回归姿势或者预测3D关键点的2D位置,从中可以使用PnP算法获得姿势。在这两种情况下,对象都被视为全局实体,并计算单个姿势估计。结果,所产生的技术可能易受大的遮挡。在本文中,我们介绍了一种分段驱动的6D姿势估计框架,其中对象的每个可见部分以2D关键点位置的形式贡献局部姿势预测。然后,我们使用预测的置信度将这些姿势候选者组合成一组强大的3D到2D对应关系,从中可以获得可靠的姿势估计。我们在挑战性的Occluded-LINEMOD和YBB上超越了最先进的技术水平。 - 视频数据集,这证明我们的方法可以很好地处理相互遮挡的多个纹理不良的对象。此外,它依赖于足够简单的架构来实现实时性能。
translated by 谷歌翻译