我们的艺术家和机器学习研究团队设计了一种创造性算法,可以生成真正的雕塑艺术品。这些艺术品不会模仿任何给定的形式,也不能轻易归类为数据集类别。我们的方法将DeepDream从图像扩展到3D点云。提出的算法,Amalgamated DeepDream(ADD),利用点云的属性来创建比天真扩展更好的对象.ADD为机器的创造力提供了希望,推动艺术家探索新方法或材料的创造力,并创造新的类型而不是在onegenre中创建现有表单或样式的变体。例如,从现实主义到抽象表现主义,或极简主义。最后,我们展示了基于ADD创建的点云进行3D打印的雕塑。
translated by 谷歌翻译
我们提出了一种基于学习的方案,用于在穿着的3D人体扫描中稳健且准确地估计穿着健康以及人体形状。 Ourapproach将穿着的人体几何图形映射到我们称之为穿透GI的几何图像。为了在不同的衣服下对齐衣服GI,我们扩展了参数人体模型,并采用骨架检测和翘曲来实现可靠的对齐。对于穿着-GI上的每个像素,我们提取包括颜色/纹理,位置,法线等的特征向量,并使用全面的3D服装训练用于每像素适应度预测的修改的条件GAN网络。我们的技术显着提高了人体形状预测的准确性,特别是在宽松和合身的服装下。我们进一步展示了我们的结果,人类/服装细分和虚拟服装适应高视觉真实感。
translated by 谷歌翻译
注册是自动医学图像分析中的一项重要任务。尽管基于深度学习(DL)的图像配准方法执行时间消耗传统方法,但它们严重依赖于训练数据并且不能很好地概括新的图像类型。我们提出了一种基于DL的方法,可以注册与训练图像不同的图像对。这是通过训练生成对抗网络(GAN)与分割信息和转移学习相结合来实现的。试验X射线和脑MR图像显示,我们的方法比传统方法具有更好的配准性能。
translated by 谷歌翻译
我们从单一的RGB图像中提出了一种新的车辆识别学习框架。与仅使用注意机制来处理2D判别信息的现有方法不同,我们的统一框架以相互关联和加强的方式学习2D全局纹理和基于3D边界框的特征表示。这两种特征表示由一个新的融合网络组合,预测了车辆的类别。使用现成的检测网络提取2D全局特征,其中估计的2D边界框有助于找到感兴趣的区域(RoI)。在RoI的帮助下,3D边界框及其相应的特征以几何形式生成。使用新颖的3Dperspective网络(3DPN)的正确方法。 3DPN由卷积神经网络(CNN),消失点损失和RoI透视层组成。 CNN在所提出的消失点损失的指导下重新评估3D边界框,这提供了透视几何约束。由于提出的RoIperspective图层,由视点变化引起的变化通过估计的几何图形进行校正,从而增强了特征表示。我们为BoxCars数据集中的车辆分类和验证任务提供了定性和定量结果。结果表明,通过学习如何从3D边界框中提取特征,我们可以获得与仅使用2D信息的方法相当或更优越的性能。
translated by 谷歌翻译
形式风格转换是修改agiven句子形式而不改变其内容的任务。它面临的挑战是缺乏大规模的句子对齐并行数据。在本文中,我们提出了异构模型,它将并行数据和形式分类数据联合起来,以减轻数据稀疏性问题。我们通过在最近提出的形式转移基准数据集上实现最先进的性能,凭经验证明了我们方法的有效性。此外,我们的模型可以很容易地适应其他无监督的文本样式传输任务,如无监督的情绪转移,并在三个广泛认可的基准上获得竞争结果。
translated by 谷歌翻译
在与人体内部环境相互作用的同时赋予连续机器人合规性对于防止对机器人和周围组织的损害至关重要。与被动顺应性相比,主动顺应性在增加力传递性和提高监视力输出的安全性方面具有优势。以往的研究表明,基于复杂的力学模型与传统的机器学习技术(如支持向量机)相结合,可以实现主动合规性。本文提出了一种基于递归神经网络的方法,避免了建模的复杂性,同时捕获非线性因素,例如滞后,摩擦和电子设备的延迟,这些都很容易建模。该方法在3-tendon单段连续机器人上进行测试,每根电缆上都有力传感器。进行实验以证明具有基于RNN的前馈控制系统的连续机器人能够快速响应外力并且顺从地进入未知环境。
translated by 谷歌翻译
一种快速有效的运动去模糊方法在现实生活中具有很大的应用价值。这项工作提出了一种创新方法,其中自学习与GAN结合,以对图像进行去模糊。首先,我们解释一个正确的发电机可以用作深度先验,并指出基于像素的损失的解决方案与基于感知的损失的解决方案不同。通过以这些思路为出发点,提出了Bi-Skip网络来提高生成能力,采用双层损失来解决常见条件不一致的问题。其次,考虑到复杂运动模糊会在训练过程中扰乱网络,采用自定进度机制来增强网络的鲁棒性。通过对定性和定量标准的全面评估,我们认为我们的方法具有超越现有技术的竞争优势。
translated by 谷歌翻译
在本文中,我们推导出具有子高斯范数的随机向量的浓度不等式(子高斯随机向量和非标准随机向量的推广),这些随机向量紧靠对数因子。
translated by 谷歌翻译
在本文中,我们开发了一种称为分层预测网络(HPNet)的分层网络模型,以了解时空记忆如何在视觉皮层层次结构中的循环电路中被学习和编码,以预测未来的视频帧。这种神经启发的模型在综合分析框架中运作。它包含一个前馈路径,用于计算和编码连续复杂度的时空特征,以及连续级别的反馈路径,以便将它们的解释投影到下面的级别。在每个级别内,前馈路径和反馈路径在LSTM模块中实例化的循环门控电路中进行交互,以生成对输入信号的预测或解释。该网络通过最小化其在层次结构的每个级别上的输入信号的预测误差来学习其世界的内部模型。我们发现,即使在最早的模块中,网络中的层次交互也增加了沿着层次结构的单元的群体代码中的全局运动模式的语义聚类。这有助于学习运动模式之间的关系,从而在基准数据集中的长程视频序列预测中产生最先进的性能。网络模型自动再现在视觉皮层中观察到的各种预测抑制和熟悉抑制神经生理现象,表明分层预测可能确实是视觉皮层中表征学习的重要原则。
translated by 谷歌翻译
最近关于数据库自然语言接口(NLIDB)的工作引起了人们的极大关注。 NLIDB允许用户使用自然语言而不是类似SQL的查询语言来搜索数据库。在保存用户免于学习查询语言的同时,与NLIDB的多圈交互通常涉及多个查询,其中上下文信息对于理解用户的查询意图是至关重要的。在本文中,我们解决了典型的上下文理解问题,称为后续查询分析。尽管存在不公正性,但由于两个主要障碍,后续查询分析尚未得到很好的研究:后续查询场景的多种性质以及缺乏高质量的数据集。我们的工作总结了典型的后续查询场景,并在120个表格上提供了一个新的FollowUp数据集,其中包含$ 1000 $查询三元组。此外,我们提出了一种新方法FANDA,它考虑了查询的结构,并采用了弱监督的多边缘学习的排名模型。 。 FollowUp的实验结果证明了FANDA在多个指标上的多个基线的优越性。
translated by 谷歌翻译