我们的艺术家和机器学习研究团队设计了一种创造性算法,可以生成真正的雕塑艺术品。这些艺术品不会模仿任何给定的形式,也不能轻易归类为数据集类别。我们的方法将DeepDream从图像扩展到3D点云。提出的算法,Amalgamated DeepDream(ADD),利用点云的属性来创建比天真扩展更好的对象.ADD为机器的创造力提供了希望,推动艺术家探索新方法或材料的创造力,并创造新的类型而不是在onegenre中创建现有表单或样式的变体。例如,从现实主义到抽象表现主义,或极简主义。最后,我们展示了基于ADD创建的点云进行3D打印的雕塑。
translated by 谷歌翻译
理解物体之间的物理关系,尤其是它们的支撑关系,对机器人操纵至关重要。关于RGB-D图像中简单配置的支持关系和结构稳定性的研究已经有所进展。在本文中,我们提出了一种方法,从使用定性推理和直观物理模型从同一场景但来自不同视图的一组RGB-D图像中提取更详细的物理知识。我们的方法不是提供简单的接触关系图并且近似于凸形状的稳定性,而是能够提供基于体积表示的详细支持关系分析。具体来说,确定对象之间的真正支持关系(例如,如果一个对象通过触摸另一个对象来支持另一个对象,或者上面的对象有助于下面对象的稳定性)。我们将我们的方法应用于仓库中捕获的真实结构scenario并显示我们的方法按预期工作。
translated by 谷歌翻译
在这项工作中,我们提出了一个名为Region-Aware Network(RANet)的新型框架,用于实现人体姿势估计的反混淆,包括重度遮挡,附近人和对称外观。具体地,我们提出的方法解决了人体姿势估计的三个关键方面,即数据增强,特征学习和预测融合。首先,我们提出基于分析的数据增强(PDA)来生成具有混淆纹理的丰富数据。其次,我们不仅提出特征金字塔干(FPS)模块在较低阶段容忍更好的低级特征;但也结合了有效区域提取(ERE)模块来研究更好的人体特异性特征。第三,我们引入级联投票融合(CVS)以明确地利用可见性来排除偏转的预测并实现最终的精确姿态估计。实验结果证明了我们的方法对现有技术的优越性,对两个流行的基准数据集(包括MPII和LSP)进行了重大改进。
translated by 谷歌翻译
像SVRG这样的方差减少技术为优化凸有限和目标提供了简单快速的算法。对于非凸目标,这些技术也可以找到一阶静止点(具有小梯度)。然而,在非凸优化中,找到二阶点(具有小梯度和几乎PSD粗体)通常是至关重要的。在本文中,我们证明了Stabilized SVRG(SVRG的一个简单变体)只能使用$ \ widetilde {O}(n ^ {2/3} / \ epsilon ^ 2找到$ \ epsilon $ -second-order固定点。 + n / \ epsilon ^ {1.5})$随机梯度。为了获得最佳知识,这是SVRG的简单变量的第一个二阶保证。运行时间几乎与找到$ \ epsilon $ -first-order固定点的已知保证相匹配。
translated by 谷歌翻译
在实际大规模机器学习中使用的步长调度与由随机近似理论认为是最优的步长调度之间存在明显的差异。理论上,大多数结果利用多项式衰减学习速率时间表,而在实践中,“StepDecay”时间表是最受欢迎的时间表之一,其中学习速率被切割每个恒定数量的时期(即,这是几何衰减时间表)。这项工作考察了流量最小二乘回归的随机优化问题的步骤衰减时间表(在非强凸和强凸的情况下),其中我们表明最佳学习速率时间表的尖锐理论表征远比前面提到的更为细微。工作。我们特别关注使用随机梯度下降的最终迭代时可达到的速率,这在实践中是常见的。我们的主要结果可证明,适当调整的几何衰减学习率计划提供了任何多项式衰减学习率计划的指数改进(就条件数而言)。我们还为这些结果的广泛适用性提供实验支持,包括用于培训现代深度神经网络。
translated by 谷歌翻译
在本文中,我们将嵌套极性代码构造建模为马尔可夫决策过程(MDP),并使用先进的强化学习(RL)技术解决它。首先,在极性编码的背景下定义具有状态,动作和奖励的MDP环境。具体来说,状态表示$(N,K)$极性代码的构造,动作指定其减少为$(N,K-1)$子代码,并且奖励是解码性能。提出了一种由策略和价值网络组成的神经网络体系结构,以基于观察到的状态生成动作,旨在最大化整体提升。定义损失函数以在开发和开发之间进行权衡。为了进一步提高学习效率和质量,提出了“综合学习”范式。它首先使用遗传算法为每个$(N,K)$生成(子)最优极性码的群体,然后将它们作为先验知识用于改进RL中的策略。这样的范例用于加速训练过程,并且收敛于更好的性能。模拟结果表明,所提出的基于学习的极性构造比连续取消列表(SCL)解码器的现有技术具有可比性或甚至更好的性能。最后但并非最不重要的是,如果没有利用极地编码理论中的任何专业知识来学习算法,就可以实现这一目标。
translated by 谷歌翻译
我们提出了一种基于学习的方案,用于在穿着的3D人体扫描中稳健且准确地估计穿着健康以及人体形状。 Ourapproach将穿着的人体几何图形映射到我们称之为穿透GI的几何图像。为了在不同的衣服下对齐衣服GI,我们扩展了参数人体模型,并采用骨架检测和翘曲来实现可靠的对齐。对于穿着-GI上的每个像素,我们提取包括颜色/纹理,位置,法线等的特征向量,并使用全面的3D服装训练用于每像素适应度预测的修改的条件GAN网络。我们的技术显着提高了人体形状预测的准确性,特别是在宽松和合身的服装下。我们进一步展示了我们的结果,人类/服装细分和虚拟服装适应高视觉真实感。
translated by 谷歌翻译
注册是自动医学图像分析中的一项重要任务。尽管基于深度学习(DL)的图像配准方法执行时间消耗传统方法,但它们严重依赖于训练数据并且不能很好地概括新的图像类型。我们提出了一种基于DL的方法,可以注册与训练图像不同的图像对。这是通过训练生成对抗网络(GAN)与分割信息和转移学习相结合来实现的。试验X射线和脑MR图像显示,我们的方法比传统方法具有更好的配准性能。
translated by 谷歌翻译
我们从单一的RGB图像中提出了一种新的车辆识别学习框架。与仅使用注意机制来处理2D判别信息的现有方法不同,我们的统一框架以相互关联和加强的方式学习2D全局纹理和基于3D边界框的特征表示。这两种特征表示由一个新的融合网络组合,预测了车辆的类别。使用现成的检测网络提取2D全局特征,其中估计的2D边界框有助于找到感兴趣的区域(RoI)。在RoI的帮助下,3D边界框及其相应的特征以几何形式生成。使用新颖的3Dperspective网络(3DPN)的正确方法。 3DPN由卷积神经网络(CNN),消失点损失和RoI透视层组成。 CNN在所提出的消失点损失的指导下重新评估3D边界框,这提供了透视几何约束。由于提出的RoIperspective图层,由视点变化引起的变化通过估计的几何图形进行校正,从而增强了特征表示。我们为BoxCars数据集中的车辆分类和验证任务提供了定性和定量结果。结果表明,通过学习如何从3D边界框中提取特征,我们可以获得与仅使用2D信息的方法相当或更优越的性能。
translated by 谷歌翻译
形式风格转换是修改agiven句子形式而不改变其内容的任务。它面临的挑战是缺乏大规模的句子对齐并行数据。在本文中,我们提出了异构模型,它将并行数据和形式分类数据联合起来,以减轻数据稀疏性问题。我们通过在最近提出的形式转移基准数据集上实现最先进的性能,凭经验证明了我们方法的有效性。此外,我们的模型可以很容易地适应其他无监督的文本样式传输任务,如无监督的情绪转移,并在三个广泛认可的基准上获得竞争结果。
translated by 谷歌翻译