深度学习是图像分类大幅改进的基础。为了提高预测的稳健性,贝叶斯近似已被用于学习深度神经网络中的参数。我们采用另一种方法,通过使用高斯过程作为贝叶斯深度学习模型的构建模块,由于卷积和深层结构的推断,这种模型最近变得可行。我们研究了深度卷积高斯过程,并确定了一个保持逆流性能的问题。为了解决这个问题,我们引入了一个转换敏感卷积内核,它消除了对相同补丁输入的要求相同输出的限制。我们凭经验证明,这种卷积核可以改善浅层和深层模型的性能。在ONMNIST,FASHION-MNIST和CIFAR-10上,我们在准确性方面改进了以前的GP模型,增加了更简单的DNN模型的校准预测概率。
translated by 谷歌翻译
变分推理是贝叶斯建模工具包中的一个强大工具,然而,它的有效性取决于所使用的变分分布的表达性,以及它们匹配真实的海报分布的能力。反过来,变分族的表达性在很大程度上受到具有易处理密度函数的要求的限制。为了克服这个障碍,我们在层次模型(也称为潜变量模型)的情况下引入了一个新的边界对数密度上变量上界。然后,我们给出了Kullback-Leiblerdivergence的上界,并得出了一个越来越紧密的变分下界族,否则就是分层变分分布的下界的难以处理的标准证据,使得能够使用更具表现力的近似内部。我们表明,先前已知的方法,如层次变分模型,半隐式变分推理和双半隐式变分推理可以被视为所提出方法的特殊情况,并且在一组实验中凭经验证明了所提出方法的优越性能。
translated by 谷歌翻译
通过深度网络分析三维点云的几何和语义属性仍然具有挑战性,因为它们的几何结构的采样不规则和稀疏。本文提出了一种通过所提出的环形卷积直接在三维点云上定义和计算卷积的新方法。这个新的卷积算子可以通过在计算中指定(规则的和扩张的)环形结构和方向来更好地捕获每个点的局部邻域几何。它可以适应信号处理级别的几何变化和可扩展性。我们将应用于开发的分层神经网络,用于大规模场景中的对象分类,部分分割和语义分割。广泛的实验和比较表明,我们的方法在各种标准基准数据集(例如,ModelNet10,ModelNet40,ShapeNet-part,S3DIS和ScanNet)上优于最先进的方法。
translated by 谷歌翻译
本文介绍了提交到距离挑战2019的VOiCES的语音技术中心(STC)说话人识别(SR)系统。挑战的SR任务侧重于在嘈杂条件下单声道远/远场音频中的说话人识别问题。在这项工作中,我们研究了不同的深度神经网络架构,用于扬声器嵌入式提取以解决任务。我们表明,具有残余帧级连接的深度网络优于更浅层的体系结构。在这项工作中研究了基于简单能量的语音活动检测器(SAD)和基于自动语音识别(ASR)的SADare。我们还解决了强大的嵌入提取器训练的数据准备问题。使用自动房间脉冲响应发生器执行数据增强的混响。在我们的系统中,我们使用经过区别训练的余弦相似性度量学习模型作为嵌入后端。对我们使用的每个个体子系统应用分数归一化程序。我们最终提交的系统基于不同子系统的融合。在VOiCES开发和评估集上获得的结果证明了在嘈杂条件下处理远/远场音频时所提出的系统的有效性和鲁棒性。
translated by 谷歌翻译
Quadrotor稳定控制器通常需要仔细,模型特定的调整以确保安全操作。我们使用强化学习来训练对多个不同的物理四轮转子非常好地转移的策略模拟。我们的政策是低水平的,即我们将转子船直接映射到电机输出。经过训练的控制策略对于外部干扰非常强大,并且可以承受诸如此类的苛刻的初始条件。我们展示了不同的培训方法(成本函数的变化,噪声建模,域随机化的使用)如何影响飞行性能。据我们所知,这是第一项证明简单神经网络可以在不使用稳定PD控制器的情况下学习稳定的低级四旋翼控制器的工作;以及分析单一政策传输能力的第一项工作到多个四旋翼飞行器。
translated by 谷歌翻译
我们提出了一种新的深度学习方法,用于人体照片的姿势引导再合成。新方法的核心是基于单张照片估计完整体表面纹理。由于输入的光学图像仅观察到表面的一部分,我们建议采用一种新的修复方法来完成人体的纹理。修复网络不是直接与纹理元素的颜色一起工作,而是针对体表的每个元素估计输入图像中的适当源位置。然后,输入图像和纹理之间的该对应字段基于期望的姿势进一步变形到目标图像坐标系中,即使在姿势变化剧烈时也有效地建立源和目标视图之间的对应关系。最后的卷积网络然后使用建立的对应关系和所有其他可用信息使用具有可变形卷积的完全卷积架构合成输出图像。我们展示了姿势指导合成的最新结果。此外,我们展示了我们的系统进行的服装转移和姿势引导面部再合成的表现。
translated by 谷歌翻译
大多数现代神经机器翻译(NMT)系统依赖于预分段输入。分段粒度重要地确定输入和输出序列长度,因此建模深度,源和目标词汇表,其反过来确定模型大小,软最大化的计算成本以及词汇外单词的处理。然而,当前实践是使用在NTT训练之前修复的基于启发式的静态分段。这就引出了一个问题,即所选分割对于翻译任务是否是最佳的。为了克服次优的分割选择,我们提出了一种基于AdaptativeComputation Time算法(Graves 2016)的动态分割算法,该算法可以通过NMT目标进行端到端训练和驱动。在对三个翻译任务的评估中,我们发现,考虑到在不同分段级别之间导航的自由度,该模型更喜欢在(几乎)角色级别上操作,从而以新颖的角度为纯粹的角色级别的NMT模型提供支持。
translated by 谷歌翻译
我们引入了一种弱监督方法,用于在完全没有标记数据的情况下推断单词和表达的抽象性质。仅利用最小的语言线索和在文本数据中表现出的概念的语境使用,我们训练足够强大的分类器,获得高度相关性。人体标签。结果意味着这种方法适用于概念,附加语言和资源稀缺场景的其他属性。
translated by 谷歌翻译
场景流描述了3D位置以及图像中每个像素的3D运动。这些算法是许多最先进的自动驾驶功能的基础。为了验证和训练,需要大量的地面真实数据,这对于真实数据是不可用的。在本文中,我们演示了一种创建合成数据的技术,该数据具有密集和精确的场景流基础事实。
translated by 谷歌翻译
计算机模拟药物 - 目标相互作用(DTI)预测是药物化学中一个重要且具有挑战性的问题,对药物工业和患者具有巨大的潜在益处。用于DTI预测的大多数现有方法通常具有二进制端点,这可能是问题的过度简化。随着深度学习的出现,一些深度学习模型被设计用于解决DTI预测问题,但是它们中的大多数仍然使用二进制点,并且它们通常无法处理冷目标问题,即涉及目标蛋白质的问题,这些问题从未出现过。训练集。 Wecontrived PADME(蛋白质和药物分子相互作用prEdiction),一个基于深度神经网络的框架,用于预测化合物和蛋白质之间的实值相互作用强度。 PADME将化合物和蛋白质信息输入模型,因此适用于冷靶问题。据我们所知,我们也是第一个将分子图卷积(MGC)纳入复合特征化模型的人。我们使用了不同的交叉验证分割方案和不同的指标来衡量PADME在多个数据集上的表现(我们是第一个使用ToxCast的问题),PADME始终支配基线方法。我们还进行了一项案例研究,预测化合物与雄激素受体(AR)之间的相互作用,并将预测结果与化合物在NCI60中的生长抑制活性进行比较,这也给我们提供了令人满意的结果,表明PADME在药物开发中的潜力。我们期望在未来提出和实验PADME的不同变量,并且网络学习深度学习将改变化学信息学领域。
translated by 谷歌翻译