机器学习正在从艺术和科学转变为可供每个开发人员使用的技术。在不久的将来,每个平台上的每个应用程序都将包含训练有素的模型,以编码开发人员无法创作的基于数据的决策。这提出了一个重要的工程挑战,因为目前数据科学和建模在很大程度上与标准软件开发过程脱钩。这种分离使得在应用程序内部的机器学习能力不必要地变得困难,并且进一步阻碍了开发人员将MLin置于首位。在本文中,我们介绍了ML .NET,这是一个在过去十年中在Microsoft开发的框架,用于应对在大型软件应用程序中轻松发布机器学习模型的挑战。我们提出了它的架构,并阐明了形成它的应用程序需求。具体而言,我们引入了DataView,它是ML .NET的核心数据抽象,它可以有效地,一致地捕获完整的预测管道,并在训练和推理生命周期中进行。我们结束了论文,对ML .NET进行了令人惊讶的有利的性能研究,与更多的接受者相比,并讨论了一些经验教训。
translated by 谷歌翻译
随着网络信息技术的快速发展,越来越多的人沉浸在网络带来的虚拟社区环境中,忽视了现实生活中的社会互动。随之而来的诽谤问题变得越来越严重。通过宠物机器人和育种者之间的情感沟通促进人与人之间的离线沟通“解决了这个问题,并开发了一种名为”汤姆“的设计。”汤姆“是一个智能宠物机器人,具有基于petrobot的社交机制,名为”Tom-本文的主要贡献是提出一种名为“Tom-Talker”的社交机制,鼓励用户离线社交。“Tom-Talker”也有相应的奖励机制和朋友推荐算法。它还提出了一个宠物机器人名为“汤姆“通过情感交互算法识别用户的情绪,模拟动物的情绪,并用情感进行交流。本文设计实验并分析结果。结果表明,荆棘机器人对解决城市自闭症问题有很好的效果。
translated by 谷歌翻译
在本报告中,我们回顾了基于记忆的元学习作为建筑样本有效策略的工具,该策略从过去的经验中学习以适应目标类中的任何任务。我们的目标是为读者提供此工具的概念基础,以构建在陆域上运行的新的可扩展代理。为此,我们提出了基本的算法模板,用于建立最佳预测器和强化学习器,其行为就好像它们具有允许它们有效地利用任务结构的概率模型。此外,我们在贝叶斯框架内重建基于内存的元学习,显示元学习策略接近最优,因为它们分摊贝叶斯过滤数据,其中适应在内存动态中实现为具有足够统计数据的状态机。从本质上讲,基于记忆的学习 - 学习将概率序贯推理的难题转化为回归问题。
translated by 谷歌翻译
众所周知,深度神经网络的正确性是对其输入的“对抗性”扰动。虽然研究这些攻击是有价值的,但它们并不一定符合任何现实世界的威胁模型。这引起了人们对无限制对抗性输入的产生(和稳健性)的兴趣,这些对抗性输入并不构成对正确分类的地面实况输入的小扰动。我们引入了一个nove算法来生成逼真的无限制对抗输入,在这种情况下,它们无法通过人类可靠地与训练数据集区分开来。这是通过修改生成对抗网络来实现的:训练年龄框神经网络以构建欺骗固定目标网络的示例(因此它们是对抗性的),同时也欺骗通常的训练鉴别器网络(因此它们是现实的)。我们的方法是通过为受过训练的图像分类器生成无限制的对抗输入来证明的,该分类器对于基于扰动的攻击是鲁棒的。我们发现人类法官无法确定我们的方法在大约50%的时间内产生了十分之一的图像,提供了证据证明它们是非常现实的。
translated by 谷歌翻译
机器视觉对机器人技术至关重要,因为它依赖于视觉传感器(如自动移动机器人和智能生产系统)的广泛应用。为了创建明天的智能家居和系统,对研究领域当前挑战的概述将用于识别以系统化和可再现的方式创建的进一步可能的方向。在这项工作中,进行了系统的文献回顾,涵盖了过去10年的研究。我们从四个数据库中筛选了172篇论文,并选出了52篇相关论文。虽然稳健性和计算时间得到了很大改善,但遮挡和光照变化仍然是最大的问题。根据最近出版物的数量,我们得出结论,观察领域与研究界具有相关性和关注性。在该领域的许多领域中出现了进一步的挑战。
translated by 谷歌翻译
我们研究了不同扰动类型之间的深度神经网络的对抗鲁棒性的转移。虽然大多数关于对抗性实例的工作都集中在$ L_ \ infty $和$ L_2 $ -bounded扰动上,但这些并没有捕获对手可用的所有类型的扰动。目前的工作评估了5种不同类型的32次攻击,对抗100个ImageNet子集的对抗模型。我们的实证结果表明,对广泛的扰动大小进行评估对于理解扰动类型之间的对抗鲁棒性转移是必要的。我们进一步证明针对一种扰动类型的鲁棒性可能并不总是意味着可能有时会损害对其他扰动类型的鲁棒性。鉴于这些结果,我们建议对各种扰动类型和大小的对抗性防御进行评估。
translated by 谷歌翻译
随着深度学习的最新进展,相当多的注意力已经实现了自动语音识别性能,其接近人类在对话电话语音(CTS)识别等任务上的表现。在本文中,我们评估了这些提议技术在广播新闻(BN)上的有用性,这是一项类似的挑战性任务。我们还执行一组识别测量,以了解所实现的自动语音识别结果与人类在此任务上的表现有多接近。在两个公开可用的BNtest集合DEV04F和RT04上,我们的语音识别系统使用LSTM和基于残余网络的声学模型,结合n-gram和神经网络语言模型,单词误码率分别为6.5%和5.9%。通过在这些测试集上实现新的性能里程碑,我们的实验表明,在其他相关任务(如CTS)上开发的技术可以转移到类似的性能。相比之下,在这些测试集上测得的最佳人体识别性能要低得多,分别为3.6%和2.8%,这表明该空间仍有新技术和改进的空间,以达到人类的表现水平。
translated by 谷歌翻译
使用关节致动器来驱动骨骼运动是动画的常见做法,但是合成的扭矩模式通常是不自然的或者对于真人来说是不可行的。另一方面,基于生理学的模型明确地模拟肌肉和肌腱,从而产生更像人类的运动和扭矩模式。本文介绍了一种将肌肉驱动空间中的最优控制问题转化为关节驱动空间中的等效问题的技术,使得解决问题具有相同的最优值。通过解决关节驱动空间中的等效问题,我们可以生成类似于肌肉模型生成的人类运动,同时保留联合驱动模型提供的简单建模和快速计算的好处。我们的方法将肌肉激活的常数界限转换为关节驱动空间中的非线性,状态依赖性扭矩限制。此外,肌肉激活的代谢能量函数转化为关节扭矩,关节配置和关节速度的非线性函数。我们的技术还可以利用深度强化学习方法,通过为学习者在学习过程中探索解剖学上真实的动作空间而有利于政策优化。我们利用基于生理学的模拟器OpenSim提供训练数据,以学习扭矩限制和代谢能量函数。一旦经过训练,相同的扭矩限制和能量函数就可以应用于完全不同的运动任务,这些任务包括轨迹优化或政策学习。
translated by 谷歌翻译
对抗训练,其中网络训练对抗的例子,是抵御强烈攻击的对抗性攻击的少数防御之一。遗憾的是,产生强大对抗性示例的高成本使标准对抗性训练对像ImageNet这样的大规模问题不切实际。我们提出了一种算法,通过循环更新模型参数时计算的梯度信息,消除了生成对抗性示例的开销成本。与自然训练相比,我们的“免费”对抗训练算法在CIFAR-10和CIFAR-100数据集上具有最先进的稳健性,并且比其他强大的对抗训练方法快7到30倍。使用具有4个P100 GPU的单工作站和2天的运行时间,我们可以为大规模ImageNet分类任务训练一个强大的模型,该任务对PGD攻击保持40%的准确性。
translated by 谷歌翻译
本文不是提出一种新方法,而是研究现有学习算法中存在的一个问题。我们研究了强化学习(RL)的学习动态,特别是学习和数据生成之间的特征耦合,因为RL代理控制着他们的未来数据分布。在存在函数逼近的情况下,这种耦合可以导致一种有问题的“射线干扰”类型,其特征在于学习动力学顺序地遍历许多性能平台,有效地约束代理一次学习一件事,即使并行学习更好。我们建立了发生射线干扰的条件,显示了它与鞍点的关系,并在受限制的环境中获得了精确的学习动力学。我们描述了它的许多特性,并讨论了可能的补救措施。
translated by 谷歌翻译