在使用连续控制的运动范式中深度强化学习的最新进展已经引起了游戏制作者对使用主动布娃娃的数字演员的潜力的兴趣。目前,开发这些想法的可用选项要么是研究人员有限的代码库,要么是专有的封闭系统。我们使用Unity ML-Agents工具包提供Marathon Environments,这是一套在Unity游戏引擎上实现的开源,连续控制基准测试。我们通过这些基准证明了连续控制研究可以转移到商业游戏引擎。此外,我们通过重现高级连续控制研究展示了这些环境的稳健性,例如从运动捕捉数据学习走路,跑步和回退;学习驾驭复杂的地形;并通过实现视频游戏输入控制系统。我们通过使用OpenAI.Baselines中的替代算法进行培训,展示了更强大的功能。最后,weshare策略可以显着缩短培训时间。
translated by 谷歌翻译
本文对机器学习文献进行了调查,并将机器学习作为优化模型。这些模型可以受益于数值优化技术的进步,这些技术已经在若干机器学习设置中起到了分辨率。特别地,针对回归,分类,聚类和深度神经网络的常用机器学习方法以及机器教学和经验模型学习中的新兴应用,提出了数学优化模型。讨论了这些模型的强度和缺点,并突出了潜在的研究方向。
translated by 谷歌翻译
我们提出了时间聚合网络(TAN),它将3D转换分解为空间和时间聚合块。通过重复堆叠空间和时间卷积,TAN形成了用于捕获视频中的时空信息的深层次表示。由于我们不在每层中应用3D卷积,而是仅在网络中的每个空间下采样层之后应用一次时间聚合块,因此显着降低了模型复杂度。在网络的不同分辨率下使用扩张卷积有助于有效地聚合多尺度时空信息。实验表明,我们的模型适用于密集的多标签动作识别,这是一个动作识别的挑战主题,需要在每个帧中预测多个动作标签。我们分别在theCharades和Multi-THUMOS数据集上的表现优于最先进的方法5%和3%。
translated by 谷歌翻译
通过减少测量来加速磁共振成像(MRI)有可能降低医疗成本,最大限度地减少对患者的压力,并使MI在目前非常昂贵的应用中成为可能。我们介绍了fastMRI数据集,这是一个大规模的MR MR测量和临床MR图像集合,可用于训练评估MR图像重建的机器学习方法。通过引入标准化评估标准和可自由访问的数据集,我们的目标是帮助社区快速推进MR图像重建的最新技术。我们还为没有医学成像背景的机器学习研究人员提供了独立的MRI入门介绍。
translated by 谷歌翻译
最近的硬件开发使得前所未有的数据并行性可用于加速神经网络训练。利用下一代加速器的最简单方法之一是增加标准小批量神经网络训练算法中的批量大小。在这项工作中,我们的目标是通过实验表征增加批量大小训练时间的效果,以达到目标样本误差所需的步骤数量来衡量。最终,增加批量大小将不再减少所需的培训步骤数量,但批量大小与需要多少培训步骤之间的确切关系对于从业者,研究人员和硬件设计人员来说都是至关重要的。 Westudy这种关系如何随训练算法,模型和数据集而变化,并发现工作负载之间的差异非常大。在此过程中,文献中关于批量大小是否会影响模型质量的协调不一致。最后,我们讨论了我们的结果对于将来更快地提供神经网络的努力的意义。
translated by 谷歌翻译
“不”属于儿童使用的前十个词,体现了语言否定的第一种形式。尽管早期发生,但收购过程的细节仍然很大程度上未知。 “不”不能被解释为可察觉的物体或事件的标签的情况使其超出了大多数现代语言习得的范围。此外,大多数符号接地体系结构由于其非指称性而难以将该字接地。在一项涉及儿童仿人机器人iCub的实验研究中,该机器人被设计用于照亮整个单词的获取过程,机器人被部署在几轮语音 - 不受约束的交互中,并且作为其语言教师的参与者。结果证实了这一假设。这种影响或意志在社会分配的习得过程中发挥着关键作用。否定词语在禁欲言辞和消极意图解释中具有韵律意义,使得它们可以很容易地与教师的言语信号隔离开来。这些词语随后可能以消极的情感状态为基础。但是,观察禁止行为的性质及其语言和语言外部分之间的时间关系引发了关于Hebbian类型算法在语言背景中的适用性的严重问题。
translated by 谷歌翻译
图形卷积网络(GCN)已广泛用于半监督设置中的图节点分类。以前的工作表明,GCN容易受到现有节点的邻接和特征矩阵的扰动。但是,更改许多应用程序中的现有节点是不现实的,例如社交网络中的现有用户。在本文中,我们设计了通过添加假节点来攻击GCN的算法。提出了一种贪婪算法来生成伪节点的邻接和特征矩阵,旨在最大化现有节点上的分类精度。另外,我们引入一个鉴别器来对来自真实节点的假节点进行分类,并提出一个Greedy-GAN攻击来同时更新鉴别器和攻击者,使虚假节点与真实节点无法区分。我们的非目标攻击将GCN的准确度降低到0.10,并且我们的目标攻击在整个数据集上达到99%的成功率,并且攻击单个目标节点的平均攻击率达到94%。
translated by 谷歌翻译
命题典型性逻辑(PTL)是最近提出的逻辑,通过使用典型算子来丰富经典命题逻辑,捕获给定句子所持有的最典型(别名正常或常规)情况。 PTL的语义是按照着名的KLM优先推理方法研究的排序模型,因此KLM风格的后果关系可以嵌入到PTL中。尽管典型操作者采用的语义引入了单调特征,但明显的Tarskian对PTL蕴涵的定义仍然是单调的,因此在许多情况下都不合适。我们的第一个重要结果是一个不可能性定理,它表明,一组最初看起来都适合于典型性的蕴涵概念的提议不能同时得到满足。更仔细的检查表明,这一结果最好被解释为主张开发不止一种PTL蕴涵的论据。本着这种解释的精神,我们研究了PTL的三种不同(语义)蕴涵版本,每一种都基于Lehmann和Magidor对KLM风格条件引入的理性闭包的定义,并构建了不同的最小概念。
translated by 谷歌翻译
Darwiche和Pearl的开创性1997年文章概述了迭代信念修正逻辑的一些基本原则。这些原则,即DPpostulates,已经以多种替代方式得到补充。大多数提出的建议都产生了一种“还原论”,即通过世界秩序来识别信仰状态。然而,这一立场最近被批评为不可接受的强势。其他提议,例如“可支配的运营商”的特殊原则(P),又称“独立”,仍然值得称赞。在本文中,假设DP假设和(P)具有许多新的条件。虽然DP假设约束先验条件和后验条件信念集之间的关系,但我们的新原则显着地控制了从两个后验条件信念集之间的关系。不同规定的共同先验。我们证明了包含词典和限制修正的结果族的运算符可以表示为与“适当序数区间”(POI)赋值相关的相关信念,这种结构比简单的世界排序更精细。通过注意这些运算符满足大量AGM时代假设(包括超扩展)的迭代版本,这些对于一般的可接受运营商来说是不合理的。
translated by 谷歌翻译
在典型的机器学习任务和应用程序中,有必要获得或创建大型标记数据集以实现高性能。遗憾的是,大型标记数据集并不总是可用且可能来源昂贵,从而为更广泛适用的机器学习创造了瓶颈。弱监督的范例提供了一种替代方案,允许通过强制约束来整合特定领域的知识,即学习问题的正确解决方案将遵循输出空间。在这项工作中,我们探讨了这种范式在由非线性微分方程控制的2-Dysysical系统中的应用。我们证明了控制系统的偏微分方程的知识可以通过适当选择的卷积核被编码到神经网络的损失函数中。我们通过证明在没有标记的训练数据的情况下,通过卷积神经网络可以直接从初始条件学习二维热方程的稳态解析来证明这一点。我们还扩展了最近在完全卷积网络的逐步发展中的工作,以在热流问题的多个数量级上实现高精度(<1.5%误差),包括在非常大的范围内(1024x1024)。最后,我们证明了这种方法可以是用于通过finignifference加速精确计算解微分方程。
translated by 谷歌翻译