物理结构 - 为了服务某些功能而构建物体,受物理动力学影响的能力 - 是人类智能的基础。在这里,我们介绍了一套具有挑战性的物理构造框架,其灵感来自于孩子们如何玩积木,例如匹配目标配置,堆叠和附加块以将对象连接在一起,以及在目标对象上创建类似遮蔽物的结构。然后,我们将研究一系列现代深度强化学习机构如何应对这些挑战,并介绍几种提供卓越性能的新方法。我们的结果表明,使用结构化表示(例如,对象和场景图)和结构化策略(例如,以对象为中心的动作)的代理优于那些使用较少结构化表示的代理,并且当被要求推理更大的场景时,优化超出其训练。通过蒙特卡罗树搜索使用基于模型的计划的代理商在我们最具挑战性的施工问题中也优于严格的无模型代理。我们认为,将结构化表征和推理与强大学习相结合的方法是拥有丰富的直观物理,场景理解和规划的代理人的关键途径。
translated by 谷歌翻译
多智能体系统的行为动态具有丰富有序的结构,可用于理解这些系统,并改善人工智能学习如何在其中运行。在这里,我们介绍了用于多智能体学习的关系前向模型(RFM),这些网络可以学习如何在多智能体环境中对代理的未来行为进行准确的预测。因为这些模型对环境中存在的离散实体和关系进行操作,所以它们产生可解释的中间体表达能够深入了解推动代理人行为的因素,以及调解社交互动的强度和价值的事件。此外,我们展示了代理内部的RFM模块,与非增强基线相比,可以实现更快的学习系统。随着我们开发和交互的自治系统越来越多地成为多智能体,开发利用分析工具来表征代理如何以及为何做出决策的工具越来越必要。此外,开发快速且易于学会彼此协调的人工制剂以及在共享环境中与人类协调是至关重要的。
translated by 谷歌翻译
人工智能(AI)最近经历了复兴,在视觉,语言,控制和决策等关键领域取得了重大进展。部分原因在于廉价数据和廉价的计算资源,它们符合深度学习的自然优势。然而,在许多不同压力下发展的人类智能的许多定义特征仍然是当前方法所无法实现的。特别是,超越一个人的经验 - 从人类智慧中获得人类智慧的标志 - 仍然是现代人工智能的一项艰巨挑战。以下是部分立场文件,部分审查和部分统一。认为组合概括必须是人工智能达到人类能力的首要任务,结构化表征和计算是实现这一目标的关键。就像生物学使用自然和培养合作一样,我们拒绝“手工工程”和“端到端”学习之间的错误选择,而是主张从其互补优势中获益的方法。我们探索在深度学习架构中如何使用关系归纳偏差可以促进对实体,关系和组成它们的规则的学习。我们为AI工具包提供了一个新的构建模块,它具有强大的关系引导偏差 - 图形网络 - 它概括和扩展了在图形上运行的神经网络的各种方法,并提供了一个简单的界面来操纵结构化知识和生产结构化行为。我们讨论图网络如何支持关系推理和组合泛化,为更复杂,可解释和灵活的推理模式奠定基础。作为本文的参考,我们发布了一个用于构建图形网络的开源软件库,并演示了如何在实践中使用它们。
translated by 谷歌翻译
关于物体,关系和物理的推理是人类智能的核心,也是人工智能的关键目标。在这里,我们介绍了交互网络,这个模型可以推断出复杂系统中的对象如何相互作用,支持动态预测,以及对系统抽象属性的推断。我们的模型将图形作为输入,以类似于模拟的方式执行以对象和关系为中心的推理,并使用深度神经网络实现。我们评估其推理几个具有挑战性的物理领域的能力:n体问题,刚体碰撞和非刚性动力学。我们的研究结果表明,可以准确地模拟数十个对象的物理轨迹,数千个时间步长,估计能量等抽象量,并自动扩展到具有不同数量和对象和关系配置的系统。我们的交互网络实现是第一个通用的,可学习的物理引擎,以及用于在各种复杂的现实领域中对对象和关系进行推理的强大的通用框架。
translated by 谷歌翻译
在短短几年的时间里,深度生成建模已经彻底改变了我们对人工创造的看法,产生了产生原始图像,音乐和文本的自主系统。受这些成功的启发,研究人员现在正在将深度生成建模技术应用于分子的生成和优化 - 在我们的综述中,我们在过去两年中发现了45篇关于该主题的论文。这些工作指向未来这样的系统将用于生成铅分子,大大减少了下游合成和表征不良导线的资源。在本次审查中,我们调查了已提出的模型和代表方案日益复杂的情况。我们描述的四类技术是递归神经网络,自动编码器,生成性对抗网络和强化学习。在首先讨论了每种技术的一些数学基础之后,我们绘制了高级别的连接并与其他技术进行了比较,并揭示了每种技术的优缺点。这项工作产生了几个重要的高级主题,包括从分子的SMILES字符串表示转向更复杂的表示,如图形语法和3D表示,奖励函数设计的重要性,对更好的标记和测试标准的需求,以及对抗性训练和强化学习对基于最大可能性的训练的益处。
translated by 谷歌翻译
本文描述了针对机器翻译(MT),实体发现和链接(EDL)以及文本和语音中的情景帧(SF文本和语音)的检测的低资源人类语言技术(LoReHLT)2018评估的ARIEL-CMU提交。
translated by 谷歌翻译
发现和利用环境中的因果结构对于智能代理来说是一项艰巨的挑战。在这里,我们探讨通过元强化学习是否可以出现因果反应。我们通过无模型强化学习训练一个经常性的网络来解决一系列问题,每个问题都包含因果结构。我们发现受过训练的代理人可以在新情况下进行因果推理以获得奖励。代理人可以选择信息干预,从观察数据中得出因果推论,并进行反事实预测。虽然也存在已建立的正式因果推理算法,但在本文中我们表明这种推理可以从无模型强化学习中获得,并且表明复杂环境中的因果推理可能会受益于此处提供的更多端到端的基于学习的方法。通过为代理人提供执行和解释实验的能力,这项工作还为强化学习中的结构探索提供了新的策略。
translated by 谷歌翻译
我们引入了一个用于分层结构行为的组合模仿学习和执行(CompILE)的框架。 CompILE使用novelunsupercted,完全可区分的序列分割模块从演示数据中学习可重用,可变长度的行为段。然后可以重新组合和执行这些学习行为以执行新任务。在训练时间,CompILE将观察到的行为自动编码为潜码的序列,每个潜码对应于输入序列中的可变长度段。一旦训练,我们的模型推广到较长的序列和训练期间未见的环境实例。我们在具有挑战性的2D多任务环境中评估我们的模型,并显示CompILE可以无人监督的方式找到正确的任务边界和事件编码,而无需注释演示数据。 CompILE发现的潜在代码和相关行为策略可以由分层代理使用,其中高级策略选择潜在代码空间中的动作,而低级特定于任务的策略仅仅是学习的解码器。我们发现,我们的代理人只能获得稀疏的奖励,而没有任务特定政策的代理商就会挣扎。
translated by 谷歌翻译
When developing general purpose robots, the overarching software architecture can greatly affect the ease of accomplishing various tasks. Initial efforts to create unified robot systems in the 1990s led to hybrid architectures, emphasizing a hierarchy in which deliberative plans direct the use of reactive skills. However, since that time there has been significant progress in the low-level skills available to robots, including manipulation and perception, making it newly feasible to accomplish many more tasks in real-world domains. There is thus renewed optimism that robots will be able to perform a wide array of tasks while maintaining responsiveness to human operators. However, the top layer in traditional hybrid architectures, designed to achieve long-term goals, can make it difficult to react quickly to human interactions during goal-driven execution. To mitigate this difficulty, we propose a novel architecture that supports such transitions by adding a top-level reactive module which has flexible access to both reactive skills and a deliberative control module. To validate this architecture, we present a case study of its application on a domestic service robot platform.
translated by 谷歌翻译
与ab-initioquantum化学和力场建模相比,由于其高计算速度和准确性,使用机器学习预测分子性质在材料设计和药物发现领域受到了极大的关注。机器学习所需的主要成分是训练数据集,其由分子特征\ textemdash组成,例如指纹位,化学描述符等,其充分地表征相应的分子。但是,为任何应用选择功能都是非常重要的。没有用于特征选择的“通用”方法。在这项工作中,我们提出了一个数据融合框架,它使用IndependentVector Analysis来开发包含无差别分子特征化方法的潜在补充信息,使我们更接近自动化特征生成。我们的方法采用任意数量的单个特征向量,并自动生成单个,紧凑(低维)的分子特征集,可用于增强回归模型的预测性能。同时,我们的方法论保留了解释生成的特征的可能性,以发现分子结构和属性之间的关系。我们在QM7b数据集上证明了预测几种性质,如原子化能,极化率,前线轨道特征值,电离势,电子亲和力和激发能。此外,我们展示了howour方法有助于改善人BACE-1抑制剂组的实验结合亲和力的预测。为了鼓励更广泛地使用IVA,我们开发了PyIVA Python包,这是一个可在Github上下载的开源代码。
translated by 谷歌翻译