多智能体系统的行为动态具有丰富有序的结构,可用于理解这些系统,并改善人工智能学习如何在其中运行。在这里,我们介绍了用于多智能体学习的关系前向模型(RFM),这些网络可以学习如何在多智能体环境中对代理的未来行为进行准确的预测。因为这些模型对环境中存在的离散实体和关系进行操作,所以它们产生可解释的中间体表达能够深入了解推动代理人行为的因素,以及调解社交互动的强度和价值的事件。此外,我们展示了代理内部的RFM模块,与非增强基线相比,可以实现更快的学习系统。随着我们开发和交互的自治系统越来越多地成为多智能体,开发利用分析工具来表征代理如何以及为何做出决策的工具越来越必要。此外,开发快速且易于学会彼此协调的人工制剂以及在共享环境中与人类协调是至关重要的。
translated by 谷歌翻译
人工智能(AI)最近经历了复兴,在视觉,语言,控制和决策等关键领域取得了重大进展。部分原因在于廉价数据和廉价的计算资源,它们符合深度学习的自然优势。然而,在许多不同压力下发展的人类智能的许多定义特征仍然是当前方法所无法实现的。特别是,超越一个人的经验 - 从人类智慧中获得人类智慧的标志 - 仍然是现代人工智能的一项艰巨挑战。以下是部分立场文件,部分审查和部分统一。认为组合概括必须是人工智能达到人类能力的首要任务,结构化表征和计算是实现这一目标的关键。就像生物学使用自然和培养合作一样,我们拒绝“手工工程”和“端到端”学习之间的错误选择,而是主张从其互补优势中获益的方法。我们探索在深度学习架构中如何使用关系归纳偏差可以促进对实体,关系和组成它们的规则的学习。我们为AI工具包提供了一个新的构建模块,它具有强大的关系引导偏差 - 图形网络 - 它概括和扩展了在图形上运行的神经网络的各种方法,并提供了一个简单的界面来操纵结构化知识和生产结构化行为。我们讨论图网络如何支持关系推理和组合泛化,为更复杂,可解释和灵活的推理模式奠定基础。作为本文的参考,我们发布了一个用于构建图形网络的开源软件库,并演示了如何在实践中使用它们。
translated by 谷歌翻译
From just a glance, humans can make rich predictions about the future stateof a wide range of physical systems. On the other hand, modern approaches fromengineering, robotics, and graphics are often restricted to narrow domains andrequire direct measurements of the underlying states. We introduce the VisualInteraction Network, a general-purpose model for learning the dynamics of aphysical system from raw visual observations. Our model consists of aperceptual front-end based on convolutional neural networks and a dynamicspredictor based on interaction networks. Through joint training, the perceptualfront-end learns to parse a dynamic visual scene into a set of factored latentobject representations. The dynamics predictor learns to roll these statesforward in time by computing their interactions and dynamics, producing apredicted physical trajectory of arbitrary length. We found that from just sixinput video frames the Visual Interaction Network can generate accurate futuretrajectories of hundreds of time steps on a wide range of physical systems. Ourmodel can also be applied to scenes with invisible objects, inferring theirfuture states from their effects on the visible objects, and can implicitlyinfer the unknown mass of objects. Our results demonstrate that the perceptualmodule and the object-based dynamics predictor module can induce factoredlatent representations that support accurate dynamical predictions. This workopens new opportunities for model-based decision-making and planning from rawsensory observations in complex physical environments.
translated by 谷歌翻译
神经网络捕获关系知识的能力是一个长期存在争议的问题。最近,PDP的一些研究人员认为,(1)经典PDP模型可以处理关系结构(Rogers&McClelland,2008,2014)和(2)深度学习方法对文本处理的成功表明结构化表示是不必要的。捕捉人类语言的要点(Rabovsky等,2018)。在目前的研究中,我们测试了Story Gestalt模型(St. John,1992),一个经典的文本理解PDP模型,以及一个带有注意力模型的序列到序列(Bahdanau等,2015),一个当代深度学习架构的文本处理。两个模型都经过培训,可以根据几个概念在故事中扮演的主题角色回答有关故事的问题。在三个关键测试中,我们改变了新故事的统计结构,同时保持他们的关系结构在训练数据方面保持不变。每个模型都容易受到每个统计结构操纵到不同程度的影响,他们的表现低于机会,至少不能操纵。我们认为两种模型的失败都是由于它们无法对独立角色和填充物进行动态绑定这一事实。最后,这些结果使传统神经网络模型适用于解释基于关系推理的现象,包括语言处理。
translated by 谷歌翻译
ArCo是意大利文化遗产知识图,由七个词汇网络和1.69亿个三倍体组成,约有82万个文化实体。它与SPARQL端点,用于将目录记录转换为RDF的软件以及丰富的文档材料(测试,评估,操作方法,示例等)共同分发。 ArCo基于意大利文化遗产和活动部(MiBAC)的官方总目录 - 及其相关的编码规则 - 收集和验证(理想情况下)CH管理员提供的所有意大利文化遗产特性(不包括图书馆和档案馆)的目录记录。遍布意大利。我们介绍其结构,设计方法和工具,其增长社区,并描述其重要性,质量和影响。
translated by 谷歌翻译
作为实例级识别问题,人员重新识别(ReID)依赖于判别特征,其不仅捕获不同的空间尺度而且还封装多个尺度的任意组合。 Wecall同构和异构尺度的全尺度特征的这些特征。在本文中,设计了一种新的深度CNN,称为Omni-ScaleNetwork(OSNet),用于ReID中的全方位特征学习。这是通过设计由多个卷积特征流组成的残差块来实现的,每个卷积特征流检测特定尺度的特征。重要的是,引入了一种新颖的统一聚集门,以动态融合多尺度特征的输入相关的信道方向权重。为了有效地学习空间 - 通道相关并避免过度拟合,构建块使用逐点和深度卷积。通过逐层堆叠这些块,我们的OSNet非常轻巧,可以在现有的ReIDbenchmarks上从头开始进行培训。尽管模型尺寸较小,但我们的OSNet在六人ReID数据集上实现了最先进的性能。
translated by 谷歌翻译
真实世界的自动驾驶车辆通常在先验的非知识环境中运行。由于这些系统中的大多数都是安全关键的,因此确保它们在面对环境不确定性(例如看不见的障碍物)时安全运行非常重要。当前的安全分析工具使得自治系统能够在给出有关环境状态的完整信息的情况下对安全性进行审查。但是,这些工具无法很好地适应实时感测环境的情况,例如在导航任务期间。在这项工作中,我们提出了一种基于哈密尔顿 - 雅可比可达性的新型实时安全分析方法,该方法在环境不确定的情况下提供了强有力的安全保证。我们的安全方法与计划者无关,并为各种测绘传感器提供保证。我们展示了我们的方法模拟和硬件,以围绕最先进的基于视觉的,基于学习的规划器提供安全保障。
translated by 谷歌翻译
人工智能(AI)应用程序被用于预测和评估多个领域的行为,例如刑事司法和消费者财务,这直接影响人类福祉。但是,如果AI是为了改善人们的生活,那么人们必须能够信任AI,这意味着能够理解系统正在做什么以及为什么。尽管在这种情况下透明度通常被视为要求,但实际上它可能并不总是可行的或可取的,而确保系统在设定的道德范围内运行的需要仍然存在。在本文中,我们提出了一种方法,在监测其输入和输出的基础上,评估人工智能系统的道德界限。我们通过将道德价值映射到限制输入和输出的明确可验证规范,在系统周围放置一个“玻璃盒子”,这样如果这些仍然在框内,我们可以保证系统坚持价值。对输入和输出的关注允许对完全不同的智能系统进行验证和比较;来自深度神经网络的基于代理的系统。将抽象道德价值观明确转化为具体规范,在可解释性方面带来了巨大的好处;利益相关者确切地知道该制度如何解释和运用相关的抽象道德人类价值并相应地校准他们的信任。此外,通过在更高级别操作,我们可以检查系统是否符合相同值的不同解释。这些优势将对人工智能系统用户的福祉产生影响,建立他们的信任并为他们提供有关系统如何遵守道德价值观的具体知识。
translated by 谷歌翻译
用于无监督表示学习的最先进方法可以训练标准卷积神经网络的前几层,但是它们不如针对更深层的监督学习那么好。这可能是由于浅层的一般性和相对简单的性质;然而,这些方法被应用于数百万张图像,由于未标记的数据收集起来很便宜,因此可扩展性被宣传为主要优势。在本文中,我们质疑这种做法,并询问是否真的需要这么多图像才能容忍无监督学习效果最好的图层。我们的主要结果是,一些甚至单个图像以及强大的数据增强功能足以使性能几乎达到饱和。具体来说,我们提供了三种不同的自我监督特征学习方法(BiGAN,RotNet,DeepCluster)与训练图像数量(1,10,1000)的分析,并表明我们只使用公共网络的前两个卷积层的准确性。单个未标记的训练图像,并获得其他层的竞争结果。我们进一步研究和可视化学习表示作为哪个(单个)图像用于训练的功能。我们的结果也可以通过浅层不同网络捕获哪种类型的信息。
translated by 谷歌翻译
考虑到i.i.d,我们考虑在$ d $ -dimensional球体上学习关于平方损失的未知函数$ f _ {\ star} $的问题。 samples $ \ {(y_i,{\ boldsymbol x} _i)\} _ {i \ le n} $其中$ {\ boldsymbol x} _i $是一个均匀分布在球体上的特征向量,$ y_i = f _ {\ star} ({\ boldsymbolx} _i)$。我们研究了两种流行的模型,可以看作围绕随机初始化的两层神经网络的线性化:(RF)Rahimi-Recht的随机特征模型; (NT)Jacot-Gabriel-Hongler的神经切线核模型。这两种方法也可以被视为核岭回归(相对于不同内核)的随机近似,因此当神经元$ N $的数量发散时,对于固定维度$ d $,它们享有通用近似属性。我们证明,如果$ d $和$ N $都很大,这些模型的行为就非常简单了。如果$ N = o(d ^ 2)$,那么就原始特征$ {\ boldsymbol x} _i $而言,RF的表现并不比线性回归更好,而且对于一级和二级的一级和二级,NT的表现并不比线性回归好。 $ {\ boldsymbol x} _i $。更一般地说,如果$ N = o(d ^ {\ ell + 1})$那么RF最多适合一个度 - 原始特征中的$ \ ell $多项式,以及最多一度的NTfits - $(\ ell + 1 )$多项式。
translated by 谷歌翻译