尽管过去已经建立了许多用于自动驾驶的研究车辆平台,但硬件设计,源代码和经验教训尚未提供给下一代示范者。这为研究界提供了基于实际评估的结果的努力,因为建立和维护研究车辆的工程知识丢失了。在本文中,我们分析了我们将开源驱动堆栈转移到研究工具的方法。我们将硬件和软件设置放在其他演示器的上下文中,并指出了导致我们选择的硬件和软件设计的标准。具体来说,我们讨论了Apollo驱动堆栈到我们研究工具的系统布局的映射,包括与执行器的通信通过在实时硬件平台上运行的控制器和传感器设置的集成。通过我们收集的经验教训,我们鼓励其他研究小组在未来更快地设置此类系统。
translated by 谷歌翻译
在过去的一年中,用于预训练和转学习的新模型和方法在各种语言理解任务中带来了显着的性能提升。一年前推出的GLUE基准提供了一个单数量度量标准,总结了各种此类任务的进展情况,但最近基准测试的表现接近非专家人员的水平,表明进一步研究的空间有限。本文回顾了从GLUE基准测试中汲取的经验教训,并介绍了SuperGLUE,这是一款以GLUE为基础的新标记,具有一系列更加困难的语言理解任务,改进的资源以及新的公共排行榜.SuperGLUE将很快在super.gluebenchmark.com上发布。
translated by 谷歌翻译
视频游戏中程序生成的级别和内容是一个具有挑战性的AI问题。通常,这种生成依赖于评估正在生成的内容的智能方式,以便满足约束和/或最大化目标。在这项工作中,我们解决了创建水平的问题,这个水平不仅可以玩,而且还围绕游戏中的特定机制展开。我们使用约束进化算法和质量分集算法来生成称为场景的超级马里奥兄弟级别的小部分,使用三种不同的模拟方法:有限代理,惩罚模型和力学维度。所有这三种方法都能够创建场景,让玩家有机会遇到或使用具有不同属性的目标机制。最后,我们讨论了每种方法的优点和缺点,并将它们相互比较。
translated by 谷歌翻译
人工神经网络在非常不同的应用案例中取得了令人瞩目的成功选择合适的网络架构是网络成功的关键决策,通常以手动方式完成。作为一种简单的策略,选择大型,大部分完全连接的架构,从而依靠良好的优化策略来找到适当的权重,同时避免过度拟合。但是,最终网络的大部分都是多余的。在最好的情况下,网络的大部分变得与以后的推理无关。在最坏的情况下,高度参数化的体系结构阻碍了适当的优化,并允许简单地创建欺骗网络的异常示例。去除相关架构部分的第一步在于识别那些需要测量诸如神经元之类的各个组件的贡献的部分。在以前的工作中,基于使用神经元的权重分布作为贡献度量的启发式方法已经取得了一些成功,但没有提供理论上的理解。因此,在我们的工作中,我们研究游戏理论对策,即Shapley值(SV),以便分离人工神经网络的相关部分。我们首先设计一个用于人工神经网络的附加游戏,其中神经元形成了联盟,神经元对联盟的平均贡献产生了Shapley值。为了衡量Shapley值如何衡量单个神经元的贡献,我们删除低贡献神经元并测量其对网络性能的影响。在我们的实验中,我们表明Shapley值优于其他启发式测量神经元的贡献。
translated by 谷歌翻译
设计用于飞机碰撞避免系统的决策逻辑的一种方法将该问题构建为马尔可夫决策过程并使​​用动态编程优化系统。产生的碰撞避免策略可以表示为数字表。这种方法已用于开发用于有人驾驶和无人驾驶飞机的机载避撞系统X(ACAS X)系列防撞系统,但状态空间的高维度导致非常大的工作台。为了提高投资效率,使用深度神经网络来近似表格。通过使用非对称损失函数和梯度下降算法,可以训练该网络的参数以提供准确的可预测值估计,同时保留相对偏好。每个州的可能的建议。通过训练多个网络代表子集,网络还减少了计算避免咨询所需的运行时间。仿真研究表明,网络提高了防撞系统的安全性和效率。由于只需要存储网络参数,所需的存储空间减少了1000倍,使得防撞系统能够使用当前的航空电子系统进行操作。
translated by 谷歌翻译
本文介绍了DATA Agent,这是一个从开放数据中创建谋杀神秘冒险的系统。在游戏中,玩家扮演的角色是负责找到谋杀罪的罪魁祸首。 DATA Agent游戏中的所有角色,地点和项目都是以开放数据为源内容生成的。本文讨论了DATA Agent的一般游戏设计和用户界面,并详细介绍了将链接数据转换为不同游戏对象的生成算法。通过两个DATA Agent游戏进行的用户研究得出的结果表明,游戏简单有趣,而且它产生的奥秘很容易解决。
translated by 谷歌翻译
自动生成游戏教程是一个具有挑战性的AI问题。虽然可以生成注释和说明,向玩家解释游戏的播放方式,但本文着重于生成将玩家引入游戏机制的游戏体验。它为Mario AI框架发展了小规模,只有被知道如何在游戏中执行特定操作的代理才能打败它。它使用各种方式限制的完美A *代理的变体,例如无法跳跃或看到敌人,测试未能做某些动作可以阻止玩家击败关卡。
translated by 谷歌翻译
本文介绍了一种生成视频游戏教程的全自动方法。 AtDELFI系统(AuTomatically DEsigning Legible,FullInstructions for games)用于研究程序生成教导玩家如何玩视频游戏的指令。我们使用图形系统以及使用所述图形表示的教程生成方法呈现游戏规则和机制的表示。我们通过在通用视频游戏人工智能(GVG-AI)框架内对游戏进行测试来演示该概念;本文讨论了不同游戏产生的教程。我们的研究结果表明,图形表示方案适用于简单的街机风格游戏,如Space Invaders和Pacman,但似乎更复杂的游戏教程可能需要比单一机制更高的游戏理解。
translated by 谷歌翻译
对于自然语言理解(NLU)技术而言,无论是实际上还是作为科学研究对象,它都必须是通用的:它必须能够以不是专门针对任何特定任务或数据集的方式处理语言。为了实现这一目标,我们引入了通用语言理解评估基准(GLUE),这是一种在各种现有NLU任务中评估和分析模型性能的工具。 GLUE与模型无关,但它可以激励跨任务共享知识,因为某些任务的训练数据非常有限。我们还提供了一个手工制作的诊断测试套件,可以对NLU模型进行详细的语言分析。我们基于多任务和转移学习的当前方法评估基线,并发现它们不会立即对每个任务训练单独模型的总体性能进行实质性改进,这表明改进了一般性和强大的NLU系统的改进空间。
translated by 谷歌翻译
本文介绍了Minecraft的沉降生成竞赛,这是Minecraft挑战中生成设计的第一部分。定居点竞争是关于创建人工智能(AI)代理,它可以产生适合于给定的Minecraft地图的功能性,美学吸引力和可信的定居点 - 理想情况下可以与人类创建的设计竞争。该竞赛的目的是推动游戏的程序性内容生成,尤其是克服自适应和整体PCG的挑战。本文介绍了挑战的技术细节,但主要集中在竞争提供的挑战以及它们是否具有科学相关性。
translated by 谷歌翻译