人类群体通常能够找到相互合作的方式,不合时宜的,暂时延长的社会困境。基于行为经济学的模型只能解释这种不现实的无状态矩阵游戏的现象。最近,多智能体强化学习被应用于普遍化社会困境问题,以暂时和空间扩展马尔科夫格。然而,这还没有产生一种能够像人类一样学会合作社会困境的代理人。一个关键的洞察力是,许多(但不是全部)人类个体具有不公平的厌恶社会偏好。这促进了矩阵游戏社会困境的特定解决方案,其中不公平 - 反对个人亲自亲社会并惩罚叛逃者。在这里,我们将这一内容扩展到马尔可夫游戏,并表明它通过与政策性能的有利互动促进了几种类型的顺序社会困境中的合作。特别是,我们发现不公平厌恶改善了跨期社会困境的重要类别的时间信用分配。这些结果有助于解释大规模合作可能如何产生和持续存在。
translated by 谷歌翻译
图形和视觉中的许多任务都需要使用稀疏参数集转换形状的机器;这些表示有助于渲染,编辑和存储。然而,当源数据嘈杂时,艺术家和工程师经常手动构建这样的表示,这是一个繁琐且可能耗时的过程。虽然深度学习中的进展已成功应用于嘈杂的几何数据,但迄今为止生成参数形状的任务一直难以实现。因此,我们提出了一个使用深度学习来预测参数化原语的新框架。我们使用距离场来在形状参数(如控制点)和栅格网格上的输入数据之间进行转换。我们展示了对2D和3D任务的效果,包括字体矢量化和表面抽象。
translated by 谷歌翻译
Deep neural networks can be powerful tools, but require careful application-specific design to ensure that the most informative relationships in the data are learnable. In this paper, we apply deep neural networks to the nonlinear spatiotemporal physics problem of vehicle traffic dynamics. We consider problems of estimating macroscopic quantities (e.g., the queue at an intersection) at a lane level. First-principles modeling at the lane scale has been a challenge due to complexities in modeling social behaviors like lane changes, and those behaviors' resultant macro-scale effects. Following domain knowledge that upstream/downstream lanes and neighboring lanes affect each others' traffic flows in distinct ways, we apply a form of neural attention that allows the neural network layers to aggregate information from different lanes in different manners. Using a microscopic traffic simulator as a testbed, we obtain results showing that an attentional neural network model can use information from nearby lanes to improve predictions, and, that explicitly encoding the lane-to-lane relationship types significantly improves performance. We also demonstrate the transfer of our learned neural network to a more complex road network, discuss how its performance degradation may be attributable to new traffic behaviors induced by increased topological complexity, and motivate learning dynamics models from many road network topologies.
translated by 谷歌翻译
在本文中,我们从RGB视频中解决了3D对象网格重建的问题。我们的方法结合了最佳的多视图几何和数据驱动方法进行三维重建,通过优化对象网格形成多视图光度一致性,同时用ashape先前约束网格变形。我们将其视为每个网面投影的分段图像对齐问题。我们的方法允许我们从光度误差更新形状参数,而无需任何深度或掩模信息。此外,我们展示了如何通过从虚拟角度进行光栅化来避免零光度梯度的简并性。我们使用我们的光度网格优化来展示合成和现实世界视频的3D对象网格重建结果,无论是网状生成网络还是传统的表面重建管道,无需繁重的手工处理,都无法实现。
translated by 谷歌翻译
本报告概述了利用大数据革命和大规模计算解决多信使天体物理学中的重大计算挑战的最新工作,特别强调实时发现活动。该文件承认了多信使天体物理学的跨学科性质,由物理学家,天文学,计算机科学,数据科学,软件和网络基础设施社区的成员编写,他们参加了NSF-,DOE-和NVIDIA资助的“多信使天体物理学的深度学习”。 :实时发现规模“研讨会,于2018年10月17日至19日在国家超级计算应用中心举办。本报告的重点包括一致同意这对于加速新型信号处理算法的开发和部署至关重要。利用人工智能(AI)和高性能计算之间的协同作用,最大限度地发挥Multi-Messenger天体物理学的潜在科学发现。我们讨论了实现这一努力的关键方面,即(i)为多信使天体物理学设计和利用可扩展和计算效率高的AI算法;(ii)数字模拟天体物理资源的网络基础设施要求,以及处理和解释多信使天体物理学数据; (iii)管理引力波探测和触发以实现电磁和天体粒子跟踪; (iv)利用未来发展的机器和深度学习以及网络基础设施资源的愿景与大数据时代的发现规模相结合; (v)需要建立一个社区,将领域专家与数据科学家一起进行平等,以最大限度地加速发现多信天体物理学的新兴领域。
translated by 谷歌翻译
胸部X线摄影是一种非常强大的成像模式,允许对患者的胸部进行详细检查,但需要专门的培训才能正确解释。随着高性能通用计算机视觉算法的出现,胸部X射线照片的准确自动分析越来越受到研究人员的关注。然而,开发这些技术的关键挑战是缺乏足够的数据。在这里,我们描述了MIMIC-CXR,一个371,920个胸部X射线的大型数据集,与2011年至2016年间来自Beth Israel DeaconessMedical Center的227,943个成像研究相关联。每个成像研究可以涉及一个或多个图像,但大多数情况下与两个图像相关联:正面视图和侧视图。图像提供有14个标签,这些标签来自应用于相应的自由文本放射学报告的自然语言处理工具。所有图像均已去除识别,以保护患者隐私。该数据库是免费提供的,以促进和鼓励医学计算机视觉的广泛研究。
translated by 谷歌翻译
本文讨论了在无向网络的局部调节(LC)中对消息进行求和,扩展和重新排序的实际实现。特别地,必须扩展以接收节点的相关集合的可能不同的子集为条件的输入消息以在该相关集合上进行条件化,然后重新排序,使得可以通过逐元素乘法来融合条件矩阵的对应列。然后通过对在前沿边缘上游的循环割集节点求和来减少传出消息。强调实施是对Fay等人提出的LC的理论依据的主要贡献。然而,网格网络中局部调节的复杂性仍然不比聚类更好。
translated by 谷歌翻译
由于高度的环境扰动,对微型飞行器(MAV)的灵活且计算上有效的控制器的需求日益增加。在这项工作中,由于缺乏规则前提参数,因此提出了一种不断发展的神经模糊控制器,即Parsimonious Controller(PAC),其特征在于比传统方法更少的网络参数。 PAC建立在最近开发的演化神经模糊系统的基础上,称为简约学习机(PALM),并采用从偏差和方差的近似得出的新规则生长和修剪模块。这些方法不依赖于用户定义的阈值,从而增加了实时部署的自主权。 PAC通过滑模控制(SMC)理论以单程方式调整后续参数。利用Lyapunov稳定性分析证明了我们PAC的稳定性。最后,通过观察生物激励扑翼微型飞行器(BI-FWMAV)和称为hexacopter的旋翼微型飞行器的各种轨迹跟踪性能来评估控制器的功效。 ,它与三个独特的控制器进行比较。我们的PAC输出基于线性PID控制器和基于广义回归神经网络(GRNN)的非线性自适应控制器。与其前身G控制器相比,跟踪精度具有可比性,但PAC获得的参数明显少于获得与G控制器相似或更好的性能。
translated by 谷歌翻译
将概率模型应用于强化学习(RL)已经成为研究的一个方向,因为强大的优化工具如变分推理适用于RL。然而,由于它们的制定,现有的推理框架及其算法对学习最优策略提出了显着的挑战,例如,伪似然方法中缺乏模式捕获行为以及在基于最大熵RL的方法中难以优化学习目标。我们提出了VIREL,一种用于RL的新颖的,理论上基于概率的推理框架,它利用参数化形式的动作 - 值函数来捕获基础马尔可夫决策过程的未来动态。由于一般性,我们的框架适用于变分推理的当前进展。将变分期望最大化算法应用于我们的框架,我们表明,演员 - 评论者算法可以减少到期望最大化。我们从我们的框架中推导出一系列方法,包括基于软值函数的最先进方法。我们评估了来自这个家族的两个演员批评算法,这些算法与软件演员评论家的表现相当,证明了我们的框架提供了一个有希望的RL作为推理的观点。
translated by 谷歌翻译
核理论中的从头算方法,如无核壳模型(NCSM),已被开发用于近似解决有限核与现实强相互作用。 NCSM和其他方法需要将在有限基础空间中获得的结果进行非扩展到无限空间限制并评估那些外推的不确定性。每个可观测量都需要单独推断,并且大多数可观测值具有noproven外推法。我们提出了一种前馈人工神经网络(ANN)方法作为外推工具,以获得基态能量和基态点 - 质子均方根(rms)半径及其外推不确定性。设计的人工神经网络足以产生这两个非常不同的可观测量的结果,这些结果来自ab initioNCSM导致满足以下理论物理条件的小基础空间:基本空间参数在极大矩阵极限中的独立性。还提供了人工神经网络结果与其他外推法相比较的方法。
translated by 谷歌翻译