本报告概述了利用大数据革命和大规模计算解决多信使天体物理学中的重大计算挑战的最新工作,特别强调实时发现活动。该文件承认了多信使天体物理学的跨学科性质,由物理学家,天文学,计算机科学,数据科学,软件和网络基础设施社区的成员编写,他们参加了NSF-,DOE-和NVIDIA资助的“多信使天体物理学的深度学习”。 :实时发现规模“研讨会,于2018年10月17日至19日在国家超级计算应用中心举办。本报告的重点包括一致同意这对于加速新型信号处理算法的开发和部署至关重要。利用人工智能(AI)和高性能计算之间的协同作用,最大限度地发挥Multi-Messenger天体物理学的潜在科学发现。我们讨论了实现这一努力的关键方面,即(i)为多信使天体物理学设计和利用可扩展和计算效率高的AI算法;(ii)数字模拟天体物理资源的网络基础设施要求,以及处理和解释多信使天体物理学数据; (iii)管理引力波探测和触发以实现电磁和天体粒子跟踪; (iv)利用未来发展的机器和深度学习以及网络基础设施资源的愿景与大数据时代的发现规模相结合; (v)需要建立一个社区,将领域专家与数据科学家一起进行平等,以最大限度地加速发现多信天体物理学的新兴领域。
translated by 谷歌翻译
通过确定性和连续代理网络对具有二进制($ \ pm1 $)权重和激活的随机神经网络模型进行了研究。我们使用平均场理论推导出一组标量方程,描述输入信号如何通过代理网络传播。这些方程表明,这些连续模型表现出对chaostransition的顺序,以及限制最大可训练深度的深度尺度的存在。此外,我们在理论上进行预测并在数值上进行确认,标准连续网络中使用的共同权重初始化方案,当应用于随机二元权重的平均值时,产生波动性能。这项研究表明,与常见的直觉相反,随机二元权重的主题应该初始化接近$ \ pm 1 $,以便更深入的网络可以训练。
translated by 谷歌翻译
虽然人类和群体分析已经成为过去几十年的重要领域,但是一些当前和相关的应用涉及估计真实视频序列中的行人的未来运动。本文提出了一种利用人群模拟在下一秒提供真实行人运动估计的方法。我们的方法是基于物理学和启发式方法,并使用BioCrowds作为模拟方法来估计人们在视频序列中的未来位置。结果表明,即使对于可能发生事件的复杂视频,我们的估算方法也能很好地工作。当估计32位行人的未来运动超过2秒时,最大平均误差为2.72美元。本文讨论了这个和其他结果。
translated by 谷歌翻译
我们提供了一个统一的框架,用于理解来自自我中心RGB相机的原始图像序列中的3D手和物体相互作用。给定单个RGB图像,我们的模型联合估计3D手和物体姿势,模拟它们的相互作用,并通过神经网络单一前馈传递识别物体和动作类。我们提出了一种不依赖于外部检测算法的单一体系结构,而是单个图像上的trainedend-end。我们进一步合并和传播时域中的信息,以推断手和物体轨迹之间的相互作用并识别行动。完整模型将每帧3D手和帧对象姿势预测的帧和输出序列与整个序列的对象和动作类别的估计一起作为输入。即使与深度数据和地面实况注释相关的方法相比,我们也展示了算法的最新性能。
translated by 谷歌翻译
虚拟人需要具有说服力,以促进人类用户的行为改变。虽然有几项研究侧重于理解影响说服程度的众多方面,但大多数研究都是有限的韵律相互作用。在本文中,我们提出了一个评估研究,重点是了解多个代理对用户说服的影响。除了gengen和status(权威和同行)之外,我们还会查看代理人所关注的聚类类型,即用户指导的代理人通过直接寻址用户来说服的地方,以及代理人旨在说服作为观察者的用户的代理人,在讨论中间接聘请其他代理人。参与者被随机分配到12个条件中的一个,并由一个或多个虚拟代理提供有说服力的消息。 Aquestionnaire被用来衡量感知到的人际关系态度,信誉和说服力。结果表明,可信度正在影响说服力。一般而言,无论焦点如何,多个代理设置比单个代理设置更具说服力。虽然参与者倾向于指导设置并且报告说它具有说服力并且对代理人的信任程度有所提高,但说服分数的实际变化反映了替代性设置在诱导行为改变方面最有效。除此之外,该研究还表明,权威代理人具有最强的说服力。
translated by 谷歌翻译
诸如ELMo(Peters等人,2018)和BERT(Devlin等人,2018)之类的语境词嵌入模型在最近几个月中已经显着改善了许多自然语言处理(NLP)任务的性能。然而,这些模型已经在专业语料库中进行了最低限度的探索,例如临床文本;此外,在临床领域,没有公开可用的预训练BERT模型。在这项工作中,我们通过探索和发布临床文本的BERT模型来满足这一需求:一个用于通用临床文本,另一个用于特定的放电摘要。我们证明,与非特定嵌入相比,使用特定于域的模型可以在三个常见的临床NLP任务上获得性能提升。这些特定领域的模型在两个临床去识别任务上并不是非常有效,并且认为这是去识别源文本和合成非去识别任务文本之间差异的解剖结果。
translated by 谷歌翻译
尽管在各个领域具有前所未有的性能,但在安全关键环境中使用深度神经网络(DNN)在存在甚至小的对抗性扰动时受到严重限制。目前的工作开发了一种随机方法来检测基于最小不确定性度量的这种扰动,这些度量依赖于在DNNinference阶段期间隐藏层的采样。采样概率旨在有效检测对侧损坏的输入。模块化,对手的新型探测器可以方便地由任何预先训练的DNN使用,不需要额外的训练费用。从贝叶斯神经网络的角度选择每个隐藏的layerentails采样的单位量化DNN输出不确定性的数量,其中整体不确定性以其分层组件表示 - 这也促进了可扩展性。然后通过逐层最小化不确定性度量来寻找采样概率,从而导致新的凸优化问题,其允许具有超线性收敛速率的非精确求解器。通过简化目标函数,还开发了低复杂度的近似求解器。除了宝贵的见解之外,这些近似还将新方法与最先进的随机对抗探测器联系起来。通过对具有不同强度水平的各种类型的对抗性攻击进行深入测试,强调了在竞争性替代方案中的物理探测器的有效性。
translated by 谷歌翻译
用于深度学习的混合信号硬件加速器实现了比数字对应物更高的电源效率。在超低功耗方案中,模拟计算固有的有限信号精度成为一项挑战。我们对在混合信号加速器上运行的6层卷积神经网络进行了案例研究,并评估了对硬件特定噪声的敏感性。我们应用各种方法来改善网络的稳健性,并展示通过自适应信号削波来优化有用信号范围的有效方法。得到的模型足以在CIFAR-10数据集上实现80.2%的分类准确度,功率预算为1.4 mW,而6 mW预算允许我们达到87.1%的准确度,这在软件基线的1%范围内。相比之下,同一型号的最优化版本在1.4 mW时的准确度仅达到67.7%,在6 mW时达到78.6%。
translated by 谷歌翻译
本研究通过检查25种不同维基百科语言版本中知识表示的多样性,探讨了语言对用户生成内容的分段效应。这种多样性在两个层面上进行衡量:每个版本中包含的概念以及描述这些概念的方式。我们证明了存在的多样性大于文献中假定的多样性,并且对使用维基百科作为世界知识来源的应用具有重大影响。最后,我们通过阐述如何有益地利用知识多样性来创建“文化意识应用”和“超语言应用”。
translated by 谷歌翻译
AMR到文本生成是最近引入NLP社区的问题,其目标是从抽象意义表示(AMR)图生成句子。通过将AMR图转换为字符串,可以将序列到序列模型用于此目的。在直接使用图来处理问题时,需要使用将AMR图编码为矢量表示的图 - 序列模型。这种编码在过去已被证明是有益的,并且与顺序编码不同,它允许我们明确地捕获AMR图中的任意结构。我们通过比较图形编码器与树编码器(其中不保留重入)来研究具有多个父项的节点(具有多个父节点的节点)对AMR到文本生成的影响的程度。我们表明,对于重入和长程依赖性的处理的改进有助于提高图形编码器的整体得分。我们的最佳模型在LDC2015E86上达到了24.40 BLEU,在LDC2017T10上超过了现有技术的1.1分和24.54 BLEU,超过了现有技术水平。 1.24分。
translated by 谷歌翻译