本报告概述了利用大数据革命和大规模计算解决多信使天体物理学中的重大计算挑战的最新工作,特别强调实时发现活动。该文件承认了多信使天体物理学的跨学科性质,由物理学家,天文学,计算机科学,数据科学,软件和网络基础设施社区的成员编写,他们参加了NSF-,DOE-和NVIDIA资助的“多信使天体物理学的深度学习”。 :实时发现规模“研讨会,于2018年10月17日至19日在国家超级计算应用中心举办。本报告的重点包括一致同意这对于加速新型信号处理算法的开发和部署至关重要。利用人工智能(AI)和高性能计算之间的协同作用,最大限度地发挥Multi-Messenger天体物理学的潜在科学发现。我们讨论了实现这一努力的关键方面,即(i)为多信使天体物理学设计和利用可扩展和计算效率高的AI算法;(ii)数字模拟天体物理资源的网络基础设施要求,以及处理和解释多信使天体物理学数据; (iii)管理引力波探测和触发以实现电磁和天体粒子跟踪; (iv)利用未来发展的机器和深度学习以及网络基础设施资源的愿景与大数据时代的发现规模相结合; (v)需要建立一个社区,将领域专家与数据科学家一起进行平等,以最大限度地加速发现多信天体物理学的新兴领域。
translated by 谷歌翻译
估计手对象操作对于解释和模仿人类行为至关重要。以前的工作在孤立地重建手部姿势和物体形状方面取得了重大进展。然而,在操作期间重建手和物体是一个更具挑战性的任务,因为手和物体的显着闭塞。在呈现挑战时,操作也可以简化问题,因为接触物理限制了有效手对象配置的空间。例如,在操作过程中,手和物体应该接触但不能穿透。在这项工作中,我们通过操纵约束来规范手和物体的联合重建。我们提出了一种端到端的可学习模型,它利用了一种有利于物理上可信的对象星座的新型接触损失。我们的方法使用RGB图像作为输入,提高了基线的抓取质量指标。为了训练和评估模型,我们还提出了一个新的大型合成数据集ObMan,它具有手工操作。我们证明了ObMan训练模型对实际数据的可转移性。
translated by 谷歌翻译
时间最优路径参数化是最小化致动约束代理可以穿过给定路径的时间间隔的问题。最近,提出了用于解决该问题的有效线性时间算法。然而,它的最优性仅通过基于凸规划的更加计算密集的方法来优化地解决了问题的严格子类。在本文中,我们证明了相同的线性时间算法对于所有通过凸优化方法最优地求解的问题是渐近最优的。我们还描述了时间最优路径参数化问题的最优化,这可能是独立的兴趣。
translated by 谷歌翻译
我们展示了如何为生成模型构建平滑和逼真的插值,具有任意的,不一定是高斯的先验。关键思想是基于曲线的真实性指数的构建,正如我们所示,最大化导致相对于相应的黎曼结构搜索测地线。
translated by 谷歌翻译
预测生物标志物的进展的能力,特别是在NDD中,受到纵向数据集的大小的限制,就患者数量,每位患者的就诊次数和总的随访时间而言。为此,我们引入了一种数据增强技术,该技术能够再现纵向训练数据集中的变异性,并模拟任意数量的虚拟患者的连续生物标记物轨迹。由于这个模拟框架,我们建议将训练集转换为模拟数据集,其中包括更多患者,每位患者更多的时间点以及更长的随访时间。我们在预测ADNI数据集的MCI主题的MMSE时说明了这种方法。我们证明它可以达到预测,与数据中的噪声相当,在测试/再测试研究中估计,与相同的非增强模型相比,平均绝对误差提高了37%。
translated by 谷歌翻译
问答(QA)作为一个研究领域,主要关注知识库(KB)或自由文本作为知识来源。这两个来源在历史上形成了通过资源提出的各种问题,以及为解决这些问题而开发的方法。在这项工作中,我们看到QA的实际用例,而不是用户指导的知识,它将结构化QA的元素与知识库,非结构化QA与叙述相结合,将多关系QA的任务引入个人叙述。作为实现这一目标的第一步,我们做出了三个关键贡献:(i)我们生成并发布TextWorldsQA,一组五个不同的数据集,whereeach数据集包含动态叙述,描述模拟世界中的实体和关系,与可变组成问题配对知识,(ii)我们在这项任务中对几个最先进的QA模型及其变体进行了全面的评估和分析,以及(iii)发布了一个轻量级的基于Python的框架,我们称之为TextWorlds,可以轻松生成任意的额外世界和叙事,目标是允许社区创建和分享越来越多的不同世界作为此任务的测试平台。
translated by 谷歌翻译
在本文中,我们讨论了一类基于一维切片方法的基于AutoEncoder的生成模型。该想法是基于将样本之间的区分减少到一维情况。我们的实验表明,这些方法可以分为两组。首先包括对标准正态性测试进行修改的方法,而第二种方法基于样本之间的经典距离。事实证明,这两个组都是正确的生成模型,但第二个组的Fr \'{e} chet起始距离(FID)的下降速度略快。
translated by 谷歌翻译
在我们的研究中,我们证明了卷积神经网络与SMILES的多样性之间的协同效应。我们提出的模型,即所谓的卷积神经指纹(CNF)模型,达到了传统描述符的准确性,如Dragon(Mauri等人[22]),RDKit(Landrum [18]),CDK2(Willighagen等人[43] ]和PyDescriptor(Masand和Rastija [20])。此外,CNF模型通常比高度精细的传统描述符表现更好,特别是在小数据集上,这对化学领域非常有利,因为实验成本,分子的可用性或私有数据库的可访问性,数据集通常较小。我们在训练和测试期间评估CNF模型以及SMILES增强。据我们所知,这是第一次提出这种方法。我们表明,使用SMILESduring训练的多样性可以充当常规器,从而避免过度拟合,并且在考虑进行测试时可以被视为集成学习。
translated by 谷歌翻译
ChArUco板用于机器人和增强现实中的相机校准,单眼姿态估计和姿态验证。这种基准点可以通过传统的计算机视觉方法(如在OpenCV中找到的)在光照环境中检测到,但是当光线较差或者当图像经历极端运动模糊时,经典方法会失败。我们提出Deep ChArUco,区域时间姿态估计系统,它结合了两个自定义深度网络ChArUcoNet和RefineNet,以及Perspective-n-Point(PnP)算法来估计标记的6DoF姿势。 ChArUcoNet是一种双头标记特定卷积神经网络(CNN),它联合输出ID特定分类器和2D点位置。使用RefineNet将2D点位置进一步细化为子像素坐标。我们的网络使用目标标记的自动标记视频,合成亚像素角数据和极端数据增强的组合进行训练。我们评估Deep ChArUco具有挑战性的低光,高运动,高模糊情景,并证明我们的方法优于传统的基于OpenCV的ChArUcomarker检测和姿态估计方法。
translated by 谷歌翻译
基于神经网络的对话模型通常缺乏对异常域外(OOD)用户输入的鲁棒性,这会导致意外的对话行为,并且在很大程度上限制了这些模型在任务关键型生产环境中的使用。这个问题尤其与设置具有有限训练数据的对话系统自举有关,并且无法访问OOD示例。在本文中,我们探讨了这种系统的恶意输入的鲁棒性问题以及与其在看到和看到的精度上的折衷相关联的问题。数据。我们提出了一个新的数据集,用于研究对话系统对OOD输入的鲁棒性,这是bAbI Dialog Task 6以受控方式增加了OOD内容。然后,我们提出了转弯辍学,这是一种简单而有效的基于负采样的技术,用于提高神经对话模型的鲁棒性。我们将其有效性应用于混合代码网络 - 家庭模型(HCN),这些模型在我们的OOD增强数据集以及原始数据集上达到最先进的结果。具体而言,受过甩尾训练的HCN在增强数据集的OOD转向和74%F1得分作为OOD探测器时具有超过75%的每个发声准确度的最先进性能。此外,我们引入了变化的HCN增强在原始bAbI任务6数据集中,丢失率超过56.5%,因此优于最初报告的HCN结果。
translated by 谷歌翻译