问答(QA)作为一个研究领域,主要关注知识库(KB)或自由文本作为知识来源。这两个来源在历史上形成了通过资源提出的各种问题,以及为解决这些问题而开发的方法。在这项工作中,我们看到QA的实际用例,而不是用户指导的知识,它将结构化QA的元素与知识库,非结构化QA与叙述相结合,将多关系QA的任务引入个人叙述。作为实现这一目标的第一步,我们做出了三个关键贡献:(i)我们生成并发布TextWorldsQA,一组五个不同的数据集,whereeach数据集包含动态叙述,描述模拟世界中的实体和关系,与可变组成问题配对知识,(ii)我们在这项任务中对几个最先进的QA模型及其变体进行了全面的评估和分析,以及(iii)发布了一个轻量级的基于Python的框架,我们称之为TextWorlds,可以轻松生成任意的额外世界和叙事,目标是允许社区创建和分享越来越多的不同世界作为此任务的测试平台。
translated by 谷歌翻译
我们考虑使用神经嵌入方法学习KB中实体和关系的表示。我们证明了大多数现有的模型,包括NTN(Socher等,2013)和TransE(Bordes等,2013b),可以在统一的学习框架下进行推广,其中实体是从神经网络中获得的低维向量,关系是双线性和/或线性映射函数。在此框架下,我们在链接预测任务上比较各种嵌入模型。我们证明了一个简单的双线性公式可以为任务实现最新的最终结果(在Freebase上实现TransE的前10精度为73.2%和54.7%)。此外,我们引入了一种新方法,利用学习的关系嵌入来挖掘逻辑规则,如“BornInCity(a,b)和CityInCountry(b,c)=>国籍(a,c)”。我们发现从双线性目标中学习的嵌入特别擅长于捕获关系语义,并且关系的组成以矩阵乘法为特征。更有趣的是,我们证明了基于嵌入的规则提取方法在挖掘涉及组合推理的Horn规则中成功地优于基于信任的最先进规则挖掘方法。
translated by 谷歌翻译
背景:药代动力学评价是药物发现和开发的关键过程之一。然而,目前的吸收,分布,代谢,排泄预测模型仍然具有有限的准确性。目的:本研究旨在构建一个综合的转移学习和多任务学习方法,用于开发定量结构 - 活性关系模型,预测四种人体药代动力学参数。方法:药代动力学数据集包括1104种美国FDA批准的小分子药物。该数据包括四个人体药代动力学参数子集(口服生物利用度,血浆蛋白结合率,稳态分布的表观体积和消除半衰期)。对预先训练的模型进行了超过3000万生物活性数据的训练。建立了综合转移学习和多任务学习方法,以加强模型的推广。结果:药代动力学数据集分为三个部分(60:20:20)进行训练,验证和测试,采用改进的最大不相似算法,代表初始集选择算法和加权距离函数。多任务学习技术增强了模型的可预测性。综合转移学习和多任务学习模型表现出最佳的准确性,因为深度神经网络具有一般的特征提取能力,转移学习和多任务学习改进了模型的推广。结论:首先介绍了改进数据集分裂算法的综合转移学习和多任务学习方法,以预测药代动力学参数。该方法可以进一步用于药物发现和开发。
translated by 谷歌翻译
我们提出并分析了$(1,\ lambda)$进化算法的自适应版本,其中当前的突变率是个体的一部分,因此也受到突变。对OneMax基准测试函数进行严格的运行时分析,发现当一个简单的局部变异方案导致$ O(n \ lambda / \ log \ lambda + n \ log n)$时的预期优化时间(适应度评估次数)$ \ lambda $至少是$ C \ ln n $ forsome constant $ C> 0 $。对于$ \ lambda \ ge C \ ln n $的所有值,在所有基于$ \ lambda $ -parallelmutation的无偏黑框算法中,此性能是渐近最佳的。我们的结果表明,进化计算中的自适应可以在运行中找到复杂的最优参数设置。同时,证明了Doerr,Gie {\ ss} en,Witt和Yang~(GECCO~2017)提出的相对复杂的突变率自调整方案可以用我们的简单内生方案代替。在技​​术方面,本文为分析动态参数选择中出现的二维漂移过程提供了新的工具,包括非恒定漂移过程中的占据概率。
translated by 谷歌翻译
我们提出了一个新的CogQA框架,用于多跳问题回答inweb-scale文档。受认知科学中的双重过程理论的启发,该框架通过协调隐式提取模块(系统1)和显式推理模块(系统2)逐步在迭代过程中构建\ textit {认知图}。在给出准确答案的同时,我们的框架进一步提供了可解释的推理路径。具体而言,基于BERT和图形神经网络的实现有效处理了HotpotQAfullwiki数据集中的多跳推理问题的数百万个文档,在排行榜上获得了34.9的联合$ F_1 $得分,而最佳竞争对手的得分为23.6。
translated by 谷歌翻译
视觉定位是一个有吸引力的问题,它基于查询图像估计来自数据库图像的相似定位。它是各种应用的关键任务,例如自动驾驶汽车,辅助导航和增强现实。任务的挑战性问题在于查询和数据库图像之间的不同外观变化,包括照明变化,季节变化,动态对象变化和观点变化。为了应对这些挑战,本文提出了全景环形透镜和强大的深度图像描述符的全景环形定位器。处理由单个摄像机捕获的全景环形图像并将其馈送到NetVLAD网络中以形成活动的深度描述符,并且利用顺序匹配来生成定位结果。在公共数据集和现场进行的实验说明了所提出的系统的验证。
translated by 谷歌翻译
从图像中自动消除雨水效果有许多应用,例如自动驾驶,无人机驾驶和照片编辑,并且仍然吸引了许多人的注意力。传统方法使用启发式手工制作各种先验,以从图像中移除或分离雨效果。最近提出了基于端到端深度学习的去除方法以提供更大的灵活性和有效性。然而,当遇到大雨的图像时,它们往往不会获得良好的视觉效果。大雨带来了不仅有雨的条纹,还有由于微小雨滴积聚而产生的雾状效应。与以往的去除方法不同,在本文中,我们使用新的雨模型来模拟雨水图像,不仅可以去除雨水条纹,还可以消除类似雾霾的效果。在我们的模型的指导下,我们设计了一个双分支网络来容忍其参数。然后,联合训练SPP结构以改进我们模型的结果,以便灵活地控制去除雾状效果的程度。此外,提出了一种可以定位雨天像素的子网,以指导我们的网络训练。在几个数据集上的广泛实验表明,我们的方法在目标评估和视觉质量方面都优于最先进的技术。
translated by 谷歌翻译
空间音频是观众对3D视觉和听觉体验的重要媒介。然而,记录设备和技术是昂贵的或者对于普通大众来说是不可访问的。在这项工作中,我们提出了一个自我监督的音频空间化网络,可以在给定相应的视频和单声道音频的情况下生成空间音频。为了增强空间化性能,我们使用辅助分类器对地面实况视频和左右声道交换的视频分类进行分类。我们收集具有空间音频的大型视频数据集以验证所提出的方法。实验结果证明了该模型在音频空间化任务中的有效性。
translated by 谷歌翻译
给定图形模型(GM),计算其分区函数是最重要的推理任务,但它在计算上通常是难以处理的。针对该问题,探索GM的某些局部结构/一致性的迭代近似算法已被研究作为实践中的流行选择。然而,由于它们的局部/迭代性质,它们经常输出异常或甚至不收敛,例如,在低温状态(大参数的硬实例)中。为了克服这个限制,我们提出了利用GM的全局光谱特征的新方法。我们的贡献是双重的:(a)我们首先提出一种完全多项式时间近似方案(FPTAS),用于近似与低阶秩耦合矩阵相关的GM的分区函数; (b)对于一般的高阶GM,我们利用(a)作为子程序设计一个光谱领域方案,其中它将高阶GM近似为秩-1 GM的乘积,以便有效地近似分区函数。所提出的算法在运行时间和精度上比现有方法更稳健,即,既不会遇到收敛问题,也不依赖于硬局部结构,如我们的实验所示。
translated by 谷歌翻译
贝叶斯推理的现代应用涉及足够复杂的模型,相应的后验分布是必需的并且必须近似。最常见的近似是基于马尔可夫链蒙特卡罗,但是当数据集很大和/或模型很复杂时这些可能很昂贵,因此更有效的变分近似最近得到了相当多的关注。传统的变分方法,旨在最小化Kullback - Leibler在相对简单的参数族之间的差异,提供后验均值的准确和有效的估计,但往往不捕捉其他时刻,并且在模型方面有局限性。它们可以应用。在这里,我们提出了基于最小化Fisher散度的变分近似的构造,并开发了一种有效的计算算法,该算法可以应用于各种模型而无需共轭或可能不现实的中心假设。我们证明了所提出的方法对于逻辑回归的基准情况的优越性能。
translated by 谷歌翻译