本文介绍了一种新的开放式域名问答框架,其中猎犬和读者互相迭代地互动。框架与机器读取模型的体系结构无关,只需要访问读取器的令牌级隐藏表示。 Theretriever使用快速最近邻搜索来缩放到包含数百万个段落的语料库。门控循环单元在读取器状态的每个步进条件下更新查询,并且重新构造的查询用于通过检索器对段落进行排序。我们进行分析并显示有用的互动有助于从信息中检索信息性段落。最后,我们展示了我们的多步推理框架在应用于各种大型开放域数据集的两个广泛使用的读者架构Dr.DrQA和BiDAF时带来了一致的改进 - TriviaQA-unfiltered,QuasarT,SearchQA和SQuAD-Open。
translated by 谷歌翻译
当今世界的大量信息存储在结构化和半结构化的知识库中。查询这些数据库的高效且简单的方法是必不可少的,不能仅限于那些在正式查询语言中具有专业知识的人。语义解析领域涉及将自然语言话语转换为可在知识库上轻松执行的逻辑形式。在本次调查中,我们研究了语义分析系统的各个组成部分,并讨论了从基于初始规则的方法到当前神经方法到程序合成的突出工作。我们还讨论了使用不同级别的监视操作的方法,并突出了学习这些系统所涉及的关键挑战。
translated by 谷歌翻译
我们提出了一种神经机器读取模型,它从程序文本构建动态知识图。它针对所描述的过程的每个步骤循环地构建这些图,并使用它们来跟踪参与实体的演变状态。我们利用并扩展最近提出的机器阅读理解(MRC)模型来查询实体状态,因为这些状态通常在文本的跨度中传递,并且MRC模型执行良好的不提取的以实体为中心的跨度。正如我们经验证明的那样,我们的模型构造的显式,结构化和不断发展的知识图表示可以用于下行问题回答任务,以提高文本的机器理解能力。在最近提出的PROPARA数据集(Dalvi et al。,2018)的两个理解任务中,我们的模型实现了最先进的结果。我们进一步表明,我们的模型在RECIPES数据集上具有竞争力(Kiddon等,2015),表明它可能是普遍适用的。我们提供了一些证据,证明模型的知识图有助于它对其预测施加常识约束。
translated by 谷歌翻译
The recent work of Clark et al. (2018) introduces the AI2 Reasoning Challenge (ARC) and the associated ARC dataset that partitions open domain, complex science questions into an Easy Set and a Challenge Set. That paper includes an analysis of 100 questions with respect to the types of knowledge and reasoning required to answer them; however, it does not include clear definitions of these types, nor does it offer information about the quality of the labels. We propose a comprehensive set of definitions of knowledge and reasoning types necessary for answering the questions in the ARC dataset. Using ten annotators and a sophisticated annotation interface, we analyze the distribution of labels across the Challenge Set and statistics related to them. Additionally , we demonstrate that although naive information retrieval methods return sentences that are irrelevant to answering the query, sufficient supporting text is often present in the (ARC) corpus. Evaluating with human-selected relevant sentences improves the performance of a neu-ral machine comprehension model by 42 points.
translated by 谷歌翻译
缺乏医生处方指南是美国目前阿片类药物流行的一个关键驱动因素。在这项工作中,我们分析了药物药物索赔数据,以了解最初合成阿片类药物后更容易出现不良后果的患者特征。为此,我们提出了一种生成模型,该模型允许从亚组的观察数据中发现,这些数据显示由于治疗而增加或减少的因果效应。我们的方法将子群作为混合分布进行建模,使用稀疏性来增强解释性,同时联合学习潜在结果的非线性预测因子以更好地调整混淆。该方法导致对已发现的子群的人类可解释的见解,提高决策支持的实用性
translated by 谷歌翻译
我们介绍ARCHANGEL;一种新颖的分布式分类帐系统,用于确保数字视频档案的长期完整性。首先,我们描述了一种新的深度网络架构,用于计算持续时间为几分钟或几小时的视听流中的紧凑时间内容哈希(TCH)。我们的TCH对意外或恶意内容修改(篡改)敏感,但不适用于用于编码视频的编解码器。这是必要的,因为档案馆要求随着时间的推移格式化移动视频以确保无缝可访问性。其次,我们描述了TCH(以及用于驱动它们的模型)是如何通过分布在多个独立档案中的权威证明区块链来保护的。我们报告了ARCHANGEL在英国,爱沙尼亚和挪威的国家政府档案参与的试验部署背景下的功效。
translated by 谷歌翻译
尽管存在大量的事实信息库,但跨维信息图(例如维基数据和谷歌知识图)只能为实体提供简短的概要描述。这样的描述可以简要地识别实体的最明显的特征,使得读者能够近乎即时地了解他们所呈现的实体类型。它们还可以帮助完成诸如命名实体化同义词,本体类型确定和回答实体查询之类的任务。给知识图中快速增加的实体数量,从基础事实信息中完全自动化合成简洁的文本描述是必不可少的。为此,我们提出了一种新颖的事实 - 序列编码器 - 解码器模型,其具有合适的复制机制,以生成对实体的简明和精确的文本描述。在深入评估中,我们证明我们的方法明显优于最先进的替代方案。
translated by 谷歌翻译
成立I4U联盟是为了促进联合进入NISTspeaker识别评估(SRE)。这种关节提交的最新版本在SRE 2018中,其中I4U提交是最佳表现系统之一。 SRE'18也标志着I4Uconsortium进入NIST SRE系列评估10周年。本文的主要目的是总结基于提交给SRE'18的各子系统及其融合的结果和经验教训。我们也有意提出一个共同观点,即我们在过去十年中从SRE'08到SRE'18见证了SRE参与者的进步,进展和主要范式转变。在这方面,除其他外,我们已经看到从超向量表示到深度说话人嵌入的范例转换,以及从信道补偿到领域适应的研究挑战的转变。
translated by 谷歌翻译
最近,深度模型已成功应用于多种应用,尤其是低级表示。然而,稀疏,嘈杂的样本和结构域(具有多个对象和交互)是大多数深层模型中的一些开放挑战。 Column Networks,一种深层架构,可以捕获这样的域结构和交互,但仍然可以从稀疏和噪声样本中进行次优学习。受人工智能中人工建议指导学习的成功启发,特别是在数据遗留物中,我们提出了知识增强列网络,利用人类的设备/知识,通过噪声/稀疏样本更好地学习。我们的实验表明,我们的方法可以带来更好的整体性能或更快的收敛(即有效和高效)。
translated by 谷歌翻译
人体的整个运动经历了一个名为Gait Cycle的周期性过程。人脚的结构是成功完成周期的关键因素。这种足部结构的异常是先天性疾病的一种惊人形式,其导致基于人类足印图像的几何形状的分类。图像处理是确定一系列足迹参数以检测紊乱严重程度的最有效方法之一。本文旨在通过生物医学图像处理,使用一个名为Modified Brucken Index的足迹参数来检测扁平足和高拱足异常。
translated by 谷歌翻译