机器学习系统定期处理实际应用中的结构化数据。遗憾的是,这种数据难以以大多数机器学习技术所期望的方式忠实地表示,即作为固定的预定大小的实值向量。在这项工作中,我们介绍了一种新方法,它将结构化数据编译成一个可满足性问题,该问题在其解决方案集中至少(通常只有)输入数据。可满足性问题由约束构成,这些约束是从给定签名先验地自动生成的,因此可以简单地允许构造输入的单词 - 矢量表示。方法在两个方面进行了演示,即自动推理和自然语言处理,在这些方面,它被证明在生成自然语言句子的矢量表示和一阶逻辑子句方面几近完美,可以将其转换回原始的结构化输入形式。
translated by 谷歌翻译
开放域问答(QA)是AI和NLP中的一个重要问题,它正在成为AI方法和技术普遍性进展的领头羊。通过信息检索方法和语料库构建的进步,开放域QA系统的大部分进展已经实现。在本文中,我们重点介绍最近推出的ARC Challengedataset,其中包含2,590个多项选择题,这些题目是为学校的科学考试而编写的。选择这些问题是当前QA系统中最具挑战性的问题,并且当前的现有技术性能仅比随机机会略好。我们提出了一个系统,它将agiven问题重写为用于从科学相关文本的大量语料库中检索支持文本的查询。我们的重写器能够整合来自ConceptNet的背景知识,并且与在SciTail上训练的通用textualentailment系统相结合,在检索结果中识别支持 ​​- 在端到端QA任务上优于几个强大的基线,尽管只是经过培训以识别基本术语在原始资源中。我们使用一般化的决策方法而不是检索证据并回答候选人以选择最佳答案。通过结合querygrriting,背景知识和文本蕴涵,我们的系统能够在ARC数据集上表现出几个强大的基线。
translated by 谷歌翻译
自然语言推理(NLI)是许多自然语言处理(NLP)应用程序的基础,包括语义搜索和问答。由于大规模,具有挑战性的数据集的发布,NLI问题得到了极大的关注。目前解决该问题的方法主要集中在基于学习的方法上,该方法仅使用文本信息来分类给定的前提是否与agiven假设相关,矛盾或中立。令人惊讶的是,使用基于结构化知识的方法 - 人工智能的一个中心主题 - 并没有受到与NLI问题相关的更多关注。虽然有许多开放的知识库包含各种类型的推理信息,但它们对NLI的使用还没有得到很好的探索。为了解决这个问题,我们提出了一些技术组合,利用知识图来提高科学问题领域中NLI问题的性能。我们提出了在文本,图形和基于文本到图形的模型上应用ourtechniques的结果,并讨论了使用外部知识解决NLI问题的重要性。 Ourmodel通过theSciTail科学问题数据集在NLI问题上实现了新的最先进的性能。
translated by 谷歌翻译
The recent work of Clark et al. (2018) introduces the AI2 Reasoning Challenge (ARC) and the associated ARC dataset that partitions open domain, complex science questions into an Easy Set and a Challenge Set. That paper includes an analysis of 100 questions with respect to the types of knowledge and reasoning required to answer them; however, it does not include clear definitions of these types, nor does it offer information about the quality of the labels. We propose a comprehensive set of definitions of knowledge and reasoning types necessary for answering the questions in the ARC dataset. Using ten annotators and a sophisticated annotation interface, we analyze the distribution of labels across the Challenge Set and statistics related to them. Additionally , we demonstrate that although naive information retrieval methods return sentences that are irrelevant to answering the query, sufficient supporting text is often present in the (ARC) corpus. Evaluating with human-selected relevant sentences improves the performance of a neu-ral machine comprehension model by 42 points.
translated by 谷歌翻译
常识知识关系对于高级NLU任务至关重要。我们检查CONCEPTNET中表示的这种关系的可学习性,考虑到它们的特定属性,这可以使关系分类变得困难:给定的概念对可以通过多种关系类型链接,并且关系可以具有不同语义类型的多字参数。我们探索了一种开放世界的多标签分类方法,该方法侧重于评估个体关系的分类准确性。在深入研究CONCEPTNET资源的特定属性的基础上,我们研究了不同关系表示和模型变化的影响。我们的分析表明,论证类型的复杂性和相关模糊性是要解决的最重要的挑战。我们设计了自定义评估方法,以解决在未来工作中可以扩展的资源的不完整性。
translated by 谷歌翻译
我们提出了一个新的CogQA框架,用于多跳问题回答inweb-scale文档。受认知科学中的双重过程理论的启发,该框架通过协调隐式提取模块(系统1)和显式推理模块(系统2)逐步在迭代过程中构建\ textit {认知图}。在给出准确答案的同时,我们的框架进一步提供了可解释的推理路径。具体而言,基于BERT和图形神经网络的实现有效处理了HotpotQAfullwiki数据集中的多跳推理问题的数百万个文档,在排行榜上获得了34.9的联合$ F_1 $得分,而最佳竞争对手的得分为23.6。
translated by 谷歌翻译
交通信号控制是一种新兴的应用场景,用于加强学习。除了作为影响人们通勤日常生活的重要问题之外,交通信号控制在适应动态交通环境和协调包括车辆和行人在内的数千名代理人方面对于强化学习提出了独特的挑战。现代强化学习成功的关键因素依赖于商品模拟器来生成大量用于学习的数据样本。然而,最常用的开源流量模拟器SUMO不能扩展到大型公路网和大流量,这阻碍了对交通场景的强化学习的研究。这促使我们创建一个新的流量模拟器CityFlow,它具有基本优化的数据结构和高效的算法。 CityFlow可以根据合成和真实数据支持灵活的道路网络和交通流量定义。它还提供了用户友好的强化学习界面。最重要的是,CityFlow比SUMO快20多倍,并且能够通过交互式渲染形式监控来支持全市范围的交通模拟。除了交通信号控制,CityFlow还可以作为其他交通研究的基础,并为智能交通领域的测试机器学习方法创造新的可能性。
translated by 谷歌翻译
研究人员经常通过他们的应用程序编程接口(API)查询在线社交平台,以找到目标人群,例如人类患有疾病的人[\ cite {De-Choudhury2017}和jazzmusicians~ \ cite {heckathorn2001finding}。这些目标群体的实体满足通常使用oracle(人类或预先训练的分类器)识别的属性。当目标实体的属性不能通过API直接查询时,我们将属性称为“隐藏”,将人口称为隐藏群体。在社交网络上查找属于这些人群的人很难,因为他们是不可查询的,并且采样器必须从有限预算限制内的组合查询空间进行探索。通过利用可查询属性和感兴趣的人口之间的相关性以及通过对查询空间进行分层排序,我们提出了一个基于决策树的Thompson采样器(\ texttt {DT-TMP}),可以有效地发现要查询的正确属性组合。我们提出的采样器在在线实验中的表现优于最先进的采样器,例如推特上的54%。当离线实验中已知查询的匹配程度数时,\ texttt {DT-TMP}在基线采样器上的执行速度比0.9-1.5 $ \ times $好。在未来,我们希望通过制定更复杂的查询来探索寻找隐藏人口的选择。
translated by 谷歌翻译
视频编码是所有流行视频流方法中的关键步骤。在视频质量,压缩和计算效率方面取得了很大进展。最近,人们一直希望找到从机器学习的快速发展领域应用技术的方法,以进一步改进视频编码。我们提出了一种使用卷积神经网络来帮助改进各种标准编码方法输出的方法。我们的方法的新颖性是训练多组不同的网络参数,每组都对应于特定的短视频段。网络参数集数组动态扩展以匹配任何长度的视频。我们证明了我们的方法可以提高标准视频编码的质量和压缩效率。
translated by 谷歌翻译
最近的研究表明,人们食用的环境会影响他们的营养行为。在这项工作中,我们提供自动工具,通过检查每日记录的以自我为中心的照片流来对个人的健康习惯进行个性化分析。具体来说,我们提出了一种新的自动方法,用于食物相关环境的分类,能够对多达15个这样的场景进行分类。通过这种方式,人们可以监控他们的食物摄入量,从而客观地了解他们的日常生活习惯。我们提出了一种模型,用于对在语义层次结构中组织的与食物相关的场景进行分类。此外,我们提供并提供了一个新的自我中心数据集,该数据集由一个由可穿戴相机记录的超过33000个图像组成,我们提出的模型已经过测试。我们的方法获得的准确度和F分数分别为56%和65%,明显优于基线方法。
translated by 谷歌翻译