理解人类的语言需要复杂的世界知识。然而,现有的大规模知识图主要关注实体的知识,而忽略了关于活动,状态或事件的知识,这些知识用于描述实体或事物在现实世界中的行为方式。为了填补这一空白,我们开发了ASER(活动,状态,事件及其关系),这是一种从超过110亿个令牌结构的文本数据中提取的大规模可能性知识图。 ASER包含15种属于五类的关系类型,1.94亿个独特的可能性,以及6400万个独特的边缘。人类和外在的评估都证明了ASER的质量和有效性。
translated by 谷歌翻译
在本文中,我们提出了弱监督文档级多方面情感分类的变分方法。我们使用目标 - 意见词对作为“监督”,而不是使用由域专家提供的用户生成的评级或注释。可以使用依赖性解析器和简单规则来提取这些单词对。我们的目标是预测给定目标词的anopinion词,而我们的最终目标是学习情感极性分类器来预测文档中每个方面的情感极性。通过将潜在变量(即情感极性)引入目标函数,我们可以通过变分下界将情感极性分类器注入目标。我们可以通过优化下限来学习asentiment极性分类器。我们表明,我们的方法可以胜过在TripAdvisor和BeeAdvocate数据集上的弱监督基线,并且可以与最先进的监督方法相媲美,每个方面有数百个标签。
translated by 谷歌翻译
问答(QA)已成为人类获取众多知识库的流行方式。与网络搜索不同,基于知识库的质量保证会提供准确而简洁的结果,前提是自然语言问题可以被理解并精确映射到知识库上的结构化查询。然而,挑战在于人类可以用不同的方式提出一个问题。以前的方法由于其代表性而具有自然限制:基于规则的方法仅理解一小组“罐头”问题,而基于关键词或基于同义词的方法不能完全理解问题。在本文中,我们设计了一种新的问题表示:模板,超过十亿规模的知识库和百万级QA语料库。例如,对于一个城市人口的问题,我们会学习模板,比如什么是$ city的人口?,$ city中有多少人?我们为2782个意图学习了2700万个模板。基于这些模板,我们的QA系统KBQA有效地支持二元仿真问题,以及由一系列二元仿真问题组成的复杂问题。此外,我们扩展了RDF知识库中的谓词,将知识库的覆盖范围提高了57倍。我们的质量保证系统在有效性和效率方面的所有其他最先进的工作系统超过了QALD基准。
translated by 谷歌翻译
分层文本分类有许多实际应用。但是,标记大量文档的成本很高。在实践中,我们可以使用半监督学习或弱监督学习(例如,无数据分类)来降低标签成本。在本文中,我们提出了一种路径成本敏感的学习算法,以利用结构信息,并进一步利用未标记和弱标记的数据。我们使用生成模型来利用大量未标记的数据,并将路径约束引入学习算法,以合并类层次结构的结构信息。未标记和弱标记数据的后验概率可以与路径依赖性核心结合。由于我们将结构敏感成本置于学习算法中,以保证与类层次结构一致的分类,并且不需要重构不同结构的特征向量,因此与结构输出学习相比,我们可以显着降低计算成本。两个分层文本分类基准的实验结果表明,我们的方法不仅有效,而且有效地处理半监督和弱监督的分层文本分类。
translated by 谷歌翻译
由于不准确的检测和识别,自主车辆可能做出错误的决定。因此,智能车辆可以将自己的数据与其他车辆相结合,提高感知能力,从而提高检测精度和驾驶安全性。然而,多车协同感知要求现实世界场景的整合和原始传感器数据交换的流量远远超过现有车载网络的带宽。据我们所知,我们是第一个对原始数据级合作感知进行研究的人。提高自驾系统的检测能力。在这项工作中,依靠LiDAR 3D点云,我们完成了从连接车辆的不同位置和角度收集的传感器数据。提出了一种基于点云的三维物体检测方法,用于对齐点云的多样性。 KITTI和我们收集的数据集的实验结果表明,所提出的系统通过扩展感知区域优于感知,提高了检测精度并促进了增强结果。最重要的是,我们证明可以通过现有的车载网络技术传输用于协作感知的pointclouds数据。
translated by 谷歌翻译
引入内在奖励来模拟人类智能如何运作,这通常通过内在动机的游戏来评估,即没有外在奖励的游戏,但是用外在奖励进行评估。然而,在这种非常具有挑战性的内在动机游戏环境下,现有的内在奖励方法都不能达到人类水平的表现。在这项工作中,我们提出了一种新颖的狂妄自大驱动的内在奖励(大奖励),据我们所知,这是第一种在内在动机游戏中实现可比较的人类表现的方法。超级奖励的出发来自于婴儿的智力在他们试图获得对环境中的实体的更多控制时的发展;因此,超级奖励旨在最大化特定环境中代理人的实体控制能力。为了形成大型奖励,提出了一种关系转换模型来弥合直接控制和潜在控制之间的差距。实验研究表明,超级奖励可以(i)大大超越最先进的内在奖励方法,(ii)通常达到与Ex-PPO和专业人类级别得分相同的表现水平; (iii)在与外在进展相结合时也具有优越的表现。
translated by 谷歌翻译
图神经网络(GNNs)受到越来越多的关注,部分归功于它们在许多节点和图形分类任务中的优越性能。然而,对于它们的学习和学习图形功能的复杂性缺乏了解。在这项工作中,我们首先提出了图形特征网络(GFN),一个简单的轻量级神经网络,在一组图形增强特征上定义。然后,我们建议将图形分类上的GNN解剖为两部分:1)图形过滤,其中执行基于图形的邻域聚合;以及2)集合函数,其中组成一组隐藏节点特征用于预测。为了分别测试这两个部分的重要性,我们通过线性化GNN的图形过滤部分来证明和利用GFN可以导出的连接。根据经验,我们对常见的图表分类基准进行了评估。令我们惊讶的是,我们发现,尽管有简化,但GFN可以匹配或超过最近提出的GNN产生的最佳精度,只需要一小部分计算成本。我们的结果为GNN学习的功能和当前评估它们的基准提供了新的视角。
translated by 谷歌翻译
机器学习和计算机科学中的许多凸问题共享相同的形式:\ begin {align *} \ min_ {x} \ sum_ {i} f_i(A_i x + b_i),\ end {align *}其中$ f_i $是凸函数on $ \ mathbb {R} ^ {n_i} $,常数为$ n_i $,$ A_i \ in \ mathbb {R} ^ {n_i \ times d} $,$ b_i \ in \ mathbb {R} ^ {n_i} $和$ \ sum_i n_i = n $。这个问题推广了线性规划,包括许多问题,经验风险最小化。在本文中,我们给出了一个运行intime \ begin {align *}的算法O ^ *((n ^ {\ omega} + n ^ {2.5 - \ alpha / 2} + n ^ {2+ 1/6}) \ log(n / \ delta))\ end {align *}其中$ \ omega $是matrixmultiplication的指数,$ \ alpha $是矩阵乘法的双指数,$ \ delta $是相对精度。请注意,运行时只对条件数或其他数据相关参数具有对数依赖性,并且这些参数在$ \ delta $中捕获。对于当前绑定的$ \ omega \ sim 2.38 $ [Vassilevska Williams'12,Le Gall'14]和$ \ alpha \ sim 0.31 $ [Le Gall,Urrutia'18],我们的运行时$ O ^ *(n ^ {\ omega} \ log(n / \ delta))$匹配当前最佳解决密集最小二乘回归问题,这是我们考虑的问题的一个特例。最近,[Alman'18]证明了目前所有已知的技术都无法提供低于$ 2.168 $的更好的$ \ omega $,这比$ 2 + 1/6 $更大。我们的结果推广了当前矩阵乘法时间[Cohen,Lee,Song'19]中线性程序的最新结果,以解决更广泛的问题。我们的算法提出了两个与[Cohen,Lee,Song'19]不同的概念:$ \ bullet $我们给出一个鲁棒的确定性中心路径方法,而前一个是随机中心路径,它通过randomsparse向量更新权重。 $ \ bullet $我们提出了一种有效的数据结构,即使权重更新向量密集,也能维持内点方法的中心路径。
translated by 谷歌翻译
我们介绍了DeepICP--一种新颖的端到端学习型3D点云注册框架,可以达到与先进的几何方法相当的注册精度。与通常需要RANSAC程序的其他基于关键点的方法不同,我们实现了使用各种深度神经网络结构来建立端到端的可训练网络。我们的关键点检测器通过这种端到端结构进行训练,并使系统能够避免动态对象的推断,利用静止物体上足够显着特征的帮助,从而实现高稳健性。不是在现有点之间搜索相应的点,而是关键的贡献是我们基于一组候选者之间的学习匹配概率创新地生成它们,这可以提高注册准确性。我们的损失功能结合了局部相似性和全局几何约束,以确保所有上述网络设计能够朝着正确的方向收敛。我们使用KITTI数据集和Apollo-SouthBay数据集全面验证了我们方法的有效性。结果表明,我们的方法比最先进的基于几何的方法实现了可比较的或更好的性能。包括详细的消融和可视化分析,以进一步说明我们网络的行为和见解。低注册错误以及我们方法的高稳健性使其对依赖点云注册任务的实质性应用具有吸引力。
translated by 谷歌翻译
早期发现肺癌是提高患者生存率的有效方法。在计算机断层扫描(CT)图像中准确检测肺结节是诊断肺癌的关键步骤。然而,由于肺结节的异质性和周围环境的复杂性,强大的结节检测一直是一项具有挑战性的任务。在这项研究中,我们提出了一种用于肺结节检测的两阶段卷积神经网络(TSCNN)架构。第一阶段的CNN架构基于改进的UNet分割网络,以建立肺结节的初始检测。同时,为了在不引入过多误报结节的情况下获得高召回率,我们提出了一种小说采样策略,并根据所提出的级联预测方法,使用离线硬挖掘思想进行训练和预测。第二阶段的CNN架构基于所提出的双池结构,其构建在三个3D CNN分类网络中用于假阳性减少。由于网络训练需要大量的训练数据,我们采用基于随机掩模的数据增强方法。此外,我们通过集成学习提高了误报减少模型的泛化能力。所提出的方法已经在LUNA数据集上进行了实验验证。实验结果表明,所提出的TSCNN架构可以获得有竞争力的检测性能。
translated by 谷歌翻译