在本文中,我们提出了一个新的实体关系提取任务范例。我们将任务转换为多回合问题回答问题,即,实体和关系的提取被转换为从上下文识别答案跨度的任务。这种多转QA形式化有几个关键优势:首先,问题查询编码我们想要识别的实体/关系类的重要信息;其次,QA提供了一种自然的方式来联合建模实体和关系;第三,它允许我们利用完善的机器阅读理解(MRC)模型。在ACE和CoNLL04公司的实验表明,所提出的范例明显优于以前的最佳模型。我们能够获得所有ACE04,ACE05和CoNLL04数据集的最新结果,增加了三个数据集的SOTA结果49.6(+1.2),60.3(+0.7)和69.2(+1.4) , 分别。此外,我们构建了一个新开发的数据集RESUME,它需要多步推理来构造实体依赖关系,而不是先前数据集中三元组提取中的单步依赖提取。提出的多转QA模型也在RESUME数据集上实现了最佳性能。
translated by 谷歌翻译
传感器是现代物联网(IoT)应用程序不可或缺的一部分。对从这些系统的各个传感器获得的异构多变量时间数据的分析至关重要。在本文中,我们特别关注每个传感器可用的训练数据量稀少的问题。我们提出了一种新的联合多任务层次关注模型(FATHOM),它共同训练来自多个传感器的分类/回归模型。所提出的模型的注意机制寻求从输入中提取特征表示并且学习关注多个传感器的时间维度的共享表示。使用注意机制和长短期记忆(LSTM)网络的组合来模拟时间和非线性关系。我们发现我们提出的方法在活动识别和环境监测数据集的分类和回归设置中优于广泛的竞争基线。我们进一步提供了我们的模型在输入传感器级别和中央时间级别学习的特征表示的可视化。
translated by 谷歌翻译
面部地标定位是众多面部相关应用中非常关键的一步,例如面部识别,面部姿势估计,面部图像合成等。然而,之前的面部地标定位竞赛(即300-W,300-VW和Menpo挑战)旨在预测68点地标,这些地标无法描述面部构件的结构。为了克服这个问题,我们构建了一个具有挑战性的数据集,名为J-landmark。每个图像都用106点地标手动注释。这个数据集涵盖了姿势和表情的大变化,这给预测准确的地标带来了很多困难。我们与IEEE国际多媒体和博览会(ICME)2019一起在该数据集上举办了一场106点的面部地标定位竞赛1。本次比赛的目的是发现有效而强大的面部地标定位方法。
translated by 谷歌翻译
本文对各种机器学习(“ML”)方法的表现进行了比较研究,将判断分类为法律领域。使用6,227个新加坡最高法院判决的新数据集,我们调查了当前的NLP方法与传统统计模型的比较,当应用于包含少量但冗长的文档的法律语料库时。 Allapproaches测试,包括主题模型,单词嵌入和基于语言模型的分类器,只需几百个判断就能很好地完成。但是,需要做更多的工作来优化法律领域的最新方法。
translated by 谷歌翻译
单帧目标检测和分割技术的最新进展激发了广泛的工作,以扩展这些方法来处理视频流。在本文中,我们探讨了针对耐力敏感应用程序的强烈关注的想法。我们的方法选择并仅处理帧的一个小子窗口,而不是对每个帧进行单独推理。然后,我们的技术基于来自先前帧的子窗口和来自当前子窗口的更新来预测全帧。通过这种强硬注意机制的延迟减少是以降低精度为代价的。我们做了两件事来解决这个问题。首先,我们提出了一个专门的内存单元,可以在处理子窗口时恢复丢失的上下文。其次,我们采用基于Q学习的策略培训策略,使我们的方法能够智能地选择子窗口,使得内存中的陈旧性对性能的影响最小。我们的实验表明,我们的方法可以将延迟减少大约四倍,而不会显着牺牲ImageNet VID视频对象检测数据集和DAVIS视频对象分割数据集的准确性。我们进一步证明,我们可以将已保存的计算重新投入网络的其他部分,从而导致在与原始系统相当的计算成本下的准确度增加,并击败其他最近提出的低延迟范围的最新方法。
translated by 谷歌翻译
常识性知识和常识推理是机器智能的主要瓶颈。在NLP社区中,已经创建了许多基准数据集和任务来解决语言理解的常识推理。这些任务旨在评估机器获取和学习常识知识的能力,以便推理和理解自然语言文本。由于这些任务成为工具和常识研究的推动力,本文旨在概述现有的任务和基准,知识资源,以及对自然语言理解的常识推理的学习和推理方法。通过这一点,我们的目标是支持更好的理解theart的状态,它的局限性和未来的挑战。
translated by 谷歌翻译
在这项工作中,我们提出离散参与推断重复(离散空气),一个具有结构潜在分布的逆流自动编码器,包含离散分类分布,连续属性分布和因子空间注意。虽然受到原始AIR模型的启发并且保留了AIR模型识别图像中对象的能力,但Discrete-AIR提供了潜在代码的直接可解释性。我们展示了对于Multi-MNIST和dSprites数据集的多对象版本,Discrete-AIR模型只需要一个分类潜在变量,一个属性变量(仅适用于Multi-MNIST),以及空间注意变量,以进行有效推理。我们的性能分析表明,学习的分类分布有效地捕获了场景中的物体类别,用于Multi-MNIST和Multi-Sprites。
translated by 谷歌翻译
用于视频对象分割(VOS)的许多最近成功的方法过于复杂,严重依赖于第一帧上的微调和/或低,因此实际使用有限。在这项工作中,我们建议FEELVOS是一种简单快速的方法,不依赖于微调。为了对视频进行分类,对于每个帧,FEELVOS使用语义像素方式嵌入与全局和局部匹配机制一起将信息从视频的第一帧和前一帧传送到当前帧。与以前的工作相比,我们的嵌入仅用作卷积网络的内部指导。我们的新型动态分段头允许训练网络,包括嵌入,端到端的多对象分割任务,具有交叉熵损失。我们在视频对象分割方面实现了新的技术水平,而没有对DAVIS 2017验证集进行微调,J&F测量值为69.1%。
translated by 谷歌翻译
状态空间模型(SSM)已被广泛应用于大型序列数据集的分析和可视化。顺序蒙特卡罗(SMC)是一种非常流行的基于粒子的方法,用于从难处理的外壳中对潜伏状态进行采样。然而,SSM受到提案选择的显着影响。最近哈密尔顿蒙特卡洛(HMC)抽样在许多实际问题上取得了成功。在本文中,我们提出了一个由HMC(HSMC)增强的SMC,用于非线性SSM的推理和模型学习,这可以使我们免于学习建议并显着降低模型复杂度。基于HMC的测量保持特性,由过渡函数直接产生的粒子可以任意地近似于潜状态的后验。为了更好地适应潜在空间的局部几何,HMC是在由正定量度量定义的黎曼流形上进行的。此外,我们证明了所提出的HSMC方法可以改善由高斯过程(GP)和神经网络(NN)实现的SSM。
translated by 谷歌翻译
制冷和冷却器优化是机械工程中一个重要且经过充分研究的重要课题,主要利用物理模型,这些模型是在过度简化的假设之上设计的。使用物理模型的常规优化技术基于硬件规范和外部条件(例如,室外天气)的非常有限的信息来做出在线参数调整的决定。近年来,新一代传感器正成为新冷水机组的重要组成部分,首次使系统管理员能够及时准确地持续监控所有设备的运行状态。在机器学习和数据挖掘不断提高的分析能力的推动下,数据流向数据库的爆炸性增长为数据驱动方法提供了实时冷却器工厂优化的新可能性。本文介绍了我们在采用数据模型和优化工厂的研究和工业经验,并讨论了我们在实际世界植物上的实践经验教训。我们强调将适当的领域知识纳入数据分析工具,而不是采用复杂的机器学习模型,这些工具相对于最先进的深度学习技术而言,成为关键的性能改进者。我们对真实世界冷水机组的实证评估实现了每日电力消耗的节省超过7%。
translated by 谷歌翻译