关系提取是构建文本数据内容的一项重要任务,在弱监督学习时变得尤其具有挑战性 - 只能给出有限数量的标记句子,并且可以获得大量未标记的句子。大多数现有工作利用未标记数据库的自我训练(即,引导模型)和多视图学习(例如,集合多个模型变体)的想法。然而,这些方法要么遭受语义漂移的问题,要么没有完全捕捉到关系提取的问题特征。在本文中,我们利用一个关键的洞察力,即检索表达关系的句子是预测给定句子的关系标签的双重任务---两个任务是互补的,可以联合优化以进行相互增强。为了对此模型进行建模,我们提出了DualRE,这是一个原理框架,它引入了与原始关系预测模块联合训练的aretrieval模块。通过这种方式,检索模块从未标记数据中选择的高质量样本可用于改进预测模块,反之亦然。实验结果\脚注{\小代码和数据可在\ url {https://github.com找到两个公共数据集上的/ INK-USC / DualRE}。}以及案例研究证明了DualRE方法的有效性。
translated by 谷歌翻译
最近,人们越来越关注在Elasticsearch中建立最近的邻居解决方案 - 这是最受欢迎的全文搜索引擎之一。在本文中,我们特别关注使用Elasticsearch的最接近邻居的汉明空间。通过结合三种技术:位操作,子串滤波和带置换的数据预处理,我们开发了一种名为FENSHSES(Hamming Space onElasticsearch中的快速精确邻居搜索)的新方法,它在现有术语matchbaseline上实现了显着的加速。这将使Elasticsearch具有快速信息检索的能力,即使文档(例如,文本,图像和声音)以二进制代码表示 - 这是当今语义表示学习的常见做法。
translated by 谷歌翻译
奖励塑造是解决强化学习(RL)中信用分配的关键但具有挑战性的问题的最有效方法之一。然而,设计整形函数通常需要很多专业知识和手工工程,并且考虑到多个相似的任务需要解决困难。 。在本文中,我们考虑奖励塑造任务的分配,并提出一个通用的元学习框架,以自动学习新采样任务的有效奖励塑造,假设只有共享的状态空间,但不一定是动作空间。我们首先在无模型RL的信用分配方面推动理论上最优的奖励形成。然后,我们提出一种基于价值的元学习算法,以提取有效的先验优于最优的奖励形成。先验可以直接应用于新任务,或者可以在几个梯度更新中解决任务时可证明适应任务后验。我们通过显着提高学习效率和各种设置的可解释可视化来展示我们塑造的有效性,包括从DQN到DDPG的成功转移。
translated by 谷歌翻译
大多数语言建模方法依赖于大规模数据来统计地学习单词的顺序模式。在本文中,我们认为单词是原子语言单位,但不一定是原子语义单位。受到HowNet的启发,我们使用人类语言中最小语义单位的sememes来表示语言建模后面的隐含语义,即名为驱动语言模型(SDLM)。更具体地说,为了预测下一个词,SDLM首先估计了sememe分布给出了文本背景。之后,它将每个sememe视为一个独特的语义专家,并且这些专家共同识别最可能的感官和相应的词。这样,SDLM启用了语言除了词级操作之外,模型还可以工作到细粒度的语义级语义,并为我们提供更多的功能,以便微调语言模型,提高可解释性以及语言模型的稳健性。语言建模实验和标题生成的下游应用证明了SDLM的显着性。可以通过以下网址访问实验中使用的源代码和数据:// github.com/thunpp/SDLM-pytorch。
translated by 谷歌翻译
用户的预期行为在很多领域都有广泛的应用。预测这些行为并采取积极措施优化业务成果是维持业务稳定增长的关键步骤。在这项工作中,我们专注于预测磨损,这是典型的用户预期行为之一。传统的磨损预测建模策略会受到一些固有的缺陷。为了克服这些局限性,我们提出了一种新颖的端到端学习方案,以跟踪预测模型的损耗模式的演变。它集成了基于多路径学习的用户活动日志,动态和静态用户配置文件。它通过建立衰减的多快照技术来利用历史用户记录。最后,它通过引导他们进行后续的学习过程,采用了先前的用户意图。因此,它解决了传统方法的所有缺点。我们在Adobe Creative Cloud提供的两个公共数据存储库和一个私有用户使用数据集上评估我们的方法。广泛的实验证明,与不同流行指标评定的几种现有方法相比,它可以提供吸引人的性能。此外,我们引入了先进的解释和可视化策略,以有效地表征用户活动日志的周期性。它可以帮助确定对用户流失和保留至关重要的重要因素,从而为业务实践提出可行的改进目标。我们的工作将为预测和阐明其他用户的预期行动提供有用的见解。
translated by 谷歌翻译
在本文中,我们专注于解决具有不完全信息的双人零和广泛游戏。反事实后悔最小化(CFR)是解决此类游戏的最流行算法,在实践中实现了最先进的性能。然而,CFR的表现并未完全理解,因为后悔的经验结果要好于\ cite {zinkevich2008regret}中证明的上限。 CFR的另一个问题是CFR必须在每一轮中遍历整个游戏树,这在大型游戏中是不能容忍的。在本文中,我们提出了一种新技术,即懒惰更新,它可以避免在CFR中遍历整个游戏树。此外,我们提出了对延迟更新的CFR的分析。我们的分析也可以应用于香草CFR,这会导致比已经证实的更严格的后悔限制{zinkevich2008regret}。受懒惰更新的启发,我们进一步展示了一种名为Lazy-CFR的新型CFR变体。与在vanilla CFR中遍历$ O(| \ mathcal {I} |)$信息集相比,Lazy-CFR每次只需要遍历$ O(\ sqrt {| \ mathcal {I} |})$信息集。遗憾的是,大约保持不变,其中$ \ mathcal {I} $是所有信息集的类。因此,与vanillaCFR相比,Lazy-CFR显示出更好的收敛结果。实验结果一致表明,Lazy-CFR显着优于vanilla CFR。
translated by 谷歌翻译
在这项工作中,开发了一个基于本体的AI辅助医学副作用(SE)预测模型,其中提出了三个主要组成部分,包括拟议模型的药物模型,治疗模型和AI辅助预测模型。为了验证所提出的模型,人工神经网络结构由224个中医处方建立和训练,这些处方从最着名的古代中医书籍和超过数千个SE报告中收集和分类,其中两个基于本体的归因,冷热,简单地介绍,以评估预测是否会导致SE或。结果初步揭示,它是基于神经学的归因与AI可以通过预测SE进行学习的相应指标之间的关系,这表明所提出的模型具有潜在的AI辅助SE预测。然而,应该注意的是,所提出的模型高度依赖于足够的临床数据,因此,更深入的探索对于提高预测的准确性是重要的。
translated by 谷歌翻译
在本文中,我们研究自动密钥短语生成。尽管常规方法对此任务表现出有希望的结果,但它们忽略了关键词之间的相关性,导致重复和覆盖问题。为了解决这些问题,我们提出了一种名为CorrRNN的关键词生成的新的序列到序列架构,它以两种方式捕获多个关键短语之间的相关性。首先,我们使用覆盖向量来指示源文档中的单词是否已由先前的短语汇总,以改善关键短语的覆盖率。其次,考虑前面的短语以消除重复的短语并改善结果的一致性。实验结果表明,我们的模型在准确性和多样性方面明显优于基准数据集上最先进的方法。
translated by 谷歌翻译
在本文中,我们描述了基于Elasticsearch的端到端基于内容的图像检索系统,Elasticsearch是一种着名且流行的文本搜索引擎。据我们所知,这是第一次在电子商务中实施这样一个系统,我们的努力结果证明是值得的。我们最终得到了一种新颖且令人兴奋的视觉搜索解决方案,该解决方案非常容易以易于使用的方式进行部署,分发,扩展和监控。此外,我们的平台本质上是灵活的,不支持多模式搜索,可以在检索中共享视觉和文本信息。核心思想是将图像特征向量编码为stringtokens的集合,使得更接近的向量将共享更多的字符串令牌。通过这样做,我们可以利用Elasticsearch根据编码的刺痛令牌中的相似性有效地检索相似图像。作为开发的一部分,我们提出了一种新的矢量到字符串编码方法,该方法在精度和延迟方面显示出基本上优于以前的编码方法。实施这个基于Elasticsearch的平台的第一手经验得到了广泛的解决,这对于对Elasticsearch建立视觉搜索引擎感兴趣的从业者也很有价值。
translated by 谷歌翻译
与专注于提高空间分辨率的传统高光谱超分辨率方法不同,光谱超分辨率旨在从RGB观察产生高分辨率高光谱图像,在光谱域中具有超分辨率。然而,准确地从每个像素的三个离散密度值重构高维连续光谱是具​​有挑战性的,因为在光谱域中对潜在高光谱图像进行下采样(例如,具有x10比例因子)以产生RGB的过程期间丢失了太多信息。观察。为了解决这个问题,我们提出了一种多尺度深度卷积神经网络(CNN)来将输入RGB图像明确地映射成高光谱图像。通过在协调范例中对中间特征图进行对称下采样和上采样,可以对局部和非局部图像信息进行联合编码以进行频谱表示,最终提高频谱重构精度。对大型高光谱数据集进行了大量实验,证明了该方法的有效性。
translated by 谷歌翻译