我们提出了一种深度强化学习方法来优化静态编译器中计算图的执行成本。关键思想是将神经网络策略与遗传算法 - 偏差随机密钥遗传算法(BRKGA)相结合。在给定要优化的输入图的情况下,策略被训练以预测BRKGA中的采样突变和交叉的节点级概率分布。我们的方法“基于REINFORCE的遗传算法学习”(REGAL)使用该策略转移到新图表的能力,以显着提高遗传算法的解决方案质量,以获得相同的客观评估预算。作为一个具体的应用,我们通过联合优化设备布局和调度来显示TensorFlow图中最小化峰值记忆的结果。在以前看不见的图表上,REGAL的峰值内存平均比BRKGA低3.56%,优于我们比较的所有算法,并且比下一个最佳算法的改进大4.4倍。我们还对生产编译器团队的XLA图表性能基准进行了评估,并且比BRKGA平均降低了3.74%的峰值内存,再次超越了所有人。我们的方法和分析是通过收集372个独特的真实世界TensorFlow图表的数据集来实现的,这比以前的工作多了一个数量级。
translated by 谷歌翻译
模块化子系统的组件正在投入使用,以便在交通,医疗保健和工业自动化等高风险,时间关键任务中执行传感,推理和决策。我们通过使用强化学习来指导组成系统的一组交互模块的配置,从而增加了整体计算系统效用的机会。在全系统范围内进行优化的挑战是一个组合问题。通过修改其配置来提高特定模块性能的本地尝试通常会导致系统性能的整体效用损失,因为下游模块的输入分布急剧变化。我们提出了metareasoning技术,它考虑了输入的丰富表示,监视整个管道的状态,并在运行中调整模块的配置,以最大化系统操作的效用。我们通过各种强化学习技术在现实世界和合成管道中显示出显着的改进。
translated by 谷歌翻译
在“安全运营中心”(SoC)工作的安全分析师在确保组织安全方面发挥着重要作用。他们对不断演变和新攻击的背景知识数量在检测攻击的能力方面存在显着差异。开源威胁智能源(如有关网络攻击的文本描述)可以以结构化方式存储在网络安全知识图中。网络安全知识图对于帮助安全分析师检测网络威胁至关重要,因为它以可以查询的语义三元组的形式存储大量网络威胁信息。语义三元组包含twocybersecurity实体,它们之间有关系。在这项工作中,我们提出了一个系统来创建基于网络安全文本的语义三元组,使用深度学习方法来提取可能的关系。我们使用通过我们的系统生成的语义三元组集来在网络安全知识图中断言。安全分析师可以从知识图中检索此数据,并使用此信息来形成有关网络攻击的决策。
translated by 谷歌翻译
我们介绍了KnowBias,这是一个用于检测政治偏见等文本内容的系统,如社交媒体帖子和新闻文章。在可扩展文本分类的空间中,常见的问题是域不匹配,其中易于访问的训练数据(即,推文)在格式上不对应于期望的测试域(即,更长形式的文章内容)。虽然诸如单词或句子嵌入之类的通用文本编码器可以用于traintarget不可知分类器,但是这种方案导致在长篇文章上表现不佳。我们的主要观点是,长篇文章是中性和政治性句子的混合,而推文则集中在意见上。我们提出了一个两步分类系统,首先在评估时自动从输入文本文档中过滤掉中性句子,然后将得到的文本输入到极性分类器中。我们使用各种测试套件评估我们的两个测试套件,包括一组推文和长篇文章,其中注释是众包的,以减少标签噪声,测量准确性和Spearman-rho等级相关性。在实践中,KnowBias在这些推文上实现了86%(rho = 0.65)的高精度,在长篇文章中实现了75%(rho = 0.69)。
translated by 谷歌翻译
Recommender systems that can learn from cross-session data to dynamically predict the next item a user will choose are crucial for online platforms. However, existing approaches often use out-of-the-box sequence models which are limited by speed and memory consumption, are often infeasible for production environments, and usually do not incorporate cross-session information, which is crucial for effective recommendations. Here we propose Hierarchical Temporal Convolutional Networks (HierTCN), a hierarchical deep learning architecture that makes dynamic recommendations based on users' sequential multi-session interactions with items. HierTCN is designed for web-scale systems with billions of items and hundreds of millions of users. It consists of two levels of models: The high-level model uses Recurrent Neural Networks (RNN) to aggregate users' evolving long-term interests across different sessions, while the low-level model is implemented with Temporal Convolutional Networks (TCN), utilizing both the long-term interests and the short-term interactions within sessions to predict the next interaction. We conduct extensive experiments on a public XING dataset and a large-scale Pinterest dataset that contains 6 million users with 1.6 billion interactions. We show that HierTCN is 2.5x faster than RNN-based models and uses 90% less data memory compared to TCN-based models. We further develop an effective data caching scheme and a queue-based mini-batch generator, enabling our model to be trained within 24 hours on a single GPU. Our model consistently outperforms state-of-the-art dynamic recommendation methods, with up to 18% improvement in recall and 10% in mean reciprocal rank.
translated by 谷歌翻译
程序性文本描述了实体及其在某些过程中的相互作用,以独特的微妙方式描述实体。首先,eachentity可能有一些可观察到的离散属性,例如它的状态或位置;对这些进行建模涉及强加全局结构和强制执行一致性。其次,实体可能具有不明确的属性,但可以通过神经网络有效地诱导和跟踪。在本文中,我们提出了一种结构化的神经结构,它反映了实体演化的这种双重性质。模型周期性地跟踪每个实体,在每个步骤更新其隐藏的连续表示以包含相关的状态信息。全局离散状态结构用神经CRF显式建模,改变实体的隐藏表示。该CRF可以随着时间的推移明确地捕获对实体状态的约束,例如,强制执行该实体状态在销毁之后不能移动到某个位置。我们评估了我们提出的模型对QA任务的性能,而不是ProPara数据集中的过程段落,并发现我们的模型实现了最先进的结果。
translated by 谷歌翻译
对输入对象进行排序是许多机器学习管道中的重要步骤。然而,排序运算符在输入方面是不可微分的,这禁止基于端到端梯度的优化。在这项工作中,我们提出NeuralSort,一种通用的连续松弛排序运算符的输出,从置换矩阵到一组单模 - 随机矩阵,其中每行总和为1并具有不同的argmax。这种放松允许任何涉及分类操作的计算图的直接优化。此外,我们使用这种弛豫,通过在排列上导出分布的派拉克 - 卢斯分布族的重新参数化梯度估计,在组合大的空间上实现基于梯度的随机优化。我们在需要学习高维对象的语义排序的三个任务中证明了我们的框架的有用性,包括k-最近邻算法的完全可微分的参数化扩展。
translated by 谷歌翻译
我们考虑最近提出的语境马尔可夫决策过程(CMDP)的强化学习(RL)框架,其中代理具有与可能无限集合中选择的表格环境的一系列情形交互。这些环境的参数取决于在每集开始时代理可用的上下文向量。在本文中,我们在使用广义线性模型(GLM)从上下文获得MDP参数的设置中提出了一种无后悔的在线RL算法。拟议算法\ texttt {GL-ORL}依赖于有效的在线更新,并且还具有内存效率。我们对算法的分析在logit linkcase中给出了新的结果,并改善了线性情况下的先前界限。我们的算法使用高效的Online Newton Step更新来构建置信集。此外,还有强凸凸链接功能,我们还展示了从anyonline no-regret算法到置信集的一般转换。
translated by 谷歌翻译
流行病情报涉及使用信息(例如医院记录)和非正式来源(例如网络上的用户生成的文本)检测疾病爆发。在本次调查中,我们讨论了使用文本数据集的流行病学智能方法,将其称为“基于文本的智能智能”。我们从两大类来看过去的工作:健康提及分类(从大量选择相关文本)和健康事件检测(从相关文本集合中预测流行事件)。我们讨论的焦点是这两个类别的基本计算语言技术。该调查还提供了关于流行病情报的注释技术,资源和评估策略的最新技术细节。
translated by 谷歌翻译
神经网络在软件中变得越来越普遍,因此能够验证它们的行为是很重要的。因为验证神经网络的正确性极具挑战性,所以通常关注这些系统的其他属性的验证。特别是一个重要的特性是鲁棒性。然而,大多数现有的鲁棒性定义都集中在输入是对偶的最坏情况。这种鲁棒性的概念太强大,并且不太可能被实际的神经网络所满足和可验证。观察神经网络的实际输入是从非对抗性概率分布中得出的,我们提出了一种新的鲁棒性概念:概率鲁棒性,它要求神经网络具有至少$(1 - \ epsilon)$概率的鲁棒性。输入分布。这种概率方法是实用的,并提供了估计神经网络鲁棒性的原则方法。我们还提出了一种基于抽象解释和重要性抽样的算法,用于检查神经网络是否具有概率稳健性。我们的算法使用抽象解释来近似神经网络的行为,并计算违反鲁棒性的输入区域的近似。然后,它使用重要采样来抵消这种过度近似的影响,并计算出神经网络违反鲁棒性的概率的准确估计。
translated by 谷歌翻译