智能论文笔记

吸收，分布，代谢，排泄和毒性（ADMET）特性在药物发现中很重要，因为它们定义了功效和安全性。在这项工作中，我们应用了一系列功能，包括指纹和描述符，以及基于树的机器学习模型，极端的梯度增强，以进行准确的ADMET预测。我们的模型在Therapeutics Data Commons ADMET基准组中表现良好。对于22个任务，我们的模型在18个任务中排名第一，在21个任务中排名前3名。训练有素的机器学习模型集成在AdmetBoost，这是一家网络服务器，该网络服务器可在https://ai-druglab.smu.edu/admet上公开获得。

translated by 谷歌翻译

集成开发环境（IDE）提供工具支持，以自动化许多源代码编辑任务。传统上，IDE仅使用空间上下文，即开发人员正在编辑的位置来生成候选编辑建议。但是，仅空间上下文通常不足以自信地预测开发人员的下一个编辑，因此IDE在某个位置会产生许多建议。因此，IDE通常不会主动提供建议，而是需要单击特定图标或菜单，然后从大量潜在建议列表中进行选择。结果，开发人员通常会错过使用工具支持的机会，因为他们不知道它存在或忘记使用它。为了更好地理解开发人员行为中的常见模式并产生更好的编辑建议，我们还可以使用时间上下文，即开发人员最近执行的编辑。为了启用基于时间上下文的编辑建议，我们提出了《守望先锋》，这是一种从IDE中执行的开发人员编辑痕迹学习编辑序列模式的新颖技术。我们的实验表明，《守望先锋》具有78％的精度，守望先锋不仅完成了开发人员错过使用IDE工具支持的机会，而且还预测了在IDE中没有工具支持的新编辑。

translated by 谷歌翻译

在工厂或房屋等环境中协助我们的机器人必须学会使用对象作为执行任务的工具，例如使用托盘携带对象。我们考虑了学习常识性知识何时可能有用的问题，以及如何与其他工具一起使用其使用以完成由人类指示的高级任务。具体而言，我们引入了一种新型的神经模型，称为Tooltango，该模型首先预测要使用的下一个工具，然后使用此信息来预测下一项动作。我们表明，该联合模型可以告知学习精细的策略，从而使机器人可以顺序使用特定工具，并在使模型更加准确的情况下增加了重要价值。 Tooltango使用图神经网络编码世界状态，包括对象和它们之间的符号关系，并使用人类教师的演示进行了培训，这些演示是指导物理模拟器中的虚拟机器人的演示。该模型学会了使用目标和动作历史的知识来参加场景，最终将符号动作解码为执行。至关重要的是，我们解决了缺少一些已知工具的看不见的环境的概括，但是存在其他看不见的工具。我们表明，通过通过从知识库中得出的预训练的嵌入来增强环境的表示，该模型可以有效地将其推广到新的环境中。实验结果表明，在预测具有看不见对象的新型环境中模拟移动操纵器的成功符号计划时，至少48.8-58.1％的绝对改善对基准的绝对改善。这项工作朝着使机器人能够快速合成复杂任务的强大计划的方向，尤其是在新颖的环境中

translated by 谷歌翻译

Learning Backward Compatible Embeddings

Weihua Hu , Rajas Bansal , Kaidi Cao , Nikhil Rao , Karthik Subbian , Jure Leskovec

分类： (统计)机器学习 | 机器学习

2022-06-07

对象的嵌入，低维矢量表示，在构建现代机器学习系统中至关重要。在工业环境中，通常有一个嵌入式团队训练嵌入模型来解决预期的任务（例如，产品建议）。然后，消费者团队广泛消耗了生产的嵌入，以解决其意外任务（例如，欺诈检测）。但是，随着嵌入模型的更新和重新培训以提高预期任务的性能，新生成的嵌入不再与现有的消费者模型兼容。这意味着嵌入的历史版本永远无法退休，或者所有消费者团队都必须重新训练模型，以使其与最新版本的嵌入式兼容，这两者在实践中都是非常昂贵的。在这里，我们研究了嵌入版本更新及其向后兼容性的问题。我们正式化了嵌入团队继续更新嵌入式版本的目标，而消费者团队不必重新训练他们的模型。我们开发了一种基于向后兼容的嵌入式学习的解决方案，该解决方案允许嵌入模型版本经常更新，同时还允许将最新版本的嵌入式版本快速转换为IT的任何向后兼容的历史版本，以免消费者团队不使用消费者团队。必须重新训练他们的模型。在我们的框架下，我们探索六种方法，并在现实世界中的推荐系统应用程序上系统地评估它们。我们表明，即使在多个模型版本更新之后，我们称为BC-Aligner的最佳方法也可以与现有意外任务保持向后兼容性。同时，BC-Aligner实现了预期的任务性能，类似于仅针对预期任务进行优化的嵌入模型。

translated by 谷歌翻译