智能论文笔记

Link prediction with continuous-time classical and quantum walks

Mark Goldsmith , Guillermo García-Pérez , Joonas Malmi , Matteo A. C. Rossi , Harto Saarinen , Sabrina Maniscalco

分类：机器学习

2022-08-23

蛋白质 - 蛋白质相互作用（PPI）网络由生物体的蛋白质之间的物理和/或功能相互作用组成。由于用于形成PPI网络的生物物理和高通量方法是昂贵的，耗时的，而且通常包含不准确性，因此最终的网络通常不完整。为了推断这些网络中缺少的相互作用，我们提出了基于连续的经典和量子随机步行的新型链接预测方法。在量子步行的情况下，我们检查了网络邻接和拉普拉斯矩阵的用法来控制步行动力学。我们根据相应的过渡概率定义得分函数，并在四个现实世界PPI数据集上执行测试。我们的结果表明，使用网络邻接矩阵的连续时间经典随机步行和量子步行可以成功预测缺失的蛋白质 - 蛋白质相互作用，并且性能与艺术的状态媲美。

translated by 谷歌翻译

Teaching Small Language Models to Reason

Lucie Charlotte Magister , Jonathan Mallinson , Jakub Adamek , Eric Malmi , Aliaksei Severyn

分类：自然语言处理 | 机器学习

2022-12-16

Chain of thought prompting successfully improves the reasoning capabilities of large language models, achieving state of the art results on a range of datasets. However, these reasoning capabilities only appear to emerge in models with a size of over 100 billion parameters. In this paper, we explore the transfer of such reasoning capabilities to models with less than 100 billion parameters via knowledge distillation. Specifically, we finetune a student model on the chain of thought outputs generated by a larger teacher model. Our experiments show that the proposed method improves task performance across arithmetic, commonsense and symbolic reasoning datasets. For example, the accuracy of T5 XXL on GSM8K improves from 8.11% to 21.99% when finetuned on PaLM-540B generated chains of thought.

translated by 谷歌翻译

Text Generation with Text-Editing Models

Eric Malmi , Yue Dong , Jonathan Mallinson , Aleksandr Chuklin , Jakub Adamek , Daniil Mirylenka , Felix Stahlberg , Sebastian Krause , Shankar Kumar , Aliaksei Severyn

分类：自然语言处理

2022-06-14

文本编辑模型最近已成为单语文本生成任务（例如语法误差校正，简化和样式传输）的SEQ2SEQ模型的突出替代方法。这些任务具有共同的特征 - 它们在源文本和目标文本之间表现出大量的文本重叠。文本编辑模型利用了此观察结果，并通过预测应用于源序列的编辑操作来学会生成输出。相比之下，Seq2Seq模型从头开始生成逐字输出，从而使它们在推理时间缓慢。文本编辑模型比SEQ2SEQ模型提供了多个好处，包括更快的推理速度，更高的样本效率以及对输出的更好的控制和解释性。本教程提供了有关文本编辑模型和当前最新方法的全面概述，并分析了他们的利弊。我们讨论了与生产化有关的挑战，以及如何使用这些模型来减轻幻觉和偏见，这两者都在文本生成领域遇到了紧迫的挑战。

translated by 谷歌翻译

Hybrid Digital Twin for process industry using Apros simulation environment

Mohammad Azangoo , Joonas Salmi , Iivo Yrjölä , Jonathan Bensky , Gerardo Santillan , Nikolaos Papakonstantinou , Seppo Sierla , Valeriy Vyatkin

分类：机器学习 | 人工智能

2021-12-03

更新和竣工模型在过程工厂的生命周期中起着重要作用。特别是，必须精确地为系统精确以确保系统的效率和可靠性。数据驱动的模型可以通过考虑不确定性和生命周期相关的更改来模拟子系统的最新行为。本文介绍了使用早期实施的原型作为示例的过程工厂的混合数字双床模型的逐步概念。它将详细介绍使用流程设备的数据驱动模型更新棕色域处理系统的第一原理模型和数字双胞胎的步骤。还将讨论产生竣工混合数码双床的挑战。在处理历史数据的帮助下，教导机器学习模型，可以随着时间的推移不断提高实现的数字双胞划，并且可以进一步优化这项工作。

translated by 谷歌翻译

Exploring Business Process Deviance with Sequential and Declarative Patterns

Giacomo Bergami , Chiara Di Francescomarino , Chiara Ghidini , Fabrizio Maria Maggi , Joonas Puura

分类：人工智能

2021-11-24

业务流程偏差是指业务流程执行的子集的现象，以消极或积极的方式偏离{他们的预期或理想的结果。业务流程的偏差执行包括违反合规规则的人，或者欠冲前或超过绩效目标的执行。偏差挖掘涉及通过分析支持业务流程的系统存储的事件日志来揭示揭示异常执行的原因。在本文中，首先通过基于顺序和声明模式模式的特征和它们的组合来研究解释业务流程的偏差问题。然后，通过基于纯数据属性值和数据感知声明规则利用事件日志中的事件日志和迹线的数据属性来进一步提高说明。然后通过用于规则感应的直接和间接方法来提取表征消化的解释。使用来自多个域的实际日志，根据他们准确地区分过程的非偏差和异常执行能力以及决赛的可理解性的能力来评估一系列特征类型和不同形式的决策规则。返回给用户的结果。

translated by 谷歌翻译

A Simple Recipe for Multilingual Grammatical Error Correction

Sascha Rothe , Jonathan Mallinson , Eric Malmi , Sebastian Krause , Aliaksei Severyn

分类：自然语言处理

2021-06-07

本文提出了一个简单的食谱，用于训练最先进的多语言语法误差校正（GEC）模型。我们首先提出一种语言不足的方法来实现这一目标，以生成大量的合成示例。第二个成分是使用大规模的多语言模型（最多11B参数）。一旦对特定于语言的监督集进行了微调，我们就会以四种语言的GEC基准进行以前的最新结果：英语，捷克语，德语和俄语。在为GEC建立了一套新的基线后，我们通过释放Clang-8数据集使结果可以轻松地重现和访问。它是通过使用我们称为GT5的最佳型号来清洁广泛使用但嘈杂的Lang-8数据集的目标而产生的。 Clang-8极大地简化了由多个微调阶段组成的典型GEC训练管道 - 我们证明，使用现成的语言模型在Clang-8上执行单个微调步骤，可以进一步改善已经是顶级的，为英语执行GT5型号。

translated by 谷歌翻译

Privacy-preserving Data Sharing on Vertically Partitioned Data

Razane Tajeddine , Joonas Jälkö , Samuel Kaski , Antti Honkela

分类：机器学习 | (统计)机器学习

2020-10-19

在这项工作中，我们引入了一种差异性私有方法，用于从垂直分区的数据\ emph {i.e。}生成合成数据，其中同一个人的数据分布在多个数据持有人或各方之间。我们提出了一种差异性隐私随机梯度下降（DP-SGD）算法，以使用变异推理在此类分区数据上训练混合模型。我们修改了安全的多方计算（MPC）框架，以将MPC与差异隐私（DP）相结合，以便有效地使用差异化的私有MPC来学习DP下在此类垂直分区数据的DP下的概率生成模型。假设混合物组件不包含不同方面的依赖性，则可以将目标函数分解为当事方计算的贡献的产物之和。最后，MPC用于计算不同贡献之间的聚集体。此外，我们严格地定义了系统中不同玩家的隐私保证。为了证明我们的方法的准确性，我们从UCI机器学习存储库上运行算法在成人数据集上，在此我们获得与非分区案例的可比结果。

translated by 谷歌翻译