智能论文笔记

Epidemic inference through generative neural networks

Indaco Biazzo , Alfredo Braunstein , Luca Dall'Asta , Fabio Mazza

分类：人工智能 | 机器学习

2021-11-05

在接触网络上重建缺失的流行扩展信息可能是预防和遏制策略必不可少的。例如，鉴定和警告感染性但无症状的个体（例如，手动接触跟踪）有助于在Covid-19流行中含有爆发。可能的流行病级联的数量通常随着所涉及的个体的数量呈指数级增长。流行病过程中推理问题所带来的挑战源于难以识别与证据兼容的几乎可忽略的子集（例如，医学测试）。在这里，我们提出了一种新的生成神经网络框架，可以对与观察相兼容的最可能的感染级联来进行样本。此外，该框架可以推断治疗感染扩散的参数。所提出的方法从患者零问题，风险评估和传染性参数的现有方法获得更好或比较的结果，综合性和实际情况中的传染性参数，如在工作场所和医院传播感染。

translated by 谷歌翻译

CRISP: A Probabilistic Model for Individual-Level COVID-19 Infection Risk Estimation Based on Contact Data

Ralf Herbrich , Rajeev Rastogi , Roland Vollgraf

分类：机器学习 | (统计)机器学习

2020-06-09

我们提出了Crisp（COVID-19风险评分预测），这是一种基于SEIR模型的人群传播的COVID-19感染的概率图形模型，我们假设跨时间跨越各种渠道之间的（1）个体之间的相互接触（1）例如，蓝牙接触轨迹）以及（2）在给定时间的测试结果，以进行感染，暴露和免疫测试。我们的微型模型在每个时间点都跟踪每个人的感染状态，从易感性，暴露，感染性到恢复。我们既开发蒙特卡洛EM，又开发传递算法的消息来推断接触通道特定的感染传输概率。鉴于所有接触和测试结果数据的潜在感染状态，我们的蒙特卡洛算法使用gibbs采样在整个分析时间内绘制每个人的潜在感染状态的样本。使用模拟数据的实验结果表明，我们的清晰模型可以通过繁殖因子$ R_0 $参数化，并展示了与经典SEIR模型相似的人群水平的传染性和恢复时间序列。但是，由于单个接触数据，该模型允许精细的粒度控制和推断各种COVID-19减轻和抑制政策度量。此外，Block-GIBBS采样算法能够在测试过程隔离方法中支持有效的测试，以包含COVID-19的感染扩散。据我们所知，这是第一个基于个人水平的接触数据对Covid-19感染有效推断的模型；大多数流行病模型是宏观模型，这些模型在整个人群中推理。 Crisp的实现可在Python和C ++中获得，网址为https://github.com/zalandoresearch/crisp。

translated by 谷歌翻译

OutbreakFlow: Model-based Bayesian inference of disease outbreak dynamics with invertible neural networks and its application to the COVID-19 pandemics in Germany

Stefan T. Radev , Frederik Graw , Simiao Chen , Nico T. Mutters , Vanessa M. Eichel , Till Bärnighausen , Ullrich Köthe

分类：机器学习

2020-10-01

流行病学中的数学模型是一种不可或缺的工具，可以确定传染病的动态和重要特征。除了他们的科学价值之外，这些模型通常用于在正在进行的爆发期间提供政治决策和干预措施。然而，通过将复杂模型连接到真实数据来可靠地推断正在进行的爆发的动态仍然很难，并且需要费力的手动参数拟合或昂贵的优化方法，这些方法必须从划痕中重复给定模型的每个应用。在这项工作中，我们用专门的神经网络的流行病学建模的新组合来解决这个问题。我们的方法需要两个计算阶段：在初始训练阶段中，描述该流行病的数学模型被用作神经网络的教练，该主管是关于全球可能疾病动态的全球知识。在随后的推理阶段，训练有素的神经网络处理实际爆发的观察到的数据，并且揭示了模型的参数，以便实际地再现观察到的动态并可可靠地预测未来的进展。通过其灵活的框架，我们的仿真方法适用于各种流行病学模型。此外，由于我们的方法是完全贝叶斯的，它旨在纳入所有可用的关于合理参数值的先前知识，并返回这些参数上的完整关节后部分布。我们的方法在德国的早期Covid-19爆发阶段的应用表明，我们能够获得可靠的概率估计对重要疾病特征，例如生成时间，未检测到的感染部分，症状发作前的传播可能性，以及报告延迟非常适中的现实观测。

translated by 谷歌翻译

An introduction to variational methods for graphical models

分类：

This paper presents a tutorial introduction to the use of variational methods for inference and learning in graphical models (Bayesian networks and Markov random fields). We present a number of examples of graphical models, including the QMR-DT database, the sigmoid belief network, the Boltzmann machine, and several variants of hidden Markov models, in which it is infeasible to run exact inference algorithms. We then introduce variational methods, which exploit laws of large numbers to transform the original graphical model into a simplified graphical model in which inference is efficient. Inference in the simpified model provides bounds on probabilities of interest in the original model. We describe a general framework for generating variational transformations based on convex duality. Finally we return to the examples and demonstrate how variational algorithms can be formulated in each case.

translated by 谷歌翻译

Analysis of autocorrelation times in Neural Markov Chain Monte Carlo simulations

Piotr Białas , Piotr Korcyl , Tomasz Stebel

分类：机器学习 | (统计)机器学习

2021-11-19

我们提供了对神经马尔可夫链蒙特卡罗模拟中的自相关的深度研究，该版本的传统大都会算法采用神经网络来提供独立的建议。我们使用二维ising模型说明了我们的想法。我们提出了几次自相关时间的估算，其中一些灵感来自于为大都市独立采样器导出的分析结果，我们将其与逆温度$ \ Beta $的函数进行比较和研究。基于我们提出替代损失功能，并研究其对自动系列的影响。此外，我们调查对自动相关时间的神经网络培训过程中强加系统对称（$ Z_2 $和/或翻译）的影响。最终，我们提出了一种包含局部热浴更新的方案。讨论了上述增强功能的影响为16美元16美元旋转系统。我们的调查结果摘要可以作为实施更复杂模型的神经马尔可夫链蒙特卡罗模拟的指导。

translated by 谷歌翻译

Hands-on Bayesian Neural Networks -- a Tutorial for Deep Learning Users

Laurent Valentin Jospin , Wray Buntine , Farid Boussaid , Hamid Laga , Mohammed Bennamoun

分类：机器学习 | (统计)机器学习

2020-07-14

现代深度学习方法构成了令人难以置信的强大工具，以解决无数的挑战问题。然而，由于深度学习方法作为黑匣子运作，因此与其预测相关的不确定性往往是挑战量化。贝叶斯统计数据提供了一种形式主义来理解和量化与深度神经网络预测相关的不确定性。本教程概述了相关文献和完整的工具集，用于设计，实施，列车，使用和评估贝叶斯神经网络，即使用贝叶斯方法培训的随机人工神经网络。

translated by 谷歌翻译

An Introduction to Modern Statistical Learning

Joseph G. Makin

分类：机器学习

2022-07-20

这项正在进行的工作旨在为统计学习提供统一的介绍，从诸如GMM和HMM等经典模型到现代神经网络（如VAE和扩散模型）缓慢地构建。如今，有许多互联网资源可以孤立地解释这一点或新的机器学习算法，但是它们并没有（也不能在如此简短的空间中）将这些算法彼此连接起来，或者与统计模型的经典文献相连现代算法出现了。同样明显缺乏的是一个单一的符号系统，尽管对那些已经熟悉材料的人（如这些帖子的作者）不满意，但对新手的入境造成了重大障碍。同样，我的目的是将各种模型（尽可能）吸收到一个用于推理和学习的框架上，表明（以及为什么）如何以最小的变化将一个模型更改为另一个模型（其中一些是新颖的，另一些是文献中的）。某些背景当然是必要的。我以为读者熟悉基本的多变量计算，概率和统计以及线性代数。这本书的目标当然不是完整性，而是从基本知识到过去十年中极强大的新模型的直线路径或多或少。然后，目标是补充而不是替换，诸如Bishop的\ emph {模式识别和机器学习}之类的综合文本，该文本现在已经15岁了。

translated by 谷歌翻译

Adaptive Sequential Surveillance with Network and Temporal Dependence

Ivana Malenica , Jeremy R. Coyle , Mark J. van der Laan , Maya L. Petersen

分类： (统计)机器学习

2022-12-05

Strategic test allocation plays a major role in the control of both emerging and existing pandemics (e.g., COVID-19, HIV). Widespread testing supports effective epidemic control by (1) reducing transmission via identifying cases, and (2) tracking outbreak dynamics to inform targeted interventions. However, infectious disease surveillance presents unique statistical challenges. For instance, the true outcome of interest - one's positive infectious status, is often a latent variable. In addition, presence of both network and temporal dependence reduces the data to a single observation. As testing entire populations regularly is neither efficient nor feasible, standard approaches to testing recommend simple rule-based testing strategies (e.g., symptom based, contact tracing), without taking into account individual risk. In this work, we study an adaptive sequential design involving n individuals over a period of {\tau} time-steps, which allows for unspecified dependence among individuals and across time. Our causal target parameter is the mean latent outcome we would have obtained after one time-step, if, starting at time t given the observed past, we had carried out a stochastic intervention that maximizes the outcome under a resource constraint. We propose an Online Super Learner for adaptive sequential surveillance that learns the optimal choice of tests strategies over time while adapting to the current state of the outbreak. Relying on a series of working models, the proposed method learns across samples, through time, or both: based on the underlying (unknown) structure in the data. We present an identification result for the latent outcome in terms of the observed data, and demonstrate the superior performance of the proposed strategy in a simulation modeling a residential university environment during the COVID-19 pandemic.

translated by 谷歌翻译

MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood Inference from Sampled Trajectories

Giulio Isacchini , Natanael Spisak , Armita Nourmohammad , Thierry Mora , Aleksandra M. Walczak

分类：机器学习 | (统计)机器学习

2021-06-03

即使在实践中无法计算其可能性，基于模拟的推断也能够学习模型的参数。一类方法使用用不同参数模拟的数据来推断摊销估计器，以获得似然到证据比，或等效的后函数。我们表明，可以在模型参数和模拟数据之间的相互信息最大化方面配制这种方法。我们使用此等价来重新诠释摊销推理的现有方法，并提出了两种依赖于互信息的下限的新方法。我们使用人工神经网络用于后部预测的采样轨迹，将框架应用于随机过程和混沌动态系统的推动。我们的方法提供了一个统一的框架，利用了相互信息估计的功率进行推理。

translated by 谷歌翻译

Advances in Multi-Variate Analysis Methods for New Physics Searches at the Large Hadron Collider

Anna Stakia , Tommaso Dorigo , Giovanni Banelli , Daniela Bortoletto , Alessandro Casa , Pablo de Castro , Christophe Delaere , Julien Donini , Livio Finos , Michele Gallinaro

分类：机器学习

2021-05-16

在2015年和2019年之间，地平线的成员2020年资助的创新培训网络名为“Amva4newphysics”，研究了高能量物理问题的先进多变量分析方法和统计学习工具的定制和应用，并开发了完全新的。其中许多方法已成功地用于提高Cern大型Hadron撞机的地图集和CMS实验所执行的数据分析的敏感性;其他几个人，仍然在测试阶段，承诺进一步提高基本物理参数测量的精确度以及新现象的搜索范围。在本文中，在研究和开发的那些中，最相关的新工具以及对其性能的评估。

translated by 谷歌翻译

Natural Reweighted Wake-Sleep

Csongor Várady , Riccardo Volpi , Luigi Malagò , Nihat Ay

分类：机器学习 | (统计)机器学习

2020-08-15

Helmholtz机器（HMS）是由两个Sigmoid信念网络（SBN）组成的一类生成模型，分别用作编码器和解码器。这些模型通常是使用称为唤醒 - 睡眠（WS）的两步优化算法对这些模型进行的，并且最近通过改进版本（例如重新恢复的尾流（RWS）和双向Helmholtz Machines（BIHM））进行了改进版本。 SBN中连接的局部性在与概率模型相关的Fisher信息矩阵中诱导稀疏性，并以细粒粒度的块状结构的形式引起。在本文中，我们利用自然梯度利用该特性来有效地训练SBN和HMS。我们提出了一种新颖的算法，称为“自然重新唤醒”（NRWS），该算法与其标准版本的几何适应相对应。以类似的方式，我们还引入了天然双向Helmholtz机器（NBIHM）。与以前的工作不同，我们将展示如何有效地计算自然梯度，而无需引入Fisher信息矩阵结构的任何近似值。在文献中进行的标准数据集进行的实验表明，NRW和NBIHM不仅在其非几何基准方面，而且在HMS的最先进培训算法方面都具有一致的改善。在训练后，汇聚速度以及对数可能达到的对数似然的值量化了改进。

translated by 谷歌翻译

A Tutorial on Learning With Bayesian Networks

David Heckerman

分类：机器学习 | 人工智能 | (统计)机器学习

2020-02-01

贝叶斯网络是一种图形模型，用于编码感兴趣的变量之间的概率关系。当与统计技术结合使用时，图形模型对数据分析具有几个优点。一个，因为模型对所有变量中的依赖性进行编码，因此它易于处理缺少某些数据条目的情况。二，贝叶斯网络可以用于学习因果关系，因此可以用来获得关于问题域的理解并预测干预的后果。三，因为该模型具有因果和概率语义，因此是结合先前知识（通常出现因果形式）和数据的理想表示。四，贝叶斯网络与贝叶斯网络的统计方法提供了一种有效和原则的方法，可以避免数据过剩。在本文中，我们讨论了从先前知识构建贝叶斯网络的方法，总结了使用数据来改善这些模型的贝叶斯统计方法。关于后一项任务，我们描述了学习贝叶斯网络的参数和结构的方法，包括使用不完整数据学习的技术。此外，我们还联系了贝叶斯网络方法，以学习监督和无监督学习的技术。我们说明了使用真实案例研究的图形建模方法。

translated by 谷歌翻译

Nonequilibrium Monte Carlo for unfreezing variables in hard combinatorial optimization

Masoud Mohseni , Daniel Eppens , Johan Strumpfer , Raffaele Marino , Vasil Denchev , Alan K. Ho , Sergei V. Isakov , Sergio Boixo , Federico Ricci-Tersenghi , Hartmut Neven

分类：机器学习

2021-11-26

优化在离散变量上的高度复杂的成本/能源功能是不同科学学科和行业的许多公开问题的核心。一个主要障碍是在硬实例中的某些变量子集之间的出现，导致临界减慢或集体冻结了已知的随机本地搜索策略。通常需要指数计算工作来解冻这种变量，并探索配置空间的其他看不见的区域。在这里，我们通过开发自适应梯度的策略来介绍一个量子启发的非本球非识别蒙特卡罗（NMC）算法，可以有效地学习成本函数的关键实例的几何特征。该信息随行使用，以构造空间不均匀的热波动，用于以各种长度尺度集体未填充变量，规避昂贵的勘探与开发权衡。我们将算法应用于两个最具挑战性的组合优化问题：随机k可满足（K-SAT）附近计算阶段转换和二次分配问题（QAP）。我们在专业的确定性求解器和通用随机求解器上观察到显着的加速和鲁棒性。特别是，对于90％的随机4-SAT实例，我们发现了最佳专用确定性算法无法访问的解决方案，该算法（SP）具有最强的10％实例的解决方案质量的大小提高。我们还通过最先进的通用随机求解器（APT）显示出在最先进的通用随机求解器（APT）上的时间到溶液的两个数量级改善。

translated by 谷歌翻译

Fast and Credible Likelihood-Free Cosmology with Truncated Marginal Neural Ratio Estimation

Alex Cole , Benjamin Kurt Miller , Samuel J. Witte , Maxwell X. Cai , Meiert W. Grootes , Francesco Nattino , Christoph Weniger

分类：机器学习

2021-11-15

基于采样的推理技术是现代宇宙学数据分析的核心;然而，这些方法与维度不良，通常需要近似或顽固的可能性。在本文中，我们描述了截短的边际神经比率估计（TMNRE）（即所谓的基于模拟的推断的新方法）自然避免了这些问题，提高了$（i）$效率，$（ii）$可扩展性和$ （iii）推断后的后续后续的可信度。使用宇宙微波背景（CMB）的测量，我们表明TMNRE可以使用比传统马尔可夫链蒙特卡罗（MCMC）方法更少模拟器呼叫的数量级来实现融合的后海后。值得注意的是，所需数量的样本有效地独立于滋扰参数的数量。此外，称为\ MEMPH {本地摊销}的属性允许对基于采样的方法无法访问的严格统计一致性检查的性能。 TMNRE承诺成为宇宙学数据分析的强大工具，特别是在扩展宇宙学的背景下，其中传统的基于采样的推理方法所需的时间级数融合可以大大超过$ \ Lambda $ CDM等简单宇宙学模型的时间。为了执行这些计算，我们使用开源代码\ texttt {swyft}来使用TMNRE的实现。

translated by 谷歌翻译

Descriptive vs. inferential community detection: pitfalls, myths and half-truths

Tiago P. Peixoto

分类： (统计)机器学习

2021-11-30

社区检测是网络科学中最重要的方法领域之一，在过去的几十年里引起了大量关注的方法之一。该区域处理网络的自动部门到基础构建块中，目的是提供其大规模结构的概要。尽管它的重要性和广泛的采用普及，所谓的最先进和实际在各种领域实际使用的方法之间存在明显的差距。在这里，我们试图通过根据是否具有“描述性”或“推论”目标来划分现有方法来解决这种差异。虽然描述性方法在基于社区结构的直观概念的网络中找到模式的模式，但是推理方法阐述了精确的生成模型，并尝试将其符合数据。通过这种方式，他们能够为网络形成机制提供见解，并以统计证据支持的方式与随机性的单独结构。我们审查如何使用推论目标采用描述性方法被陷入困境和误导性答案，因此应该一般而言。我们认为推理方法更通常与更清晰的科学问题一致，产生更强大的结果，并且应该是一般的首选。我们试图消除一些神话和半真半假在实践中使用社区检测时，努力改善这些方法的使用以及对结果的解释。

translated by 谷歌翻译

Variational inference with a quantum computer

Marcello Benedetti , Brian Coyle , Mattia Fiorentini , Michael Lubasch , Matthias Rosenkranz

分类：机器学习

2021-03-11

推理是绘制关于未观察变量的结论的任务，给出了相关变量的观察。应用范围从鉴定症状的疾病从价格转移到分类经济制度。遗憾的是，执行精确的推论通常是棘手的。一种替代方案是变分推理，其中优化了候选概率分布以近似于未观察变量的后部分布。为了良好的近似，希望灵活和高度表现力的候选分布。在这项工作中，我们将量子出生的机器用作离散变量的变形分布。我们应用操作员变异推理的框架来实现这一目标。特别是，我们采用了两种特定的实现：一个具有对抗的目标，一个基于肠道斯坦的差异。我们使用贝叶斯网络的示例进行了数控展示了方法，并在IBM量子计算机上实施实验。我们的技术能够实现高效的变分推理，其分布在经典计算机上有效地表示的分布。

translated by 谷歌翻译

BCD Nets: Scalable Variational Approaches for Bayesian Causal Discovery

Chris Cundy , Aditya Grover , Stefano Ermon

分类：机器学习 | 人工智能 | (统计)机器学习

2021-12-06

结构方程模型（SEM）是一种有效的框架，其原因是通过定向非循环图（DAG）表示的因果关系。最近的进步使得能够从观察数据中实现了DAG的最大似然点估计。然而，在实际场景中，可以不能准确地捕获在推断下面的底层图中的不确定性，其中真正的DAG是不可识别的并且/或观察到的数据集是有限的。我们提出了贝叶斯因果发现网（BCD网），一个变分推理框架，用于估算表征线性高斯SEM的DAG的分布。由于图形的离散和组合性质，开发一个完整的贝叶斯后面是挑战。我们通过表达变分别家庭分析可扩展VI的可扩展VI的关键设计选择，例如1）表达性变分别家庭，2）连续弛豫，使低方差随机优化和3）在潜在变量上具有合适的前置。我们提供了一系列关于实际和合成数据的实验，显示BCD网在低数据制度中的标准因果发现度量上的最大似然方法，例如结构汉明距离。

translated by 谷歌翻译

Implicit Deep Adaptive Design: Policy-Based Experimental Design without Likelihoods

Desi R. Ivanova , Adam Foster , Steven Kleinegesse , Michael U. Gutmann , Tom Rainforth

分类： (统计)机器学习 | 人工智能 | 机器学习

2021-11-03

我们引入隐深自适应设计（iDAD），在实时与隐性模型进行适应性实验的新方法。iDAD通过学习设计政策网络的前期，然后可以在实验时快速部署摊销贝叶斯优化实验设计（BOED）的成本。该iDAD网络可以在其模拟微样品，不同于需要一个封闭的形式可能性和条件独立实验以前的设计政策工作的任何模型进行训练。在部署时，iDAD允许以毫秒为单位进行设计决策，而相比之下，需要实验本身期间繁重的计算传统BOED方法。我们说明了多项实验iDAD的适用性，并表明它提供了与隐式模型进行适应性设计一个快速和有效的机制。

translated by 谷歌翻译

Sparse Graph Learning from Spatiotemporal Time Series

Andrea Cini , Daniele Zambon , Cesare Alippi

分类：机器学习 | 人工智能

2022-05-26

Outstanding achievements of graph neural networks for spatiotemporal time series analysis show that relational constraints introduce an effective inductive bias into neural forecasting architectures. Often, however, the relational information characterizing the underlying data-generating process is unavailable and the practitioner is left with the problem of inferring from data which relational graph to use in the subsequent processing stages. We propose novel, principled - yet practical - probabilistic score-based methods that learn the relational dependencies as distributions over graphs while maximizing end-to-end the performance at task. The proposed graph learning framework is based on consolidated variance reduction techniques for Monte Carlo score-based gradient estimation, is theoretically grounded, and, as we show, effective in practice. In this paper, we focus on the time series forecasting problem and show that, by tailoring the gradient estimators to the graph learning problem, we are able to achieve state-of-the-art performance while controlling the sparsity of the learned graph and the computational scalability. We empirically assess the effectiveness of the proposed method on synthetic and real-world benchmarks, showing that the proposed solution can be used as a stand-alone graph identification procedure as well as a graph learning component of an end-to-end forecasting architecture.

translated by 谷歌翻译

Learning effective stochastic differential equations from microscopic simulations: linking stochastic numerics to deep learning

Felix Dietrich , Alexei Makeev , George Kevrekidis , Nikolaos Evangelou , Tom Bertalan , Sebastian Reich , Ioannis G. Kevrekidis

分类：机器学习

2021-06-10

我们确定有效的随机微分方程（SDE），用于基于精细的粒子或基于试剂的模拟的粗糙观察结果；然后，这些SDE提供了精细规模动力学的有用的粗替代模型。我们通过神经网络近似这些有效的SDE中的漂移和扩散率函数，可以将其视为有效的随机分解。损失函数的灵感来自于已建立的随机数值集成剂的结构（在这里，欧拉 - 玛鲁山和米尔斯坦）；因此，我们的近似值可以受益于这些基本数值方案的向后误差分析。当近似粗的模型（例如平均场方程）可用时，它们还自然而然地适合“物理信息”的灰色盒识别。 Langevin型方程和随机部分微分方程（SPDE）的现有数值集成方案也可以用于训练；我们在随机强迫振荡器和随机波方程式上证明了这一点。我们的方法不需要长时间的轨迹，可以在散落的快照数据上工作，并且旨在自然处理每个快照的不同时间步骤。我们考虑了预先知道粗糙的集体观察物以及必须以数据驱动方式找到它们的情况。

translated by 谷歌翻译