智能论文笔记

Bayesian Variable Selection in a Million Dimensions

Martin Jankowiak

分类：机器学习 | (统计)机器学习

2022-08-02

贝叶斯变量选择是用于数据分析的强大工具，因为它为可变选择提供了原则性的方法，该方法可以说明事先信息和不确定性。但是，贝叶斯变量选择的广泛采用受到计算挑战的阻碍，尤其是在具有大量协变量P或非偶联的可能性的困难政权中。为了扩展到大型P制度，我们引入了一种有效的MCMC方案，其每次迭代的成本在P中是均等的。此外，我们还显示了如何将该方案扩展到用于计数数据的广义线性模型，这些模型在生物学，生态学，经济学，经济学，经济学，经济学，经济学，经济学，经济学上很普遍超越。特别是，我们设计有效的算法，用于二项式和负二项式回归中的可变选择，其中包括逻辑回归作为一种特殊情况。在实验中，我们证明了方法的有效性，包括对癌症和玉米基因组数据。

translated by 谷歌翻译

Fast Bayesian Variable Selection in Binomial and Negative Binomial Regression

Martin Jankowiak

分类： (统计)机器学习

2021-06-28

贝叶斯变量选择是用于数据分析的强大工具，因为它为可变选择提供了原则性的方法，该方法可以说明事先信息和不确定性。但是，贝叶斯变量选择的更广泛采用受到计算挑战的阻碍，尤其是在具有大量协变量或非偶联的可能性的困难政权中。在生物学，生态学，经济学及其他方面普遍存在的计数数据的广义线性模型代表了一个重要的特殊情况。在这里，我们介绍了一种有效的MCMC方案，用于利用脾气暴躁的Gibbs采样（Zanella and Roberts，2019年）中的二项式和负二项式回归中的可变选择，其中包括逻辑回归作为一种特殊情况。在实验中，我们证明了我们的方法的有效性，包括对拥有一千万变量的癌症数据。

translated by 谷歌翻译

Faster MCMC for Gaussian Latent Position Network Models

Neil A. Spencer , Brian Junker , Tracy M. Sweet

分类： (统计)机器学习

2020-06-13

潜在位置网络模型是网络科学的多功能工具;应用程序包括集群实体，控制因果混淆，并在未观察的图形上定义前提。估计每个节点的潜在位置通常是贝叶斯推理问题的群体，吉布斯内的大都市是最流行的近似后分布的工具。然而，众所周知，GIBBS内的大都市对于大型网络而言是低效;接受比计算成本昂贵，并且所得到的后绘高度相关。在本文中，我们提出了一个替代的马尔可夫链蒙特卡罗战略 - 使用分裂哈密顿蒙特卡罗和萤火虫蒙特卡罗的组合定义 - 利用后部分布的功能形式进行更有效的后退计算。我们展示了这些战略在吉布斯和综合网络上的其他算法中优于大都市，以及学区的教师和工作人员的真正信息共享网络。

translated by 谷歌翻译

Surrogate Likelihoods for Variational Annealed Importance Sampling

Martin Jankowiak , Du Phan

分类： (统计)机器学习 | 机器学习

2021-12-22

变分推理是一种强大的范例，用于近似贝叶斯推论，具有许多吸引人的属性，包括支持模型学习和数据分配。通过对比MCMC方法，如Hamiltonian Monte Carlo不共享这些属性，但由于与参数方法相反，因此仍然有吸引力，因此MCMC是无偏见的。由于这些原因，研究人员试图将两类算法的优势结合起来，最近的方法更接近在实践中实现这一愿景。然而，支持这些混合方法中的数据分配可能是一个挑战，通过引入可以与其他变分参数共同学习的替代可能性来解决的缺点。从理论上，理论上我们认为所产生的算法允许用户在推理保真度和计算成本之间进行直观的折衷。在一个广泛的经验比较中，我们表明我们的方法在实践中表现良好，并且它非常适合在概率编程框架中的黑匣子推断。

translated by 谷歌翻译

Distributed Computation for Marginal Likelihood based Model Choice

Alexander Buchholz , Daniel Ahfock , Sylvia Richardson

分类： (统计)机器学习

2019-10-10

我们提出了一种使用边缘似然的分布式贝叶斯模型选择的一般方法，其中数据集被分开在非重叠子集中。这些子集仅由个别工人本地访问，工人之间没有共享数据。我们近似通过在每个子集的每个子集上从后部采样通过Monte Carlo采样的完整数据的模型证据。结果使用一种新的方法来组合，该方法校正使用所产生的样本的汇总统计分裂。我们的鸿沟和征服方法使贝叶斯模型在大型数据设置中选择，利用所有可用信息，而是限制工人之间的沟通。我们派生了理论误差界限，这些错误界限量化了计算增益与精度损失之间的结果。当我们的真实世界实验所示，令人尴尬的平行性质在大规模数据集时产生了重要的速度。此外，我们展示了如何在可逆跳转设置中扩展建议的方法以在可逆跳转设置中进行模型选择，该跳转设置在一个运行中探讨多个特征组合。

translated by 谷歌翻译

Flexible Bayesian Nonlinear Model Configuration

Aliaksandr Hubin , Geir Storvik , Florian Frommlet

分类： (统计)机器学习 | 机器学习

2020-03-05

回归模型用于各种应用，为来自不同领域的研究人员提供强大的科学工具。线性或简单的参数，模型通常不足以描述输入变量与响应之间的复杂关系。通过诸如神经网络的灵活方法可以更好地描述这种关系，但这导致不太可解释的模型和潜在的过度装备。或者，可以使用特定的参数非线性函数，但是这种功能的规范通常是复杂的。在本文中，我们介绍了一种灵活的施工方法，高度灵活的非线性参数回归模型。非线性特征是分层的，类似于深度学习，但对要考虑的可能类型的功能具有额外的灵活性。这种灵活性，与变量选择相结合，使我们能够找到一小部分重要特征，从而可以更具可解释的模型。在可能的功能的空间内，考虑了贝叶斯方法，基于它们的复杂性引入功能的前沿。采用遗传修改模式跳跃马尔可夫链蒙特卡罗算法来执行贝叶斯推理和估计模型平均的后验概率。在各种应用中，我们说明了我们的方法如何用于获得有意义的非线性模型。此外，我们将其预测性能与多个机器学习算法进行比较。

translated by 谷歌翻译

Conjugate priors for count and rounded data regression

Daniel R. Kowal

分类： (统计)机器学习

2021-10-23

离散数据丰富，并且通常作为计数或圆形数据而出现。甚至对于线性回归模型，缀合格前沿和闭合形式的后部通常是不可用的，这需要近似诸如MCMC的后部推理。对于广泛的计数和圆形数据回归模型，我们介绍了能够闭合后部推理的共轭前沿。密钥后和预测功能可通过直接蒙特卡罗模拟来计算。至关重要的是，预测分布是离散的，以匹配数据的支持，并且可以在多个协变量中进行共同评估或模拟。这些工具广泛用途是线性回归，非线性模型，通过基础扩展，以及模型和变量选择。多种仿真研究表明计算，预测性建模和相对于现有替代方案的选择性的显着优势。

translated by 谷歌翻译

Robust leave-one-out cross-validation for high-dimensional Bayesian models

Luca Silva , Giacomo Zanella

分类： (统计)机器学习

2022-09-19

剩下的交叉验证（LOO-CV）是一种估计样本外预测准确性的流行方法。但是，由于需要多次拟合模型，因此计算LOO-CV标准在计算上可能很昂贵。在贝叶斯的情况下，重要性采样提供了一种可能的解决方案，但是经典方法可以轻松地产生差异是无限的估计器，从而使它们可能不可靠。在这里，我们提出和分析一种新型混合估计量来计算贝叶斯Loo-CV标准。我们的方法保留了经典方法的简单性和计算便利性，同时保证了所得估计器的有限差异。提供了理论和数值结果，以说明提高的鲁棒性和效率。在高维问题中，计算益处尤为重要，可以为更广泛的模型执行贝叶斯loo-CV。所提出的方法可以在标准概率编程软件中很容易实现，并且计算成本大致相当于拟合原始模型一次。

translated by 谷歌翻译

Enhanced gradient-based MCMC in discrete spaces

Benjamin Rhodes , Michael Gutmann

分类： (统计)机器学习 | 机器学习

2022-07-29

最近介绍基于梯度的MCMC用于离散空间具有巨大的希望，并带来了新离散的可能性的诱人可能性，即MALA和HMC等著名的连续方法。为了实现这一目标，我们介绍了几个在概念上受到MALA启发的分离大都会杂货样本，并在贝叶斯推理和基于能量的建模中表现出了一系列具有挑战性的采样问题。从方法上讲，我们确定了为什么对预处理的MALA的离散类似物通常是棘手的，激发了我们基于辅助变量和“高斯整体技巧”引入一种新型的预处理。

translated by 谷歌翻译

Scalable Spike-and-Slab

Niloy Biswas , Lester Mackey , Xiao-Li Meng

分类：机器学习 | (统计)机器学习

2022-04-04

尖峰和单杆先验由于其可解释性和有利的统计特性，通常用于贝叶斯变量选择。但是，当变量数量较大时，现有的尖峰和锯齿状后侧面的采样器会产生过度的计算成本。在本文中，我们提出了可伸缩的尖峰和剪裁（$ s^3 $），这是用于高维贝叶斯回归的可伸缩吉布斯采样实现，并具有乔治和麦卡洛克（George and McCulloch）的连续尖峰和剪辑（1993）。对于具有$ n $观测值和$ p $ cOVARIATES的数据集，$ s^3 $具有订单$ \ max \ {n^2 p_t，np \} $计算成本$ t $，其中$ p_t $永远不超过数量Markov链的迭代$ t $和$ t-1 $之间的协变量切换尖峰和单杆状态。这可以改善最先进实施的$ n^2 p $每题费，因为通常，$ p_t $大大小于$ p $。我们将$ S^3 $应用于合成和现实世界数据集上，证明了现有精确采样器的数量级加速顺序，并且比相当成本的近似采样器相比，推断质量的显着增长。

translated by 谷歌翻译

A flexible empirical Bayes approach to multiple linear regression and connections with penalized regression

Youngseok Kim , Wei Wang , Peter Carbonetto , Matthew Stephens

分类： (统计)机器学习

2022-08-23

我们引入了一种新的经验贝叶斯方法，用于大规模多线性回归。我们的方法结合了两个关键思想：（i）使用灵活的“自适应收缩”先验，该先验近似于正常分布的有限混合物，近似于正常分布的非参数家族；（ii）使用变分近似来有效估计先前的超参数并计算近似后期。将这两个想法结合起来，将快速，灵活的方法与计算速度相当，可与快速惩罚的回归方法（例如Lasso）相当，并在各种场景中具有出色的预测准确性。此外，我们表明，我们方法中的后验平均值可以解释为解决惩罚性回归问题，并通过直接解决优化问题（而不是通过交叉验证来调整）从数据中学到的惩罚函数的精确形式。。我们的方法是在r https://github.com/stephenslab/mr.ash.ash.alpha的r软件包中实现的

translated by 谷歌翻译

The No-U-Turn Sampler: Adaptively Setting Path Lengths in Hamiltonian Monte Carlo

Matthew D. Hoffman , Andrew Gelman

分类：

2011-11-18

Hamiltonian Monte Carlo (HMC) is a Markov chain Monte Carlo (MCMC) algorithm that avoids the random walk behavior and sensitivity to correlated parameters that plague many MCMC methods by taking a series of steps informed by first-order gradient information. These features allow it to converge to high-dimensional target distributions much more quickly than simpler methods such as random walk Metropolis or Gibbs sampling. However, HMC's performance is highly sensitive to two user-specified parameters: a step size and a desired number of steps L. In particular, if L is too small then the algorithm exhibits undesirable random walk behavior, while if L is too large the algorithm wastes computation. We introduce the No-U-Turn Sampler (NUTS), an extension to HMC that eliminates the need to set a number of steps L. NUTS uses a recursive algorithm to build a set of likely candidate points that spans a wide swath of the target distribution, stopping automatically when it starts to double back and retrace its steps. Empirically, NUTS perform at least as efficiently as and sometimes more efficiently than a well tuned standard HMC method, without requiring user intervention or costly tuning runs. We also derive a method for adapting the step size parameter on the fly based on primal-dual averaging. NUTS can thus be used with no hand-tuning at all. NUTS is also suitable for applications such as BUGS-style automatic inference engines that require efficient "turnkey" sampling algorithms.

translated by 谷歌翻译

A Two-step Metropolis Hastings Method for Bayesian Empirical Likelihood Computation with Application to Bayesian Model Selection

Sanjay Chaudhuri , Teng Yin

分类： (统计)机器学习

2022-09-02

最近，经验可能性已在贝叶斯框架下广泛应用。马尔可夫链蒙特卡洛（MCMC）方法经常用于从感兴趣参数的后验分布中采样。然而，可能性支持的复杂性，尤其是非凸性的性质，在选择适当的MCMC算法时建立了巨大的障碍。这种困难限制了在许多应用中基于贝叶斯的经验可能性（贝叶赛）方法的使用。在本文中，我们提出了一个两步的大都会黑斯廷斯算法，以从贝耶斯后期进行采样。我们的建议是在层次上指定的，其中确定经验可能性的估计方程用于根据其余参数的建议值提出一组参数的值。此外，我们使用经验可能性讨论贝叶斯模型的选择，并将我们的两步大都会黑斯廷斯算法扩展到可逆的跳跃马尔可夫链蒙特卡洛手术程序，以便从最终的后验中采样。最后，提出了我们提出的方法的几种应用。

translated by 谷歌翻译

Marginal likelihood computation for model selection and hypothesis testing: an extensive review

Fernando Llorente , Luca Martino , David Delgado , Javier Lopez-Santiago

分类：机器学习

2020-05-17

这是模型选择和假设检测的边缘似然计算的最新介绍和概述。计算概率模型（或常量比率）的常规规定常数是许多统计数据，应用数学，信号处理和机器学习中的许多应用中的基本问题。本文提供了对主题的全面研究。我们突出了不同技术之间的局限性，优势，连接和差异。还描述了使用不正确的前沿的问题和可能的解决方案。通过理论比较和数值实验比较一些最相关的方法。

translated by 谷歌翻译

Variational Bayes for high-dimensional proportional hazards models with applications to gene expression variable selection

Michael Komodromos , Eric Aboagye , Marina Evangelou , Sarah Filippi , Kolyan Ray

分类： (统计)机器学习

2021-12-19

我们提出了一种变分贝叶斯比例危险模型，用于预测和可变选择的关于高维存活数据。我们的方法基于平均场变分近似，克服了MCMC的高计算成本，而保留有用的特征，提供优异的点估计，并通过后夹层概念提供可变选择的自然机制。我们提出的方法的性能通过广泛的仿真进行评估，并与其他最先进的贝叶斯变量选择方法进行比较，展示了可比或更好的性能。最后，我们展示了如何在两个转录组数据集上使用所提出的方法进行审查的生存结果，其中我们识别具有预先存在的生物解释的基因。

translated by 谷歌翻译

Pareto Smoothed Importance Sampling

Aki Vehtari , Daniel Simpson , Andrew Gelman , Yuling Yao , Jonah Gabry

分类： (统计)机器学习

2015-07-09

重要的加权是调整蒙特卡洛集成以说明错误分布中抽取的一种一般方法，但是当重要性比的右尾巴较重时，最终的估计值可能是高度可变的。当目标分布的某些方面无法通过近似分布捕获，在这种情况下，可以通过修改极端重要性比率来获得更稳定的估计。我们提出了一种新的方法，该方法使用拟合模拟重要性比率的上尾的广义帕累托分布来稳定重要性权重。该方法在经验上的性能要比现有方法稳定重要性采样估计值更好，包括稳定的有效样本量估计，蒙特卡洛误差估计和收敛诊断。提出的帕累托$ \ hat {k} $有限样本收敛率诊断对任何蒙特卡洛估计器都有用。

translated by 谷歌翻译

Efficient MCMC Sampling with Dimension-Free Convergence Rate using ADMM-type Splitting

Maxime Vono , Daniel Paulin , Arnaud Doucet

分类： (统计)机器学习

2019-05-23

对复杂模型执行精确的贝叶斯推理是计算的难治性的。马尔可夫链蒙特卡罗（MCMC）算法可以提供后部分布的可靠近似，但对于大型数据集和高维模型昂贵。减轻这种复杂性的标准方法包括使用子采样技术或在群集中分发数据。然而，这些方法通常在高维方案中不可靠。我们在此处专注于最近的替代类别的MCMC方案，利用类似于乘客（ADMM）优化算法的庆祝交替方向使用的分裂策略。这些方法似乎提供了凭经验最先进的性能，但其高维层的理论行为目前未知。在本文中，我们提出了一个详细的理论研究，该算法之一称为分裂Gibbs采样器。在规律条件下，我们使用RICCI曲率和耦合思路为此方案建立了明确的收敛速率。我们以数字插图支持我们的理论。

translated by 谷歌翻译

Stacking for Non-mixing Bayesian Computations: The Curse and Blessing of Multimodal Posteriors

Yuling Yao , Aki Vehtari , Andrew Gelman

分类： (统计)机器学习

2020-06-22

在使用多模式贝叶斯后部分布时，马尔可夫链蒙特卡罗（MCMC）算法难以在模式之间移动，并且默认变分或基于模式的近似推动将低估后不确定性。并且，即使找到最重要的模式，难以评估后部的相对重量。在这里，我们提出了一种使用MCMC，变分或基于模式的模式的并行运行的方法，以便尽可能多地击中多种模式或分离的区域，然后使用贝叶斯堆叠来组合这些用于构建分布的加权平均值的可扩展方法。通过堆叠从多模式后分布的堆叠，最小化交叉验证预测误差的结果，并且代表了比变分推断更好的不确定度，但它不一定是相当于渐近的，以完全贝叶斯推断。我们呈现理论一致性，其中堆叠推断逼近来自未衰退的模型和非混合采样器的真实数据生成过程，预测性能优于完全贝叶斯推断，因此可以被视为祝福而不是模型拼写下的诅咒。我们展示了几个模型家庭的实际实施：潜在的Dirichlet分配，高斯过程回归，分层回归，马蹄素变量选择和神经网络。

translated by 谷歌翻译

Approximate Post-Selective Inference for Regression with the Group LASSO

Snigdha Panigrahi , Peter W. MacDonald , Daniel Kessler

分类： (统计)机器学习

2020-12-31

在选择组套索（或普遍的变体，例如重叠，稀疏或标准化的组套索）之后，在没有选择偏见的调整的情况下，对所选参数的推断是不可靠的。在受惩罚的高斯回归设置中，现有方法为选择事件提供了调整，这些事件可以表示为数据变量中的线性不平等。然而，这种表示未能与组套索一起选择，并实质上阻碍了随后的选择后推断的范围。推论兴趣的关键问题 - 例如，推断选定变量对结果的影响 - 仍未得到解答。在本文中，我们开发了一种一致的，选择性的贝叶斯方法，通过得出似然调整因子和近似值来解决现有差距，从而消除了组中的偏见。对模拟数据和人类Connectome项目数据的实验表明，我们的方法恢复了所选组中参数的影响，同时仅支付较小的偏差调整价格。

translated by 谷歌翻译

Optimal Thinning of MCMC Output

Marina Riabiz , Wilson Chen , Jon Cockayne , Pawel Swietach , Steven A. Niederer , Lester Mackey , Chris. J. Oates

分类： (统计)机器学习

2020-05-08

利用启发式来评估收敛性和压缩马尔可夫链蒙特卡罗的输出可以在生产的经验逼近时是次优。通常，许多初始状态归因于“燃烧”并移除，而链条的其余部分是“变薄”，如果还需要压缩。在本文中，我们考虑回顾性地从样本路径中选择固定基数的状态的问题，使得由其经验分布提供的近似接近最佳。提出了一种基于核心稳定性差异的贪婪最小化的新方法，这适用于需要重压力的问题。理论结果保障方法的一致性及其有效性在常微分方程的参数推理的具体背景下证明了该效果。软件可在Python，R和Matlab中的Stein细化包中提供。

translated by 谷歌翻译