智能论文笔记

Bayesian Optimization of Function Networks

Raul Astudillo , Peter I. Frazier

分类：机器学习 | (统计)机器学习

2021-12-31

我们考虑贝叶斯型优化函数网络的输出，其中每个功能都将其作为输入其父节点的输出，并且网络在其位置需要评估。例如，在强化学习，工程设计和制造中出现了这些问题。虽然标准贝叶斯优化方法只观察到最终输出，但我们的方法通过利用前者忽略的信息来提供更大的查询效率：网络内中间输出。这是通过使用高斯过程建模网络的节点来实现的实现，并选择要使用的点作为我们的采集功能来评估点，所以在物镜上的隐含后续计算的预期改进。尽管这种后部的非高斯性质阻止了以封闭形式计算我们的采集功能，但我们表明它可以通过样本平均近似有效地最大化。此外，我们证明我们的方法是渐近的，这意味着它发现全球最佳解决方案随着评估的数量增长到无穷大，因此概括了预期改进的先前已知的收敛结果。值得注意的是，即使我们的方法可能无法谨慎地评估域，而是利用问题结构留下未开发的区域。最后，我们表明我们的方法在几个合成和现实世界问题中显着优于标准贝叶斯优化方法。

translated by 谷歌翻译

Thinking inside the box: A tutorial on grey-box Bayesian optimization

Raul Astudillo , Peter I. Frazier

分类：机器学习 | (统计)机器学习

2022-01-02

Bayesian Optimization（Bo）是全球优化昂贵的客观功能的框架。古典BO方法假设客观函数是一个黑匣子。但是，有关客观函数计算的内部信息通常可用。例如，在使用模拟优化制造行的吞吐量时，除了整体吞吐量之外，我们还会观察每个工作站等待等待的部件数。最近的BO方法利用此类内部信息显着提高性能。我们称之为这些“灰盒”BO方法，因为它们将客观计算视为部分可观察且甚至可修改，将黑盒方法与所谓的“白盒”的第一原理进行客观函数计算的知识。本教程描述了这些方法，专注于复合物镜功能的博，其中可以观察和选择性地评估饲喂整体目标的单个成分;和多保真博，其中一个人可以通过改变评估oracle的参数来评估目标函数的更便宜的近似。

translated by 谷歌翻译

BoTorch: A Framework for Efficient Monte-Carlo Bayesian Optimization

Maximilian Balandat , Brian Karrer , Daniel R. Jiang , Samuel Daulton , Benjamin Letham , Andrew Gordon Wilson , Eytan Bakshy

分类：

2019-10-14

Bayesian optimization provides sample-efficient global optimization for a broad range of applications, including automatic machine learning, engineering, physics, and experimental design. We introduce BOTORCH, a modern programming framework for Bayesian optimization that combines Monte-Carlo (MC) acquisition functions, a novel sample average approximation optimization approach, autodifferentiation, and variance reduction techniques. BOTORCH's modular design facilitates flexible specification and optimization of probabilistic models written in PyTorch, simplifying implementation of new acquisition functions. Our approach is backed by novel theoretical convergence results and made practical by a distinctive algorithmic foundation that leverages fast predictive distributions, hardware acceleration, and deterministic optimization. We also propose a novel "one-shot" formulation of the Knowledge Gradient, enabled by a combination of our theoretical and software contributions. In experiments, we demonstrate the improved sample efficiency of BOTORCH relative to other popular libraries.34th Conference on Neural Information Processing Systems (NeurIPS 2020),

translated by 谷歌翻译

Multi-Step Budgeted Bayesian Optimization with Unknown Evaluation Costs

Raul Astudillo , Daniel R. Jiang , Maximilian Balandat , Eytan Bakshy , Peter I. Frazier

分类：机器学习 | (统计)机器学习

2021-11-12

Bayesian Optimization（BO）是一种优化昂贵对评估黑匣子功能的采样有效的方法。大多数BO方法忽略了评估成本如何在优化域中变化。然而，这些成本可以是高度异质的并且通常提前未知。这发生在许多实际设置中，例如机器学习算法或基于物理的仿真优化的超参数调整。此外，那些确认成本异质性的现有方法并不自然地适应总评估成本的预算限制。这种未知的成本和预算限制的组合引入了勘探开发权衡的新维度，其中关于成本的学习成本本身。现有方法没有原因地理由以原则的方式对此问题的各种权衡，经常导致性能不佳。我们通过证明，每单位成本的预期改进和预期改善，可以使这两个最广泛使用的采购职能在实践中的预期改进和预期的索赔可以是任意劣等的。为了克服现有方法的缺点，我们提出了预算的多步预期改进，是一个非近视收购函数，以概括为异质和未知评估成本的古典预期改进。最后，我们表明我们的采集功能优于各种合成和实际问题的现有方法。

translated by 谷歌翻译

Two-step Lookahead Bayesian Optimization with Inequality Constraints

Yunxiang Zhang , Xiangyu Zhang , Peter I. Frazier

分类： (统计)机器学习 | 人工智能 | 机器学习

2021-12-06

计算高效的非近视贝叶斯优化（BO）的最新进展提高了传统近视方法的查询效率，如预期的改进，同时仅适度提高计算成本。然而，这些进展在很大程度上是有限的，因为不受约束的优化。对于约束优化，少数现有的非近视博方法需要重量计算。例如，一个现有的非近视约束BO方法[LAM和Willcox，2017]依赖于计算昂贵的不可靠的暴力衍生物的无可靠性衍生物优化蒙特卡罗卷展卷采集功能。使用Reparameterization技巧进行更有效的基于衍生物的优化的方法，如在不受约束的环境中，如样本平均近似和无限扰动分析，不扩展：约束在取样的采集功能表面中引入阻碍其优化的不连续性。此外，我们认为非近视在受限制问题中更为重要，因为违反限制的恐惧将近视方法推动了可行和不可行区域之间的边界，减缓了具有严格约束的最佳解决方案的发现。在本文中，我们提出了一种计算的有效的两步保护受限贝叶斯优化采集功能（2-OPT-C）支持顺序和批处理设置。为了实现快速采集功能优化，我们开发了一种新的基于似然比的非偏见估计，其两步最佳采集函数的梯度不使用Reparameterization技巧。在数值实验中，2-OPT-C通常通过先前的方法通过2倍或更多的查询效率，并且在某些情况下通过10倍或更大。

translated by 谷歌翻译

A General Recipe for Likelihood-free Bayesian Optimization

Jiaming Song , Lantao Yu , Willie Neiswanger , Stefano Ermon

分类：机器学习 | 人工智能 | (统计)机器学习

2022-06-27

采集函数是贝叶斯优化（BO）中的关键组成部分，通常可以写为在替代模型下对效用函数的期望。但是，为了确保采集功能是可以优化的，必须对替代模型和实用程序功能进行限制。为了将BO扩展到更广泛的模型和实用程序，我们提出了不含可能性的BO（LFBO），这是一种基于无似然推理的方法。 LFBO直接对采集函数进行建模，而无需单独使用概率替代模型进行推断。我们表明，可以将计算LFBO中的采集函数缩小为优化加权分类问题，而权重对应于所选择的实用程序。通过为预期改进选择实用程序功能，LFBO在几个现实世界优化问题上都优于各种最新的黑盒优化方法。 LFBO还可以有效利用目标函数的复合结构，从而进一步改善了其遗憾。

translated by 谷歌翻译

Adaptivity and Confounding in Multi-Armed Bandit Experiments

Chao Qin , Daniel Russo

分类：机器学习 | (统计)机器学习

2022-02-18

我们探索了一个新的强盗实验模型，其中潜在的非组织序列会影响武器的性能。上下文 - 统一算法可能会混淆，而那些执行正确的推理面部信息延迟的算法。我们的主要见解是，我们称之为Deconfounst Thompson采样的算法在适应性和健壮性之间取得了微妙的平衡。它的适应性在易于固定实例中带来了最佳效率，但是在硬性非平稳性方面显示出令人惊讶的弹性，这会导致其他自适应算法失败。

translated by 谷歌翻译

Relaxed Gaussian process interpolation: a goal-oriented approach to Bayesian optimization

Sébastien Petit , Julien Bect , Emmanuel Vazquez

分类： (统计)机器学习

2022-06-07

这项工作提出了一个新的程序，可以在高斯过程（GP）建模的背景下获得预测分布，并放松了一些感兴趣的范围之外的插值约束：预测分布的平均值不一定会在观察到的值时插入观察值的值。感兴趣的外部范围，但仅限于留在外面。这种称为放松的高斯工艺（REGP）插值的方法在感兴趣的范围内提供了更好的预测分布，尤其是在GP模型的平稳性假设不合适的情况下。它可以被视为一种面向目标的方法，并且在贝叶斯优化中变得特别有趣，例如，对于目标函数的最小化，低功能值的良好预测分布很重要。当将预期改进标准和REGP用于依次选择评估点时，从理论上保证了所得优化算法的收敛性（前提）。实验表明，在贝叶斯优化中使用REGP代替固定的GP模型是有益的。

translated by 谷歌翻译

NOMU: Neural Optimization-based Model Uncertainty

Jakob Heiss , Jakob Weissteiner , Hanna Wutte , Sven Seuken , Josef Teichmann

分类：机器学习 | 人工智能 | (统计)机器学习

2021-02-26

我们研究了回归中神经网络（NNS）的模型不确定性的方法。为了隔离模型不确定性的效果，我们专注于稀缺训练数据的无噪声环境。我们介绍了关于任何方法都应满足的模型不确定性的五个重要的逃亡者。但是，我们发现，建立的基准通常无法可靠地捕获其中一些逃避者，即使是贝叶斯理论要求的基准。为了解决这个问题，我们介绍了一种新方法来捕获NNS的模型不确定性，我们称之为基于神经优化的模型不确定性（NOMU）。 NOMU的主要思想是设计一个由两个连接的子NN组成的网络体系结构，一个用于模型预测，一个用于模型不确定性，并使用精心设计的损耗函数进行训练。重要的是，我们的设计执行NOMU满足我们的五个Desiderata。由于其模块化体系结构，NOMU可以为任何给定（先前训练）NN提供模型不确定性，如果访问其培训数据。我们在各种回归任务和无嘈杂的贝叶斯优化（BO）中评估NOMU，并具有昂贵的评估。在回归中，NOMU至少和最先进的方法。在BO中，Nomu甚至胜过所有考虑的基准。

translated by 谷歌翻译

Deep Learning for Bayesian Optimization of Scientific Problems with High-Dimensional Structure

Samuel Kim , Peter Y. Lu , Charlotte Loh , Jamie Smith , Jasper Snoek , Marin Soljačić

分类：机器学习

2021-04-23

贝叶斯优化（BO）是用于全局优化昂贵的黑盒功能的流行范式，但是在许多域中，该函数并不完全是黑色框。数据可能具有一些已知的结构（例如对称性）和/或数据生成过程可能是一个复合过程，除优化目标的值外，还可以产生有用的中间或辅助信息。但是，传统上使用的代孕模型，例如高斯工艺（GPS），随数据集大小的规模较差，并且不容易适应已知的结构。取而代之的是，我们使用贝叶斯神经网络，这是具有感应偏见的一类可扩展和灵活的替代模型，将BO扩展到具有高维度的复杂，结构化问题。我们证明了BO在物理和化学方面的许多现实问题，包括使用卷积神经网络对光子晶体材料进行拓扑优化，以及使用图神经网络对分子进行化学性质优化。在这些复杂的任务上，我们表明，就抽样效率和计算成本而言，神经网络通常优于GP作为BO的替代模型。

translated by 谷歌翻译

Batch Bayesian Optimization via Particle Gradient Flows

Enrico Crovini , Simon L. Cotter , Konstantinos Zygalakis , Andrew B. Duncan

分类： (统计)机器学习 | 机器学习

2022-09-10

贝叶斯优化（BO）方法试图找到目标功能的全球最佳功能，这些功能仅作为黑盒或昂贵的评估。这样的方法为目标函数构建了替代模型，从而量化了通过贝叶斯推论的替代物中的不确定性。客观评估是通过在每个步骤中最大化采集函数来依次确定的。但是，由于采集函数的非转换性，尤其是在批处理贝叶斯优化的情况下，该辅助优化问题可能是高度不平凡的，因此可以解决。在这项工作中，我们将批处理重新定义为在概率措施空间上的优化问题。我们基于多点预期改进来构建一个新的采集函数，该功能是概率度量空间的凸面。解决此“内部”优化问题的实用方案自然会作为该目标函数的梯度流。我们证明了这种新方法对不同基准函数的功效，并与最先进的批次BO方法进行了比较。

translated by 谷歌翻译

Combining Multi-Fidelity Modelling and Asynchronous Batch Bayesian Optimization

Jose Pablo Folch , Robert M Lee , Behrang Shafei , David Walz , Calvin Tsay , Mark van der Wilk , Ruth Misener

分类：机器学习 | (统计)机器学习

2022-11-11

Bayesian Optimization is a useful tool for experiment design. Unfortunately, the classical, sequential setting of Bayesian Optimization does not translate well into laboratory experiments, for instance battery design, where measurements may come from different sources and their evaluations may require significant waiting times. Multi-fidelity Bayesian Optimization addresses the setting with measurements from different sources. Asynchronous batch Bayesian Optimization provides a framework to select new experiments before the results of the prior experiments are revealed. This paper proposes an algorithm combining multi-fidelity and asynchronous batch methods. We empirically study the algorithm behavior, and show it can outperform single-fidelity batch methods and multi-fidelity sequential methods. As an application, we consider designing electrode materials for optimal performance in pouch cells using experiments with coin cells to approximate battery performance.

translated by 谷歌翻译

Policy Optimization in Dynamic Bayesian Network Hybrid Models of Biomanufacturing Processes

Hua Zheng , Wei Xie , Ilya O. Ryzhov , Dongming Xie

分类：人工智能 | 机器学习

2021-05-13

生物制药制造业是一个快速增长的行业，几乎对所有药品分支机构产生了影响。在具有许多相互依赖因素的复杂生物过程动力学的情况下，生物制造过程需要密切监测和控制，并且由于实验的高成本以及个性化的生物毒品的新颖性，因此数据非常有限。我们开发了一种新型的基于模型的增强学习框架，该框架可以在低数据表环境中实现人级控制。该模型使用动态的贝叶斯网络来捕获因素之间的因果关系，并预测不同输入的影响如何通过生物处理机制的途径传播。这使得在模型风险上既可以解释又有坚固的过程控制策略的设计。我们提出了一种计算有效的，可证明的收敛随机梯度方法，用于优化此类策略。验证是在具有多维，连续状态变量的现实应用程序上进行的。

translated by 谷歌翻译

Consistent and fast inference in compartmental models of epidemics using Poisson Approximate Likelihoods

Michael Whitehouse , Nick Whiteley , Lorenzo Rimella

分类：机器学习

2022-05-26

解决扩大流行病学推断对复杂和异质模型的挑战，我们引入了泊松近似可能性（PAL）方法。 PAL是从有限人口，随机隔室模型的近似滤波方程中得出的，并且较大的人口限制驱动了最大PAL估计器的一致性。我们的理论结果似乎是基于大量的部分观察到的关于大量人群限制的部分随机隔室模型的第一个基于可能性的参数估计一致性结果。与基于仿真的方法（例如近似贝叶斯计算和顺序蒙特卡洛）相比，PALS易于实现，仅涉及基本算术操作，而无需调整参数。并快速评估，不需要模型的模拟，并且具有与人口规模无关的计算成本。通过示例，我们演示了PAL的如何：嵌入延迟的接受粒子马尔可夫链蒙特卡洛中以促进贝叶斯的推断；用于拟合流感的年龄结构化模型，利用Stan的自动分化；并应用于校准麻疹的空间元群模型。

translated by 谷歌翻译

Gaussian Process Optimization in the Bandit Setting: No Regret and Experimental Design

Niranjan Srinivas , Andreas Krause , Sham M. Kakade , Matthias Seeger

分类：

2009-12-21

Many applications require optimizing an unknown, noisy function that is expensive to evaluate. We formalize this task as a multiarmed bandit problem, where the payoff function is either sampled from a Gaussian process (GP) or has low RKHS norm. We resolve the important open problem of deriving regret bounds for this setting, which imply novel convergence rates for GP optimization. We analyze GP-UCB, an intuitive upper-confidence based algorithm, and bound its cumulative regret in terms of maximal information gain, establishing a novel connection between GP optimization and experimental design. Moreover, by bounding the latter in terms of operator spectra, we obtain explicit sublinear regret bounds for many commonly used covariance functions. In some important cases, our bounds have surprisingly weak dependence on the dimensionality. In our experiments on real sensor data, GP-UCB compares favorably with other heuristical GP optimization approaches.

translated by 谷歌翻译

State-space deep Gaussian processes with applications

Zheng Zhao

分类： (统计)机器学习

2021-11-24

本论文主要涉及解决深层（时间）高斯过程（DGP）回归问题的状态空间方法。更具体地，我们代表DGP作为分层组合的随机微分方程（SDES），并且我们通过使用状态空间过滤和平滑方法来解决DGP回归问题。由此产生的状态空间DGP（SS-DGP）模型生成丰富的电视等级，与建模许多不规则信号/功能兼容。此外，由于他们的马尔可道结构，通过使用贝叶斯滤波和平滑方法可以有效地解决SS-DGPS回归问题。本论文的第二次贡献是我们通过使用泰勒力矩膨胀（TME）方法来解决连续离散高斯滤波和平滑问题。这诱导了一类滤波器和SmooThers，其可以渐近地精确地预测随机微分方程（SDES）解决方案的平均值和协方差。此外，TME方法和TME过滤器和SmoOthers兼容模拟SS-DGP并解决其回归问题。最后，本文具有多种状态 - 空间（深）GPS的应用。这些应用主要包括（i）来自部分观察到的轨迹的SDES的未知漂移功能和信号的光谱 - 时间特征估计。

translated by 谷歌翻译

Bayesian Optimization for Cascade-type Multi-stage Processes

Shunya Kusakawa , Shion Takeno , Yu Inatsu , Kentaro Kutsukake , Shogo Iwazaki , Takashi Nakano , Toru Ujihara , Masayuki Karasuyama , Ichiro Takeuchi

分类： (统计)机器学习 | 机器学习

2021-11-16

科学和工程中的复杂过程通常被制定为多阶段决策问题。在本文中，我们考虑了一种称为级联过程的多级决策过程。级联过程是一个多级过程，其中一个级的输出用作下一阶段的输入。当每个阶段的成本昂贵时，难以详尽地搜索每个阶段的最佳可控参数。为了解决这个问题，我们将级联过程的优化作为贝叶斯优化框架的延伸，提出了两种类型的采集功能（AFS），基于可靠的间隔和预期的改进。我们调查所提出的AFS的理论特性，并通过数值实验证明其有效性。此外，我们考虑一个被称为悬架设置的延伸，其中我们被允许在多阶段决策过程中暂停级联过程，这些过程经常出现在实际问题中。我们在太阳能电池模拟器的优化问题中应用提出的方法，这是本研究的动机。

translated by 谷歌翻译

Output Space Entropy Search Framework for Multi-Objective Bayesian Optimization

Syrine Belakaria , Aryan Deshwal , Janardhan Rao Doppa

分类：机器学习 | 人工智能 | (统计)机器学习

2021-10-13

我们考虑使用昂贵的功能评估（也称为实验）的黑匣子多目标优化（MOO）的问题，其中目标是通过最小化实验的总资源成本来近似真正的帕累托解决方案。例如，在硬件设计优化中，我们需要使用昂贵的计算模拟找到权衡性能，能量和面积开销的设计。关键挑战是选择使用最小资源揭示高质量解决方案的实验顺序。在本文中，我们提出了一种基于输出空间熵（OSE）搜索原理来解决MOO问题的一般框架：选择最大化每单位资源成本的信息的实验，这是真正的帕累托前线所获得的信息。我们适当地实例化了OSE搜索的原理，以导出以下四个Moo问题设置的高效算法：1）最基本的EM单一保真设置，实验昂贵且准确; 2）处理EM黑匣子约束}在不执行实验的情况下无法进行评估; 3）离散的多保真设置，实验可以在消耗的资源量和评估准确度时变化; 4）EM连续保真设置，其中连续函数近似导致巨大的实验空间。不同综合和现实世界基准测试的实验表明，基于OSE搜索的算法在既有计算效率和MOO解决方案的准确性方面改进了最先进的方法。

translated by 谷歌翻译

Robust Generalised Bayesian Inference for Intractable Likelihoods

Takuo Matsubara , Jeremias Knoblauch , François-Xavier Briol , Chris. J. Oates

分类： (统计)机器学习

2021-04-15

广义贝叶斯推理使用损失函数而不是可能性的先前信仰更新，因此可以用于赋予鲁棒性，以防止可能的错误规范的可能性。在这里，我们认为广泛化的贝叶斯推论斯坦坦差异作为损失函数的损失，由应用程序的可能性含有难治性归一化常数。在这种情况下，斯坦因差异来避免归一化恒定的评估，并产生封闭形式或使用标准马尔可夫链蒙特卡罗的通用后出版物。在理论层面上，我们显示了一致性，渐近的正常性和偏见 - 稳健性，突出了这些物业如何受到斯坦因差异的选择。然后，我们提供关于一系列棘手分布的数值实验，包括基于内核的指数家庭模型和非高斯图形模型的应用。

translated by 谷歌翻译

Generalised Bayesian Inference for Discrete Intractable Likelihood

Takuo Matsubara , Jeremias Knoblauch , François-Xavier Briol , Chris. J. Oates

分类： (统计)机器学习

2022-06-16

离散状态空间代表了对统计推断的主要计算挑战，因为归一化常数的计算需要在大型或可能的无限集中进行求和，这可能是不切实际的。本文通过开发适合离散可怜的可能性的新型贝叶斯推理程序来解决这一计算挑战。受到连续数据的最新方法学进步的启发，主要思想是使用离散的Fisher Divergence更新有关模型参数的信念，以代替有问题的棘手的可能性。结果是可以使用标准计算工具（例如Markov Chain Monte Carlo）进行采样的广义后部，从而规避了棘手的归一化常数。分析了广义后验的统计特性，并具有足够的后验一致性和渐近正态性的条件。此外，提出了一种新颖的通用后代校准方法。应用程序在离散空间数据的晶格模型和计数数据的多元模型上介绍，在每种情况下，方法论都以低计算成本促进通用的贝叶斯推断。

translated by 谷歌翻译