智能论文笔记

Multi-fidelity Hierarchical Neural Processes

Dongxia Wu , Matteo Chinazzi , Alessandro Vespignani , Yi-An Ma , Rose Yu

分类：机器学习

2022-06-10

科学和工程领域广泛使用计算机模拟。这些模拟通常以多个级别的复杂性运行，以平衡准确性和效率。多保真替代建模通过融合不同的仿真输出来降低计算成本。低保真模拟器产生的廉价数据可以与昂贵的高保真模拟器生成的有限高质量数据结合使用。基于高斯流程的现有方法依赖于内核函数的强烈假设，并且几乎不能扩展到高维设置。我们提出了多保真层次神经过程（MF-HNP），这是一种用于多效率替代模型的统一神经潜在变量模型。 MF-HNP继承了神经过程的灵活性和可扩展性。潜在变量将不同的保真度水平之间的相关性从观测到潜在空间。鉴于潜在状态，跨忠诚度之间的预测是有条件独立的。它有助于缓解现有方法中的错误传播问题。 MF-HNP足够灵活，可以在不同的保真度水平下处理非巢高维数据，并具有不同的输入和输出尺寸。我们评估了MF-HNP关于流行病学和气候建模任务的评估，从而在准确性和不确定性估计方面实现了竞争性能。与仅具有低维度（<10）任务的Deep Gaussian过程相反，我们的方法显示出巨大的希望，可以加速高维复杂模拟（用于流行病学建模的7000多个超过7000个，对于气候建模45000）。

translated by 谷歌翻译

Recent Advances in Bayesian Optimization

Xilu Wang , Yaochu Jin , Sebastian Schmitt , Markus Olhofer

分类：机器学习 | 神经与进化计算

2022-06-07

由于其数据效率，贝叶斯优化已经出现在昂贵的黑盒优化的最前沿。近年来，关于新贝叶斯优化算法及其应用的发展的研究激增。因此，本文试图对贝叶斯优化的最新进展进行全面和更新的调查，并确定有趣的开放问题。我们将贝叶斯优化的现有工作分为九个主要群体，并根据所提出的算法的动机和重点。对于每个类别，我们介绍了替代模型的构建和采集功能的适应的主要进步。最后，我们讨论了开放的问题，并提出了有希望的未来研究方向，尤其是在分布式和联合优化系统中的异质性，隐私保护和公平性方面。

translated by 谷歌翻译

Infinite-Fidelity Coregionalization for Physical Simulation

Shibo Li , Zheng Wang , Robert M. Kirby , Shandian Zhe

分类：机器学习

2022-07-01

多保真建模和学习在与物理模拟相关的应用中很重要。它可以利用低保真性和高保真示例进行培训，以降低数据生成成本，同时仍然达到良好的性能。尽管现有方法仅模型有限，离散的保真度，但实际上，忠诚度的选择通常是连续且无限的，这可以对应于连续的网格间距或有限元元素长度。在本文中，我们提出了无限的保真度核心化（IFC）。鉴于数据，我们的方法可以在连续无限的保真度中提取和利用丰富的信息来增强预测准确性。我们的模型可以插值和/或推断出对新型保真度的预测，甚至可以高于训练数据的保真度。具体而言，我们引入了一个低维的潜在输出作为保真度和输入的连续函数，并具有带有基矩阵的多个IT以预测高维解决方案输出。我们将潜在输出建模为神经普通微分方程（ODE），以捕获内部的复杂关系并在整个连续保真度中整合信息。然后，我们使用高斯工艺或其他颂歌来估计忠诚度变化的碱基。为了有效的推断，我们将碱基重组为张量，并使用张量 - 高斯变异后部为大规模输出开发可扩展的推理算法。我们在计算物理学的几个基准任务中展示了我们的方法的优势。

translated by 谷歌翻译

Shallow and Deep Nonparametric Convolutions for Gaussian Processes

Thomas M. McDonald , Magnus Ross , Michael T. Smith , Mauricio A. Álvarez

分类： (统计)机器学习 | 机器学习

2022-06-17

高斯流程（GPS）实际应用的主要挑战是选择适当的协方差函数。 GPS的移动平均值或过程卷积的构建可以提供一些额外的灵活性，但仍需要选择合适的平滑核，这是非平凡的。以前的方法通过在平滑内核上使用GP先验，并通过扩展协方差来构建协方差函数，以绕过预先指定它的需求。但是，这样的模型在几种方面受到限制：它们仅限于单维输入，例如时间;它们仅允许对单个输出进行建模，并且由于推理并不简单，因此不会扩展到大型数据集。在本文中，我们引入了GPS的非参数过程卷积公式，该公式通过使用基于Matheron规则的功能采样方法来减轻这些弱点，以使用诱导变量的间域间采样进行快速采样。此外，我们提出了这些非参数卷积的组成，可作为经典深度GP模型的替代方案，并允许从数据中推断中间层的协方差函数。我们测试了单个输出GP，多个输出GPS和DEEP GPS在基准测试上的模型性能，并发现在许多情况下，我们的方法可以提供比标准GP模型的改进。

translated by 谷歌翻译

Discovering and forecasting extreme events via active learning in neural operators

Ethan Pickering , Stephen Guth , George Em Karniadakis , Themistoklis P. Sapsis

分类：机器学习 | (统计)机器学习

2022-04-05

社会和自然中的极端事件，例如大流行尖峰，流氓波浪或结构性失败，可能会带来灾难性的后果。极端的表征很困难，因为它们很少出现，这似乎是由良性的条件引起的，并且属于复杂且通常是未知的无限维系统。这种挑战使他们将其描述为“毫无意义”。我们通过将贝叶斯实验设计（BED）中的新型训练方案与深神经操作员（DNOS）合奏结合在一起来解决这些困难。这个模型不足的框架配对了一个床方案，该床方案积极选择数据以用近似于无限二二维非线性运算符的DNO集合来量化极端事件。我们发现，这个框架不仅清楚地击败了高斯流程（GPS），而且只有两个成员的浅色合奏表现最好； 2）无论初始数据的状态如何（即有或没有极端），都会发现极端； 3）我们的方法消除了“双研究”现象； 4）与逐步全球Optima相比，使用次优的采集点的使用不会阻碍床的性能； 5）蒙特卡洛的获取优于高量级的标准优化器。这些结论共同构成了AI辅助实验基础设施的基础，该基础设施可以有效地推断并查明从物理到社会系统的许多领域的关键情况。

translated by 谷歌翻译

Multi-Task Neural Processes

Jiayi Shen , Xiantong Zhen , Marcel Worring , Ling Shao

分类：机器学习

2021-11-10

神经过程最近被出现为一类强大的神经潜变模型，这些模型结合了神经网络和随机过程的优势。由于它们可以编码网络功能空间中的上下文数据，因此它们为多任务学习中的任务相关性提供了一种新方法。为了研究其潜力，我们开发多任务神经过程，是多任务学习的神经过程的新变种。特别是，我们建议探索功能空间中相关任务的可转让知识，以提供用于改善每个任务的归纳偏差。为此，我们派生在分层贝叶斯推理框架中的功能前导者，它使每个任务能够将相关任务提供的共享知识结合到预测函数的上下文中。我们的多任务神经工艺方法展开了Vanilla神经过程的范围，并提供了一种探索功能空间任务相关性的新方法，以获得多任务学习。所提出的多任务神经过程能够学习具有有限标记数据和域移位的有限的多个任务。我们对多任务回归和分类任务的几个基准进行了大量的实验评估。结果展示了多任务神经过程在多任务学习任务中转移有用知识的有效性以及多任务分类和大脑图像分割中的优越性。

translated by 谷歌翻译

Bayesian Calibration for Activity Based Models

Laura Schultz , Joshua Auld , Vadim Sokolov

分类： (统计)机器学习

2022-03-08

我们考虑基于活动的运输模拟器的校准和不确定性分析问题。基于活动的模型（ABM）依靠单个旅行者行为的统计模型来预测大都市地区的高阶旅行模式。输入参数通常是使用最大似然从旅行者调查中估算的。我们开发了一种使用高斯工艺模拟器使用流量流数据校准这些参数的方法。我们的方法扩展了传统的模拟器，以处理运输模拟器的高维和非平稳性。我们介绍了一个深度学习维度降低模型，该模型与高斯工艺模型共同估计以近似模拟器。我们使用几个模拟示例以及校准伊利诺伊州布卢明顿的关键参数来证明方法。

translated by 谷歌翻译

Safe Real-Time Optimization using Multi-Fidelity Gaussian Processes

Panagiotis Petsagkourakis , Benoit Chachuat , Ehecatl Antonio del Rio-Chanona

分类：机器学习

2021-11-10

本文提出了一类新的实时优化方案，以克服不确定过程的系统模型不匹配。这项工作的新颖性在于在贝叶斯优化框架内集成无衍生优化的优化方案和多保真高斯进程。所提出的方案对随机系统进行了两个高斯过程，通过测量来模拟（已知）过程模型，另一个，真实系统。以这种方式，可以通过模型获得低保真度样本，而通过系统的测量获得高保真样本。该框架在非参数时捕获系统的行为，同时通过采集函数驾驶探索。使用高斯进程代表系统的好处是能够实时地执行不确定性量化，并允许有机会限制以满足高信任。这导致一种实用的方法，其在数值案例研究中示出，包括半批量光生物反应器优化问题。

translated by 谷歌翻译

Transformer Neural Processes: Uncertainty-Aware Meta Learning Via Sequence Modeling

Tung Nguyen , Aditya Grover

分类：机器学习 | 人工智能

2022-07-09

神经过程（NP）是一种流行的元学习方法。与高斯工艺（GPS）类似，NPS将分布定义在功能上，并可以估计其预测中的不确定性。但是，与GPS不同，NP及其变体遭受不足的折磨，并且通常具有棘手的可能性，这限制了其在顺序决策中的应用。我们提出了变形金刚神经过程（TNP），这是NP家族的新成员，将不确定性感知的元学习作为序列建模问题。我们通过基于自回旋的可能性目标学习TNP，并通过新颖的基于变压器的建筑实例化。该模型架构尊重问题结构固有的归纳偏差，例如对观察到的数据点的不变性以及与未观察到的点的等效性。我们进一步研究了TNP框架内的旋钮，以额外的计算来折衷解码分布的表达。从经验上讲，我们表明TNP在各种基准问题上实现最新性能，在元回归，图像完成，上下文多武器匪徒和贝叶斯优化方面表现优于所有先前的NP变体。

translated by 谷歌翻译

Deep dynamic modeling with just two time points: Can we still allow for individual trajectories?

Maren Hackenberg , Philipp Harms , Michelle Pfaffenlehner , Astrid Pechmann , Janbernd Kirschner , Thorsten Schmidt , Harald Binder

分类： (统计)机器学习 | 机器学习

2020-12-01

纵向生物医学数据通常是稀疏时间网格和个体特定发展模式的特征。具体而言，在流行病学队列研究和临床登记处，我们面临的问题是在研究早期阶段中可以从数据中学到的问题，只有基线表征和一个后续测量。灵感来自最近的进步，允许将深度学习与动态建模相结合，我们调查这些方法是否可用于揭示复杂结构，特别是对于每个单独的两个观察时间点的极端小数据设置。然后，通过利用个体的相似性，可以使用不规则间距来获得有关个体动态的更多信息。我们简要概述了变形的自动化器（VAES）如何作为深度学习方法，可以与普通微分方程（ODES）相关联用于动态建模，然后具体研究这种方法的可行性，即提供个人特定的潜在轨迹的方法通过包括规律性假设和个人的相似性。我们还提供了对这种深度学习方法的描述作为过滤任务，以提供统计的视角。使用模拟数据，我们展示了方法可以在多大程度上从多大程度上恢复具有两个和四个未知参数的颂歌系统的单个轨迹，以及使用具有类似轨迹的个体群体，以及其崩溃的地方。结果表明，即使在极端的小数据设置中，这种动态深度学习方法也可能是有用的，但需要仔细调整。

translated by 谷歌翻译

Combining Multi-Fidelity Modelling and Asynchronous Batch Bayesian Optimization

Jose Pablo Folch , Robert M Lee , Behrang Shafei , David Walz , Calvin Tsay , Mark van der Wilk , Ruth Misener

分类：机器学习 | (统计)机器学习

2022-11-11

Bayesian Optimization is a useful tool for experiment design. Unfortunately, the classical, sequential setting of Bayesian Optimization does not translate well into laboratory experiments, for instance battery design, where measurements may come from different sources and their evaluations may require significant waiting times. Multi-fidelity Bayesian Optimization addresses the setting with measurements from different sources. Asynchronous batch Bayesian Optimization provides a framework to select new experiments before the results of the prior experiments are revealed. This paper proposes an algorithm combining multi-fidelity and asynchronous batch methods. We empirically study the algorithm behavior, and show it can outperform single-fidelity batch methods and multi-fidelity sequential methods. As an application, we consider designing electrode materials for optimal performance in pouch cells using experiments with coin cells to approximate battery performance.

translated by 谷歌翻译

Revisiting Active Sets for Gaussian Process Decoders

Pablo Moreno-Muñoz , Cilie W Feldager , Søren Hauberg

分类： (统计)机器学习 | 机器学习

2022-09-10

基于高斯工艺（GP）建立的解码器由于非线性函数空间的边缘化而诱人。这样的模型（也称为GP-LVM）通常很昂贵且众所周知，在实践中训练，但可以使用变异推理和诱导点来缩放。在本文中，我们重新访问主动集近似值。我们基于最近发现的交叉验证链接来开发对数 - 边界可能性的新随机估计，并提出了其计算有效近似。我们证明，所得的随机活动集（SAS）近似显着提高了GP解码器训练的鲁棒性，同时降低了计算成本。SAS-GP在潜在空间中获得更多的结构，比例为许多数据点，并且比变异自动编码器更好地表示表示，这对于GP解码器来说很少是这种情况。

translated by 谷歌翻译

Evidential Conditional Neural Processes

Deep Shankar Pandey , Qi Yu

分类：机器学习 | 人工智能

2022-11-30

The Conditional Neural Process (CNP) family of models offer a promising direction to tackle few-shot problems by achieving better scalability and competitive predictive performance. However, the current CNP models only capture the overall uncertainty for the prediction made on a target data point. They lack a systematic fine-grained quantification on the distinct sources of uncertainty that are essential for model training and decision-making under the few-shot setting. We propose Evidential Conditional Neural Processes (ECNP), which replace the standard Gaussian distribution used by CNP with a much richer hierarchical Bayesian structure through evidential learning to achieve epistemic-aleatoric uncertainty decomposition. The evidential hierarchical structure also leads to a theoretically justified robustness over noisy training tasks. Theoretical analysis on the proposed ECNP establishes the relationship with CNP while offering deeper insights on the roles of the evidential parameters. Extensive experiments conducted on both synthetic and real-world data demonstrate the effectiveness of our proposed model in various few-shot settings.

translated by 谷歌翻译

When in Doubt: Neural Non-Parametric Uncertainty Quantification for Epidemic Forecasting

Harshavardhan Kamarthi , Lingkai Kong , Alexander Rodríguez , Chao Zhang , B. Aditya Prakash

分类：机器学习 | 人工智能

2021-06-07

准确可靠的流行病预测是对公共卫生规划和疾病缓解影响的重要问题。大多数现有的疫情预测模型无视不确定性量化，导致错误校准的预测。近期神经模型的作品，用于不确定感知的时序预测也有几个限制;例如很难在贝叶斯NNS中指定有意义的前瞻，而Deep Leaseming的方法在实践中是计算昂贵的。在本文中，我们填补了这个重要的差距。我们将预测任务模拟为概率生成过程，并提出了一种名为EPIFNP的功能神经过程模型，其直接模拟预测值的概率密度。 EPIFNP利用动态随机相关图来模拟非参数方式之间序列之间的相关性，并设计不同的随机潜变量以捕获不同视角的功能不确定性。我们在实时流感预测环境中的广泛实验表明，EPIFNP在准确性和校准度量中显着优于先前的最先进模型，精度高达2.5倍，校准2.4倍。此外，由于其生成过程的性质，EPIFNP了解当前季节与历史季节类似模式之间的关系，从而实现可解释的预测。超越疫情预测，EPIFNP可以是独立的利益，以便在深度顺序模型中推进预测性分析的深度顺序模型

translated by 谷歌翻译

Deep Gaussian Process Emulation using Stochastic Imputation

Deyu Ming , Daniel Williamson , Serge Guillas

分类： (统计)机器学习 | 机器学习

2021-07-04

与常规的GPS相比，深层高斯工艺（DGP）提供了丰富的模型，可以更好地表示具有不同的机制或急剧变化的功能。在这项工作中，我们为计算机模型模拟的DGP提出了一种新颖的推理方法。通过随机归纳潜在层，我们的方法将DGP转换为链接的GP：为链接计算机模型系统开发的新型模拟器。这种转换允许有效的DGP培训程序，仅涉及常规GP的优化。此外，DGP模拟器的预测可以通过自然利用链接的GP仿真器的封闭形式的预测手段和方差来快速和分析性地进行。我们在一系列合成示例和经验应用中演示了该方法，并表明它是DGP替代推理的竞争候选者，将效率相结合，可与双随机的变异推理和不确定性量化相媲美，与完全巴约西亚方法相当。还生产了$ \ texttt {python} $ package $ \ texttt {dgpsi} $实现该方法并在https://github.com/mingdeyu/dgp上找到。

translated by 谷歌翻译

Latent Variable Modelling Using Variational Autoencoders: A survey

Vasanth Kalingeri

分类：机器学习 | 人工智能

2022-06-20

概率分布允许从业者发现数据中的隐藏结构，并构建模型，以使用有限的数据解决监督的学习问题。该报告的重点是变异自动编码器，这是一种学习大型复杂数据集概率分布的方法。该报告提供了对变异自动编码器的理论理解，并巩固了该领域的当前研究。该报告分为多个章节，第一章介绍了问题，描述了变异自动编码器并标识了该领域的关键研究方向。第2、3、4和5章深入研究了每个关键研究领域的细节。第6章总结了报告，并提出了未来工作的指示。具有机器学习基本思想但想了解机器学习研究中的一般主题的读者可以从报告中受益。该报告解释了有关学习概率分布的中心思想，人们为使这种危险做些什么，并介绍了有关当前如何应用深度学习的细节。该报告还为希望为这个子场做出贡献的人提供了温和的介绍。

translated by 谷歌翻译

Practical Conditional Neural Processes Via Tractable Dependent Predictions

Stratis Markou , James Requeima , Wessel P. Bruinsma , Anna Vaughan , Richard E. Turner

分类： (统计)机器学习 | 机器学习

2022-03-16

条件神经过程（CNP; Garnelo等，2018a）是元学习模型，它利用深度学习的灵活性来产生良好的预测，并自然处理网格和缺失的数据。 CNPS缩放到大型数据集并轻松训练。由于这些功能，CNP似乎非常适合来自环境科学或医疗保健的任务。不幸的是，CNP不会产生相关的预测，从而使它们从根本上不适合许多估计和决策任务。例如，预测热浪或洪水需要在时间和空间中对温度或降水的依赖性进行建模。建模输出依赖性的现有方法，例如神经过程（NPS; Garnelo等，2018b）或FullConvgNP（Bruinsma等，2021），要么是复杂的训练或过于昂贵的。需要的是一种提供依赖预测的方法，但可以易于训练和计算障碍。在这项工作中，我们提出了一类新的神经过程模型，这些模型可以简单且可扩展，从而提供相关的预测并支持确切的最大似然训练。我们通过使用可逆输出转换来扩展提出的模型，以捕获非高斯输出分布。我们的模型可以用于需要相关功能样本的下游估计任务中。通过考虑输出依赖性，我们的模型在合成和真实数据的一系列实验上显示出改进的预测性能。

translated by 谷歌翻译

Non-Myopic Multifidelity Bayesian Optimization

Francesco Di Fiore , Laura Mainini

分类：机器学习

2022-07-13

贝叶斯优化是黑匣子功能优化的流行框架。多重方法方法可以通过利用昂贵目标功能的低保真表示来加速贝叶斯优化。流行的多重贝叶斯策略依赖于采样政策，这些策略解释了在特定意见下评估目标函数的立即奖励，从而排除了更多的信息收益，这些收益可能会获得更多的步骤。本文提出了一个非侧重多倍数贝叶斯框架，以掌握优化的未来步骤的长期奖励。我们的计算策略具有两步的lookahead多因素采集函数，可最大程度地提高累积奖励，从而测量解决方案的改进，超过了前面的两个步骤。我们证明，所提出的算法在流行的基准优化问题上优于标准的多尺寸贝叶斯框架。

translated by 谷歌翻译

Data Fusion with Latent Map Gaussian Processes

Nicholas Oune , Jonathan Tammer Eweis-Labolle , Ramin Bostanabad

分类： (统计)机器学习 | 机器学习

2021-12-04

多保真建模和校准是在工程设计中普遍出现的数据融合任务。在本文中，我们介绍了一种基于潜在地图高斯过程（LMGPS）的新方法，可实现高效准确的数据融合。在我们的方法中，我们将数据融合转换为潜在的空间学习问题，其中自动学习不同数据源之间的关系。这种转换赋予我们的方法具有有吸引力的优点，例如提高准确性，降低成本，灵活性，共同熔断任何数量的数据源，以及可视化数据源之间的相关性。该可视化允许用户通过拟合LMGP仅拟合到具有良好相关的数据源的子集的子集来检测模型形式误差或确定用于高保真仿真的最佳策略。我们还开发了一种新的内核功能，使LMGPS能够不仅构建概率的多保真代理，而且还具有高精度和一致性的估计参数。与现有技术相比，我们的方法的实施和使用易于更简单，更不容易出现数值问题。我们通过在广泛的示例中比较其对竞争方法的性能来证明基于LMGP的数据融合的好处。

translated by 谷歌翻译

Mitigating the Effects of Non-Identifiability on Inference for Bayesian Neural Networks with Latent Variables

Yaniv Yacoby , Weiwei Pan , Finale Doshi-Velez

分类：机器学习 | (统计)机器学习

2019-11-01

贝叶斯神经网络具有潜在变量（BNN + LVS）通过明确建模模型不确定性（通过网络权重）和环境暂停（通过潜在输入噪声变量）来捕获预测的不确定性。在这项工作中，我们首先表明BNN + LV具有严重形式的非可识别性：可以在模型参数和潜在变量之间传输解释性，同时拟合数据。我们证明，在无限数据的极限中，网络权重和潜变量的后部模式从地面真理渐近地偏离。由于这种渐近偏差，传统的推理方法可以在实践中，产量参数概括不确定和不确定的不确定性。接下来，我们开发一种新推断过程，明确地减轻了训练期间不可识别性的影响，并产生高质量的预测以及不确定性估计。我们展示我们的推理方法在一系列合成和实际数据集中改善了基准方法。

translated by 谷歌翻译