智能论文笔记

A generalised form for a homogeneous population of structures using an overlapping mixture of Gaussian processes

Tina A. Dardeno , Lawrence A. Bull , Nikolaos Dervilis , Keith Worden

分类：机器学习 | (统计)机器学习

2022-06-23

固有频率的降低通常用作结构健康监测（SHM）目的的损坏指标。但是，操作和环境条件的波动，边界条件的变化以及名义相同结构之间的微小差异也会影响刚度，从而产生模仿或掩盖损坏的频率变化。这种可变性限制了SHM技术的实际实施和概括。这项工作的目的是研究正常变异的效果，并确定解释产生不确定性的方法。这项工作考虑了从四个健康的全尺度复合直升机叶片收集的振动数据。叶片名义上是相同的，但叶片是不同的，并且叶片之间的材料特性和几何形状略有差异，导致频率响应函数的显着差异，这是整个输入空间中四个独立的轨迹。在本文中，使用高斯工艺（OMGP）的重叠混合物来生成标签并量化直升机叶片的正常条件频率响应数据的不确定性。使用基于人群的方法，OMGP模型提供了称为形式的通用表示形式，以表征叶片的正常状况。然后将其他模拟数据与该形式进行比较，并使用边缘样式新颖性指数评估损伤。

translated by 谷歌翻译

Modelling variability in vibration-based PBSHM via a generalised population form

Tina A Dardeno , Lawrence A Bull , Robin S Mills , Nikolaos Dervilis , Keith Worden

分类：机器学习 | (统计)机器学习

2022-03-14

在过去的三十年中，结构性健康监测（SHM）一直是一个活跃的研究领域，并且在此期间积累了许多关键进展，如文献所示。但是，由于损害状态数据，操作和环境波动，可重复性问题以及边界条件的变化，SHM仍然面临挑战。这些问题在被捕获的功能中是不一致的，并且可能会对实际实施产生巨大影响，但更重要的是对技术的概括。基于人群的SHM旨在通过使用从相似结构组收集的数据对缺失信息进行建模和传输信息来解决其中的一些问题。在这项工作中，从四个健康的，名义上相同的全尺度复合直升机叶片收集了振动数据。制造差异（例如，几何形状和/或材料属性的略有差异），在其结构动力学上显示为可变性，这对于基于振动数据的机器学习而对SHM来说可能非常有问题。这项工作旨在通过使用高斯过程的混合物来定义叶片的频率响应函数的通用模型来解决此变异性。

translated by 谷歌翻译

Bayesian Modelling of Multivalued Power Curves from an Operational Wind Farm

L. A. Bull , P. A. Gardner , T. J. Rogers , N. Dervilis , E. J. Cross , E. Papatheou , A. E. Maguire , C. Campos , K. Worden

分类： (统计)机器学习 | 机器学习

2021-11-30

功率曲线捕获风速与特定风力涡轮机的输出功率之间的关系。这种功能的准确回归模型在监控，维护，设计和规划方面证明是有用的。然而，在实践中，测量并不总是对应于理想曲线：电源缩减将显示为（附加）功能组件。这种多值关系不能通过常规回归建模，并且在预处理期间通常去除相关数据。目前的工作表明了一种替代方法，可以在缩减电力数据中推断多值关系。使用基于人群的方法，将概率回归模型的重叠混合应用于从操作风电场内的涡轮机记录的信号。示出了模型，以便在整个人口中提供精确的实际功率数据表示。

translated by 谷歌翻译

Hierarchical Bayesian Modelling for Knowledge Transfer Across Engineering Fleets via Multitask Learning

L. A. Bull , D. Di Francesco , M. Dhada , O. Steinert , T. Lindgren , A. K. Parlikad , A. B. Duncan , M. Girolami

分类： (统计)机器学习 | 机器学习

2022-04-26

在建立工程基础设施的预测模型时，提出了人群级分析来解决数据稀疏性。利用可解释的层次贝叶斯方法和操作车队数据，域专业知识是自然编码（并适当共享）在不同的子组之间，代表（i）使用型，（ii）组件或（iii）操作条件。具体而言，利用领域专业知识来通过假设（和先前的分布）来限制模型，从而使该方法可以自动共享相似资产之间的信息，从而改善了对风电场中卡车机队和权力预测的生存分析。在每个资产管理示例中，在合并的推理中学习了一组相关的功能，以学习人口模型。当允许子型在层次结构中的不同级别共享相关信息时，参数估计得到改善。反过来，数据不完整的组会自动从数据丰富的组中借用统计强度。统计相关性使知识转移能够通过贝叶斯转移学习，并且可以检查相关性，以告知哪些资产共享有关哪些效果（即参数）的信息。两种案例研究的成功都证明了实践基础设施监测的广泛适用性，因为该方法自然适应了不同原位示例的可解释的车队模型。

translated by 谷歌翻译

On robust risk-based active-learning algorithms for enhanced decision support

Aidan J. Hughes , Lawrence A. Bull , Paul Gardner , Nikolaos Dervilis , Keith Worden

分类：机器学习 | (统计)机器学习

2022-01-07

分类模型是物理资产管理技术的基本组成部分，如结构健康监测（SHM）系统和数字双胞胎。以前的工作介绍了\ Texit {基于风险的主动学习}，一种在线方法，用于开发考虑它们所应用的决策支持上下文的统计分类器。通过优先查询数据标签来考虑决策，根据\ Textit {完美信息的预期值}（EVPI）。虽然通过采用基于风险的主动学习方法获得了几种好处，但包括改进的决策性能，但算法遭受与引导查询过程的采样偏差有关的问题。这种采样偏差最终表现为在主动学习后的后期阶段的决策表现的下降，这又对应于丢失的资源/实用程序。目前的论文提出了两种新方法来抵消采样偏置的影响：\纺织{半监督学习}，以及\ extentit {鉴别的分类模型}。首先使用合成数据集进行这些方法，然后随后应用于实验案例研究，具体地，Z24桥数据集。半监督学习方法显示有变量性能;具有稳健性，对采样偏置依赖于对每个数据集选择模型所选择的生成分布的适用性。相反，判别分类器被证明对采样偏压的影响具有优异的鲁棒性。此外，发现在监控运动期间进行的检查数，因此可以通过仔细选择决策支持监测系统中使用的统计分类器的仔细选择来减少。

translated by 谷歌翻译

Modelling stellar activity with Gaussian process regression networks

J. D. Camacho , J. P. Faria , P. T. P. Viana

分类： (统计)机器学习

2022-05-13

Stellar photospheric activity is known to limit the detection and characterisation of extra-solar planets. In particular, the study of Earth-like planets around Sun-like stars requires data analysis methods that can accurately model the stellar activity phenomena affecting radial velocity (RV) measurements. Gaussian Process Regression Networks (GPRNs) offer a principled approach to the analysis of simultaneous time-series, combining the structural properties of Bayesian neural networks with the non-parametric flexibility of Gaussian Processes. Using HARPS-N solar spectroscopic observations encompassing three years, we demonstrate that this framework is capable of jointly modelling RV data and traditional stellar activity indicators. Although we consider only the simplest GPRN configuration, we are able to describe the behaviour of solar RV data at least as accurately as previously published methods. We confirm the correlation between the RV and stellar activity time series reaches a maximum at separations of a few days, and find evidence of non-stationary behaviour in the time series, associated with an approaching solar activity minimum.

translated by 谷歌翻译

Marginalised Gaussian Processes with Nested Sampling

Fergus Simpson , Vidhi Lalchand , Carl Edward Rasmussen

分类： (统计)机器学习 | 机器学习

2020-10-30

高斯工艺（GPS）模型是具有由内核功能控制的电感偏差的功能丰富的分布。通过使用边际似然作为目标优化内核超参数来实现学习。这种称为II类型最大似然（ML-II）的经典方法产生了高参数的点估计，并继续成为培训GPS的默认方法。然而，这种方法在低估预测不确定性并且易于在有许多近似数目时易于过度拟合。此外，基于梯度的优化使ML-II点估计高度易受局部最小值的存在。这项工作提出了一种替代的学习过程，其中核心函数的超参数使用嵌套采样（NS）被边缘化，这是一种非常适合于复杂的多模态分布来采样的技术。我们专注于具有频谱混合物（SM）粒子的回归任务，并发现定量模型不确定性的原则方法导致在一系列合成和基准数据集中的预测性能中的大量收益。在这种情况下，还发现嵌套的抽样在汉密尔顿蒙特卡罗（HMC）上提供了速度优势，广泛认为是基于MCMC推断的金标准。

translated by 谷歌翻译

Physics-informed machine learning for Structural Health Monitoring

Elizabeth J Cross , Samuel J Gibson , Matthew R Jones , Daniel J Pitchforth , Sikai Zhang , Timothy J Rogers

分类：机器学习

2022-06-30

在结构健康监测中使用机器学习的情况变得越来越普遍，因为许多固有的任务（例如回归和分类）在开发基于条件的评估中自然而然地属于其职责。本章介绍了物理知识的机器学习概念，其中人们适应ML算法来说明工程师通常会试图建模或评估的结构。本章将演示将基于物理学的模型与数据驱动的模型相结合的灰色盒模型如何在SHM设置中提高预测能力。此处证明的方法的特殊优势是模型的推广能力，并具有在不同制度中增强的预测能力。这是一项需要评估的关键问题，或者监视数据不涵盖结构将经历的操作条件。本章将概述物理知识的ML，并在贝叶斯环境中引入了许多用于灰色盒子建模的方法。讨论的主要ML工具将是高斯过程回归，我们将证明如何通过约束，平均功能和内核设计以及最终在状态空间设置中通过约束来合并物理假设/模型。将展示一系列SHM应用程序，从负载监视离岸和航空航天结构的负载任务到长跨度桥梁的性能监控。

translated by 谷歌翻译

Cluster-Specific Predictions with Multi-Task Gaussian Processes

Arthur Leroy , Pierre Latouche , Benjamin Guedj , Servane Gey

分类：机器学习 | (统计)机器学习

2020-11-16

引入了涉及高斯流程（GPS）的模型，以同时处理多个功能数据的多任务学习，聚类和预测。该过程充当了功能数据的基于模型的聚类方法，也是对新任务进行后续预测的学习步骤。该模型是将多任务GPS与常见平均过程的混合物实例化。得出了一种用于处理超参数的优化以及超构件对潜在变量和过程的估计的优化。我们建立了明确的公式，用于将平均过程和潜在聚类变量整合到预测分布中，这是两个方面的不确定性。该分布定义为集群特异性GP预测的混合物，在处理组结构数据时，可以增强性能。该模型处理观察的不规则网格，并提供了关于协方差结构的不同假设，用于在任务之间共享其他信息。聚类和预测任务上的性能将通过各种模拟方案和真实数据集进行评估。总体算法称为magmaclust，可公开作为R包。

translated by 谷歌翻译

A Latent Restoring Force Approach to Nonlinear System Identification

Timothy J. Rogers , Tobias Friis

分类： (统计)机器学习 | 机器学习

2021-09-22

非线性动态系统的识别仍然是整个工程的重大挑战。这项工作提出了一种基于贝叶斯过滤的方法，以提取和确定系统中未知的非线性项的贡献，可以将其视为恢复力表面类型方法的替代观点。为了实现这种识别，最初将非线性恢复力的贡献作为高斯过程建模。该高斯过程将转换为状态空间模型，并与系统的线性动态组件结合使用。然后，通过推断过滤和平滑分布，可以提取系统的内部状态和非线性恢复力。在这些状态下，可以构建非线性模型。在模拟案例研究和实验基准数据集中，该方法被证明是有效的。

translated by 谷歌翻译

Reduced-order modeling for parameterized large-eddy simulations of atmospheric pollutant dispersion

Bastien X Nony , Mélanie Rochoux , Thomas Jaravel , Didier Lucor

分类： (统计)机器学习

2022-08-02

映射近场污染物的浓度对于跟踪城市地区意外有毒羽状分散体至关重要。通过求解大部分湍流谱，大型模拟（LES）具有准确表示污染物浓度空间变异性的潜力。找到一种合成大量信息的方法，以提高低保真操作模型的准确性（例如，提供更好的湍流封闭条款）特别有吸引力。这是一个挑战，在多质量环境中，LES的部署成本高昂，以了解羽流和示踪剂分散如何随着各种大气和源参数的变化。为了克服这个问题，我们提出了一个合并正交分解（POD）和高斯过程回归（GPR）的非侵入性降低阶模型，以预测与示踪剂浓度相关的LES现场统计。通过最大的后验（MAP）过程，GPR HyperParameter是通过POD告知的最大后验（MAP）过程来优化组件的。我们在二维案例研究上提供了详细的分析，该案例研究对应于表面安装的障碍物上的湍流大气边界层流。我们表明，障碍物上游的近源浓度异质性需要大量的POD模式才能得到充分捕获。我们还表明，逐组分的优化允许捕获POD模式中的空间尺度范围，尤其是高阶模式中较短的浓度模式。如果学习数据库由至少五十至100个LES快照制成，则可以首先估算所需的预算，以朝着更逼真的大气分散应用程序迈进，因此减少订单模型的预测仍然可以接受。

translated by 谷歌翻译

Fast and robust Bayesian Inference using Gaussian Processes with GPry

Jonas El Gammal , Nils Schöneberg , Jesús Torrado , Christian Fidler

分类： (统计)机器学习

2022-11-03

We present the GPry algorithm for fast Bayesian inference of general (non-Gaussian) posteriors with a moderate number of parameters. GPry does not need any pre-training, special hardware such as GPUs, and is intended as a drop-in replacement for traditional Monte Carlo methods for Bayesian inference. Our algorithm is based on generating a Gaussian Process surrogate model of the log-posterior, aided by a Support Vector Machine classifier that excludes extreme or non-finite values. An active learning scheme allows us to reduce the number of required posterior evaluations by two orders of magnitude compared to traditional Monte Carlo inference. Our algorithm allows for parallel evaluations of the posterior at optimal locations, further reducing wall-clock times. We significantly improve performance using properties of the posterior in our active learning scheme and for the definition of the GP prior. In particular we account for the expected dynamical range of the posterior in different dimensionalities. We test our model against a number of synthetic and cosmological examples. GPry outperforms traditional Monte Carlo methods when the evaluation time of the likelihood (or the calculation of theoretical observables) is of the order of seconds; for evaluation times of over a minute it can perform inference in days that would take months using traditional methods. GPry is distributed as an open source Python package (pip install gpry) and can also be found at https://github.com/jonaselgammal/GPry.

translated by 谷歌翻译

Non-Gaussian Process Regression

Yaman Kındap , Simon Godsill

分类： (统计)机器学习 | 机器学习

2022-09-07

标准GPS为行为良好的流程提供了灵活的建模工具。然而，预计与高斯的偏差有望在现实世界数据集中出现，结构异常值和冲击通常会观察到。在这些情况下，GP可能无法充分建模不确定性，并且可能会过度推动。在这里，我们将GP框架扩展到一类新的时间变化的GP，从而可以直接建模重尾非高斯行为，同时通过非均匀GPS表示的无限混合物保留了可拖动的条件GP结构。有条件的GP结构是通过在潜在转化的输入空间上调节观测值来获得的，并使用L \'{e} Vy过程对潜在转化的随机演变进行建模，该过程允许贝叶斯在后端预测密度和潜在转化中的贝叶斯推断功能。我们为该模型提供了马尔可夫链蒙特卡洛推理程序，并证明了与标准GP相比的潜在好处。

translated by 谷歌翻译

Sequential Gaussian Processes for Online Learning of Nonstationary Functions

Michael Minyi Zhang , Bianca Dumitrascu , Sinead A. Williamson , Barbara E. Engelhardt

分类： (统计)机器学习 | 机器学习

2019-05-24

许多机器学习问题可以在估计功能的背景下构成，并且通常是时间依赖的功能，随着观察结果的到来，这些功能是实时估计的。高斯工艺（GPS）是建模实现非线性函数的吸引人选择，这是由于其灵活性和不确定性定量。但是，典型的GP回归模型有几个缺点：1）相对于观测值的常规GP推理量表$ O（n^{3}）$； 2）顺序更新GP模型并非微不足道； 3）协方差内核通常在该函数上执行平稳性约束，而具有非平稳协方差内核的GP通常在实践中使用了很难使用。为了克服这些问题，我们提出了一种顺序的蒙特卡洛算法，以适合GP的无限混合物，这些混合物捕获非平稳行为，同时允许在线分布式推理。我们的方法从经验上改善了在时间序列数据中存在非平稳性的在线GP估计的最先进方法的性能。为了证明我们在应用设置中提出的在线高斯流程混合物方法的实用性，我们表明我们可以使用在线高斯工艺匪徒成功实现优化算法。

translated by 谷歌翻译

Deep Gaussian Processes

Andreas C. Damianou , Neil D. Lawrence

分类：

2012-11-02

In this paper we introduce deep Gaussian process (GP) models. Deep GPs are a deep belief network based on Gaussian process mappings. The data is modeled as the output of a multivariate GP. The inputs to that Gaussian process are then governed by another GP. A single layer model is equivalent to a standard GP or the GP latent variable model (GP-LVM). We perform inference in the model by approximate variational marginalization. This results in a strict lower bound on the marginal likelihood of the model which we use for model selection (number of layers and nodes per layer). Deep belief networks are typically applied to relatively large data sets using stochastic gradient descent for optimization. Our fully Bayesian treatment allows for the application of deep models even when data is scarce. Model selection by our variational bound shows that a five layer hierarchy is justified even when modelling a digit data set containing only 150 examples.

translated by 谷歌翻译

Incorporating Sum Constraints into Multitask Gaussian Processes

Philipp Pilar , Carl Jidling , Thomas B. Schön , Niklas Wahlström

分类： (统计)机器学习 | 机器学习

2022-02-03

Machine learning models can be improved by adapting them to respect existing background knowledge. In this paper we consider multitask Gaussian processes, with background knowledge in the form of constraints that require a specific sum of the outputs to be constant. This is achieved by conditioning the prior distribution on the constraint fulfillment. The approach allows for both linear and nonlinear constraints. We demonstrate that the constraints are fulfilled with high precision and that the construction can improve the overall prediction accuracy as compared to the standard Gaussian process.

translated by 谷歌翻译

Nonparametric Multi-shape Modeling with Uncertainty Quantification

Hengrui Luo , Justin D. Strait

分类： (统计)机器学习 | 机器学习

2022-06-18

封闭曲线的建模和不确定性量化是形状分析领域的重要问题，并且可以对随后的统计任务产生重大影响。这些任务中的许多涉及封闭曲线的集合，这些曲线通常在多个层面上表现出结构相似性。以有效融合这种曲线间依赖性的方式对多个封闭曲线进行建模仍然是一个具有挑战性的问题。在这项工作中，我们提出并研究了一个多数输出（又称多输出），多维高斯流程建模框架。我们说明了提出的方法学进步，并在几个曲线和形状相关的任务上证明了有意义的不确定性量化的实用性。这种基于模型的方法不仅解决了用内核构造对封闭曲线（及其形状）的推断问题，而且还为通常对功能对象的多层依赖性的非参数建模打开了门。

translated by 谷歌翻译

Sparse Gaussian Process Hyperparameters: Optimize or Integrate?

Vidhi Lalchand , Wessel P. Bruinsma , David R. Burt , Carl E. Rasmussen

分类： (统计)机器学习 | 机器学习

2022-11-04

The kernel function and its hyperparameters are the central model selection choice in a Gaussian proces (Rasmussen and Williams, 2006). Typically, the hyperparameters of the kernel are chosen by maximising the marginal likelihood, an approach known as Type-II maximum likelihood (ML-II). However, ML-II does not account for hyperparameter uncertainty, and it is well-known that this can lead to severely biased estimates and an underestimation of predictive uncertainty. While there are several works which employ a fully Bayesian characterisation of GPs, relatively few propose such approaches for the sparse GPs paradigm. In this work we propose an algorithm for sparse Gaussian process regression which leverages MCMC to sample from the hyperparameter posterior within the variational inducing point framework of Titsias (2009). This work is closely related to Hensman et al. (2015b) but side-steps the need to sample the inducing points, thereby significantly improving sampling efficiency in the Gaussian likelihood case. We compare this scheme against natural baselines in literature along with stochastic variational GPs (SVGPs) along with an extensive computational analysis.

translated by 谷歌翻译

Stochastic Collapsed Variational Inference for Structured Gaussian Process Regression Network

Rui Meng , Herbie Lee , Kristofer Bouchard

分类：机器学习 | (统计)机器学习

2021-06-01

本文提出了一种有效的变分推导框架，用于导出结构化高斯进程回归网络（SGPRN）模型的系列。关键的想法是将辅助诱导变量合并到潜在函数中，并共同处理诱导变量和超参数的分布作为变分参数。然后，我们提出了结构化可变分布和边缘化潜变量，这使得可分解的变分性下限并导致随机优化。我们推断方法能够建模数据，其中输出不共享具有与输入和输出大小无关的计算复杂性的公共输入集，因此容易处理具有缺失值的数据集。我们说明了我们对合成数据和真实数据集的方法的性能，并显示我们的模型通常提供比最先进的数据缺失数据的更好的估算结果。我们还提供了一种可视化方法，用于电职业学数据的输出中的输出的时变相关性，并且这些估计提供了了解神经群体动态的洞察力。

translated by 谷歌翻译

A similarity-based Bayesian mixture-of-experts model

Tianfang Zhang , Rasmus Bokrantz , Jimmy Olsson

分类： (统计)机器学习 | 机器学习

2020-12-03

我们提出了一种新的非参数混合物模型，用于多变量回归问题，灵感来自概率K-Nearthimest邻居算法。使用有条件指定的模型，对样本外输入的预测基于与每个观察到的数据点的相似性，从而产生高斯混合物表示的预测分布。在混合物组件的参数以及距离度量标准的参数上，使用平均场变化贝叶斯算法进行后推断，并具有基于随机梯度的优化过程。在与数据大小相比，输入 - 输出关系很复杂，预测分布可能偏向或多模式的情况下，输入相对较高的尺寸，该方法尤其有利。对五个数据集进行的计算研究，其中两个是合成生成的，这说明了我们的高维输入的专家混合物方法的明显优势，在验证指标和视觉检查方面都优于竞争者模型。

translated by 谷歌翻译