智能论文笔记

MAGIC: Microlensing Analysis Guided by Intelligent Computation

Haimeng Zhao , Wei Zhu

分类：机器学习

2022-06-16

由于耗时的光曲线计算和高维参数空间中的病理可能性景观，通过基于标准的采样方法对二进制微透镜曲线进行建模可能具有挑战性。在这项工作中，我们提出了魔术，这是一个机器学习框架，可有效，准确地推断出具有现实数据质量的二进制事件的微透镜参数。在魔术中，将二进制微透镜参数分为两组，并通过不同的神经网络分别推断。魔术的关键特征是引入神经控制的微分方程，该方程提供了通过不规则采样和较大数据差距处理光曲线的能力。基于模拟的光曲线，我们表明魔术可以在二进制质量比和分离上达到几％的分数不确定性。我们还在真实的微透镜事件中测试魔术。即使引入了较大的数据差距，魔术也能够找到退化的解决方案。由于不规则的采样在天文学调查中很常见，因此我们的方法还对涉及时间序列的其他研究具有影响。

translated by 谷歌翻译

Inferring subhalo effective density slopes from strong lensing observations with neural likelihood-ratio estimation

Gemma Zhang , Siddharth Mishra-Sharma , Cora Dvorkin

分类：机器学习

2022-08-29

强烈的引力透镜已成为一种有前途的方法，用于探测亚半乳尺度上的暗物质模型。最近的工作提出了Subhalo有效密度斜率比常用的Subhalo质量功能更可靠。 subhalo有效密度斜率是一个独立于对基础密度曲线的假设的测量值，可以通过传统的采样方法来推断单个Subhalos。为了超越单个Subhalo测量，我们利用机器学习的最新进展，并引入神经似然比估计器来推断Subhalos人群的有效密度斜率。我们证明我们的方法能够利用多个Subhalos（内部和跨多个图像）的统计能力来区分不同Subhalo种群的特征。神经似然比估计量对传统抽样的估计值所需的计算效率可以实现对暗物质遗传的统计研究，并且特别有用，因为我们希望从即将进行的调查中涌入强镜头系统。

translated by 谷歌翻译

A machine learning based approach to gravitational lens identification with the International LOFAR Telescope

S. Rezaei , J. P. McKean , M. Biehl , W. de Roo1 , A. Lafontaine

分类：机器学习

2022-07-21

我们提出了一种基于机器学习的新型方法，用于从干涉数据中检测出星系尺度的重力透镜，特别是使用国际Lofar望远镜（ILT）采用的方法，该镜头是在150 MHz的频率上观察到北部无线电天空，该频率是350的角度分辨率。 MAS和90 Ujy Beam-1（1 Sigma）的灵敏度。我们开发并测试了几个卷积神经网络，以确定给定样品被归类为镜头或非镜头事件的概率和不确定性。通过对包括逼真的镜头和非镜头无线电源的模拟干涉成像数据集进行训练和测试，我们发现可以恢复95.3％的镜头样品（真正的正速率），仅污染仅为0.008来自非静态样品（假阳性速率）的含量。考虑到预期的镜头概率，结果导致了92.2％的镜头事件的样品纯度。我们发现，当镜头图像之间的最大图像分离大于合成光束尺寸的3倍时，网络结构是最健壮的，并且镜头图像具有至少与20个Sigma（点源）的总磁通密度相等）检测。对于ILT，这对应于爱因斯坦半径大于0.5 ARCSEC和一个无线电源群体的镜头样品，其150 MHz通量密度超过2 MJY。通过应用这些标准和我们的镜头检测算法，我们希望发现Lofar两米天空调查中包含的绝大多数星系尺度重力透镜系统。

translated by 谷歌翻译

Advances in Multi-Variate Analysis Methods for New Physics Searches at the Large Hadron Collider

Anna Stakia , Tommaso Dorigo , Giovanni Banelli , Daniela Bortoletto , Alessandro Casa , Pablo de Castro , Christophe Delaere , Julien Donini , Livio Finos , Michele Gallinaro

分类：机器学习

2021-05-16

在2015年和2019年之间，地平线的成员2020年资助的创新培训网络名为“Amva4newphysics”，研究了高能量物理问题的先进多变量分析方法和统计学习工具的定制和应用，并开发了完全新的。其中许多方法已成功地用于提高Cern大型Hadron撞机的地图集和CMS实验所执行的数据分析的敏感性;其他几个人，仍然在测试阶段，承诺进一步提高基本物理参数测量的精确度以及新现象的搜索范围。在本文中，在研究和开发的那些中，最相关的新工具以及对其性能的评估。

translated by 谷歌翻译

Constraining dark matter annihilation with cosmic ray antiprotons using neural networks

Felix Kahlhoefer , Michael Korsmeier , Michael Krämer , Silvia Manconi , Kathrin Nippel

分类：机器学习

2021-07-26

从间接检测实验中寻找暗物质湮灭的间接检测实验的解释需要计算昂贵的宇宙射线传播模拟。在这项工作中，我们提出了一种基于经常性神经网络的新方法，可显着加速二次和暗物质银宇射线反滴角的模拟，同时实现优异的准确性。这种方法允许在宇宙射线传播模型的滋扰参数上进行高效的分析或边缘化，以便为各种暗物质模型进行参数扫描。我们确定重要的采样，具体适用于确保仅在训练有素的参数区域中评估网络。我们使用最新AMS-02 Antiproton数据在几种模型的弱相互作用的大规模粒子上呈现导出的限制。与传统方法相比，全训练网络与此工作一起作为Darkraynet释放，并通过至少两个数量级来实现运行时的加速。

translated by 谷歌翻译

A Ubiquitous Unifying Degeneracy in 2-body Microlensing Systems

Keming Zhang , B. Scott Gaudi , Joshua S. Bloom

分类：机器学习

2021-11-26

虽然行星系统的引力微透镜可以在外部片网的性质上提供独特的vistas，但是通常可以用多种和不同的物理配置来解释这种2体微透镜事件的观察，所谓的模型退化。对不同类别退化的内在和外源性起源的理解为现象学解释提供了基础。在这里，利用基于快速的机器学习推断框架，我们展示了一种新的退化制度 - 偏移退化 - 统一的级别已知的级别和内外的退化，概括为共振焦化，以及重新分析，在先前公布的行星事件中普遍存在2倍的退化溶液中。重要的是，我们的发现表明，通常报告的级别逐步退化基本上从未出现在实际事件中，而是应该更适当地被视为偏移退行病的过渡点。虽然以前的微溶剂变性的研究在很大程度上研究了脱腐蚀性，但我们的发现表明脱腐蚀性不一定导致退化的事件，这对于后者在源地点的研究放大率更为相关。这一发现从根本上改变了应该解释行星微透镜事件中的退化过程的方式，表明2人镜头的数学中的更深对称性，而不是先前认识到，并且将越来越多地表现出来自新几代微溶剂调查的数据。

translated by 谷歌翻译

PGNets: Planet mass prediction using convolutional neural networks for radio continuum observations of protoplanetary disks

Shangjia Zhang , Zhaohuan Zhu , Mingon Kang

分类：机器学习

2021-11-30

我们开发了卷积神经网络（CNNS），快速，直接从无线电尘埃连续图像中推断出行星质量。在原始板块中的年轻行星引起的子结构可用于推断潜在的年轻行星属性。流体动力模拟已被用于研究地球属性与这些磁盘特征之间的关系。然而，这些尝试了微调的数值模拟，以一次适合一个原始磁盘，这是耗时的，或者四方平均模拟结果，以导出间隙宽度/深度和行星质量之间的一些线性关系，这丢失了信息磁盘中的不对称功能。为了应对这些缺点，我们开发了行星间隙神经网络（PGNET），以推断出2D图像的行星质量。我们首先符合张等人的网格数据。（2018）作为分类问题。然后，通过使用近随机采样参数运行额外的模拟来分布数据集，并将行星质量和磁盘粘度一起作为回归问题衍生在一起。分类方法可以达到92 \％的准确性，而回归方法可以达到1 $ \ Sigma $ AS 0.16 DEX，用于行星质量和0.23°D磁盘粘度。我们可以在线性拟合方法中重现退化缩放$ \ alpha $ $ \ propto $ $ m_p ^ 3 $。这意味着CNN方法甚至可以用于寻找退化关系。梯度加权类激活映射有效地确认PGNETS使用适当的磁盘特征来限制行星质量。我们为张等人提供了PGNETS和传统配件方法的计划。（2018），并讨论各种方法的优缺点。

translated by 谷歌翻译

Alleviating the transit timing variation bias in transit surveys. I. RIVERS: Method and detection of a pair of resonant super-Earths around Kepler-1705

A. Leleu , G. Chatel , S. Udry , Y. Alibert , J. -B. Delisle , R. Mardling

分类：机器学习

2021-11-12

传输定时变化（TTV）可以提供用于通过运输观察的系统的有用信息，因为它们允许我们对观察到的行星的质量和偏心的限制，甚至限制存在非过转化伴侣的存在。然而，TTV也可以用作检测偏压，可以防止在运输调查中检测小行星，否则将被标准算法（如盒装最小二乘算法（BLS）检测到）如果它们的轨道没有扰乱。这种偏差特别存在于具有长基线的调查，例如开普勒，其中一些苔丝扇区以及即将到来的柏拉图任务。在这里，我们介绍了一种对大型TTV的稳健的检测方法，并通过恢复和确认围绕开普勒-1705的十个TTV的一对谐振超级地球来说明其使用。该方法基于培训的神经网络，以恢复河图中的低信噪比比（S / N）扰动行星的轨道。我们通过拟合光线曲线来恢复这些候选人的传输参数。电孔-1705b和c的各个运输S / n大约比具有3小时或更长时间的所有先前已知的行星低的三倍，推动这些小型动态活动行星的恢复中的边界。恢复这种类型的物体对于获得观察到的行星系统的完整图谱是必不可少的，并且解决在外产群体的统计研究中不经常考虑的偏差。此外，TTV是获得质量估计的方法，这对于研究通过过境调查发现的行星的内部结构是必不可少的。最后，我们表明，由于强大的轨道扰动，开普勒-1705的外谐振行星的旋转可能被捕获在子或超级同步的旋转轨道共振中。

translated by 谷歌翻译

Light curve completion and forecasting using fast and scalable Gaussian processes (MuyGPs)

Imène R. Goumiri , Alec M. Dunton , Amanda L. Muyskens , Benjamin W. Priest , Robert E. Armstrong

分类： (统计)机器学习

2022-08-31

明显大小的时间变化（称为光曲线）是望远镜在长时间内捕获的感兴趣的观察统计。光曲线提供了空间域意识（SDA）目标（例如对象识别或姿势估计）作为潜在变量推理问题等目标的探索。与较高的精确仪器相比，来自货架上商业架子（COTS）摄像机的地面观测仍然很便宜，但是，有限的传感器可用性与嘈杂的观察结果相结合，可能会产生可能难以建模的gappy时间序列数据。这些外部因素混淆了对光曲线的自动开发，这使光曲线预测和外推成为应用的关键问题。传统上，使用基于扩散或基于示例的方法解决了图像或时间序列的完成问题。最近，由于学习复杂的非线性嵌入方面的经验成功，深度神经网络（DNNS）已成为首选工具。但是，DNN通常需要大量的培训数据，而这些数据不一定在查看单个卫星的光曲线的独特功能时可用。在本文中，我们提出了一种新的方法，可以使用高斯工艺（GPS）预测光曲线的缺失和未来数据点。 GPS是非线性概率模型，可推断后验分布在功能上并自然量化不确定性。但是，GP推理和培训的立方缩放是其在应用中采用的主要障碍。特别是，单个光曲线可以具有数十万个观测值，这远远超出了单个机器上常规GP的实际实现极限。因此，我们采用MUYGP，这是一种可扩展的框架，用于使用最近的邻居稀疏和局部交叉验证的GP模型的超参数估计。 muygps ...

translated by 谷歌翻译

HTML版本

A Probabilistic Autoencoder for Type Ia Supernovae Spectral Time Series

George Stein , Uros Seljak , Vanessa Bohm , G. Aldering , P. Antilogus , C. Aragon , S. Bailey , C. Baltay , S. Bongard , K. Boone

分类：机器学习

2022-07-15

我们从一组稀疏的光谱时间序列中构建了一个物理参数化的概率自动编码器（PAE），以学习IA型超新星（SNE IA）的内在多样性。 PAE是一个两阶段的生成模型，由自动编码器（AE）组成，该模型在使用归一化流（NF）训练后概率地解释。我们证明，PAE学习了一个低维的潜在空间，该空间可捕获人口内存在的非线性特征范围，并且可以直接从数据直接从数据中准确地对整个波长和观察时间进行精确模拟SNE IA的光谱演化。通过引入相关性惩罚项和多阶段训练设置以及我们的物理参数化网络，我们表明可以在训练期间分离内在和外在的可变性模式，从而消除了需要进行额外标准化的其他模型。然后，我们在SNE IA的许多下游任务中使用PAE进行越来越精确的宇宙学分析，包括自动检测SN Outliers，与数据分布一致的样本的产生以及在存在噪音和不完整数据的情况下解决逆问题限制宇宙距离测量。我们发现，与以前的研究相一致的最佳固有模型参数数量似乎是三个，并表明我们可以用$ 0.091 \ pm 0.010 $ mag标准化SNE IA的测试样本，该样本对应于$ 0.074 \ pm。 0.010 $ mag如果删除了特殊的速度贡献。训练有素的模型和代码在\ href {https://github.com/georgestein/supaernova} {github.com/georgestein/supaernova}上发布

translated by 谷歌翻译

Dim but not entirely dark: Extracting the Galactic Center Excess' source-count distribution with neural nets

Florian List , Nicholas L. Rodd , Geraint F. Lewis

分类：机器学习

2021-07-19

$ \ Texit {Fermi} $数据中的银河系中多余（GCE）的两个领先假设是一个未解决的微弱毫秒脉冲条件（MSP）和暗物质（DM）湮灭。这些解释之间的二分法通常通过将它们建模为两个单独的发射组分来反映。然而，诸如MSP的点源（PSS）在超微弱的极限中具有统计变质的泊松发射（正式的位置，预期每个来源平均贡献远低于一个光子），导致可能提出问题的歧义如排放是否是PS样或性质中的泊松人。我们提出了一种概念上的新方法，以统一的方式描述PS和泊松发射，并且刚刚从此获得的结果中获得了对泊松组件的约束。为了实现这种方法，我们利用深度学习技术，围绕基于神经网络的方法，用于直方图回归，其表达量数量的不确定性。我们证明我们的方法对许多困扰先前接近的系统，特别是DM / PS误操作来稳健。在$ \ texit {fermi} $数据中，我们发现由$ \ sim4 \ times 10 ^ {-11} \ \ text {counts} \ {counts} \ text {counts} \ text {counts} \ \ text {cm} ^ { - 2} \ \ text {s} ^ { - 1} $（对应于$ \ sim3 - 4 $每pL期望计数），这需要$ n \ sim \ mathcal {o}（ 10 ^ 4）$源来解释整个过剩（中位数价值$ n = \文本{29,300} $横跨天空）。虽然微弱，但这种SCD允许我们获得95％信心的Poissonian比赛的约束$ \ eta_p \ leq 66 \％$。这表明大量的GCE通量是由于PSS 。

translated by 谷歌翻译

Swift sky localization of gravitational waves using deep learning seeded importance sampling

Alex Kolmus , Grégory Baltus , Justin Janquart , Twan van Laarhoven , Sarah Caudill , Tom Heskes

分类：机器学习

2021-11-01

快速，高度准确，可靠的引力波浪的推动，可以实现实时多信使天文学。目前贝叶斯推理方法虽然高度准确可靠，但很慢。深度学习模型已经表明了引力波的推理任务非常快速，但由于神经网络的黑箱性质，它们的产出本质上是可疑的。在这项工作中，我们通过应用了多头卷积神经网络产生的近似后验的重要性抽样加入贝叶斯推论和深度学习。神经网络参数化Von Mises-Fisher和天空坐标和高斯分布的天空坐标和两个群众，用于给定Ligo和Virgo探测器的模拟重力波注射。我们为看不见的引力波事件产生跨ysmaps，这是几分钟内使用贝叶斯推理产生的高等类似的预测。此外，我们可以检测神经网络的差，并迅速向它们标记。

translated by 谷歌翻译

Bayesian parameter estimation using conditional variational autoencoders for gravitational-wave astronomy

Hunter Gabbard , Chris Messenger , Ik Siong Heng , Francesco Tonolini , Roderick Murray-Smith

分类：机器学习

2019-09-13

引力波（GW）检测现在是普遍的，并且随着GW探测器的全球网络的灵敏度，我们将观察每年瞬态GW事件的$ \ MATHCAL {O}（100）美元。用于估计其源参数的目前的方法采用最佳敏感但是计算昂贵的贝叶斯推理方法，其中典型的分析在6小时和5天之间取。对于二元中子星和中子星黑洞系统提示，预计在1秒 - 1分钟的时间尺度和用于提醒EM随访观察员的最快方法，可以提供估计在$ \ mathcal {o }（1）$分钟，在有限的关键源参数范围内。在这里，我们表明，在二进制黑洞信号上预先培训的条件变形Autiachoder可以返回贝叶斯后概率估计。仅针对给定的先前参数空间执行一次训练程序，然后可以将所得培训的机器能够生成描述后部分配$ \ SIM 6 $幅度的样本比现有技术更快。

translated by 谷歌翻译

Estimating Uncertainty Intervals from Collaborating Networks

Tianhui Zhou , Yitong Li , Yuan Wu , David Carlson

分类： (统计)机器学习 | 机器学习

2020-02-12

有效的决策需要了解预测中固有的不确定性。在回归中，这种不确定性可以通过各种方法估算;然而，许多这些方法对调谐进行费力，产生过度自确性的不确定性间隔，或缺乏敏锐度（给予不精确的间隔）。我们通过提出一种通过定义具有两个不同损失功能的神经网络来捕获回归中的预测分布的新方法来解决这些挑战。具体地，一个网络近似于累积分布函数，第二网络近似于其逆。我们将此方法称为合作网络（CN）。理论分析表明，优化的固定点处于理想化的解决方案，并且该方法是渐近的与地面真理分布一致。凭经验，学习是简单且强大的。我们基准CN对两个合成和六个现实世界数据集的几种常见方法，包括预测来自电子健康记录的糖尿病患者的A1C值，其中不确定是至关重要的。在合成数据中，所提出的方法与基本上匹配地面真理。在真实世界数据集中，CN提高了许多性能度量的结果，包括对数似然估计，平均误差，覆盖估计和预测间隔宽度。

translated by 谷歌翻译

Physics-based Deep Learning

Nils Thuerey , Philipp Holl , Maximilian Mueller , Patrick Schnell , Felix Trost , Kiwon Um

分类：机器学习

2021-09-11

这本数字本书包含在物理模拟的背景下与深度学习相关的一切实际和全面的一切。尽可能多，所有主题都带有Jupyter笔记本的形式的动手代码示例，以便快速入门。除了标准的受监督学习的数据中，我们将看看物理丢失约束，更紧密耦合的学习算法，具有可微分的模拟，以及加强学习和不确定性建模。我们生活在令人兴奋的时期：这些方法具有从根本上改变计算机模拟可以实现的巨大潜力。

translated by 谷歌翻译

Bayesian posterior repartitioning for nested sampling

Xi Chen , Farhan Feroz , Michael Hobson

分类：神经与进化计算

2019-08-13

贝叶斯分析中的先验者通常编码信息域知识，这些知识可用于使推理过程更有效。但是，有时，先验可能是给定数据集的参数值的代表性的，这可能导致参数空间探索效率低下，甚至是错误的推论，尤其是对于嵌套采样（NS）算法。在这种情况下，仅仅在某些应用中扩大了先验可能是不合适的或不可能的。因此，我们以前对该问题的解决方案（称为后验电源（PR））在保持产品固定的同时重新定义了先前和可能性，以使后验推断和证据估计保持不变，但是NS过程的效率显着提高。 PR在其最实用的形式中提高了某些功率beta的提高，该beta是作为一个辅助变量引入的，必须根据具体情况确定，通常是通过根据某些预定的“退火时间表”降低beta的统一性来确定的。 '直到产生的推论会收敛到一致的解决方案。在这里，我们提出了一种非常简单但功能强大的替代贝叶斯方法，其中beta被视为从数据与问题的原始参数一起从数据推断出来的超参数，然后边缘化以获得最终推断。我们通过数值示例表明，这种贝叶斯PR（BPR）方法为使用NS的贝叶斯推断中未代表性的先验问题提供了一种非常健壮，自我适应和计算有效的“手持”解决方案。此外，与原始PR方法不同，我们表明，即使对于代表性的PRIORS，BPR也相对于标准嵌套采样而具有可忽略的计算间接费用，这表明它应在所有NS分析中用作默认值。

translated by 谷歌翻译

Identifying Exoplanets with Deep Learning. IV. Removing Stellar Activity Signals from Radial Velocity Measurements Using Neural Networks

Zoe L. de Beurs , Andrew Vanderburg , Christopher J. Shallue , Xavier Dumusque , Andrew Collier Cameron , Christopher Leet , Lars A. Buchhave , Rosario Cosentino , Adriano Ghedina , Raphaëlle D. Haywood

分类：机器学习

2020-10-30

目前，由精确的径向速度（RV）观察结果受到恒星活性引入的虚假RV信号的限制。我们表明，诸如线性回归和神经网络之类的机器学习技术可以有效地从RV观测中删除活动信号（由于星形/张图引起的）。先前的工作着重于使用高斯工艺回归等建模技术仔细地过滤活性信号（例如Haywood等人，2014年）。取而代之的是，我们仅使用对光谱线平均形状的更改进行系统地删除活动信号，也没有有关收集观测值的信息。我们对模拟数据（使用SOAP 2.0软件生成； Dumusque等人，2014年生成）和从Harps-N太阳能望远镜（Dumusque等，2015; Phillips等人2015; 2016; Collier训练）培训了机器学习模型。 Cameron等人2019）。我们发现，这些技术可以从模拟数据（将RV散射从82 cm/s提高到3 cm/s）以及从HARPS-N太阳能望远镜中几乎每天进行的600多种真实观察结果来预测和消除恒星活动（将RV散射从82 cm/s提高到3 cm/s）。（将RV散射从1.753 m/s提高到1.039 m/s，提高了约1.7倍）。将来，这些或类似的技术可能会从太阳系以外的恒星观察中去除活动信号，并最终有助于检测到阳光状恒星周围可居住的区域质量系外行星。

translated by 谷歌翻译

TACTiS: Transformer-Attentional Copulas for Time Series

Alexandre Drouin , Étienne Marcotte , Nicolas Chapados

分类：机器学习 | (统计)机器学习

2022-02-07

时间变化数量的估计是医疗保健和金融等领域决策的基本组成部分。但是，此类估计值的实际实用性受到它们量化预测不确定性的准确程度的限制。在这项工作中，我们解决了估计高维多元时间序列的联合预测分布的问题。我们提出了一种基于变压器体系结构的多功能方法，该方法使用基于注意力的解码器估算关节分布，该解码器可被学会模仿非参数Copulas的性质。最终的模型具有多种理想的属性：它可以扩展到数百个时间序列，支持预测和插值，可以处理不规则和不均匀的采样数据，并且可以在训练过程中无缝地适应丢失的数据。我们从经验上证明了这些属性，并表明我们的模型在多个现实世界数据集上产生了最新的预测。

translated by 谷歌翻译

Uncertainty-Aware Blob Detection with an Application to Integrated-Light Stellar Population Recoveries

Prashin Jethwa , Fabian Parzer , Otmar Scherzer , Glenn van de Ven

分类：计算机视觉

2022-08-11

语境。斑点检测是天文学中的常见问题。一个例子是在恒星种群建模中，其中从观察结果推断出星系中恒星年龄和金属性的分布。在这种情况下，斑点可能对应于原位的恒星与从卫星中吸收的恒星相对应，而BLOB检测的任务是解散这些组件。当分布带来重大不确定性时，就会出现一个困难，就像从未解决的恒星系统的建模光谱中推断出的恒星种群的情况一样。目前没有不确定性检测BLOB检测的令人满意的方法。目标。我们介绍了一种在恒星系统综合光谱的恒星种群建模的背景下开发的不确定性感知斑点检测方法。方法。我们为经典的blob检测方法的经典laplacian方法的不确定性感知版本开发了理论和计算工具，我们称之为ULOG。这确定了考虑各种尺度的重要斑点。作为将ULOG应用于恒星种群建模的先决条件，我们引入了一种有效计算光谱建模不确定性的方法。该方法基于截断的奇异值分解和马尔可夫链蒙特卡洛采样（SVD-MCMC）。结果。我们将方法应用于星团M54的数据。我们表明，SVD-MCMC推断与标准MCMC的推断相匹配，但计算速度更快。我们将ULOG应用于推断的M54年龄/金属性分布，识别其恒星中的2或3个显着不同的种群。

translated by 谷歌翻译

Fast and robust Bayesian Inference using Gaussian Processes with GPry

Jonas El Gammal , Nils Schöneberg , Jesús Torrado , Christian Fidler

分类： (统计)机器学习

2022-11-03

We present the GPry algorithm for fast Bayesian inference of general (non-Gaussian) posteriors with a moderate number of parameters. GPry does not need any pre-training, special hardware such as GPUs, and is intended as a drop-in replacement for traditional Monte Carlo methods for Bayesian inference. Our algorithm is based on generating a Gaussian Process surrogate model of the log-posterior, aided by a Support Vector Machine classifier that excludes extreme or non-finite values. An active learning scheme allows us to reduce the number of required posterior evaluations by two orders of magnitude compared to traditional Monte Carlo inference. Our algorithm allows for parallel evaluations of the posterior at optimal locations, further reducing wall-clock times. We significantly improve performance using properties of the posterior in our active learning scheme and for the definition of the GP prior. In particular we account for the expected dynamical range of the posterior in different dimensionalities. We test our model against a number of synthetic and cosmological examples. GPry outperforms traditional Monte Carlo methods when the evaluation time of the likelihood (or the calculation of theoretical observables) is of the order of seconds; for evaluation times of over a minute it can perform inference in days that would take months using traditional methods. GPry is distributed as an open source Python package (pip install gpry) and can also be found at https://github.com/jonaselgammal/GPry.

translated by 谷歌翻译