智能论文笔记

Uncovering dark matter density profiles in dwarf galaxies with graph neural networks

Tri Nguyen , Siddharth Mishra-Sharma , Reuel Williams , Lina Necib

分类：机器学习

2022-08-26

矮星系是小的，以暗物质为主导的星系，其中一些嵌入了银河系中。他们缺乏重型物质（例如，恒星和气体）使它们成为探测暗物质特性的完美测试床 - 了解这些系统中的空间暗物质分布可用于限制影响形成和进化的微物理暗物质相互作用我们宇宙中的结构。我们介绍了一种新方法，该方法利用基于模拟的推理和基于图的机器学习，以推断出恒星的可观察到的恒星重力与这些系统结合的可观察到的矮星系的暗物质密度曲线。我们的方法旨在解决基于动态牛仔裤建模的既定方法的一些局限性。我们表明，这种新颖的方法可以对暗物质概况施加更强的约束，因此，有可能权衡与暗物质晕圈小规模结构（例如核心核心差异）相关的一些持续的难题。

translated by 谷歌翻译

Inferring dark matter substructure with astrometric lensing beyond the power spectrum

Siddharth Mishra-Sharma

分类：机器学习

2021-10-04

ASTROMYRY - 天体物体的职位和运动的精确测量 - 已成为一个有希望的大道，用于在我们的银河系中表征暗物质人口。通过利用基于仿真的推断和神经网络架构的最近进步，我们介绍了一种新的方法来搜索天球暗物质引起的天体辐射数据集中的重力透镜签名。我们基于神经似然比估计的方法显示出与基于两点相关统计的现有方法相比，与测量噪声相比，对冷暗物质人群的敏感性显着提高了敏感性。我们通过将其稳健而言，展示了我们的方法的真实可行性，并且在天体测量中预期的非普通建模以及未拼模型的噪声功能。这使得机器学习作为一种强大的工具，用于使用artromicric数据表征暗物质。

translated by 谷歌翻译

Inferring subhalo effective density slopes from strong lensing observations with neural likelihood-ratio estimation

Gemma Zhang , Siddharth Mishra-Sharma , Cora Dvorkin

分类：机器学习

2022-08-29

强烈的引力透镜已成为一种有前途的方法，用于探测亚半乳尺度上的暗物质模型。最近的工作提出了Subhalo有效密度斜率比常用的Subhalo质量功能更可靠。 subhalo有效密度斜率是一个独立于对基础密度曲线的假设的测量值，可以通过传统的采样方法来推断单个Subhalos。为了超越单个Subhalo测量，我们利用机器学习的最新进展，并引入神经似然比估计器来推断Subhalos人群的有效密度斜率。我们证明我们的方法能够利用多个Subhalos（内部和跨多个图像）的统计能力来区分不同Subhalo种群的特征。神经似然比估计量对传统抽样的估计值所需的计算效率可以实现对暗物质遗传的统计研究，并且特别有用，因为我们希望从即将进行的调查中涌入强镜头系统。

translated by 谷歌翻译

Dim but not entirely dark: Extracting the Galactic Center Excess' source-count distribution with neural nets

Florian List , Nicholas L. Rodd , Geraint F. Lewis

分类：机器学习

2021-07-19

$ \ Texit {Fermi} $数据中的银河系中多余（GCE）的两个领先假设是一个未解决的微弱毫秒脉冲条件（MSP）和暗物质（DM）湮灭。这些解释之间的二分法通常通过将它们建模为两个单独的发射组分来反映。然而，诸如MSP的点源（PSS）在超微弱的极限中具有统计变质的泊松发射（正式的位置，预期每个来源平均贡献远低于一个光子），导致可能提出问题的歧义如排放是否是PS样或性质中的泊松人。我们提出了一种概念上的新方法，以统一的方式描述PS和泊松发射，并且刚刚从此获得的结果中获得了对泊松组件的约束。为了实现这种方法，我们利用深度学习技术，围绕基于神经网络的方法，用于直方图回归，其表达量数量的不确定性。我们证明我们的方法对许多困扰先前接近的系统，特别是DM / PS误操作来稳健。在$ \ texit {fermi} $数据中，我们发现由$ \ sim4 \ times 10 ^ {-11} \ \ text {counts} \ {counts} \ text {counts} \ text {counts} \ \ text {cm} ^ { - 2} \ \ text {s} ^ { - 1} $（对应于$ \ sim3 - 4 $每pL期望计数），这需要$ n \ sim \ mathcal {o}（ 10 ^ 4）$源来解释整个过剩（中位数价值$ n = \文本{29,300} $横跨天空）。虽然微弱，但这种SCD允许我们获得95％信心的Poissonian比赛的约束$ \ eta_p \ leq 66 \％$。这表明大量的GCE通量是由于PSS 。

translated by 谷歌翻译

Constraining dark matter annihilation with cosmic ray antiprotons using neural networks

Felix Kahlhoefer , Michael Korsmeier , Michael Krämer , Silvia Manconi , Kathrin Nippel

分类：机器学习

2021-07-26

从间接检测实验中寻找暗物质湮灭的间接检测实验的解释需要计算昂贵的宇宙射线传播模拟。在这项工作中，我们提出了一种基于经常性神经网络的新方法，可显着加速二次和暗物质银宇射线反滴角的模拟，同时实现优异的准确性。这种方法允许在宇宙射线传播模型的滋扰参数上进行高效的分析或边缘化，以便为各种暗物质模型进行参数扫描。我们确定重要的采样，具体适用于确保仅在训练有素的参数区域中评估网络。我们使用最新AMS-02 Antiproton数据在几种模型的弱相互作用的大规模粒子上呈现导出的限制。与传统方法相比，全训练网络与此工作一起作为Darkraynet释放，并通过至少两个数量级来实现运行时的加速。

translated by 谷歌翻译

Inferring halo masses with Graph Neural Networks

Pablo Villanueva-Domingo , Francisco Villaescusa-Navarro , Daniel Anglés-Alcázar , Shy Genel , Federico Marinacci , David N. Spergel , Lars Hernquist , Mark Vogelsberger , Romeel Dave , Desika Narayanan

分类：机器学习

2021-11-16

了解晕星连接是基本的，以提高我们对暗物质的性质和性质的知识。在这项工作中，我们构建一个模型，鉴于IT主机的星系的位置，速度，恒星群体和半径的位置。为了捕获来自星系属性的相关性及其相位空间的相关信息，我们使用图形神经网络（GNN），该网络设计用于使用不规则和稀疏数据。我们从宇宙学和天体物理学中培训了我们在Galaxies上的模型，从宇宙学和天体物理学与机器学习模拟（骆驼）项目。我们的模型，占宇宙学和天体物理的不确定性，能够用$ \ SIM 0.2欧元的准确度来限制晕群。此外，在一套模拟上培训的GNN能够在用利用不同的代码的模拟上进行测试时保留其精度的一部分精度。 GNN的Pytorch几何实现在HTTPS://github.com/pablovd/halographnet上公开可用于github上

translated by 谷歌翻译

High-Precision Inversion of Dynamic Radiography Using Hydrodynamic Features

Maliha Hossain , Balasubramanya T. Nadiga , Oleg Korobkin , Marc L. Klasky , Jennifer L. Schei , Joshua W. Burby , Michael T. McCann , Trevor Wilcox , Soumi De , Charles A. Bouman

分类：机器学习

2021-12-02

放射造影通常用于探测动态系统中的复杂，不断发展的密度字段，以便在潜在的物理学中实现进入洞察力。该技术已用于许多领域，包括材料科学，休克物理，惯性监禁融合和其他国家安全应用。然而，在许多这些应用中，噪声，散射，复杂光束动力学等的并发症防止了密度的重建足以足以识别具有足够置信度的底层物理。因此，来自静态/动态射线照相的密度重建通常限于在许多这些应用中识别诸如裂缝和空隙的不连续特征。在这项工作中，我们提出了一种从基本上重建密度的基本上新的射线照片序列的密度。仅使用射线照相识别的稳健特征，我们将它们与使用机器学习方法的底层流体动力方程组合，即条件生成对冲网络（CGAN），以从射线照片的动态序列确定密度字段。接下来，我们寻求通过参数估计和投影的过程进一步提高ML的密度重建的流体动力学一致性，并进入流体动力歧管。在这种情况下，我们注意到，训练数据给出的流体动力歧管在被认为的参数空间中给出的测试数据是用于预测的稳定性的诊断，并用于增强培训数据库，期望后者将进一步降低未来的密度重建错误。最后，我们展示了这种方法优于传统的射线照相重建在捕获允许的流体动力学路径中的能力，即使存在相对少量的散射。

translated by 谷歌翻译

Fast and Credible Likelihood-Free Cosmology with Truncated Marginal Neural Ratio Estimation

Alex Cole , Benjamin Kurt Miller , Samuel J. Witte , Maxwell X. Cai , Meiert W. Grootes , Francesco Nattino , Christoph Weniger

分类：机器学习

2021-11-15

基于采样的推理技术是现代宇宙学数据分析的核心;然而，这些方法与维度不良，通常需要近似或顽固的可能性。在本文中，我们描述了截短的边际神经比率估计（TMNRE）（即所谓的基于模拟的推断的新方法）自然避免了这些问题，提高了$（i）$效率，$（ii）$可扩展性和$ （iii）推断后的后续后续的可信度。使用宇宙微波背景（CMB）的测量，我们表明TMNRE可以使用比传统马尔可夫链蒙特卡罗（MCMC）方法更少模拟器呼叫的数量级来实现融合的后海后。值得注意的是，所需数量的样本有效地独立于滋扰参数的数量。此外，称为\ MEMPH {本地摊销}的属性允许对基于采样的方法无法访问的严格统计一致性检查的性能。 TMNRE承诺成为宇宙学数据分析的强大工具，特别是在扩展宇宙学的背景下，其中传统的基于采样的推理方法所需的时间级数融合可以大大超过$ \ Lambda $ CDM等简单宇宙学模型的时间。为了执行这些计算，我们使用开源代码\ texttt {swyft}来使用TMNRE的实现。

translated by 谷歌翻译

Unifying supervised learning and VAEs -- automating statistical inference in (astro-)particle physics with amortized conditional normalizing flows

Thorsten Glüsenkamp

分类：机器学习 | (统计)机器学习

2020-08-13

数据和标签的联合分布的KL差异目标允许在随机变异推断的一个保护伞下统一监督的学习和变异自动编码器（VAE）。统一激发了扩展的监督方案，该方案允许计算神经网络模型的合适性P值。通过神经网络摊销的条件归一化流在这种结构中至关重要。我们讨论了它们如何允许在产品空间上共同定义的后代定义的覆盖范围，例如$ \ mathbb {r}^n \ times \ times \ mathcal {s}^m $，它包含在方向上的海报。最后，系统的不确定性自然包含在变化观点中。在经典的可能性方法或其他机器学习模型中，（1）系统，（2）覆盖范围和（3）拟合优度的成分通常并非全部可用，或者至少有一个受到严格限制。相比之下，拟议的扩展监督培训和摊销标准化流量可容纳所有三个，用于在产品空间上定义的任意统计分布的变异推理，例如$ \ mathbb {r}^n \ times \ times \ ldots \ ldots \ times \ times \ mathcal {s}^m {s}^m $，没有基本数据复杂性的基本障碍。因此，它具有当代（Astro-）粒子物理学家的统计工具箱的巨大潜力。

translated by 谷歌翻译

Advances in Multi-Variate Analysis Methods for New Physics Searches at the Large Hadron Collider

Anna Stakia , Tommaso Dorigo , Giovanni Banelli , Daniela Bortoletto , Alessandro Casa , Pablo de Castro , Christophe Delaere , Julien Donini , Livio Finos , Michele Gallinaro

分类：机器学习

2021-05-16

在2015年和2019年之间，地平线的成员2020年资助的创新培训网络名为“Amva4newphysics”，研究了高能量物理问题的先进多变量分析方法和统计学习工具的定制和应用，并开发了完全新的。其中许多方法已成功地用于提高Cern大型Hadron撞机的地图集和CMS实验所执行的数据分析的敏感性;其他几个人，仍然在测试阶段，承诺进一步提高基本物理参数测量的精确度以及新现象的搜索范围。在本文中，在研究和开发的那些中，最相关的新工具以及对其性能的评估。

translated by 谷歌翻译

Weighing the Milky Way and Andromeda with Artificial Intelligence

Pablo Villanueva-Domingo , Francisco Villaescusa-Navarro , Shy Genel , Daniel Anglés-Alcázar , Lars Hernquist , Federico Marinacci , David N. Spergel , Mark Vogelsberger , Desika Narayanan

分类：人工智能 | 机器学习

2021-11-29

我们对托管银河系和andromeda星系的群众呈现出新的限制，并使用图形神经网络导出。我们的型号培训了骆驼项目的数千个最先进的流体动力模拟，仅利用属于晕圈的星系的位置，速度和恒星群体，并且能够对无似然推断进行无似的推理晕群，同时占宇宙学和天体物理的不确定性。我们的制约因素与其他传统方法的估计一致。

translated by 谷歌翻译

Robust field-level inference with dark matter halos

Helen Shao , Francisco Villaescusa-Navarro , Pablo Villanueva-Domingo , Romain Teyssier , Lehman H. Garrison , Marco Gatti , Derek Inman , Yueying Ni , Ulrich P. Steinwandel , Mihir Kulkarni

分类：人工智能 | 机器学习

2022-09-14

我们将图形神经网络训练来自小工具N体模拟的光晕目录的神经网络，以执行宇宙学参数的无现场级别可能的推断。目录包含$ \ Lessim $ 5,000 HAROS带质量$ \ gtrsim 10^{10} 〜h^{ - 1} m_ \ odot $，定期卷为$（25〜H^{ - 1} {\ rm mpc}）{\ rm mpc}） ^3 $;目录中的每个光环都具有多种特性，例如位置，质量，速度，浓度和最大圆速度。我们的模型构建为置换，翻译和旋转的不变性，不施加最低限度的规模来提取信息，并能够以平均值来推断$ \ omega _ {\ rm m} $和$ \ sigma_8 $的值$ \ sim6 \％$的相对误差分别使用位置加上速度和位置加上质量。更重要的是，我们发现我们的模型非常强大：他们可以推断出使用数千个N-n-Body模拟的Halo目录进行测试时，使用五个不同的N-进行测试时，在使用Halo目录进行测试时，$ \ omega _ {\ rm m} $和$ \ sigma_8 $身体代码：算盘，Cubep $^3 $ M，Enzo，PKDGrav3和Ramses。令人惊讶的是，经过培训的模型推断$ \ omega _ {\ rm m} $在对数千个最先进的骆驼水力动力模拟进行测试时也可以使用，该模拟使用四个不同的代码和子网格物理实现。使用诸如浓度和最大循环速度之类的光环特性允许我们的模型提取更多信息，而牺牲了模型的鲁棒性。这可能会发生，因为不同的N体代码不会在与这些参数相对应的相关尺度上收敛。

translated by 谷歌翻译

Sensitivity Estimation for Dark Matter Subhalos in Synthetic Gaia DR2 using Deep Learning

Abdullah Bazarov , María Benito , Gert Hütsi , Rain Kipper , Joosep Pata , Sven Põder

分类：机器学习 | (统计)机器学习

2022-03-15

The abundance of dark matter (DM) subhalos orbiting a host galaxy is a generic prediction of the cosmological framework, and is a promising way to constrain the nature of DM. In this paper, we investigate the use of machine learning-based tools to quantify the magnitude of phase-space perturbations caused by the passage of DM subhalos. A simple binary classifier and an anomaly detection model are proposed to estimate if stars or star particles close to DM subhalos are statistically detectable in simulations. The simulated datasets are three Milky Way-like galaxies and nine synthetic Gaia DR2 surveys derived from these. Firstly, we find that the anomaly detection algorithm, trained on a simulated galaxy with full 6D kinematic observables and applied on another galaxy, is nontrivially sensitive to the DM subhalo population. On the other hand, the classification-based approach is not sufficiently sensitive due to the extremely low statistics of signal stars for supervised training. Finally, the sensitivity of both algorithms in the Gaia-like surveys is negligible. The enormous size of the Gaia dataset motivates the further development of scalable and accurate data analysis methods that could be used to select potential regions of interest for DM searches to ultimately constrain the Milky Way's subhalo mass function, as well as simulations where to study the sensitivity of such methods under different signal hypotheses.

translated by 谷歌翻译

Bayesian model calibration for block copolymer self-assembly: Likelihood-free inference and expected information gain computation via measure transport

Ricardo Baptista , Lianghao Cao , Joshua Chen , Omar Ghattas , Fengyi Li , Youssef M. Marzouk , J. Tinsley Oden

分类： (统计)机器学习

2022-06-22

我们考虑了使用显微镜或X射线散射技术产生的图像数据自组装的模型的贝叶斯校准。为了说明BCP平衡结构中的随机远程疾病，我们引入了辅助变量以表示这种不确定性。然而，这些变量导致了高维图像数据的综合可能性，通常可以评估。我们使用基于测量运输的可能性方法以及图像数据的摘要统计数据来解决这一具有挑战性的贝叶斯推理问题。我们还表明，可以计算出有关模型参数的数据中的预期信息收益（EIG），而无需额外的成本。最后，我们介绍了基于二嵌段共聚物薄膜自组装和自上而下显微镜表征的ohta-kawasaki模型的数值案例研究。为了进行校准，我们介绍了一些基于域的能量和傅立叶的摘要统计数据，并使用EIG量化了它们的信息性。我们证明了拟议方法研究数据损坏和实验设计对校准结果的影响的力量。

translated by 谷歌翻译

Predicting the Thermal Sunyaev-Zel'dovich Field using Modular and Equivariant Set-Based Neural Networks

Leander Thiele , Miles Cranmer , William Coulton , Shirley Ho , David N. Spergel

分类：机器学习

2022-02-28

理论不确定性限制了我们从诸如Thermal Sunyaev-Zel'Dovich（TSZ）效应等重的宇宙学信息中提取宇宙学信息的能力。 TSZ效应由电子压力场采购，取决于通常由昂贵的流体动力模拟建模的男性物理学。我们在Illustristng-300宇宙学模拟上训练神经网络，以预测仅重力模拟的星系簇中的连续电子压力场。对于神经网络而言，建模群集具有挑战性，因为大多数气体压力集中在少数体素中，甚至最大的流体动力模拟只包含几百个可以用于训练的簇。我们选择采用旋转等效的深度体系结构直接在暗物质颗粒集上运行，而不是传统的卷积神经网（CNN）体系结构。我们认为，基于集合的体系结构比CNN具有不同的优势。例如，我们可以执行精确的旋转和置换量比，并在TSZ领域中纳入现有的知识，并与宇宙学标准的稀疏领域一起工作。我们使用单独的，物理上有意义的模块组成我们的体系结构，使其可以解释。例如，我们可以分别研究局部和集群尺度环境的影响，确定簇三轴性具有可忽略的影响，并训练一个纠正错误居中的模块。我们的模型在适合相同模拟数据的分析概况上提高了70％。我们认为，电子压力场被视为仅重力模拟的函数，具有固有的随机性，并通过向网络的条件vae扩展进行建模。这种修饰可进一步提高7％，但受我们的小型培训集的限制。（简略）

translated by 谷歌翻译

Field Level Neural Network Emulator for Cosmological N-body Simulations

Drew Jamieson , Yin Li , Renan Alves de Oliveira , Francisco Villaescusa-Navarro , Shirley Ho , David N. Spergel

分类：机器学习

2022-06-09

我们为宇宙结构形成构建了一个场级模拟器，该模拟器在非线性方案中是准确的。我们的仿真器由两个卷积神经网络组成，这些神经网络训练有素，可根据其线性输入输出N体模拟粒子的非线性位移和速度。宇宙学的依赖性是在神经网络的每一层上以样式参数的形式编码的，从而使模拟器能够有效地插入了在广泛的背景问题范围内，不同扁平$ \ lambda $ cdm宇宙之间的结构形成结果。神经网络体系结构使模型可通过构造来区分，从而为快速场水平推断提供了强大的工具。我们通过考虑几个摘要统计数据，包括具有和不带红移空间扭曲的密度谱，位移功率谱，动量功率谱，密度双光谱，光晕丰度以及带有红移空间的光晕概况，并没有红移空间，我们可以测试方法的准确性。扭曲。我们将模拟器中的这些统计数据与完整的N体结果，可乐方法和没有宇宙学依赖性的基准神经网络进行了比较。我们发现我们的仿真器将准确的结果降至$ k \ sim 1 \ \ mathrm {mpc}^{ - 1} \，h $，代表对COLA和基金神经网络的可观改进。我们还证明，我们的模拟器很好地概括到包含原始非高斯性的初始条件，而无需任何其他样式参数或再培训。

translated by 谷歌翻译

Variational inference of fractional Brownian motion with linear computational complexity

Hippolyte Verdier , François Laurent , Christian Vestergaard , Jean-Baptiste Masson , Alhassan Cassé

分类：机器学习

2022-03-15

我们引入了基于仿真的摊销贝叶斯推理方案，以推断随机步行的参数。我们的方法通过无可能的方法了解了步行参数的后验分布。在第一步中，对图形神经网络进行了模拟数据培训，以学习随机步行的优化低维摘要统计数据。在第二步中，可逆神经网络使用变分推断从学习的汇总统计数据中产生参数的后验分布。我们应用我们的方法来从单轨迹推断布朗尼运动模型的参数。摊销推理过程的计算复杂性与轨迹长度线性缩放，其精度比例与cram {\'e} r-rao相似，在较大的长度上结合。该方法对位置噪声是强大的，并且比训练期间看到的轨迹更长的轨迹更长。最后，我们适应了该方案，以表明环境中的有限去相关时间可以从单个轨迹中推断出来。

translated by 谷歌翻译

Simple lessons from complex learning: what a neural network model learns about cosmic structure formation

Drew Jamieson , Yin Li , Siyu He , Francisco Villaescusa-Navarro , Shirley Ho , Renan Alves de Oliveira , David N. Spergel

分类：机器学习

2022-06-09

我们训练一个神经网络模型，以预测宇宙N体模拟的全相空间演化。它的成功表明，神经网络模型正在准确地近似绿色的功能扩展，该功能将模拟的初始条件与其在深层非线性方向上的后期结合到结果。我们通过评估其在具有已知精确解决方案或充分理解扩展的简单情况下的良好理解的简单案例上的表现来测试这种近似值的准确性。这些场景包括球形构型，隔离平面波和两个相互作用的平面波：与用于训练的高斯随机场有很大不同的初始条件。我们发现我们的模型可以很好地推广到这些良好理解的方案，这表明网络已经推断了一般的物理原理，并从复杂的随机高斯训练数据中学习了非线性模式耦合。这些测试还为查找模型的优势和劣势以及确定改进模型的策略提供了有用的诊断。我们还测试了仅包含横向模式的初始条件，该模式的模式不仅在其相位上有所不同，而且还与训练集中使用的纵向生长模式相比。当网络遇到与训练集正交的这些初始条件时，该模型将完全失败。除了这些简单的配置外，我们还评估了模型对N体模拟的标准初始条件的密度，位移和动量功率谱的预测。我们将这些摘要统计数据与N体结果和称为COLA的近似快速模拟方法进行了比较。我们的模型在$ k \ sim 1 \ \ mathrm {mpc}^{ - 1} \，h $的非线性尺度上达到百分比精度，代表了对COLA的显着改进。

translated by 谷歌翻译

Uncertainty-Aware Blob Detection with an Application to Integrated-Light Stellar Population Recoveries

Prashin Jethwa , Fabian Parzer , Otmar Scherzer , Glenn van de Ven

分类：计算机视觉

2022-08-11

语境。斑点检测是天文学中的常见问题。一个例子是在恒星种群建模中，其中从观察结果推断出星系中恒星年龄和金属性的分布。在这种情况下，斑点可能对应于原位的恒星与从卫星中吸收的恒星相对应，而BLOB检测的任务是解散这些组件。当分布带来重大不确定性时，就会出现一个困难，就像从未解决的恒星系统的建模光谱中推断出的恒星种群的情况一样。目前没有不确定性检测BLOB检测的令人满意的方法。目标。我们介绍了一种在恒星系统综合光谱的恒星种群建模的背景下开发的不确定性感知斑点检测方法。方法。我们为经典的blob检测方法的经典laplacian方法的不确定性感知版本开发了理论和计算工具，我们称之为ULOG。这确定了考虑各种尺度的重要斑点。作为将ULOG应用于恒星种群建模的先决条件，我们引入了一种有效计算光谱建模不确定性的方法。该方法基于截断的奇异值分解和马尔可夫链蒙特卡洛采样（SVD-MCMC）。结果。我们将方法应用于星团M54的数据。我们表明，SVD-MCMC推断与标准MCMC的推断相匹配，但计算速度更快。我们将ULOG应用于推断的M54年龄/金属性分布，识别其恒星中的2或3个显着不同的种群。

translated by 谷歌翻译

The Dark Machines Anomaly Score Challenge: Benchmark Data and Model Independent Event Classification for the Large Hadron Collider

T. Aarrestad , M. van Beekveld , M. Bona , A. Boveia , S. Caron , J. Davies , A. De Simone , C. Doglioni , J. M. Duarte , A. Farbin

分类： (统计)机器学习

2021-05-28

我们描述了作为黑暗机器倡议和LES Houches 2019年物理学研讨会进行的数据挑战的结果。挑战的目标是使用无监督机器学习算法检测LHC新物理学的信号。首先，我们提出了如何实现异常分数以在LHC搜索中定义独立于模型的信号区域。我们定义并描述了一个大型基准数据集，由> 10亿美元的Muton-Proton碰撞，其中包含> 10亿美元的模拟LHC事件组成。然后，我们在数据挑战的背景下审查了各种异常检测和密度估计算法，我们在一组现实分析环境中测量了它们的性能。我们绘制了一些有用的结论，可以帮助开发无监督的新物理搜索在LHC的第三次运行期间，并为我们的基准数据集提供用于HTTPS://www.phenomldata.org的未来研究。重现分析的代码在https://github.com/bostdiek/darkmachines-unsupervisedChallenge提供。

translated by 谷歌翻译