ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列,该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战,这是由于探测器的几何形状,不均匀的散射和冰中光的吸收,并且低于100 GEV的光,每个事件产生的信号光子数量相对较少。为了应对这一挑战,可以将ICECUBE事件表示为点云图形,并将图形神经网络(GNN)作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开,对不同的中微子事件类型进行分类,并重建沉积的能量,方向和相互作用顶点。基于仿真,我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术,包括已知系统不确定性的影响。对于中微子事件分类,与当前的IceCube方法相比,GNN以固定的假阳性速率(FPR)提高了信号效率的18%。另外,GNN在固定信号效率下将FPR的降低超过8(低于半百分比)。对于能源,方向和相互作用顶点的重建,与当前最大似然技术相比,分辨率平均提高了13%-20%。当在GPU上运行时,GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件,这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。
translated by 谷歌翻译
在2015年和2019年之间,地平线的成员2020年资助的创新培训网络名为“Amva4newphysics”,研究了高能量物理问题的先进多变量分析方法和统计学习工具的定制和应用,并开发了完全新的。其中许多方法已成功地用于提高Cern大型Hadron撞机的地图集和CMS实验所执行的数据分析的敏感性;其他几个人,仍然在测试阶段,承诺进一步提高基本物理参数测量的精确度以及新现象的搜索范围。在本文中,在研究和开发的那些中,最相关的新工具以及对其性能的评估。
translated by 谷歌翻译
我们描述了作为黑暗机器倡议和LES Houches 2019年物理学研讨会进行的数据挑战的结果。挑战的目标是使用无监督机器学习算法检测LHC新物理学的信号。首先,我们提出了如何实现异常分数以在LHC搜索中定义独立于模型的信号区域。我们定义并描述了一个大型基准数据集,由> 10亿美元的Muton-Proton碰撞,其中包含> 10亿美元的模拟LHC事件组成。然后,我们在数据挑战的背景下审查了各种异常检测和密度估计算法,我们在一组现实分析环境中测量了它们的性能。我们绘制了一些有用的结论,可以帮助开发无监督的新物理搜索在LHC的第三次运行期间,并为我们的基准数据集提供用于HTTPS://www.phenomldata.org的未来研究。重现分析的代码在https://github.com/bostdiek/darkmachines-unsupervisedChallenge提供。
translated by 谷歌翻译
罕见的事件搜索使我们能够通过利用专门的大型探测器来搜索无法与其他方式无法访问的新物理学。机器学习提供了一种新工具来最大化这些检测器提供的信息。信息很少,这迫使这些算法从最低级别的数据开始,并利用检测器中的所有对称性来产生结果。在这项工作中,我们提出了Kamnet,该Kamnet在几何深度学习和时空数据分析中实现了突破,以最大程度地提高Kamland-Zen的物理范围,Kamland-Zen是kiloton量表球形液体闪烁体检测器,以寻找中微子的中微子双β衰减($ 0 \ beta \ beta \ beta \ beta $) 。使用Kamland的简化背景模型,我们表明Kamnet在基准MC模拟上以较高的鲁棒性水平优于常规CNN。然后,我们使用模拟数据,证明了Kamnet将Kamland-Zen的敏感性提高到$ 0 \ nu \ beta \ beta \ beta $和$ 0 \ nu \ beta \ beta \ beta $的能力。这项工作的一个关键组成部分是增加了注意机制来阐明基础物理Kamnet用于背景排斥。
translated by 谷歌翻译
卷积图网络用于粒子物理学,以进行有效的事件重建和分类。但是,如果应用于传感器级数据,则可以通过现代粒子探测器中使用的大量传感器来限制它们的性能。我们提出了一个合并方案,该方案使用分区来在图形上创建汇总内核,类似于图像上的汇总。分区池可用于采用成功的图像识别体系结构,以用于粒子物理中的图形神经网络应用。减少的计算资源允许更深的网络和更广泛的超参数优化。为了显示其适用性,我们构建了一个带有分区池的卷积图网络,该网络重建了理想化的中微子检测器的模拟交互顶点。汇总网络的性能提高了,并且与没有合并的类似网络相比,不容易拟合过度。较低的资源要求允许建立更深层次的网络,并进一步提高性能。
translated by 谷歌翻译
最近的工作已经证明了图形神经网络(GNN)等几何深度学习方法非常适合于在高能粒子物理学中解决各种重建问题。特别地,粒子跟踪数据通过识别硅跟踪器命中作为节点和粒子轨迹作为边缘来自然表示为曲线图;给定一组假设的边缘,边缘分类GNN标识与真实粒子轨迹相对应的那些。在这项工作中,我们将物理激励的相互作用网络(IN)GNN调整为与高亮度大强子撞机的预期相似的填充条件中的粒子跟踪问题。假设在各种粒子矩阈值下进行理想化的击中过滤,我们通过在基于GNN的跟踪的每个阶段进行了一系列测量来展示了优异的边缘分类精度和跟踪效率:图形结构,边缘分类和轨道建筑。建议的建筑基本上比以前研究的GNN跟踪架构小幅小;这尤其希望,因为大小的减小对于在受约束的计算环境中实现基于GNN的跟踪至关重要。此外,可以将其表示为一组显式矩阵操作或传递GNN的消息。正在进行努力,以通过异构计算资源朝向高级和低延迟触发应用程序加速每个表示。
translated by 谷歌翻译
我们介绍了一种从电磁(EM)采样量热计收集的数据重建多个淋浴的第一算法。这种探测器广泛用于高能量物理中,以测量进入粒子的能量和运动学。在这项工作中,我们考虑许多电子通过乳液云室(ECC)砖的情况,启动电子诱导的电磁淋浴,这可以是长曝光时间或大输入粒子通量的情况。例如,船舶实验计划使用乳液检测器进行暗物质搜索和中微子物理调查。船舶实验的预期完整通量约为10 ^ 20颗粒。为了降低与替换ECC砖和离线数据的实验的成本(乳液扫描),决定增加暴露时间。因此,我们希望观察大量重叠阵雨,将EM淋浴重建变为挑战的点云分割问题。我们的重建管线包括图形神经网络,其预测邻接矩阵和聚类算法。我们提出了一种新的层型(乳液CONV),其考虑了ECC砖中淋浴开发的几何特性。对于重叠阵雨的聚类,我们使用修改后的基于分层密度的聚类算法。我们的方法不使用有关进入粒子的任何先前信息,并识别乳液检测器中的高达87%的电磁淋浴。用于重建电磁淋浴的算法的主要测试台将是SND @ LHC。
translated by 谷歌翻译
数据和标签的联合分布的KL差异目标允许在随机变异推断的一个保护伞下统一监督的学习和变异自动编码器(VAE)。统一激发了扩展的监督方案,该方案允许计算神经网络模型的合适性P值。通过神经网络摊销的条件归一化流在这种结构中至关重要。我们讨论了它们如何允许在产品空间上共同定义的后代定义的覆盖范围,例如$ \ mathbb {r}^n \ times \ times \ mathcal {s}^m $,它包含在方向上的海报。最后,系统的不确定性自然包含在变化观点中。在经典的可能性方法或其他机器学习模型中,(1)系统,(2)覆盖范围和(3)拟合优度的成分通常并非全部可用,或者至少有一个受到严格限制。相比之下,拟议的扩展监督培训和摊销标准化流量可容纳所有三个,用于在产品空间上定义的任意统计分布的变异推理,例如$ \ mathbb {r}^n \ times \ times \ ldots \ ldots \ times \ times \ mathcal {s}^m {s}^m $,没有基本数据复杂性的基本障碍。因此,它具有当代(Astro-)粒子物理学家的统计工具箱的巨大潜力。
translated by 谷歌翻译
深度学习是高能物理学领域的标准工具,可促进许多分析策略的敏感性增强。特别是,在识别物理对象(例如喷气味标记)时,复杂的神经网络体系结构起着重要作用。但是,这些方法依赖于准确的模拟。不隔材料会导致需要测量和校准的数据的性能差异不可忽略。我们研究了对输入数据的分类器响应,并通过应用对抗性攻击来探测风味标记算法的脆弱性。随后,我们提出了一种对抗性训练策略,以减轻这种模拟攻击的影响并改善分类器的鲁棒性。我们研究了性能与脆弱性之间的关系,并表明该方法构成了一种有希望的方法,可以减少对差建模的脆弱性。
translated by 谷歌翻译
$ \ Texit {Fermi} $数据中的银河系中多余(GCE)的两个领先假设是一个未解决的微弱毫秒脉冲条件(MSP)和暗物质(DM)湮灭。这些解释之间的二分法通常通过将它们建模为两个单独的发射组分来反映。然而,诸如MSP的点源(PSS)在超微弱的极限中具有统计变质的泊松发射(正式的位置,预期每个来源平均贡献远低于一个光子),导致可能提出问题的歧义如排放是否是PS样或性质中的泊松人。我们提出了一种概念上的新方法,以统一的方式描述PS和泊松发射,并且刚刚从此获得的结果中获得了对泊松组件的约束。为了实现这种方法,我们利用深度学习技术,围绕基于神经网络的方法,用于直方图回归,其表达量数量的不确定性。我们证明我们的方法对许多困扰先前接近的系统,特别是DM / PS误操作来稳健。在$ \ texit {fermi} $数据中,我们发现由$ \ sim4 \ times 10 ^ {-11} \ \ text {counts} \ {counts} \ text {counts} \ text {counts} \ \ text {cm} ^ { - 2} \ \ text {s} ^ { - 1} $(对应于$ \ sim3 - 4 $每pL期望计数),这需要$ n \ sim \ mathcal {o}( 10 ^ 4)$源来解释整个过剩(中位数价值$ n = \文本{29,300} $横跨天空)。虽然微弱,但这种SCD允许我们获得95%信心的Poissonian比赛的约束$ \ eta_p \ leq 66 \%$。这表明大量的GCE通量是由于PSS 。
translated by 谷歌翻译
由液体闪光灯(LS)靶标组成的大型探测器被一系列照片 - 型型管(PMT)包围,广泛用于现代中微子实验中:Borexino,Kamland,Daya Bay,Double Chooz,Reno,Ren​​o,Ren​​o和即将到来的Juno及其卫星朱诺检测器陶。这样的设备能够测量中微子能量,这可以从PMT通道上的光及其空间和时间分布中得出。但是,在大规模探测器中实现精细的能源分辨率是具有挑战性的。在这项工作中,我们介绍了该类型最先进的检测器Juno的能源重建方法的机器学习方法。我们专注于0-10 MEV的能量范围的正电子事件,该事件与juno $ - $中微子中的主要信号相对应,该信号源自核反应堆核心,并通过逆β-蛋白通道检测到。我们考虑使用PMTS收集的信息计算的综合特征,并在综合特征上进行了培训的深层神经网络。我们描述了我们功能工程程序的详细信息,并表明机器学习模型可以使用工程功能的子集提供能源分辨率$ \ sigma = 3 \%$。用于模型培训和测试的数据集由Monte Carlo方法与官方Juno软件生成。还提出了用于评估实际数据重建算法性能的校准源。
translated by 谷歌翻译
机器学习在加强和加速寻求新基本物理学方面发挥着至关重要的作用。我们审查了新物理学的机器学习方法和应用中,在地面高能量物理实验的背景下,包括大型强子撞机,罕见的事件搜索和中微生实验。虽然机器学习在这些领域拥有悠久的历史,但深入学习革命(2010年代初)就研究的范围和雄心而产生了定性转变。这些现代化的机器学习发展是本综述的重点。
translated by 谷歌翻译
喷气标记是粒子物理学中的一项关键但具有挑战性的分类任务。尽管深度学习已经改变了喷气标记并显着提高了性能,但缺乏大规模的公共数据集阻碍了进一步的增强。在这项工作中,我们提出了JetClass,这是一种用于喷气标记的新综合数据集。 JETCLASS数据集由100 M喷气机组成,比现有公共数据集大约两个数量级。总共模拟了10种类型的喷气机,包括到目前为止未探索用于标记的几种类型。基于大型数据集,我们提出了一种用于喷射标记的新的基于变压器的体系结构,称为“粒子变压器”(部分)。通过将成对的粒子相互作用纳入注意机制,部分可以达到比普通变压器更高的标记性能,并超过了先前最新的颗粒,颗粒的幅度很大。一旦进行了微调,预先训练的零件模型也大大提高了两个广泛采用的喷气标记基准的性能。数据集,代码和模型可在https://github.com/jet-universe/particle_transformer上公开获得。
translated by 谷歌翻译
在背景主导的情况下,通过机器学习和信号和背景之间的可观察者之间的高度重叠来调查LHC在LHC的新物理搜索的敏感性。我们使用两种不同的型号,XGBoost和深度神经网络,利用可观察到之间的相关性,并将这种方法与传统的切割方法进行比较。我们认为不同的方法来分析模型的输出,发现模板拟合通常比简单的切割更好地执行。通过福芙氏分解,我们可以额外了解事件运动学与机器学习模型输出之间的关系。我们认为具有亚霉素的超对称场景作为一个具体示例,但方法可以应用于更广泛的超对称模型。
translated by 谷歌翻译
地震阶段关联将地震到达时间测量连接到其致病来源。有效的关联必须确定离散事件的数量,其位置和起源时间,并且必须将实际到达与测量工件区分开。深度学习采摘者的出现,从紧密重叠的小地震中提供了高率的速度,它激发了重新审视相关问题并使用深度学习方法来解决它。我们已经开发了一个图形神经网络关联器,该协会同时预测源时空定位和离散的源源 - 边界关联可能性。该方法适用于任意几何形状,数百个电台的时变地震网络,并且具有可变噪声和质量的高源和输入选拔速率。我们的图形地震神经解释引擎(Genie)使用一个图来表示站点,另一个图表示空间源区域。 Genie从数据中从数据中学习了关系,使其能够确定可靠的源和源源联想。我们使用Phasenet Deep Learth Learning Phase Phase Picker生成的输入来培训合成数据,并测试来自北加州(NC)地震网络的真实数据的方法。我们成功地重新检测了USGS在2000年$ \ unicode {x2013} $ 2022之间的500天报告中报告的所有事件M> 1的96%。在2017年的100天连续处理间隔中,$ \ unicode {x2013} $ 2018,我们检测到〜4.2x USGS报告的事件数量。我们的新事件的估计值低于USGS目录的完整性幅度,并且位于该地区的活动故障和采石场附近。我们的结果表明,精灵可以在复杂的地震监测条件下有效解决关联问题。
translated by 谷歌翻译
The occurrence of vacuum arcs or radio frequency (rf) breakdowns is one of the most prevalent factors limiting the high-gradient performance of normal conducting rf cavities in particle accelerators. In this paper, we search for the existence of previously unrecognized features related to the incidence of rf breakdowns by applying a machine learning strategy to high-gradient cavity data from CERN's test stand for the Compact Linear Collider (CLIC). By interpreting the parameters of the learned models with explainable artificial intelligence (AI), we reverse-engineer physical properties for deriving fast, reliable, and simple rule-based models. Based on 6 months of historical data and dedicated experiments, our models show fractions of data with a high influence on the occurrence of breakdowns. Specifically, it is shown that the field emitted current following an initial breakdown is closely related to the probability of another breakdown occurring shortly thereafter. Results also indicate that the cavity pressure should be monitored with increased temporal resolution in future experiments, to further explore the vacuum activity associated with breakdowns.
translated by 谷歌翻译
在CERN大强子撞机(LHC)的碰撞中的带电粒子轨迹的测定是一个重要但挑战性的问题,特别是在LHC(HL-LHC)的未来高亮度相期间的高相互作用密度条件下。图形神经网络(GNNS)是一种类型的几何深度学习算法,通过将跟踪器数据嵌入作为图形节点来成功应用于此任务的几何深度学习算法,而边缘表示可能的曲线段 - 并将边缘分类为真实或假轨道段。但是,由于其大量的计算成本,它们在基于硬件或软件的触发器应用中的研究受到限制。在本文中,我们介绍了一个自动翻译工作流程,集成到一个名为$ \ texttt {hls4ml} $的更广泛的工具中,用于将GNN转换为现场可编程门阵列(FPGA)的固件。我们使用此翻译工具实现用于带电粒子跟踪的GNN,使用TrackML挑战DataSet在FPGA上培训,其中设计针对不同的图表大小,任务复杂和延迟/吞吐量要求。该工作可以在HL-LHC实验的触发水平下纳入带电粒子跟踪GNN。
translated by 谷歌翻译
In this article, we use artificial intelligence algorithms to show how to enhance the resolution of the elementary particle track fitting in inhomogeneous dense detectors, such as plastic scintillators. We use deep learning to replace more traditional Bayesian filtering methods, drastically improving the reconstruction of the interacting particle kinematics. We show that a specific form of neural network, inherited from the field of natural language processing, is very close to the concept of a Bayesian filter that adopts a hyper-informative prior. Such a paradigm change can influence the design of future particle physics experiments and their data exploitation.
translated by 谷歌翻译
这本数字本书包含在物理模拟的背景下与深度学习相关的一切实际和全面的一切。尽可能多,所有主题都带有Jupyter笔记本的形式的动手代码示例,以便快速入门。除了标准的受监督学习的数据中,我们将看看物理丢失约束,更紧密耦合的学习算法,具有可微分的模拟,以及加强学习和不确定性建模。我们生活在令人兴奋的时期:这些方法具有从根本上改变计算机模拟可以实现的巨大潜力。
translated by 谷歌翻译
培训和测试监督对象检测模型需要大量带有地面真相标签的图像。标签定义图像中的对象类及其位置,形状以及可能的其他信息,例如姿势。即使存在人力,标签过程也非常耗时。我们引入了一个新的标签工具,用于2D图像以及3D三角网格:3D标记工具(3DLT)。这是一个独立的,功能丰富和跨平台软件,不需要安装,并且可以在Windows,MacOS和基于Linux的发行版上运行。我们不再像当前工具那样在每个图像上分别标记相同的对象,而是使用深度信息从上述图像重建三角形网格,并仅在上述网格上标记一次对象。我们使用注册来简化3D标记,离群值检测来改进2D边界框的计算和表面重建,以将标记可能性扩展到大点云。我们的工具经过最先进的方法测试,并且在保持准确性和易用性的同时,它极大地超过了它们。
translated by 谷歌翻译