我们在密歇根州立大学国家超导电子实验室(NSCL)的主动 - 目标时间投影室探测器中评估事件分类的机器学习方法。单独输出所需反应产物的自动化方法将产生更准确的物理结果以及更快的分析过程。对2015年9月在NSCL进行的$ ^ {46} $ Ar(p,p)实验所产生的数据进行了二元和多类分类方法的测试。我们发现卷积神经网络是最成功的质子散射事件转移分类器学习。本研究的结果和建议预示着未来实验的分类。
translated by 谷歌翻译
A new tool is introduced for screening macromolecular X-ray crystallography diffraction images produced at an X-ray free-electron laser light source. Based on a data-driven deep learning approach, the proposed tool executes a convolutional neural network to detect Bragg spots. Automatic image processing algorithms described can enable the classification of large data sets, acquired under realistic conditions consisting of noisy data with experimental artifacts. Outcomes are compared for different data regimes, including samples from multiple instruments and differing amounts of training data for neural network optimization.
translated by 谷歌翻译
从ActiveTarget Time Projection Chambers数据自动重建三维粒子轨迹可能是一项具有挑战性的任务,尤其是在存在噪声的情况下。在本文中,我们提出了一种非参数算法,它基于聚类点三元组而不是原始点的思想。我们在点三元组上定义适当的距离度量,然后在三元组上应用单链路层次聚类。与诸如RANSAC或Hough变换的参数方法相比,新算法具有潜在地发现甚至预先未知的形状的轨迹的优点。该特征在低能量核物理实验中特别重要,其中有源目标在磁场内运行。该算法已经使用在国家超导电子实验室(NSCL)开发的活动目标时间投影室进行的实验数据进行了验证。结果证明该算法能够识别和隔离描述非分析轨迹的粒子轨迹。对于曲线轨迹,顶点检测召回率为86 \%,精度为94%。对于直线轨迹,顶点检测召回率为96 \%,精度为98%。在仅包含直线条架的测试集的情况下,该算法比迭代霍夫变换执行得更好。
translated by 谷歌翻译
最近,涉及几何(图形和流形结构)数据分析的任务在机器学习社区中占据了重要地位,为快速发展的几何深度学习领域提供了条件。在这项工作中,我们利用图形神经网络改善IceCubeneutrino天文台的信号检测。 IceCube探测器阵列被建模为图形,其中传感器是传感器,边缘是传感器空间坐标的学习函数。由于在给定观察期间只有IceCube传感器的一个子集处于活动状态,因此我们注意到GNN的自适应特性,其中计算受限于输入信号支持。我们展示了我们的GNN架构在对IceCube事件进行分类的任务中的有效性,其中它优于传统的基于物理的方法以及经典的3D卷积神经网络。
translated by 谷歌翻译
At the Large Hadron Collider, the high transverse-momentum events studied by experimental collaborations occur in coincidence with parasitic low transverse-momentum collisions, usually referred to as pileup. Pileup mitigation is a key ingredient of the online and offline event reconstruction as pileup affects the reconstruction accuracy of many physics observables. We present a classifier based on Graph Neural Networks, trained to retain particles coming from high-transverse-momentum collisions , while rejecting those coming from pileup collisions. This model is designed as a refinement of the PUPPI algorithm [1], employed in many LHC data analyses since 2015. Thanks to an extended basis of input information and the learning capabilities of the considered network architecture, we show an improvement in pileup-rejection performances with respect to state-of-the-art solutions.
translated by 谷歌翻译
我们开发,讨论并比较几种推理技术,以对抗碰撞实验中的约束参数。通过利用粒子物理过程的潜在空间结构,我们从模拟器中提取额外的信息。该增强数据可用于训练精确估计似然比的神经网络。新方法可以很好地扩展到许多可观测量和高维参数空间,不需要任何近似淋浴和探测器响应的近似,并且可以在几微秒内进行评估。使用弱玻色子融合Higgs生成作为示例过程,我们比较了几种技术的性能。对于使用关于该分数的额外信息训练的似然比估计器,发现了最佳结果,该对数似然函数关于理论参数的梯度。该分数还提供了足够的统计数据,其中包含了标准模型邻域推理所需的所有信息。这些方法使我们能够在基于直方图的传统方法上对有效维度 - 六个运算符施加更大的界限。这种方法优于通用机器学习方法,不利用粒子物理结构,证明了它们有可能大大改善LHC遗留结果的新物理范围。
translated by 谷歌翻译
声学数据提供从生物学和通信到海洋和地球科学等领域的科学和工程见解。我们调查了机器学习(ML)的进步和变革潜力,包括声学领域的深度学习。 ML是用于自动检测和利用模式印度的广泛的统计技术家族。相对于传统的声学和信号处理,ML是数据驱动的。给定足够的训练数据,ML可以发现特征之间的复杂关系。通过大量的训练数据,ML candiscover模型描述复杂的声学现象,如人类语音和混响。声学中的ML正在迅速发展,具有令人瞩目的成果和未来的重大前景。我们首先介绍ML,然后在五个声学研究领域强调MLdevelopments:语音处理中的源定位,海洋声学中的源定位,生物声学,地震探测和日常场景中的环境声音。
translated by 谷歌翻译
质量控制是许多制造过程的基本组成部分,特别是那些涉及铸造或焊接的过程。但是,手动质量控制程序通常非常耗时且容易出错。为了满足对高质量产品的增长需求,智能视觉检测系统的使用在生产线中变得至关重要。最近,卷积神经网络(CNN)在图像分类和定位任务方面都表现出色。在本文中,基于基于掩模区域的CNN架构,提出了一种用于识别X射线图像中的铸造缺陷的系统。所提出的缺陷检测系统同时对输入图像执行缺陷检测和分割,使其适用于一系列缺陷检测任务。示出了训练网络以同时执行缺陷检测和缺陷实例分割,导致更高的缺陷检测精度,而不仅仅是缺陷检测。利用转移学习来减少训练数据需求并提高训练模型的预测准确性。更具体地,在对相对小的金属铸造X射线数据集进行微调之前,首先用两个大的可用图像数据集训练该模型。训练模型的准确性超过了GRIMA X射线图像数据库(GDXray)的最新性能。铸件数据标记的速度足以在生产环境中使用。该系统还可以在GDXray Welds数据集上执行。进行了一些深入的研究,探讨转学习,多任务学习和多班学习如何影响训练系统的表现。
translated by 谷歌翻译
机器学习是粒子物理学中的一个重要研究领域,从20世纪90年代和21世纪初的高级物理分析应用开始,随后在2010年的粒子和事件识别和重建应用爆炸式增长。在本文档中,我们将讨论粒子物理学中机器学习的未来未来研究和开发领域,其中包括实施,软件和硬件资源需求,与数据科学界,学术界和工业界的协作计划,以及数据科学中粒子物理学社区的培训。该文件的主要目的是通过High-Luminosity Large HadronCollider的物理驱动程序和未来的中微子实验来连接和激发这些研究领域的发展,并确定实施的资源需求。此外,我们还确定了与六大社区合作将带来巨大利益的领域。
translated by 谷歌翻译
Cellular electron cryo-tomography enables the 3D visualization of cellular organization in the near-native state and at submolecular resolution. However, the contents of cellular tomograms are often complex, making it difficult to automatically isolate different in situ cellular components. In this paper, we propose a convolutional autoencoder-based unsupervised approach to provide a coarse grouping of 3D small subvolumes extracted from tomograms. We demonstrate that the autoencoder can be used for efficient and coarse characterization of features of macromolecular complexes and surfaces, such as membranes. In addition, the autoencoder can be used to detect non-cellular features related to sample preparation and data collection, such as carbon edges from the grid and tomogram boundaries. The autoencoder is also able to detect patterns that may indicate spatial interactions between cellular components. Furthermore, we demonstrate that our autoencoder can be used for weakly supervised semantic segmentation of cellular components, requiring a very small amount of manual annotation.
translated by 谷歌翻译
High-Precision​ ​ Automated​ ​ Reconstruction​ ​ of​ ​ Neurons​ ​ with​ ​ Flood-filling​ ​ Networks Michał​ ​ Januszewski​ 1​ ,​ ​ Jörgen​ ​ Kornfeld​ 2​ ,​ ​ Peter​ ​ H.​ ​ Li​ 3​ ,​ ​ Art​ ​ Pope​ 3​ ,​ ​ Tim​ ​ Blakely​ 4​ ,​ ​ Larry​ ​ Lindsey​ 4​ , Jeremy​ ​ Maitin-Shepard​ 3​ ,​ ​ Mike​ ​ Tyka​ 4​ ,​ ​ Winfried​ ​ Denk​ 2​ ,​ ​ Viren​ ​ Jain​ 3,* 1​ ​ ​ Google​ ​ Research,​ ​ Zürich,​ ​ Switzerland 2​ ​ ​ Max​ ​ Planck​ ​ Institute​ ​ of​ ​ Neurobiology,​ ​ Planegg-Martinsried,​ ​ Germany 3​
translated by 谷歌翻译
连续晶体学是通过衍射图案研究晶体结构和性质的科学领域。在本文中,我们引入了由真实和合成图像组成的新的连续晶体学数据集;通过使用既可扩展又准确的模拟器生成合成图像。生成的数据集称为DiffraNet,它由25,457个512x512灰度标记图像组成。我们探索了几种用于在DiffraNet上进行分类的计算机视觉方法,例如与随机森林和支持VectorMachines相关的标准特征提取算法,以及一个被称为DeepFreak的端到端CNN拓扑,用于处理这个新数据集。所有实施都是公开的,并且使用现成的AutoML优化工具进行精细调整,以进行公平的比较。我们的最佳模型在合成图像上的准确率达到98.5%,在真实图像上达到94.51%的准确度。我们相信,DiffraNet数据集及其分类方法将在长期内对加速许多学科的发现产生积极影响,包括化学,地质学,生物学,材料科学,冶金学和物理学。
translated by 谷歌翻译
This thesis describes a new approach to video motion estimation, in which motion is represented using a set of particles. Each particle is an image point sample with a long-duration trajectory and other properties. To optimize these particles, we measure point-based matching along the particle trajectories and distortion between the particles. The resulting motion representation is useful for a variety of applications and differs from optical flow, feature tracking, and parametric or layer-based models. We demonstrate the algorithm on challenging real-world videos that include complex scene geometry, multiple types of occlusion, regions with low texture, and non-rigid deformation.
translated by 谷歌翻译
地球物理反演试图通过在地表或其上方收集的观测来估计地球内部物理性质的分布。反问题通常被认为是高维参数空间中的最小二乘优化问题。现有方法主要基于确定性的基于梯度的方法,这些方法受到逆问题的非线性和非唯一性的限制。概率反演方法虽然在不确定性量化方面具有巨大潜力,但仍然是一项艰巨的计算任务。在本文中,我探讨了电磁反演的深度学习方法的潜力。该方法不需要计算梯度并立即提供结果。基于完全卷积结构的Deepneural网络在通过完整的3-D模拟获得的大型合成数据集上进行训练。该方法的性能在强有力的实际相关性模型上得到了证明,该模型代表了海岸控制的源电磁CO2监测方案。经过预先训练的网络可以可靠地估计异常的位置和横向尺寸,以及它们的电阻率特性。几个完全卷积的网络架构在准确性,概括性和培训成本方面进行了比较。具有不同测量几何和噪声水平的示例证实了深度学习反演的可行性,从而开启了在实时时间内估计地下电阻率分布的可能性。
translated by 谷歌翻译
我们展示了如何使用基于深度学习的事件拓扑分类来提高大型强子对撞机实时选择的数据样本的纯度。我们考虑不同的数据表示,其中训练了不同类型的多类分类器。使用原始数据和高级功能。在所考虑的示例中,可以训练基于分类器的得分的过滤器以保留~99%的感兴趣的事件并且将假阳性率降低多达一个数量级的背景过程。通过操作这样的过滤器作为LHC实验的在线事件选择基础设施的一部分,可以从更灵活和包容性的选择策略中受益,同时减少在处理误报时浪费的下游资源的量。节省的资源可以转化为检测器操作成本的降低或存储和处理能力的有效增加,这可以用于扩展LHC实验的物理范围。
translated by 谷歌翻译
We describe a trainable system for analyzing videos of developing C. elegans embryos. The system automatically detects, segments, and locates cells and nuclei in microscopic images. The system was designed as the central component of a fully-automated phenotyping system. The system contains three modules (1) a convolutional network trained to classify each pixel into five categories: cell wall, cytoplasm, nucleus membrane, nucleus, outside medium; (2) an Energy-Based Model which cleans up the output of the convolutional network by learning local consistency constraints that must be satisfied by label images; (3) A set of elastic models of the embryo at various stages of development that are matched to the label images.
translated by 谷歌翻译
We are interested in the development of surrogate models for uncertainty quantification and propagation in problems governed by stochastic PDEs using a deep convolutional encoder-decoder network in a similar fashion to approaches considered in deep learning for image-to-image regression tasks. Since normal neural networks are data intensive and cannot provide predic-tive uncertainty, we propose a Bayesian approach to convolutional neural nets. A recently introduced variational gradient descent algorithm based on Stein's method is scaled to deep convolutional networks to perform approximate Bayesian inference on millions of uncertain network parameters. This approach achieves state of the art performance in terms of predictive accuracy and uncertainty quantification in comparison to other approaches in Bayesian neural networks as well as techniques that include Gaussian processes and ensemble methods even when the training data size is relatively small. To evaluate the performance of this approach, we consider standard uncertainty quantification benchmark problems including flow in heterogeneous media defined in terms of limited data-driven permeability realizations. The performance of the surrogate model developed is very good even though there is no underlying structure shared between the input (permeability) and output (flow/pressure) fields as is often the case in the image-to-image regression models used in computer vision problems. Studies are performed with an underlying stochastic input dimensionality up to 4, 225 where most other uncertainty quantification methods fail. Uncertainty propagation tasks are considered and the predictive output Bayesian statistics are compared to those obtained with Monte Carlo estimates.
translated by 谷歌翻译
深度学习提出了希望和期望,作为许多应用程序的一般解决方案;事实证明它已被证明是有效的,但它也显示出对大量数据的强烈依赖性。幸运的是,已经证明,即使数据稀缺,也可以通过重复使用priorknowledge来训练成功的模型。因此,在最广泛的定义中,开发转移学习技术是部署有效和准确的智能系统的关键因素。本文将重点研究一系列适用于视觉目标识别任务的转移学习方法,特别是图像分类。转移学习是一个通用术语,并且特定设置已经给出了特定的名称:当学习者只能访问来自目标域的标记数据和来自不同域(源)的标记数据时,问题被称为“无监督域适应”。 (DA)。这项工作的第一部分将集中在这个设置的三种方法:其中一种方法涉及特征,一种是图像,而第三种方法同时使用两种。第二部分将重点关注机器人感知的现实生活问题,特别是RGB-D识别。机器人平台通常不仅限于色彩感知;他们经常带着Depthcamera。不幸的是,深度模态很少用于视觉识别,因为缺乏预先训练的模型,从中可以传输并且很少有数据从头开始。将提出两种处理这种情况的方法:一种使用合成数据,另一种利用跨模态转移学习。
translated by 谷歌翻译