智能论文笔记

A physics-aware deep learning model for energy localization in multiscale shock-to-detonation simulations of heterogeneous energetic materials

Phong C. H. Nguyen , Yen-Thi Nguyen , Pradeep K. Seshadri , Joseph B. Choi , H. S. Udaykumar , Stephen Baek

分类：机器学习

2022-11-08

Predictive simulations of the shock-to-detonation transition (SDT) in heterogeneous energetic materials (EM) are vital to the design and control of their energy release and sensitivity. Due to the complexity of the thermo-mechanics of EM during the SDT, both macro-scale response and sub-grid mesoscale energy localization must be captured accurately. This work proposes an efficient and accurate multiscale framework for SDT simulations of EM. We employ deep learning to model the mesoscale energy localization of shock-initiated EM microstructures upon which prediction results are used to supply reaction progress rate information to the macroscale SDT simulation. The proposed multiscale modeling framework is divided into two stages. First, a physics-aware recurrent convolutional neural network (PARC) is used to model the mesoscale energy localization of shock-initiated heterogeneous EM microstructures. PARC is trained using direct numerical simulations (DNS) of hotspot ignition and growth within microstructures of pressed HMX material subjected to different input shock strengths. After training, PARC is employed to supply hotspot ignition and growth rates for macroscale SDT simulations. We show that PARC can play the role of a surrogate model in a multiscale simulation framework, while drastically reducing the computation cost and providing improved representations of the sub-grid physics. The proposed multiscale modeling approach will provide a new tool for material scientists in designing high-performance and safer energetic materials.

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Biomedical image analysis competitions: The state of current participation practice

Matthias Eisenmann , Annika Reinke , Vivienn Weru , Minu Dietlinde Tizabi , Fabian Isensee , Tim J. Adler , Patrick Godau , Veronika Cheplygina , Michal Kozubek , Sharib Ali

分类：计算机视觉 | 机器学习

2022-12-16

The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译

Do-AIQ: A Design-of-Experiment Approach to Quality Evaluation of AI Mislabel Detection Algorithm

J. Lian , K. Choi , B. Veeramani , A. Hu , L. Freeman , E. Bowen , X. Deng

分类： (统计)机器学习 | 机器学习

2022-08-21

人工智能（AI）算法的质量对于在网络安全，医疗保健和自动驾驶等各种应用中自信采用算法至关重要。这项工作提出了一个原则上的框架，该框架使用实验设计的方法系统地评估AI算法的质量，称为DO-AIQ。具体而言，我们专注于研究针对数据中毒的AI Mislabel数据算法的质量。 AI算法的性能受到算法和数据质量中的超参数的影响，尤其是数据错误标签，类不平衡和数据类型。为了评估AI算法的质量并获得有关算法质量的值得信赖的评估，我们建立了经验设计框架，以在高维约束空间中构建有效的空间填充设计并开发有效的替代模型使用加性高斯工艺来实现AI算法质量的仿真。进行了理论和数值研究，以证明所提出框架的优点是合理的。所提出的框架可以为AI算法设置一个示例，以增强对鲁棒性，可重复性和透明度的AI保证。

translated by 谷歌翻译

Deeply-Learned Generalized Linear Models with Missing Data

David K Lim , Naim U Rashid , Junier B Oliva , Joseph G Ibrahim

分类： (统计)机器学习 | 机器学习

2022-07-18

近年来，深度学习（DL）方法的流行程度急剧增加，并且在生物医学科学中的监督学习问题中的应用显着增长。但是，现代生物医学数据集中缺失数据的较高流行率和复杂性对DL方法提出了重大挑战。在这里，我们在深入学习的广义线性模型的背景下，对缺失数据进行了正式处理，这是一种监督的DL架构，用于回归和分类问题。我们提出了一种新的体系结构，即\ textit {dlglm}，这是第一个能够在训练时在输入功能和响应中灵活地说明忽略和不可忽视的缺失模式之一。我们通过统计模拟证明，我们的方法在没有随机（MNAR）缺失的情况下胜过现有的监督学习任务方法。我们从UCI机器学习存储库中对银行营销数据集进行了案例研究，在该数据集中我们预测客户是否基于电话调查数据订阅了产品。

translated by 谷歌翻译

Learning Image Representations for Content Based Image Retrieval of Radiotherapy Treatment Plans

Charles Huang , Varun Vasudevan , Oscar Pastor-Serrano , Md Tauhidul Islam , Yusuke Nomura , Piotr Dubrowski , Jen-Yeu Wang , Joseph B. Schulz , Yong Yang , Lei Xing

分类：计算机视觉

2022-06-06

目的：基于知识的计划（KBP）通常涉及培训端到端深度学习模型以预测剂量分布。但是，由于经常使用的医疗数据集规模有限，端到端方法可能与实际限制有关。为了解决这些局限性，我们提出了一种基于内容的图像检索（CBIR）方法，用于根据解剖学相似性检索先前计划的患者的剂量分布。方法：我们提出的CBIR方法训练一种代表模型，该模型可产生患者解剖信息的潜在空间嵌入。然后将新患者的潜在空间嵌入与数据库中以前患者的潜在空间嵌入，以检索剂量分布的图像。该项目的所有源代码均可在GitHub上获得。主要结果：在由我们机构的公开计划和临床计划组成的数据集上评估了各种CBIR方法的检索性能。这项研究比较了各种编码方法，从简单的自动编码器到Simsiam等最新的暹罗网络，并且在Multipask Siamese网络中观察到了最佳性能。意义：应用CBIR告知后续的治疗计划可能会解决与端到端KBP相关的许多限制。我们目前的结果表明，可以通过对先前开发的暹罗网络进行轻微更改来获得出色的图像检索性能。我们希望通过Metaplanner框架等方法将CBIR集成到未来工作中的自动化计划工作流程中。

translated by 谷歌翻译

Experimental Demonstration of Neuromorphic Network with STT MTJ Synapses

Peng Zhou , Alexander J. Edwards , Fred B. Mancoff , Dimitri Houssameddine , Sanjeev Aggarwal , Joseph S. Friedman

分类：神经与进化计算

2021-12-09

我们介绍了具有磁隧道结（MTJ）突触的神经形态网络的第一个实验证明，其通过矢量矩阵乘法进行图像识别。我们还模拟了执行Mnist手写数字识别的大型MTJ网络，展示MTJ交叉栏可以匹配映射器精度，同时提供更高的精度，稳定性和耐久性。

translated by 谷歌翻译

NL-Augmenter: A Framework for Task-Sensitive Natural Language Augmentation

Kaustubh D. Dhole , Varun Gangal , Sebastian Gehrmann , Aadesh Gupta , Zhenhao Li , Saad Mahamood , Abinaya Mahendiran , Simon Mille , Ashish Srivastava , Samson Tan

分类：自然语言处理 | 人工智能 | 机器学习

2021-12-06

数据增强是自然语言处理（NLP）模型的鲁棒性评估的重要组成部分，以及增强他们培训的数据的多样性。在本文中，我们呈现NL-Cogmenter，这是一种新的参与式Python的自然语言增强框架，它支持创建两个转换（对数据的修改）和过滤器（根据特定功能的数据拆分）。我们描述了框架和初始的117个变换和23个过滤器，用于各种自然语言任务。我们通过使用其几个转换来分析流行自然语言模型的鲁棒性来证明NL-Upmenter的功效。基础架构，Datacards和稳健性分析结果在NL-Augmenter存储库上公开可用（\ url {https://github.com/gem-benchmark/nl-augmenter}）。

translated by 谷歌翻译

Rapid Automated Analysis of Skull Base Tumor Specimens Using Intraoperative Optical Imaging and Artificial Intelligence

Cheng Jiang , Abhishek Bhattacharya , Joseph Linzey , Rushikesh S. Joshi , Sung Jik Cha , Sudharsan Srinivasan , Daniel Alber , Akhil Kondepudi , Esteban Urias , Balaji Pandian

分类：计算机视觉 | 人工智能 | 机器学习

2021-08-08

背景：精确诊断颅底肿瘤对于提供个性化的手术治疗策略至关重要。由于肿瘤多样性和缺乏术中病理资源，术中诊断可能具有挑战性。目的：开发独立且平行的术中病理学工作流程，可以使用无标签的光学成像和人工智能提供快速准确的颅底肿瘤诊断。方法：我们使用了基于光纤激光，无标签，非消费性，高分辨率显微镜方法（$ <$ <$ <$ <$ 60秒，每1 $ \ times $ 1 mm $ $^\ text {2} $），称为刺激的拉曼组织学（SRH），以对颅底肿瘤患者的连续多中心队列进行成像。然后，使用三种表示学习策略：跨渗透性，自我监督的对比度学习和监督对比度学习，使用SRH图像来训练卷积神经网络（CNN）模型。我们训练有素的CNN模型在持有的多中心SRH数据集上进行了测试。结果：SRH能够成像良性和恶性颅底肿瘤的诊断特征。在三种表示策略中，有监督的对比度学习最有效地学习了每种颅底肿瘤类型的独特和诊断SRH图像特征。在我们的多中心测试集中，跨渗透性达到了91.5％的总体诊断准确性，自我监督的对比度学习为83.9％，并且有监督的对比度学习为96.6％。我们训练有素的模型能够鉴定出肿瘤正常的边缘，并检测整个SRH图像中微观肿瘤浸润的区域。结论：具有训练有素的人工智能模型的SRH可以对颅底肿瘤标本进行快速准确的术中分析，以告知手术决策。

translated by 谷歌翻译