智能论文笔记

Bringing Atomistic Deep Learning to Prime Time

Nathan C. Frey , Siddharth Samsi , Bharath Ramsundar , Connor W. Coley , Vijay Gadepally

分类：机器学习

2021-12-09

人工智能尚未彻底改变材料和分子的设计。在这种观点中，我们确定了四个障碍，阻碍了原子深度学习，分子科学和高性能计算的整合。我们概述了重点的研究努力，解决这些挑战所提供的机会。

translated by 谷歌翻译

Scalable Geometric Deep Learning on Molecular Graphs

Nathan C. Frey , Siddharth Samsi , Joseph McDonald , Lin Li , Connor W. Coley , Vijay Gadepally

分类：机器学习

2021-12-06

分子和材料科学的深度学习受应用科学，人工智能和高性能计算之间缺乏融合的限制。关于培训数据量，模型架构的规模和复杂程度以及计算基础设施的规模的瓶颈是限制分子和材料深度学习缩放的关键因素。在这里，我们呈现$ \ texit {litmatter} $，轻量级框架用于缩放分子深度学习方法。我们在超过400个GPU上培训四个图形神经网络架构，并调查这些方法的缩放行为。根据模型架构，可以看到高达60美元的培训时间加速。经验神经缩放关系量化模型依赖性缩放，使能最优计算资源分配和可伸缩分子几何深度学习模型实现的识别。

translated by 谷歌翻译

Learning from learning machines: a new generation of AI technology to meet the needs of science

Luca Pion-Tonachini , Kristofer Bouchard , Hector Garcia Martin , Sean Peisert , W. Bradley Holtz , Anil Aswani , Dipankar Dwivedi , Haruko Wainwright , Ghanshyam Pilania , Benjamin Nachman

分类：机器学习 | 人工智能

2021-11-27

我们概述了新兴机会和挑战，以提高AI对科学发现的效用。AI为行业的独特目标与AI科学的目标创造了识别模式中的识别模式与来自数据的发现模式之间的紧张。如果我们解决了与域驱动的科学模型和数据驱动的AI学习机之间的“弥补差距”相关的根本挑战，那么我们预计这些AI模型可以改变假说发电，科学发现和科学过程本身。

translated by 谷歌翻译

Beyond Low Earth Orbit: Biological Research, Artificial Intelligence, and Self-Driving Labs

Lauren M. Sanders , Jason H. Yang , Ryan T. Scott , Amina Ann Qutub , Hector Garcia Martin , Daniel C. Berrios , Jaden J. A. Hastings , Jon Rask , Graham Mackintosh , Adrienne L. Hoarfrost

分类：机器学习

2021-12-22

空间生物学研究旨在了解太空飞行对生物的根本影响，制定支持深度空间探索的基础知识，最终生物工程航天器和栖息地稳定植物，农作物，微生物，动物和人类的生态系统，为持续的多行星寿命稳定。要提高这些目标，该领域利用了来自星空和地下模拟研究的实验，平台，数据和模型生物。由于研究扩展到低地球轨道之外，实验和平台必须是最大自主，光，敏捷和智能化，以加快知识发现。在这里，我们介绍了由美国国家航空航天局的人工智能，机器学习和建模应用程序组织的研讨会的建议摘要，这些应用程序为这些空间生物学挑战提供了关键解决方案。在未来十年中，将人工智能融入太空生物学领域将深化天空效应的生物学理解，促进预测性建模和分析，支持最大自主和可重复的实验，并有效地管理星载数据和元数据，所有目标使生活能够在深空中茁壮成长。

translated by 谷歌翻译

Snowmass 2021 Computational Frontier CompF03 Topical Group Report: Machine Learning

Phiala Shanahan , Kazuhiro Terao , Daniel Whiteson

分类：人工智能

2022-09-15

机器学习（ML）与高能物理学（HEP）的快速发展的交集给我们的社区带来了机会和挑战。远远超出了标准ML工具在HEP问题上的应用，这两个领域的一代人才素养正在开发真正的新的和潜在的革命性方法。迫切需要支持跨学科社区推动这些发展的需求，包括在这两个领域的交汇处为专门研究提供资金，在大学投资高性能计算以及调整分配政策以支持这项工作，开发社区工具和标准，并为年轻研究人员提供教育和职业道路，从而吸引了机器学习的智力活力，以吸引高能量物理学。

translated by 谷歌翻译

Geometric Deep Learning on Molecular Representations

Kenneth Atz , Francesca Grisoni , Gisbert Schneider

分类：人工智能 | 机器学习

2021-07-26

基于合并和处理对称信息的神经网络架构的几何深度学习（GDL）已经成为人工智能最近的范式。GDL在分子建模应用中具有特定的承诺，其中存在具有不同对称性和抽象水平的各种分子表示。本综述提供了分子GDL的结构化和协调概述，突出了其在药物发现，化学合成预测和量子化学中的应用。重点是学习的分子特征的相关性及其对成熟的分子描述符的互补性。本综述概述了当前的挑战和机会，并提出了用于分子科学GDL的未来的预测。

translated by 谷歌翻译

Towards Launching AI Algorithms for Cellular Pathology into Clinical & Pharmaceutical Orbits

Amina Asif , Kashif Rajpoot , David Snead , Fayyaz Minhas , Nasir Rajpoot

分类：计算机视觉 | 机器学习

2021-12-17

计算病理（CPATH）是一种具有关于组织病理研究的新兴领域，通过计算和分析组织载玻片的数字化高分辨率图像的处理算法。CPATH最近的深度学习的发展已经成功地利用了组织学图像中的原始像素数据的纯粹体积，以预测诊断域，预测，治疗敏感性和患者分层中的目标参数 - 覆盖新数据驱动的AI时代的承诺既组织病理学和肿瘤。使用作为燃料和作为发动机的燃料和AI的数据，CPATH算法准备好用于起飞和最终发射到临床和药物轨道中。在本文中，我们讨论了CPATH限制和相关挑战，使读者能够区分HIPE的希望，并为未来的研究提供指示，以克服这个崭露头角领域的一些主要挑战，以使其发射到两个轨道上。

translated by 谷歌翻译

Technology Readiness Levels for Machine Learning Systems

Alexander Lavin , Ciarán M. Gilligan-Lee , Alessya Visnjic , Siddha Ganju , Dava Newman , Atılım Güneş Baydin , Sujoy Ganguly , Danny Lange , Amit Sharma , Stephan Zheng

分类：机器学习 | 人工智能

2021-01-11

机器学习（ML）系统的开发和部署可以用现代工具轻松执行，但该过程通常是匆忙和意思是结束的。缺乏勤奋会导致技术债务，范围蠕变和未对准的目标，模型滥用和失败，以及昂贵的后果。另一方面，工程系统遵循明确定义的流程和测试标准，以简化高质量，可靠的结果的开发。极端是航天器系统，其中关键任务措施和鲁棒性在开发过程中根深蒂固。借鉴航天器工程和ML的经验（通过域名通过产品的研究），我们开发了一种经过验证的机器学习开发和部署的系统工程方法。我们的“机器学习技术准备水平”（MLTRL）框架定义了一个原则的过程，以确保强大，可靠和负责的系统，同时为ML工作流程流线型，包括来自传统软件工程的关键区别。 MLTRL甚至更多，MLTRL为跨团队和组织的人们定义了一个人工智能和机器学习技术的人员。在这里，我们描述了通过生产化和部署在医学诊断，消费者计算机视觉，卫星图像和粒子物理学等领域，以通过生产和部署在基本研究中开发ML方法的几个现实世界使用情况的框架和阐明。

translated by 谷歌翻译

Artificial Intelligence in Drug Discovery: Applications and Techniques

Jianyuan Deng , Zhibo Yang , Iwao Ojima , Dimitris Samaras , Fusheng Wang

分类：机器学习 | 人工智能

2021-06-09

人工智能（AI）在过去十年中一直在改变药物发现的实践。各种AI技术已在广泛的应用中使用，例如虚拟筛选和药物设计。在本调查中，我们首先概述了药物发现，并讨论了相关的应用，可以减少到两个主要任务，即分子性质预测和分子产生。然后，我们讨论常见的数据资源，分子表示和基准平台。此外，为了总结AI在药物发现中的进展情况，我们介绍了在调查的论文中包括模型架构和学习范式的相关AI技术。我们预计本调查将作为有兴趣在人工智能和药物发现界面工作的研究人员的指南。我们还提供了GitHub存储库（HTTPS:///github.com/dengjianyuan/survey_survey_au_drug_discovery），其中包含文件和代码，如适用，作为定期更新的学习资源。

translated by 谷歌翻译

Interpretable and Explainable Machine Learning for Materials Science and Chemistry

Felipe Oviedo , Juan Lavista Ferres , Tonio Buonassisi , Keith Butler

分类：机器学习

2021-11-01

虽然数据驱动的材料科学和化学方法采用了令人兴奋的，早期的阶段，实现了机器学习模型的真正潜力，以实现科学发现，它们必须具有超出纯粹预测力的品质。模型的预测和内在工作应由人类专家提供一定程度的解释性，允许识别潜在的模型问题或限制，建立对模型预测的信任和揭示可能导致科学洞察力的意外相关性。在这项工作中，我们总结了对材料科学和化学的可解释性和解释性技术的应用，并讨论了这些技术如何改善科学研究的结果。我们讨论了材料科学中可解释机器学习的各种挑战，更广泛地在科学环境中。特别是，我们强调通过纯粹解释机器学习模型和模型解释的不确定性估计的不确定估计来强调推断因果关系或达到泛化的风险。最后，我们在其他领域展示了一些可能会使物质科学和化学问题的可解释性的令人兴奋的发展。

translated by 谷歌翻译

Structure-based drug discovery with deep learning

Rıza Özçelik , Derek van Tilborg , José Jiménez-Luna , Francesca Grisoni

分类：机器学习

2022-12-26

Artificial intelligence (AI) in the form of deep learning bears promise for drug discovery and chemical biology, $\textit{e.g.}$, to predict protein structure and molecular bioactivity, plan organic synthesis, and design molecules $\textit{de novo}$. While most of the deep learning efforts in drug discovery have focused on ligand-based approaches, structure-based drug discovery has the potential to tackle unsolved challenges, such as affinity prediction for unexplored protein targets, binding-mechanism elucidation, and the rationalization of related chemical kinetic properties. Advances in deep learning methodologies and the availability of accurate predictions for protein tertiary structure advocate for a $\textit{renaissance}$ in structure-based approaches for drug discovery guided by AI. This review summarizes the most prominent algorithmic concepts in structure-based deep learning for drug discovery, and forecasts opportunities, applications, and challenges ahead.

translated by 谷歌翻译

Data Science and Machine Learning in Education

Gabriele Benelli , Thomas Y. Chen , Javier Duarte , Matthew Feickert , Matthew Graham , Lindsey Gray , Dan Hackett , Phil Harris , Shih-Chieh Hsu , Gregor Kasieczka

分类：机器学习

2022-07-19

鉴于HEP研究的核心，数据科学（DS）和机器学习（ML）在高能量物理学（HEP）中的作用增长良好和相关。此外，利用物理数据固有的对称性激发了物理信息的ML作为计算机科学研究的充满活力的子场。 HEP研究人员从广泛使用的材料中受益匪浅，可用于教育，培训和劳动力开发。他们还为这些材料做出了贡献，并为DS/ML相关的字段提供软件。物理部门越来越多地在DS，ML和物理学的交集上提供课程，通常使用HEP研究人员开发的课程，并涉及HEP中使用的开放软件和数据。在这份白皮书中，我们探讨了HEP研究与DS/ML教育之间的协同作用，讨论了此交叉路口的机会和挑战，并提出了将是互惠互利的社区活动。

translated by 谷歌翻译

Data-Centric Engineering: integrating simulation, machine learning and statistics. Challenges and Opportunities

Indranil Pan , Lachlan Mason , Omar Matar

分类：机器学习

2021-11-07

机器学习的最新进展，加上低成本计算，廉价流传感器，数据存储和云技术的可用性导致了广泛的多学科研究活动，具有商业利益攸关方的重大兴趣和投资。基于物理方程式的机械模型，纯粹的数据驱动统计方法代表建模光谱的两端。新的混合动力车，以数据为中心的工程方法，利用世界各国和整合模拟和数据，都是一种强大的工具，具有对物理学科的变革影响。我们在集成模拟，机器学习和统计数据中审查了新兴领域的关键研究趋势和应用场景。我们突出了这种综合愿景可以解锁和概述阻止其实现的关键挑战的机会。我们还讨论了该领域的翻译方面的瓶颈以及现有劳动力和未来大学毕业生的长期上升要求。

translated by 谷歌翻译

AI-coupled HPC Workflows

Shantenu Jha , Vincent R. Pascuzzi , Matteo Turilli

分类：人工智能 | 机器学习

2022-08-24

越来越多的科学发现需要复杂而可扩展的工作流程。工作流程已成为``新应用程序''，其中多尺度计算活动包括多个和异构的可执行任务。特别是，将AI/ML模型引入传统的HPC工作流程已成为高度准确建模的推动力，与传统方法相比，通常会减少计算需求。本章将讨论将AI/ML模型集成到HPC计算的各种模式，从而导致不同类型的AI耦合HPC工作流程。激励了跨科学领域的AI/ML和HPC耦合的需求越来越多，然后以每种模式的许多生产级用例来体现。我们还讨论了极端尺度AI耦合的HPC广告系列的主要挑战 - 任务异质性，适应性，性能 - 以及旨在解决这些问题的几种框架和中间件解决方案。尽管HPC工作流程和AI/ML计算范例都是独立有效的，但我们强调了它们的整合和最终收敛如何导致一系列领域的科学性能的显着改善，最终导致了科学探索，否则就无法实现。

translated by 谷歌翻译

HTML版本

Explainable AI (XAI): A Systematic Meta-Survey of Current Challenges and Future Opportunities

Waddah Saeed , Christian Omlin

分类：机器学习 | 人工智能

2021-11-11

过去十年已经看到人工智能（AI）的显着进展，这导致了用于解决各种问题的算法。然而，通过增加模型复杂性并采用缺乏透明度的黑匣子AI模型来满足这种成功。为了响应这种需求，已经提出了说明的AI（Xai）以使AI更透明，从而提高关键结构域中的AI。虽然有几个关于Xai主题的Xai主题的评论，但在Xai中发现了挑战和潜在的研究方向，这些挑战和研究方向被分散。因此，本研究为Xai组织的挑战和未来的研究方向提出了系统的挑战和未来研究方向：（1）基于机器学习生命周期的Xai挑战和研究方向，基于机器的挑战和研究方向阶段：设计，开发和部署。我们认为，我们的META调查通过为XAI地区的未来探索指导提供了XAI文学。

translated by 谷歌翻译

A Review of Biomedical Datasets Relating to Drug Discovery: A Knowledge Graph Perspective

Stephen Bonner , Ian P Barrett , Cheng Ye , Rowan Swiers , Ola Engkvist , Andreas Bender , Charles Tapley Hoyt , William L Hamilton

分类：人工智能

2021-02-19

药物发现和发展是一个复杂和昂贵的过程。正在研究机器学习方法，以帮助提高药物发现管道多个阶段的有效性和速度。其中，使用知识图表（kg）的那些在许多任务中具有承诺，包括药物修复，药物毒性预测和靶基因疾病优先级。在药物发现kg中，包括基因，疾病和药物在内的关键因素被认为是实体，而它们之间的关系表示相互作用。但是，为了构建高质量的KG，需要合适的数据。在这篇综述中，我们详细介绍了适用于构建聚焦KGS的药物发现的公开使用来源。我们的目标是帮助引导机器学习和kg从业者对吸毒者发现领域应用新技术，但是谁可能不熟悉相关的数据来源。通过严格的标准选择数据集，根据包含内部包含的主要信息类型，并基于可以提取的信息来进行分类以构建kg。然后，我们对现有的公共药物发现KGS进行了比较分析，并评估了文献中所选择的激励案例研究。此外，我们还提出了众多和与域及其数据集相关的众多挑战和问题，同时突出了关键的未来研究方向。我们希望本综述将激励KGS在药物发现领域的关键和新兴问题中使用。

translated by 谷歌翻译

Calibration and generalizability of probabilistic models on low-data chemical datasets with DIONYSUS

Gary Tom , Riley J. Hickman , Anizet Zinzuwadia , Afshan Mohajeri , Benjamin Sanchez-Lengeling , Alan Aspuru-Guzik

分类：人工智能

2022-12-03

Deep learning models that leverage large datasets are often the state of the art for modelling molecular properties. When the datasets are smaller (< 2000 molecules), it is not clear that deep learning approaches are the right modelling tool. In this work we perform an extensive study of the calibration and generalizability of probabilistic machine learning models on small chemical datasets. Using different molecular representations and models, we analyse the quality of their predictions and uncertainties in a variety of tasks (binary, regression) and datasets. We also introduce two simulated experiments that evaluate their performance: (1) Bayesian optimization guided molecular design, (2) inference on out-of-distribution data via ablated cluster splits. We offer practical insights into model and feature choice for modelling small chemical datasets, a common scenario in new chemical experiments. We have packaged our analysis into the DIONYSUS repository, which is open sourced to aid in reproducibility and extension to new datasets.

translated by 谷歌翻译

Digital Engineering Transformation with Trustworthy AI towards Industry 4.0: Emerging Paradigm Shifts

Jingwei Huang

分类：人工智能

2023-01-03

Digital engineering transformation is a crucial process for the engineering paradigm shifts in the fourth industrial revolution (4IR), and artificial intelligence (AI) is a critical enabling technology in digital engineering transformation. This article discusses the following research questions: What are the fundamental changes in the 4IR? More specifically, what are the fundamental changes in engineering? What is digital engineering? What are the main uncertainties there? What is trustworthy AI? Why is it important today? What are emerging engineering paradigm shifts in the 4IR? What is the relationship between the data-intensive paradigm and digital engineering transformation? What should we do for digitalization? From investigating the pattern of industrial revolutions, this article argues that ubiquitous machine intelligence (uMI) is the defining power brought by the 4IR. Digitalization is a condition to leverage ubiquitous machine intelligence. Digital engineering transformation towards Industry 4.0 has three essential building blocks: digitalization of engineering, leveraging ubiquitous machine intelligence, and building digital trust and security. The engineering design community at large is facing an excellent opportunity to bring the new capabilities of ubiquitous machine intelligence and trustworthy AI principles, as well as digital trust, together in various engineering systems design to ensure the trustworthiness of systems in Industry 4.0.

translated by 谷歌翻译

Law Informs Code: A Legal Informatics Approach to Aligning Artificial Intelligence with Humans

John J. Nay

分类：人工智能 | 机器学习

2022-09-14

We are currently unable to specify human goals and societal values in a way that reliably directs AI behavior. Law-making and legal interpretation form a computational engine that converts opaque human values into legible directives. "Law Informs Code" is the research agenda capturing complex computational legal processes, and embedding them in AI. Similar to how parties to a legal contract cannot foresee every potential contingency of their future relationship, and legislators cannot predict all the circumstances under which their proposed bills will be applied, we cannot ex ante specify rules that provably direct good AI behavior. Legal theory and practice have developed arrays of tools to address these specification problems. For instance, legal standards allow humans to develop shared understandings and adapt them to novel situations. In contrast to more prosaic uses of the law (e.g., as a deterrent of bad behavior through the threat of sanction), leveraged as an expression of how humans communicate their goals, and what society values, Law Informs Code. We describe how data generated by legal processes (methods of law-making, statutory interpretation, contract drafting, applications of legal standards, legal reasoning, etc.) can facilitate the robust specification of inherently vague human goals. This increases human-AI alignment and the local usefulness of AI. Toward society-AI alignment, we present a framework for understanding law as the applied philosophy of multi-agent alignment. Although law is partly a reflection of historically contingent political power - and thus not a perfect aggregation of citizen preferences - if properly parsed, its distillation offers the most legitimate computational comprehension of societal values available. If law eventually informs powerful AI, engaging in the deliberative political process to improve law takes on even more meaning.

translated by 谷歌翻译

Biological Robots: Perspectives on an Emerging Interdisciplinary Field

D. Blackiston , S. Kriegman , J. Bongard , M. Levin

分类：机器人 | 人工智能

2022-07-02

科学和工程学的进步通常揭示了最初用于理解，预测和控制现象的经典方法的局限性。随着进步，通常必须重新评估概念类别，以更好地跟踪最近在学科中发现的不变性。完善框架并解决学科之间的界限是至关重要的，以便它们更好地促进而不是限制实验方法和能力。在本文中，我们讨论了发育生物学，计算机科学和机器人技术的交集问题。在生物机器人的背景下，我们探索了概念，信息和生命科学的最新进展所驱动的概念和以前不同领域的变化。本文中，每个作者都提供了自己对该主题的看法，并由他们自己的纪律培训构成。我们认为，与计算一样，发育生物学和机器人技术的某些方面与特定材料无关。相反，这些领域的一致性可以帮助阐明多尺度控制，自组装以及形式与功能之间的关系。我们希望由于克服技术局限性而引起的界限，可以出现新的领域，从而将实际应用从再生医学到有用的合成生命机器。

translated by 谷歌翻译