智能论文笔记

Machine Learning with Knowledge Constraints for Process Optimization of Open-Air Perovskite Solar Cell Manufacturing

Zhe Liu , Nicholas Rolston , Austin C. Flick , Thomas Colburn , Zekun Ren , Reinhold H. Dauskardt , Tonio Buonassisi

分类：机器学习

2021-10-01

Perovskite Photovoltaics（PV）在过去十年方面取得了快速发展，方便小区实验室规模设备的电力转换效率;然而，成功的商业化仍然需要进一步发展低成本，可扩展和高通量的制造技术。开发新的制造技术的关键挑战之一是高维参数空间，并且可以使用机器学习（ML）来加速Perovskite PV缩放。在这里，我们介绍了一个ML引导框架，用于制造过程优化的顺序学习。我们在环境条件下将我们的方法应用于快速喷雾等离子体处理（RSPP）技术，用于钙钛矿薄膜。通过有限的筛选100条件工艺条件进行实验预算，我们证明了最佳设备的效率提高至18.5％，我们还通过实验发现了10个独特的条件，以生产超过17％效率的顶级设备，这是5比伪随机拉丁超立方体采样更高的成功率。我们的模型由三种创新启用：（a）通过将数据从现有的实验数据作为软限制将数据纳入实验过程之间的灵活知识转移; （b）在选择下一个实验时纳入主观人类观察和ML见解; （c）首先使用贝叶斯优化定位兴趣区域的自适应策略，然后对高效设备进行本地勘探。此外，在虚拟基准测试中，我们的框架在传统的实验方法（例如，一个可变的AT-AT-AT-A-A-Time采样）上，我们的框架更快地实现了有限的实验预算。

translated by 谷歌翻译

A Machine Learning and Computer Vision Approach to Rapidly Optimize Multiscale Droplet Generation

Alexander E. Siemenn , Evyatar Shaulsky , Matthew Beveridge , Tonio Buonassisi , Sara M. Hashmi , Iddo Drori

分类：机器学习

2021-05-28

从连续流体流生成液滴需要精确调谐设备以找到优化的控制参数条件。它在分析上棘手，以计算产生优化液滴的液滴生成设备的必要控制参数值。此外，随着流体流动的长度尺度变化，地层物理和诱导流量分解成液滴的优化条件也会改变。因此，单个比例积分衍生控制器太低，无法优化不同长度尺度或不同控制参数的设备，而分类机学习技术需要数天捕获并要求数百万滴图像。因此，问题提出，可以创建一个单一的方法，该方法普遍优化多个数据点的多个长度液滴，并且比以前的方法更快？在本文中，贝叶斯优化和计算机视觉反馈回路旨在快速可靠地发现在不同长度级设备中生成优化的液滴的控制参数值。该方法被证明在仅2.3小时内仅使用60张图像的最佳参数值会聚到比以前的方法快30倍。两种不同的长度尺度设备演示了模型实现：毫师喷墨设备和MiCof流体设备。

translated by 谷歌翻译

Fast Bayesian Optimization of Needle-in-a-Haystack Problems using Zooming Memory-Based Initialization

Alexander E. Siemenn , Zekun Ren , Qianxiao Li , Tonio Buonassisi

分类：机器学习

2022-08-26

在广泛的应用中存在针刺问题，包括罕见疾病预测，生态资源管理，欺诈检测和材料特性优化。当相对于数据集大小的最佳条件存在极端不平衡时，就会出现针中的问题。例如，在开放式材料项目数据库中，在146K总材料中，只有0.82％的泊松比为负。但是，当前的最新优化算法并未设计出能够找到这些具有挑战性的多维针中问题的解决方案，从而导致与全球最佳或pige孔变为当地最低限度的缓慢收敛。在本文中，我们提出了一种基于缩放记忆的初始化算法，标题为Zombi，该算法构建了常规的贝叶斯优化原则，以在更少的时间和更少的实验中快速有效地优化针中的针刺问题，并通过解决常见的融合和常见的融合和较少的实验。鸽子问题。 Zombi从先前表现最佳的评估实验中积极提取知识，以在采样搜索范围内迭代放大到全局最佳的“针”，然后预留出低表现的历史实验的记忆，以加速计算时间。我们验证了该算法在两种现实世界中的5维针中的性能上的性能：发现辅助泊松比的发现和发现高热电图的优点材料的发现。与传统的贝叶斯优化相比，Zombi算法显示了400倍的计算时间加速度，并有效地发现了100个以下实验的材料，高达3倍的材料比当前最新算法发现的材料高度优化。

translated by 谷歌翻译

Uncertainty-aware Mixed-variable Machine Learning for Materials Design

Hengrui Zhang , Wei "Wayne" Chen , Akshay Iyer , Daniel W. Apley , Wei Chen

分类： (统计)机器学习 | 机器学习

2022-07-11

数据驱动的设计显示了加速材料发现的希望，但由于搜索化学，结构和合成方法的庞大设计空间的高昂成本，这是具有挑战性的。贝叶斯优化（BO）采用不确定性的机器学习模型来选择有前途的设计来评估，从而降低成本。但是，在材料设计中特别感兴趣的具有混合数值和分类变量的BO尚未得到很好的研究。在这项工作中，我们调查了使用混合变量对机器学习的不确定性量化的常见主义者和贝叶斯方法。然后，我们使用来自每个组的流行代表模型，基于森林的LOLO模型（频繁主义者）和潜在的可变高斯过程模型（贝叶斯）进行了对BO中其表现的系统比较研究。我们研究了这两个模型在数学函数优化的功效以及结构和功能材料的特性，在其中我们观察到与问题维度和复杂性有关的性能差异。通过研究机器学习模型的预测性和不确定性估计功能，我们可以解释观察到的性能差异。我们的结果为在材料设计中的混合变量BO中选择频繁和贝叶斯不确定性的机器学习模型提供了实用的指导。

translated by 谷歌翻译

Bayesian Optimisation for Sequential Experimental Design with Applications in Additive Manufacturing

Mimi Zhang , Andrew Parnell , Dermot Brabazon , Alessio Benavoli

分类：机器学习

2021-07-27

Bayesian Optimization（BO）是全球优化的黑匣子客观功能的方法，这是昂贵的评估。 Bo Powered实验设计在材料科学，化学，实验物理，药物开发等方面发现了广泛的应用。这项工作旨在提请注意应用BO在设计实验中的益处，并提供博手册，涵盖方法和软件，为了方便任何想要申请或学习博的人。特别是，我们简要解释了BO技术，审查BO中的所有应用程序在添加剂制造中，比较和举例说明不同开放BO库的功能，解锁BO的新潜在应用，以外的数据（例如，优先输出）。本文针对读者，了解贝叶斯方法的一些理解，但不一定符合添加剂制造的知识;软件性能概述和实施说明是任何实验设计从业者的乐器。此外，我们在添加剂制造领域的审查突出了博的目前的知识和技术趋势。本文在线拥有补充材料。

translated by 谷歌翻译

Bayesian Active Learning for Scanning Probe Microscopy: from Gaussian Processes to Hypothesis Learning

Maxim Ziatdinov , Yongtao Liu , Kyle Kelley , Rama Vasudevan , Sergei V. Kalinin

分类：机器学习

2022-05-30

机器学习方法的最新进展以及扫描探针显微镜（SPMS）的可编程接口的新兴可用性使自动化和自动显微镜在科学界的关注方面推向了最前沿。但是，启用自动显微镜需要开发特定于任务的机器学习方法，了解物理发现与机器学习之间的相互作用以及完全定义的发现工作流程。反过来，这需要平衡领域科学家的身体直觉和先验知识与定义实验目标和机器学习算法的奖励，这些算法可以将它们转化为特定的实验协议。在这里，我们讨论了贝叶斯活跃学习的基本原理，并说明了其对SPM的应用。我们从高斯过程作为一种简单的数据驱动方法和对物理模型的贝叶斯推断作为基于物理功能的扩展的贝叶斯推断，再到更复杂的深内核学习方法，结构化的高斯过程和假设学习。这些框架允许使用先验数据，在光谱数据中编码的特定功能以及在实验过程中表现出的物理定律的探索。讨论的框架可以普遍应用于结合成像和光谱，SPM方法，纳米识别，电子显微镜和光谱法以及化学成像方法的所有技术，并且对破坏性或不可逆测量的影响特别影响。

translated by 谷歌翻译

Towards Futuristic Autonomous Experimentation--A Surprise-Reacting Sequential Experiment Policy

Imtiaz Ahmed , Satish Bukkapatnam , Bhaskar Botcha , Yu Ding

分类：机器学习

2021-12-01

制造中的一个自主实验平台据说能够进行顺序搜索，以便自行为先进材料寻找合适的制造条件，甚至用于发现具有最小的人为干预的新材料。这种平台的智能控制的核心是政策指导顺序实验，即根据到目前为止所做的事情来决定在下次进行下一个实验的地方。此类政策不可避免地违反勘探，而目前的做法是利用预期改进标准或其变体的贝叶斯优化框架。我们讨论是否利用与直接观察相关的元素和惊喜程度来促进剥削与勘探有益。我们使用两个现有的惊喜指标设计了一个惊喜的反应政策，称为香农惊喜和贝叶斯惊喜。我们的分析表明，令人惊讶的反应政策似乎更适合于在资源限制下快速表征响应面或设计地点的整体景观。我们认为未来派自治实验平台需要这种能力。我们没有声称我们有一个完全自主的实验平台，但相信我们目前的努力揭示了新灯或提供了不同的视角，因为研究人员正在赛车提升各种原始自治实验系统的自主权。

translated by 谷歌翻译

Falsification of Cyber-Physical Systems using Bayesian Optimization

Zahra Ramezani , Kenan Šehic , Luigi Nardi , Knut Åkesson

分类：机器学习

2022-09-14

网络物理系统（CPSS）通常是复杂且至关重要的；因此，确保系统的要求，即规格，很难满足。基于仿真的CPS伪造是一种实用的测试方法，可用于通过仅要求模拟正在测试的系统来提高对系统正确性的信心。由于每个仿真通常在计算上进行密集，因此一个重要的步骤是减少伪造规范所需的仿真数量。我们研究贝叶斯优化（BO），一种样本效率的方法，它学习了一个替代模型，该模型描述了可能的输入信号的参数化与规范评估之间的关系。在本文中，我们改善了使用BO的伪造；首先采用两种突出的BO方法，一种适合本地替代模型，另一个适合当地的替代模型，利用了用户的先验知识。其次，本文介绍了伪造功能的采集函数的表述。基准评估显示，使用BO的局部替代模型来伪造以前难以伪造的基准示例的显着改善。在伪造过程中使用先验知识被证明是在模拟预算有限时特别重要的。对于某些基准问题，采集功能的选择清楚地影响了成功伪造所需的模拟数量。

translated by 谷歌翻译

TunaOil: A Tuning Algorithm Strategy for Reservoir Simulation Workloads

Felipe Albuquerque Portella , David Buchaca Prats , José Roberto Pereira Rodrigues , Josep Lluís Berral

分类：人工智能

2022-08-04

石油场和地震成像的储层模拟被称为石油和天然气（O＆G）行业中高性能计算（HPC）最苛刻的工作量。模拟器数值参数的优化起着至关重要的作用，因为它可以节省大量的计算工作。最先进的优化技术基于运行大量模拟，特定于该目的，以找到良好的参数候选者。但是，在时间和计算资源方面，使用这种方法的成本高昂。这项工作提出了金枪鱼，这是一种新方法，可增强使用性能模型的储层流仿真的最佳数值参数的搜索。在O＆G行业中，通常使用不同工作流程中的模型合奏来减少与预测O＆G生产相关的不确定性。我们利用此类工作流程中这些合奏的运行来从每个模拟中提取信息，并在其后续运行中优化数值参数。为了验证该方法，我们在历史匹配（HM）过程中实现了它，该过程使用Kalman滤波器算法来调整储层模型的集合以匹配实际字段中观察到的数据。我们从许多具有不同数值配置的模拟中挖掘了过去的执行日志，并根据数据提取的功能构建机器学习模型。这些功能包括储层模型本身的属性，例如活动单元的数量，即模拟行为的统计数据，例如线性求解器的迭代次数。采样技术用于查询甲骨文以找到可以减少经过的时间的数值参数，而不会显着影响结果的质量。我们的实验表明，预测可以平均将HM工作流程运行时提高31％。

translated by 谷歌翻译

New Paradigms for Exploiting Parallel Experiments in Bayesian Optimization

Leonardo D. González , Victor M. Zavala

分类： (统计)机器学习 | 人工智能 | 机器学习

2022-10-03

Bayesian optimization (BO) is one of the most effective methods for closed-loop experimental design and black-box optimization. However, a key limitation of BO is that it is an inherently sequential algorithm (one experiment is proposed per round) and thus cannot directly exploit high-throughput (parallel) experiments. Diverse modifications to the BO framework have been proposed in the literature to enable exploitation of parallel experiments but such approaches are limited in the degree of parallelization that they can achieve and can lead to redundant experiments (thus wasting resources and potentially compromising performance). In this work, we present new parallel BO paradigms that exploit the structure of the system to partition the design space. Specifically, we propose an approach that partitions the design space by following the level sets of the performance function and an approach that exploits partially-separable structures of the performance function found. We conduct extensive numerical experiments using a reactor case study to benchmark the effectiveness of these approaches against a variety of state-of-the-art parallel algorithms reported in the literature. Our computational results show that our approaches significantly reduce the required search time and increase the probability of finding a global (rather than local) solution.

translated by 谷歌翻译

Optimizing Training Trajectories in Variational Autoencoders via Latent Bayesian Optimization Approach

Arpan Biswas , Rama Vasudevan , Maxim Ziatdinov , Sergei V. Kalinin

分类：机器学习 | (统计)机器学习

2022-06-30

无监督和半监督的ML方法，例如变异自动编码器（VAE），由于其在分离的表述方面的能力以及找到具有复杂实验数据的潜在分类和回归的能力，因此在多个物理，化学和材料科学方面已广泛采用。。像其他ML问题一样，VAE需要高参数调整，例如，平衡Kullback Leibler（KL）和重建项。但是，训练过程以及由此产生的歧管拓扑和连通性不仅取决于超参数，还取决于训练过程中的演变。由于在高维超参数空间中详尽搜索的效率低下，因此我们在这里探索了一种潜在的贝叶斯优化方法（ZBO）方法，用于用于无监督和半监测的ML的超参数轨迹优化，并证明了连接的ML，并证明VAE具有旋转不变。我们证明了这种方法的应用，用于寻找血浆纳米颗粒材料系统的MNIST和实验数据的联合离散和连续旋转不变表示。已广泛讨论了所提出的方法的性能，它允许对其他ML模型进行任何高维超参数调整或轨迹优化。

translated by 谷歌翻译

Recent Advances in Bayesian Optimization

Xilu Wang , Yaochu Jin , Sebastian Schmitt , Markus Olhofer

分类：机器学习 | 神经与进化计算

2022-06-07

由于其数据效率，贝叶斯优化已经出现在昂贵的黑盒优化的最前沿。近年来，关于新贝叶斯优化算法及其应用的发展的研究激增。因此，本文试图对贝叶斯优化的最新进展进行全面和更新的调查，并确定有趣的开放问题。我们将贝叶斯优化的现有工作分为九个主要群体，并根据所提出的算法的动机和重点。对于每个类别，我们介绍了替代模型的构建和采集功能的适应的主要进步。最后，我们讨论了开放的问题，并提出了有希望的未来研究方向，尤其是在分布式和联合优化系统中的异质性，隐私保护和公平性方面。

translated by 谷歌翻译

Autonomous synthesis of metastable materials

Sebastian Ament , Maximilian Amsler , Duncan R. Sutherland , Ming-Chiang Chang , Dan Guevarra , Aine B. Connolly , John M. Gregoire , Michael O. Thompson , Carla P. Gomes , R. Bruce van Dover

分类：人工智能 | 机器学习

2021-01-19

人工智能（AI）启用的自主实验为加速科学发现提供了新的范式。非平衡材料合成是复杂，资源密集型实验的象征性，其加速将是物料发现和发展的流域。最近通过高吞吐量实验加速了非平衡合成相图的映射，但仍然限制了材料研究，因为参数空间太大而无法彻底探索。我们通过科学自主推理代理（SARA）管辖的分层自主实验，证明了加速的合成和促进亚稳材料。 SARA将机器人材料合成和表征与AI方法的层次集成，有效地揭示了处理相图的结构。 SARA设计横向梯度激光尖峰退火（LG-LSA）实验，用于平行材料合成，采用光学光谱速度迅速识别相转变。利用嵌套的主动学习（AL）周期实现了多维参数空间的高效探索，该嵌套主动学习模型包括实验的底层物理以及端到端的不确定性量化。有了这个，萨拉在多种尺度处的协调体现了复杂的科学任务的AI利用。我们通过自主映射综合映射_3 $ System的综合相位边界来展示其性能，导致幅度加速度，即建立一个合成相图，其中包括动力学稳定$ \ delta $ -bi $的条件_2 $ o $ _3 $在室温下，用于氧化固体氧化物燃料电池等电化学技术的关键开发。

translated by 谷歌翻译

Bayesian Algorithm Execution for Tuning Particle Accelerator Emittance with Partial Measurements

Sara A. Miskovich , Willie Neiswanger , William Colocho , Claudio Emma , Jacqueline Garrahan , Timothy Maxwell , Christopher Mayes , Stefano Ermon , Auralee Edelen , Daniel Ratner

分类：人工智能 | 机器学习

2022-09-10

在处理多点测量时，即传统的黑盒优化方法效率低下，即，当控制域中的每个查询需要在次级域中的一组测量以计算目标时。在粒子加速器中，四极扫描的发射率调整是具有多点测量的优化示例。尽管发射率是高亮度机器（包括X射线激光器和线性碰撞者）的性能的关键参数，但综合优化通常受到调整所需的时间的限制。在这里，我们将最近提供的贝叶斯算法执行（BAX）扩展到具有多点测量的优化任务。 BAX通过在关节控制测量域中选择和建模各个点来实现样品效率。我们将BAX应用于Linac相干光源（LCLS）和晚期加速器实验测试II（Facet-II）粒子加速器的设施。在LCLS模拟环境中，我们表明BAX的效率提高了20倍，同时与传统优化方法相比，噪声也更强。此外，我们在LCLS和facet-II上运行了Bax，与Facet-II的手工调整发射率相匹配，并获得了比LCLS在LCLS上获得的最佳发射率低24％。我们预计我们的方法很容易适应其他类型的优化问题，这些优化问题涉及科学仪器中常见的多点测量。

translated by 谷歌翻译

On the development of a Bayesian optimisation framework for complex unknown systems

Mike Diessner , Yu Guan , Kevin J. Wilson , Richard D. Whalley

分类：机器学习

2022-07-19

贝叶斯优化提供了一种优化昂贵黑匣子功能的有效方法。它最近已应用于流体动力学问题。本文研究并在一系列合成测试函数上从经验上比较了常见的贝叶斯优化算法。它研究了采集函数和训练样本数量的选择，采集功能的精确计算以及基于蒙特卡洛的方法以及单点和多点优化。该测试功能被认为涵盖了各种各样的挑战，因此是理想的测试床，以了解贝叶斯优化的性能，并确定贝叶斯优化表现良好和差的一般情况。这些知识可以用于应用程序中，包括流体动力学的知识，这些知识是未知的。这项调查的结果表明，要做出的选择与相对简单的功能不相关，而乐观的采集功能（例如上限限制）应首选更复杂的目标函数。此外，蒙特卡洛方法的结果与分析采集函数的结果相当。在目标函数允许并行评估的情况下，多点方法提供了更快的替代方法，但它可能需要进行更多的客观函数评估。

translated by 谷歌翻译

Bayesian Calibration for Activity Based Models

Laura Schultz , Joshua Auld , Vadim Sokolov

分类： (统计)机器学习

2022-03-08

我们考虑基于活动的运输模拟器的校准和不确定性分析问题。基于活动的模型（ABM）依靠单个旅行者行为的统计模型来预测大都市地区的高阶旅行模式。输入参数通常是使用最大似然从旅行者调查中估算的。我们开发了一种使用高斯工艺模拟器使用流量流数据校准这些参数的方法。我们的方法扩展了传统的模拟器，以处理运输模拟器的高维和非平稳性。我们介绍了一个深度学习维度降低模型，该模型与高斯工艺模型共同估计以近似模拟器。我们使用几个模拟示例以及校准伊利诺伊州布卢明顿的关键参数来证明方法。

translated by 谷歌翻译

Advanced Manufacturing Configuration by Sample-efficient Batch Bayesian Optimization

Xavier Guidetti , Alisa Rupenyan , Lutz Fassl , Majid Nabavi , John Lygeros

分类：机器学习 | (统计)机器学习

2022-05-24

我们提出了一个基于贝叶斯优化的昂贵评估高级制造方法的配置和操作的框架。该框架统一了量身定制的采集功能，并行的获取过程以及为优化过程提供上下文的过程信息的集成。\ cmtb {在最新的基准测试问题上展示，分析和比较了新颖的采集函数。我们将优化方法应用于大气等离子体喷涂和融合沉积建模。}我们的结果表明，所提出的框架可以有效地找到产生预期结果的输入参数并最大程度地减少过程成本。

translated by 谷歌翻译

Calibration and generalizability of probabilistic models on low-data chemical datasets with DIONYSUS

Gary Tom , Riley J. Hickman , Anizet Zinzuwadia , Afshan Mohajeri , Benjamin Sanchez-Lengeling , Alan Aspuru-Guzik

分类：人工智能

2022-12-03

Deep learning models that leverage large datasets are often the state of the art for modelling molecular properties. When the datasets are smaller (< 2000 molecules), it is not clear that deep learning approaches are the right modelling tool. In this work we perform an extensive study of the calibration and generalizability of probabilistic machine learning models on small chemical datasets. Using different molecular representations and models, we analyse the quality of their predictions and uncertainties in a variety of tasks (binary, regression) and datasets. We also introduce two simulated experiments that evaluate their performance: (1) Bayesian optimization guided molecular design, (2) inference on out-of-distribution data via ablated cluster splits. We offer practical insights into model and feature choice for modelling small chemical datasets, a common scenario in new chemical experiments. We have packaged our analysis into the DIONYSUS repository, which is open sourced to aid in reproducibility and extension to new datasets.

translated by 谷歌翻译

Automated Benchmark-Driven Design and Explanation of Hyperparameter Optimizers

Julia Moosbauer , Martin Binder , Lennart Schneider , Florian Pfisterer , Marc Becker , Michel Lang , Lars Kotthoff , Bernd Bischl

分类：机器学习 | (统计)机器学习

2021-11-29

自动化封路计优化（HPO）已经获得了很大的普及，并且是大多数自动化机器学习框架的重要成分。然而，设计HPO算法的过程仍然是一个不系统和手动的过程：确定了现有工作的限制，提出的改进是 - 即使是专家知识的指导 - 仍然是一定任意的。这很少允许对哪些算法分量的驾驶性能进行全面了解，并且承载忽略良好算法设计选择的风险。我们提出了一个原理的方法来实现应用于多倍性HPO（MF-HPO）的自动基准驱动算法设计的原则方法：首先，我们正式化包括的MF-HPO候选的丰富空间，但不限于普通的HPO算法，然后呈现可配置的框架覆盖此空间。要自动和系统地查找最佳候选者，我们遵循通过优化方法，并通过贝叶斯优化搜索算法候选的空间。我们挑战是否必须通过执行消融分析来挑战所发现的设计选择或可以通过更加天真和更简单的设计。我们观察到使用相对简单的配置，在某些方式中比建立的方法更简单，只要某些关键配置参数具有正确的值，就可以很好地执行得很好。

translated by 谷歌翻译

Combining Multi-Fidelity Modelling and Asynchronous Batch Bayesian Optimization

Jose Pablo Folch , Robert M Lee , Behrang Shafei , David Walz , Calvin Tsay , Mark van der Wilk , Ruth Misener

分类：机器学习 | (统计)机器学习

2022-11-11

Bayesian Optimization is a useful tool for experiment design. Unfortunately, the classical, sequential setting of Bayesian Optimization does not translate well into laboratory experiments, for instance battery design, where measurements may come from different sources and their evaluations may require significant waiting times. Multi-fidelity Bayesian Optimization addresses the setting with measurements from different sources. Asynchronous batch Bayesian Optimization provides a framework to select new experiments before the results of the prior experiments are revealed. This paper proposes an algorithm combining multi-fidelity and asynchronous batch methods. We empirically study the algorithm behavior, and show it can outperform single-fidelity batch methods and multi-fidelity sequential methods. As an application, we consider designing electrode materials for optimal performance in pouch cells using experiments with coin cells to approximate battery performance.

translated by 谷歌翻译