智能论文笔记

Generalized Gradient Flows with Provable Fixed-Time Convergence and Fast Evasion of Non-Degenerate Saddle Points

Mayank Baranwal , Param Budhraja , Vishal Raj , Ashish R. Hota

分类：机器学习 | 人工智能 | (统计)机器学习

2022-12-07

Gradient-based first-order convex optimization algorithms find widespread applicability in a variety of domains, including machine learning tasks. Motivated by the recent advances in fixed-time stability theory of continuous-time dynamical systems, we introduce a generalized framework for designing accelerated optimization algorithms with strongest convergence guarantees that further extend to a subclass of non-convex functions. In particular, we introduce the \emph{GenFlow} algorithm and its momentum variant that provably converge to the optimal solution of objective functions satisfying the Polyak-{\L}ojasiewicz (PL) inequality, in a fixed-time. Moreover for functions that admit non-degenerate saddle-points, we show that for the proposed GenFlow algorithm, the time required to evade these saddle-points is bounded uniformly for all initial conditions. Finally, for strongly convex-strongly concave minimax problems whose optimal solution is a saddle point, a similar scheme is shown to arrive at the optimal solution again in a fixed-time. The superior convergence properties of our algorithm are validated experimentally on a variety of benchmark datasets.

translated by 谷歌翻译

Data-Driven Risk-sensitive Model Predictive Control for Safe Navigation in Multi-Robot Systems

Atharva Navsalkar , Ashish R. Hota

分类：机器人

2022-09-16

由于围绕机器人的未来轨迹的不确定性，安全导航是多机器人系统中的一个基本挑战，这些轨迹彼此相互障碍。在这项工作中，我们提出了一种原则性的数据驱动方法，每个机器人都反复解决一个有限的地平线优化问题，但要避免碰撞限制，后者被表达为代理商和代理之间距离的分布稳健的条件价值风险（CVAR）多面体障碍物几何形状。具体而言，需要CVAR约束来保留所有与从执行过程中收集的预测误差样本构成的经验分布的所有分布。该方法的一般性使我们能够在分布式和去中心化设置中普遍强加的假设下出现的预测错误鲁棒性。我们通过利用凸面和Minmax二元性结果来得出这类约束的有限尺寸近似值。在凉亭平台中实现的多人导航设置中说明了所提出的方法的有效性。

translated by 谷歌翻译

IterMiUnet: A lightweight architecture for automatic blood vessel segmentation

Ashish Kumar , R. K. Agrawal , Leve Joseph

分类：计算机视觉 | 机器学习

2022-08-02

眼底图像中血管的自动分割可以帮助分析视网膜脉管系统的状况，这对于确定各种全身性疾病（如高血压，糖尿病等）至关重要大量参数化，因此在实际应用中使用有限。本文提出了Itermiunet，这是一种新的基于轻量级卷积的细分模型，需要更少的参数，但提供了类似于现有模型的性能。该模型利用了ITERNET体系结构的出色分割功能，但通过将Miunet模型的编码器解码器结合在其中克服了严重的参数化性质。因此，新模型可减少参数，而不会与网络的深度进行任何妥协，这对于在深模型中学习抽象的层次概念是必不可少的。这种轻巧的分割模型可以加快训练和推理时间的速度，并且在数据稀缺的医疗领域可能会有所帮助，因此，大量参数化的模型往往过于拟合。在三个公开可用的数据集上评估了所提出的模型：驱动器，凝视和Chase-DB1。还进行了进一步的交叉培训和评估者之间的变异性评估。提出的模型具有很大的潜力，可以用作早期诊断许多疾病的工具。

translated by 谷歌翻译

GT4SD: Generative Toolkit for Scientific Discovery

Matteo Manica , Joris Cadow , Dimitrios Christofidellis , Ashish Dave , Jannis Born , Dean Clarke , Yves Gaetan Nana Teukam , Samuel C. Hoffman , Matthew Buchan , Vijil Chenthamarakshan

分类：机器学习 | 人工智能

2022-07-08

随着各种科学领域中数据的越来越多，生成模型在科学方法的每个步骤中都具有巨大的潜力来加速科学发现。他们最有价值的应用也许在于传统上提出假设最慢，最具挑战性的步骤。现在，正在从大量数据中学到强大的表示形式，以产生新的假设，这对从材料设计到药物发现的科学发现应用产生了重大影响。 GT4SD（https://github.com/gt4sd/gt4sd-core）是一个可扩展的开放源库，使科学家，开发人员和研究人员能够培训和使用科学发现中假设生成的最先进的生成模型。 GT4SD支持跨材料科学和药物发现的各种生成模型的用途，包括基于与目标蛋白，OMIC剖面，脚手架距离，结合能等性质的分子发现和设计。

translated by 谷歌翻译

GEMv2: Multilingual NLG Benchmarking in a Single Line of Code

Sebastian Gehrmann , Abhik Bhattacharjee , Abinaya Mahendiran , Alex Wang , Alexandros Papangelis , Aman Madaan , Angelina McMillan-Major , Anna Shvets , Ashish Upadhyay , Bingsheng Yao

分类：自然语言处理 | 人工智能 | 机器学习

2022-06-22

通常通过过去的选择来告知机器学习中的评估，例如要使用哪些数据集或指标。该标准化可以使用排行榜对平等基础进行比较，但是随着出现更好的替代方案，评估选择变得不佳。这个问题在自然语言生成中尤其相关，该语言需要不断改善的数据集，指标和人类评估以提出确定性的主张。为了使遵循最佳模型评估实践更加容易，我们介绍了GEMV2。新版本的一代，评估和指标基准为数据集，模型和指标开发人员提供了模块化基础架构，以使彼此受益。GEMV2支持40种记录的数据集中51种语言。所有数据集的模型都可以在线评估，我们的交互式数据卡创建和渲染工具使得在Living Benchmark中添加新数据集变得更加容易。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Beyond Low Earth Orbit: Biomonitoring, Artificial Intelligence, and Precision Space Health

Ryan T. Scott , Erik L. Antonsen , Lauren M. Sanders , Jaden J. A. Hastings , Seung-min Park , Graham Mackintosh , Robert J. Reynolds , Adrienne L. Hoarfrost , Aenor Sawyer , Casey S. Greene

分类：机器学习

2021-12-22

超越地球轨道的人类空间勘探将涉及大量距离和持续时间的任务。为了有效减轻无数空间健康危害，数据和空间健康系统的范式转移是实现地球独立性的，而不是Earth-Reliance所必需的。有希望在生物学和健康的人工智能和机器学习领域的发展可以解决这些需求。我们提出了一个适当的自主和智能精密空间健康系统，可以监控，汇总和评估生物医学状态;分析和预测个性化不良健康结果;适应并响应新累积的数据;并提供对其船员医务人员的个人深度空间机组人员和迭代决策支持的预防性，可操作和及时的见解。在这里，我们介绍了美国国家航空航天局组织的研讨会的建议摘要，以便在太空生物学和健康中未来的人工智能应用。在未来十年，生物监测技术，生物标志科学，航天器硬件，智能软件和简化的数据管理必须成熟，并编织成精确的空间健康系统，以使人类在深空中茁壮成长。

translated by 谷歌翻译

Beyond Low Earth Orbit: Biological Research, Artificial Intelligence, and Self-Driving Labs

Lauren M. Sanders , Jason H. Yang , Ryan T. Scott , Amina Ann Qutub , Hector Garcia Martin , Daniel C. Berrios , Jaden J. A. Hastings , Jon Rask , Graham Mackintosh , Adrienne L. Hoarfrost

分类：机器学习

2021-12-22

空间生物学研究旨在了解太空飞行对生物的根本影响，制定支持深度空间探索的基础知识，最终生物工程航天器和栖息地稳定植物，农作物，微生物，动物和人类的生态系统，为持续的多行星寿命稳定。要提高这些目标，该领域利用了来自星空和地下模拟研究的实验，平台，数据和模型生物。由于研究扩展到低地球轨道之外，实验和平台必须是最大自主，光，敏捷和智能化，以加快知识发现。在这里，我们介绍了由美国国家航空航天局的人工智能，机器学习和建模应用程序组织的研讨会的建议摘要，这些应用程序为这些空间生物学挑战提供了关键解决方案。在未来十年中，将人工智能融入太空生物学领域将深化天空效应的生物学理解，促进预测性建模和分析，支持最大自主和可重复的实验，并有效地管理星载数据和元数据，所有目标使生活能够在深空中茁壮成长。

translated by 谷歌翻译

Math Programming based Reinforcement Learning for Multi-Echelon Inventory Management

Pavithra Harsha , Ashish Jagmohan , Jayant R. Kalagnanam , Brian Quanz , Divya Singhvi

分类：机器学习 | 人工智能

2021-12-04

在机器人，游戏和许多其他地区，加固学习导致各种区域导致相当大的突破。但是在复杂的真实决策中申请RL仍然有限。运营管理中的许多问题（例如，库存和收入管理）的特点是大动作空间和随机系统动态。这些特征使得解决问题的问题很难解决依赖于每步行动问题解决枚举技术的现有RL方法。要解决这些问题，我们开发可编程演员强化学习（PARL），一种策略迭代方法，该方法使用整数编程和示例平均近似的技术。在分析上，我们表明，对于给定的批评者，每个迭代的学习政策会聚到最佳政策，因为不确定性的底层样本转到无穷大。实际上，我们表明，即使来自潜在的不确定性的样本很少，潜在的不确定分布的正确选择的不确定分布可以在最佳的演员政策附近产生。然后，我们将算法应用于具有复杂的供应链结构的现实库存管理问题，并显示Parl优于这些设置中的最先进的RL和库存优化方法。我们发现Parl优于常用的基础股票启发式44.7％，并且在不同供应链环境中平均最高可达的RL方法高达12.1％。

translated by 谷歌翻译

Breaking the Convergence Barrier: Optimization via Fixed-Time Convergent Flows

Param Budhraja , Mayank Baranwal , Kunal Garg , Ashish Hota

分类：人工智能 | 机器学习

2021-12-02

加速梯度方法是大规模，数据驱动优化问题的基石，其在机器学习和其他关于数据分析的其他领域出现的自然。我们介绍了一种基于梯度的优化框架，用于实现加速度，基于最近引入了动态系统的固定时间稳定性的概念。该方法本身表示作为基于简单的基于梯度的方法的概括，适当地缩放以在固定时间内实现对优化器的收敛，与初始化无关。我们通过首先利用用于设计定时稳定动态系统的连续时间框架来实现这一目标，并且稍后提供一致的离散化策略，使得等效的离散时间算法在实际固定数量的迭代中跟踪优化器。我们还提供了对所提出的梯度流动的收敛行为的理论分析，以及他们对遵循强大凸起，严格凸起，并且可能不承受的功能的一系列功能的鲁造性，但满足Polyak - {\ l} Ojasiewicz不平等。我们还表明，由于定时收敛，收敛率的遗憾是恒定的。普遍的参数具有直观的解释，可以调整以适应所需的收敛速率的要求。我们验证了针对最先进的优化算法的一系列数值示例上提出的方案的加速收敛性。我们的工作提供了通过连续时间流动的离散化开发新颖优化算法的见解。

translated by 谷歌翻译