智能论文笔记

Reactive Task and Motion Planning for Robust Whole-Body Dynamic Locomotion in Constrained Environments

Ye Zhao , Yinan Li , Luis Sentis , Ufuk Topcu , Jun Liu

分类：机器人

2018-11-11

基于联系的决策和规划方法越来越重要，无法为腿机器人提供更高的自主性。源自符号系统的正式合成方法具有巨大的推理潜力，了解高级机器决策，并以正确的担保实现复杂的机动行动。本研究迈出了一种正式设计由受约束和动态变化环境中的任务规划和控制全身动态运动行为的架构组成的架构。在高级别，我们在多肢运动策划器和其动态环境之间制定了两个玩家时间逻辑游戏，以综合提供符号机置操作的获胜策略。这些运动动作满足时间逻辑片段中的所需高级任务规范。这些操作被发送到强大的有限转换系统，该过渡系统合成了满足状态可达性限制的运动控制器。该控制器进一步通过低级运动规划器执行，所述低级运动计划产生可行的机器人轨迹。我们构建一组动态运动模型，可用于腿机器人，作为用于处理各种环境事件的模板库。我们设计了一种重新调整策略，考虑到突然的环境变化或大状态干扰，以增加所产生的机器行为的鲁棒性。我们正式证明分层运动框架的正确性，保证了运动规划层的强大实现。在各种环境中的反应运动行为模拟表明我们的框架具有潜在的智能机置行为的理论基础。

translated by 谷歌翻译

Integrated Task and Motion Planning for Safe Legged Navigation in Partially Observable Environments

Abdulaziz Shamsah , Jonas Warnke , Zhaoyuan Gu , Ye Zhao

分类：机器人

2021-10-23

本研究提出了一种具有动态障碍物和不均匀地形的部分可观察环境中的BipeDal运动的安全任务和运动计划（夯实）的分层综合框架。高级任务规划师采用线性时间逻辑（LTL），用于机器人及其环境之间的反应游戏合成，并为导航安全和任务完成提供正式保证。为了解决环境部分可观察性，在高级导航计划者采用信仰抽象，以估计动态障碍的位置。因此，合成的动作规划器向中级运动规划器发送一组运动动作，同时基于运动过程的阶数模型（ROM）结合从安全定理提取的安全机置规范。运动计划程序采用ROM设计安全标准和采样算法，以生成准确跟踪高级动作的非周期性运动计划。为了解决外部扰动，本研究还调查了关键帧运动状态的安全顺序组成，通过可达性分析实现了对外部扰动的强大转变。最终插值一组基于ROM的超参数，以设计由轨迹优化生成的全身运动机器，并验证基于ROM的可行部署，以敏捷机器人设计的20多个自由的Cassie机器人。

translated by 谷歌翻译

3D Underactuated Bipedal Walking via H-LIP based Gait Synthesis and Stepping Stabilization

Xiaobin Xiong , Aaron Ames

分类：机器人

2021-01-23

在本文中，我们全能地提出了一种基于混合线性倒置的方法（H唇），用于合成和稳定3D足底双模行走，重点是彻底的硬件实现。提出了H-唇缘以捕获机器人行走的欠置和致动部分的基本组成部分。然后基于H唇直接合成机器人行走步态。我们全面地表征了H唇的周期性轨道，并通过其步骤 - 步骤（S2S）动力学可证明步骤稳定，然后用于近似于质量中心的水平状态的S2S动态（COM）机器人散步。近似设施基于H唇的步进控制器，提供所需的步长，以稳定机器人行走。通过实现所需的步骤尺寸，机器人实现了动态且稳定的行走。在欠扰动的BipeDal机器人Cassie的模拟和实验中完全评估了该方法，其展示了具有高通用和鲁棒性的动态行走行为。

translated by 谷歌翻译

Footstep Adjustment for Biped Push Recovery on Slippery Surfaces

Erfan Ghorbani , Hossein Karimpour , Venus Pasandi , Mehdi Keshmiri

分类：机器人

2021-11-09

尽管对Bipeds的运动稳定性进行了广泛的研究，但它们仍然缺乏在湿滑表面上缺乏干扰的应对能力。在本文中，关于表面摩擦限制，开发了一种用于稳定其矢状平面中的双模运动的新型控制器。通过考虑到表面稳定趋势的表面的物理限制，实现了更先进的可靠性水平，从而提供更高的功能，例如在低摩擦表面上推挽恢复，并防止稳定剂过度反应。基于离散的事件的策略包括修改每个脚步开头的步长和时间段，以便在考虑表面摩擦限制作为防止滑动的约束的同时重新建立稳定性必要条件。调整脚步以防止面对外部干扰的滑动被认为是保持稳定性的新策略，与人类反应非常相似。开发方法包括利用基本数学操作来获取控制输入的粗闭式解决方案，允许在收敛和计算成本之间达到平衡，即使具有适度的计算硬件，即使具有实时操作也非常适合实时操作。执行几种数值模拟，包括在低摩擦表面上的不同栅极之间的推挽恢复和切换，以证明所提出的控制器的有效性。在与人体步态经验相关的情况下，结果还揭示了一些有利于稳定性的物理方面以及在Gaits之间切换的事实，以降低面对不同条件的落地的风险。

translated by 谷歌翻译

Behavior Trees in Robotics and AI: An Introduction

Michele Colledanchise , Petter Ögren

分类：机器人 | 人工智能

2017-08-31

行为树（BT）是一种在自主代理中（例如机器人或计算机游戏中的虚拟实体）之间在不同任务之间进行切换的方法。 BT是创建模块化和反应性的复杂系统的一种非常有效的方法。这些属性在许多应用中至关重要，这导致BT从计算机游戏编程到AI和机器人技术的许多分支。在本书中，我们将首先对BTS进行介绍，然后我们描述BTS与早期切换结构的关系，并且在许多情况下如何概括。然后，这些想法被用作一套高效且易于使用的设计原理的基础。安全性，鲁棒性和效率等属性对于自主系统很重要，我们描述了一套使用BTS的状态空间描述正式分析这些系统的工具。借助新的分析工具，我们可以对BTS如何推广早期方法的形式形式化。我们还显示了BTS在自动化计划和机器学习中的使用。最后，我们描述了一组扩展的工具，以捕获随机BT的行为，其中动作的结果由概率描述。这些工具可以计算成功概率和完成时间。

translated by 谷歌翻译

Partially Observable Markov Decision Processes in Robotics: A Survey

Mikko Lauri , David Hsu , Joni Pajarinen

分类：机器人 | 人工智能

2022-09-21

嘈杂的传感，不完美的控制和环境变化是许多现实世界机器人任务的定义特征。部分可观察到的马尔可夫决策过程（POMDP）提供了一个原则上的数学框架，用于建模和解决不确定性下的机器人决策和控制任务。在过去的十年中，它看到了许多成功的应用程序，涵盖了本地化和导航，搜索和跟踪，自动驾驶，多机器人系统，操纵和人类机器人交互。这项调查旨在弥合POMDP模型的开发与算法之间的差距，以及针对另一端的不同机器人决策任务的应用。它分析了这些任务的特征，并将它们与POMDP框架的数学和算法属性联系起来，以进行有效的建模和解决方案。对于从业者来说，调查提供了一些关键任务特征，以决定何时以及如何成功地将POMDP应用于机器人任务。对于POMDP算法设计师，该调查为将POMDP应用于机器人系统的独特挑战提供了新的见解，并指出了有希望的新方向进行进一步研究。

translated by 谷歌翻译

Reactive Task Allocation and Planning for Quadrupedal and Wheeled Robot Teaming

Ziyi Zhou , Dong Jae Lee , Yuki Yoshinaga , Stephen Balakirsky , Dejun Guo , Ye Zhao

分类：机器人

2021-10-16

本文迈出了一个全局线性时间逻辑规范的反应性，分层多机器人任务分配和计划框架的第一步。四倍体机器人和轮式机器人的功能都可以通过一个异质团队来完成各种导航和交付任务。但是，当部署在现实世界中时，所有机器人都可能容易受到不同类型的干扰，包括但不限于运动失败，人类干预和环境的障碍。为了解决这些干扰，我们建议任务级的本地和全局重新分配策略，以有效地在线生成更新的动作状态序列，同时保证完成原始任务的完成。这些任务重新分配方法消除了重建整个计划或重新合成新任务的方法。为了将任务计划者与低级输入集成，行为树执行层监视不同类型的干扰，并采用重新分配方法来制定相应的恢复策略。为了评估该计划框架，在现实的医院环境中进行了动态模拟，其异质机器人团队由四足动物和轮式机器人组成，用于交付任务。

translated by 谷歌翻译

Model Predictive Control with Environment Adaptation for Legged Locomotion

Niraj Rathod , Angelo Bratta , Michele Focchi , Mario Zanon , Octavio Villarreal , Claudio Semini , Alberto Bemporad

分类：机器人

2021-05-12

在腿的运动中重新规划对于追踪所需的用户速度，在适应地形并拒绝外部干扰的同时至关重要。在这项工作中，我们提出并测试了实验中的实时非线性模型预测控制（NMPC），用于腿部机器人，以实现各种地形上的动态运动。我们引入了一种基于移动性的标准来定义NMPC成本，增强了二次机器人的运动，同时最大化腿部移动性并提高对地形特征的适应。我们的NMPC基于实时迭代方案，使我们能够以25美元的价格重新计划在线，\ Mathrm {Hz} $ 2 $ 2 $ 2美元的预测地平线。我们使用在质量框架中心中定义的单个刚体动态模型，以提高计算效率。在仿真中，测试NMPC以横穿一组不同尺寸的托盘，走进V形烟囱，并在崎岖的地形上招揽。在真实实验中，我们展示了我们的NMPC与移动功能的有效性，使IIT为87美元\，\ Mathrm {kg} $四分之一的机器人HIQ，以实现平坦地形上的全方位步行，横穿静态托盘，并适应在散步期间重新定位托盘。

translated by 谷歌翻译

Adaptive Complexity Model Predictive Control

Joseph Norby , Ardalan Tajbakhsh , Yanhao Yang , Aaron M. Johnson

分类：机器人

2022-09-06

这项工作介绍了模型预测控制（MPC）的公式，该公式适应基于任务的模型的复杂性，同时保持可行性和稳定性保证。现有的MPC实现通常通过缩短预测范围或简化模型来处理计算复杂性，这两者都可能导致不稳定。受到行为经济学，运动计划和生物力学相关方法的启发，我们的方法通过简单模型解决了MPC问题，用于在地平线区域的动力学和约束，而这种模型是可行的，并且不存在该模型的复杂模型。该方法利用计划和执行的交织来迭代识别这些区域，如果它们满足确切的模板/锚关系，可以安全地简化这些区域。我们表明，该方法不会损害系统的稳定性和可行性特性，并在仿真实验中衡量在四足动物上执行敏捷行为的仿真实验中的性能。我们发现，与固定复杂性实现相比，这种自适应方法可以实现更多的敏捷运动，并扩大可执行任务的范围。

translated by 谷歌翻译

Learning Control Policies for Fall prevention and safety in bipedal locomotion

Visak Kumar

分类：机器人 | 人工智能

2022-01-04

从意外的外部扰动中恢复的能力是双模型运动的基本机动技能。有效的答复包括不仅可以恢复平衡并保持稳定性的能力，而且在平衡恢复物质不可行时，也可以保证安全的方式。对于与双式运动有关的机器人，例如人形机器人和辅助机器人设备，可帮助人类行走，设计能够提供这种稳定性和安全性的控制器可以防止机器人损坏或防止伤害相关的医疗费用。这是一个具有挑战性的任务，因为它涉及用触点产生高维，非线性和致动系统的高动态运动。尽管使用基于模型和优化方法的前进方面，但诸如广泛领域知识的要求，诸如较大的计算时间和有限的动态变化的鲁棒性仍然会使这个打开问题。在本文中，为了解决这些问题，我们开发基于学习的算法，能够为两种不同的机器人合成推送恢复控制政策：人形机器人和有助于双模型运动的辅助机器人设备。我们的工作可以分为两个密切相关的指示：1）学习人形机器人的安全下降和预防策略，2）使用机器人辅助装置学习人类的预防策略。为实现这一目标，我们介绍了一套深度加强学习（DRL）算法，以学习使用这些机器人时提高安全性的控制策略。

translated by 谷歌翻译

Cautious Planning with Incremental Symbolic Perception: Designing Verified Reactive Driving Maneuvers

Disha Kamale , Sofie Haesaert , Cristian-Ioan Vasile

分类：机器人

2022-09-20

这项工作提出了利用对机器人周围环境的逐步改善的象征感知知识的一步，以证明适用于自动驾驶问题的正确反应性控制合成。结合了运动控制和信息收集的抽象模型，我们表明假设保证规范（线性时间逻辑的子类）可用于定义和解决谨慎计划的流量规则。我们提出了一种新颖的表示，称为符号改进树，以捕获有关环境的增量知识，并体现了各种符号感知输入之间的关系。利用增量知识来合成机器人的验证反应性计划。案例研究表明，即使在部分遮挡的环境中，拟议方法在合成控制输入方面的疗效。

translated by 谷歌翻译

Perceptive Locomotion through Nonlinear Model Predictive Control

Ruben Grandia , Fabian Jenelten , Shaohui Yang , Farbod Farshidian , Marco Hutter

分类：机器人

2022-08-17

在粗糙的地形上的动态运动需要准确的脚部放置，避免碰撞以及系统的动态不足的计划。在存在不完美且常常不完整的感知信息的情况下，可靠地优化此类动作和互动是具有挑战性的。我们提出了一个完整的感知，计划和控制管道，可以实时优化机器人所有自由度的动作。为了减轻地形所带来的数值挑战，凸出不平等约束的顺序被提取为立足性可行性的局部近似值，并嵌入到在线模型预测控制器中。每个高程映射预先计算了步骤性分类，平面分割和签名的距离场，以最大程度地减少优化过程中的计算工作。多次射击，实时迭代和基于滤波器的线路搜索的组合用于可靠地以高速率解决该法式问题。我们在模拟中的间隙，斜率和踏上石头的情况下验证了所提出的方法，并在Anymal四倍的平台上进行实验，从而实现了最新的动态攀登。

translated by 谷歌翻译

Kernel-based Diffusion Approximated Markov Decision Processes for Off-Road Autonomous Navigation and Control

Junhong Xu , Kai Yin , Zheng Chen , Jason M. Gregory , Ethan A. Stump , Lantao Liu

分类：机器人

2021-11-16

我们向连续状态马尔可夫决策过程（MDP）提出了一种扩散近似方法，该方法可用于解决非结构化的越野环境中的自主导航和控制。与呈现完全已知的状态转换模型的大多数决策定理计划框架相比，我们设计了一种方法，该方法消除了这种强烈假设，这些假设通常非常难以在现实中工程师。我们首先采用价值函数的二阶泰勒扩展。然后通过部分微分方程近似贝尔曼的最优性方程，其仅依赖于转换模型的第一和第二矩。通过组合价值函数的内核表示，然后设计一种有效的策略迭代算法，其策略评估步骤可以表示为特征的方程式的线性系统，其特征是由有限组支持状态。我们首先通过大量的仿真以2D美元的$ 2D $避让和2.5d $地形导航问题进行验证。结果表明，拟议的方法在几个基线上导致了卓越的性能。然后，我们开发一个系统，该系统将我们的决策框架整合，与船上感知，并在杂乱的室内和非结构化的户外环境中进行现实世界的实验。物理系统的结果进一步展示了我们在挑战现实世界环境中的方法的适用性。

translated by 谷歌翻译

TAMOLS: Terrain-Aware Motion Optimization for Legged Systems

Fabian Jenelten , Ruben Grandia , Farbod Farshidian , Marco Hutter

分类：机器人

2022-06-28

通常，地形几何形状是非平滑的，非线性的，非凸的，如果通过以机器人为中心的视觉单元感知，则似乎部分被遮住且嘈杂。这项工作介绍了能够实时处理上述问题的完整控制管道。我们制定了一个轨迹优化问题，该问题可以在基本姿势和立足点上共同优化，但要遵守高度图。为了避免收敛到不良的本地Optima，我们部署了逐步的优化技术。我们嵌入了一个紧凑的接触式自由稳定性标准，该标准与非平板地面公式兼容。直接搭配用作转录方法，导致一个非线性优化问题，可以在少于十毫秒内在线解决。为了在存在外部干扰的情况下增加鲁棒性，我们用动量观察者关闭跟踪环。我们的实验证明了爬楼梯，踏上垫脚石上的楼梯，并利用各种动态步态在缝隙上。

translated by 谷歌翻译

Perception-Based Temporal Logic Planning in Uncertain Semantic Maps

Yiannis Kantaros , Samarth Kalluraya , Qi Jin , George J. Pappas

分类：机器人

2020-12-18

本文在具有部分未知语义的环境中解决了多机器人规划问题。假设环境具有已知的几何结构（例如，墙壁），并且由具有不确定位置和类的静态标记的地标占用。这种建模方法引发了语义SLAM算法生成的不确定语义地图。我们的目标是为配备有嘈杂感知系统的机器人设计控制策略，以便他们可以完成全局时间逻辑规范捕获的协同任务。为了指定考虑环境和感知不确定性的任务，我们采用了线性时间逻辑（LTL）的片段，称为CO-Safe LTL，定义了基于感知的原子谓性建模概率满意度要求。基于感知的LTL规划问题产生了通过新型采样的算法解决的最佳控制问题，它产生了在线更新的开环控制策略，以适应连续学习的语义地图。我们提供广泛的实验，以证明拟议的规划架构的效率。

translated by 谷歌翻译

Safety-Critical Modular Deep Reinforcement Learning with Temporal Logic through Gaussian Processes and Control Barrier Functions

Mingyu Cai , Cristian-Ioan Vasile

分类：机器人 | 机器学习

2021-09-07

强化学习（RL）是一种有希望的方法，对现实世界的应用程序取得有限，因为确保安全探索或促进充分利用是控制具有未知模型和测量不确定性的机器人系统的挑战。这种学习问题对于连续空间（状态空间和动作空间）的复杂任务变得更加棘手。在本文中，我们提出了一种由几个方面组成的基于学习的控制框架：（1）线性时间逻辑（LTL）被利用，以便于可以通过无限视野的复杂任务转换为新颖的自动化结构; （2）我们为RL-Agent提出了一种创新的奖励计划，正式保证，使全球最佳政策最大化满足LTL规范的概率; （3）基于奖励塑造技术，我们开发了利用自动机构结构的好处进行了模块化的政策梯度架构来分解整体任务，并促进学习控制器的性能; （4）通过纳入高斯过程（GPS）来估计不确定的动态系统，我们使用指数控制屏障功能（ECBF）综合基于模型的保障措施来解决高阶相对度的问题。此外，我们利用LTL自动化和ECBF的性质来构建引导过程，以进一步提高勘探效率。最后，我们通过多个机器人环境展示了框架的有效性。我们展示了这种基于ECBF的模块化深RL算法在训练期间实现了近乎完美的成功率和保护安全性，并且在训练期间具有很高的概率信心。

translated by 谷歌翻译

Recovery of Behaviors Encoded via Bilateral Constraints

George Council , Shai Revzen

分类：机器人

2020-05-01

如果机器人曾经实现与动物所展示的机器人相当的自动运动，则它们必须获得在损害，故障或环境条件下快速恢复运动行为的能力，从而损害了其有效移动的能力。我们提出了一种方法，该方法使我们的机器人和模拟机器人能够在几十次尝试中恢复自由运动行为的高度。我们的方法采用行为规范，以等级的差异约束来表达所需的行为。我们展示了如何通过编码模板来考虑这些约束，从而产生了将先前优化的行为推广到新情况下以快速学习的形式概括的秘诀。我们进一步说明，在数据驱动的上下文中，足够的限制通常很容易确定。作为例证，我们证明了我们在物理7 DOF六型六杆元机器人上的恢复方法，以及对6 DOF 2D运动机制的模拟。在这两种情况下，我们恢复了与先前优化的运动在功能上无法区分的行为。

translated by 谷歌翻译

Physically-Feasible Repair of Reactive, Linear Temporal Logic-based, High-Level Tasks

Adam Pacheck , Hadas Kress-Gazit

分类：机器人

2022-07-06

创建复杂机器人行为的一种典型方法是组成原子控制器或技能，以使所产生的行为满足高级任务；但是，当无法使用一组技能完成任务时，很难知道如何修改技能以使任务成为可能。我们提出了一种将符号维修与身体可行性检查和实现相结合的方法，以自动修改现有技能，以便机器人可以执行以前不可行的任务。我们在线性时间逻辑（LTL）公式中编码机器人技能，以捕获安全性任务的安全限制和目标。此外，我们的编码捕获了完整的技能执行，而不是先前的工作，而在执行技能之前和之后只有世界状态才被考虑。我们的维修算法提出了符号修改，然后尝试通过修改受符号修复的LTL约束的原始技能来物理实施建议。如果技能不可能，我们会自动为符号维修提供其他约束。我们用巴克斯特和一个清晰的jack狼展示了我们的方法。

translated by 谷歌翻译

Time-Varying ALIP Model and Robust Foot-Placement Control for Underactuated Bipedal Robot Walking on a Swaying Rigid Surface

Yuan Gao , Yukai Gong , Victor Paredes , Ayonga Hereid , Yan Gu

分类：机器人

2022-10-24

Controller design for bipedal walking on dynamic rigid surfaces (DRSes), which are rigid surfaces moving in the inertial frame (e.g., ships and airplanes), remains largely uninvestigated. This paper introduces a hierarchical control approach that achieves stable underactuated bipedal robot walking on a horizontally oscillating DRS. The highest layer of our approach is a real-time motion planner that generates desired global behaviors (i.e., the center of mass trajectories and footstep locations) by stabilizing a reduced-order robot model. One key novelty of this layer is the derivation of the reduced-order model by analytically extending the angular momentum based linear inverted pendulum (ALIP) model from stationary to horizontally moving surfaces. The other novelty is the development of a discrete-time foot-placement controller that exponentially stabilizes the hybrid, linear, time-varying ALIP model. The middle layer of the proposed approach is a walking pattern generator that translates the desired global behaviors into the robot's full-body reference trajectories for all directly actuated degrees of freedom. The lowest layer is an input-output linearizing controller that exponentially tracks those full-body reference trajectories based on the full-order, hybrid, nonlinear robot dynamics. Simulations of planar underactuated bipedal walking on a swaying DRS confirm that the proposed framework ensures the walking stability under different DRS motions and gait types.

translated by 谷歌翻译

Agile Maneuvers in Legged Robots: a Predictive Control Approach

Carlos Mastalli , Wolfgang Merkt , Guiyang Xin , Jaehyun Shim , Michael Mistry , Ioannis Havoutis , Sethu Vijayakumar

分类：机器人 | 人工智能

2022-03-14

在腿部机器人技术中，计划和执行敏捷的机动演习一直是一个长期的挑战。它需要实时得出运动计划和本地反馈政策，以处理动力学动量的非物质。为此，我们提出了一个混合预测控制器，该控制器考虑了机器人的致动界限和全身动力学。它将反馈政策与触觉信息相结合，以在本地预测未来的行动。由于采用可行性驱动的方法，它在几毫秒内收敛。我们的预测控制器使Anymal机器人能够在现实的场景中生成敏捷操作。关键要素是跟踪本地反馈策略，因为与全身控制相反，它们达到了所需的角动量。据我们所知，我们的预测控制器是第一个处理驱动限制，生成敏捷的机动操作以及执行低级扭矩控制的最佳反馈策略，而无需使用单独的全身控制器。

translated by 谷歌翻译