智能论文笔记

A Feasibility-Driven Approach to Control-Limited DDP

Carlos Mastalli , Wolfgang Merkt , Josep Marti-Saumell , Henrique Ferrolho , Joan Sola , Nicolas Mansard , Sethu Vijayakumar

分类：机器人 | 人工智能

2020-10-01

差分动态编程（DDP）是用于轨迹优化的直接单射击方法。它的效率来自对时间结构的开发（最佳控制问题固有的）和系统动力学的明确推出/集成。但是，它具有数值不稳定，与直接多个射击方法相比，它的初始化选项有限（允许对控件的初始化，但不能对状态进行初始化），并且缺乏对控制约束的正确处理。在这项工作中，我们采用可行性驱动的方法来解决这些问题，该方法调节数值优化过程中的动态可行性并确保控制限制。我们的可行性搜索模拟了只有动态约束的直接多重拍摄问题的数值解决。我们证明我们的方法（命名为box-fddp）具有比Box-DDP+（单个射击方法）更好的数值收敛性，并且其收敛速率和运行时性能与使用The Solded Sound的最新直接转录配方竞争内部点和主动集算法在Knitro中提供。我们进一步表明，Box-FDP可以单调地降低动态可行性误差 - 与最先进的非线性编程算法相同。我们通过为四足动物和人形机器人产生复杂而运动的运动来证明我们的方法的好处。最后，我们强调说，Box-FDDP适用于腿部机器人中的模型预测控制。

translated by 谷歌翻译

Inverse-Dynamics MPC via Nullspace Resolution

Carlos Mastalli , Saroj Prasad Chhatoi , Thomas Corbères , Steve Tonneau , Sethu Vijayakumar

分类：机器人

2022-09-12

使用逆动力学的最佳控制（OC）提供了数值益处，例如粗略优化，更便宜的衍生物计算和高收敛速率。但是，为了利用腿部机器人的模型预测控制（MPC）中的这些好处，有效处理其大量平等约束至关重要。为此，我们首先（i）提出了一种新的方法来处理基于NullSpace参数化的平等约束。我们的方法可以适当地平衡最优性，以及动态和平等构成可行性，从而增加了吸引到良好本地最小值的盆地。为此，我们（ii）（ii）通过合并功能功能来调整以可行性为导向的搜索。此外，我们介绍了（iii）的（iii）对考虑任意执行器模型的反向动力学的凝结公式。我们还基于感知运动框架中基于反向动力学的新型MPC（iv）。最后，我们提出（v）最佳控制与正向动力学和逆动力学的理论比较，并通过数值评估。我们的方法使逆动力学MPC在硬件上首次应用，从而在Anymal机器人上进行了最新的动态攀登。我们在广泛的机器人问题上进行基准测试，并产生敏捷和复杂的动作。我们显示了我们的无空间分辨率和凝结配方的计算降低（高达47.3％）。我们通过以高收敛速率解决粗略优化问题（最多10 Hz离散化）来提供方法的益处。我们的算法在Crocoddyl内公开可用。

translated by 谷歌翻译

Agile Maneuvers in Legged Robots: a Predictive Control Approach

Carlos Mastalli , Wolfgang Merkt , Guiyang Xin , Jaehyun Shim , Michael Mistry , Ioannis Havoutis , Sethu Vijayakumar

分类：机器人 | 人工智能

2022-03-14

在腿部机器人技术中，计划和执行敏捷的机动演习一直是一个长期的挑战。它需要实时得出运动计划和本地反馈政策，以处理动力学动量的非物质。为此，我们提出了一个混合预测控制器，该控制器考虑了机器人的致动界限和全身动力学。它将反馈政策与触觉信息相结合，以在本地预测未来的行动。由于采用可行性驱动的方法，它在几毫秒内收敛。我们的预测控制器使Anymal机器人能够在现实的场景中生成敏捷操作。关键要素是跟踪本地反馈策略，因为与全身控制相反，它们达到了所需的角动量。据我们所知，我们的预测控制器是第一个处理驱动限制，生成敏捷的机动操作以及执行低级扭矩控制的最佳反馈策略，而无需使用单独的全身控制器。

translated by 谷歌翻译

BiConMP: A Nonlinear Model Predictive Control Framework for Whole Body Motion Planning

Avadesh Meduri , Paarth Shah , Julian Viereck , Majid Khadiv , Ioannis Havoutis , Ludovic Righetti

分类：机器人

2022-01-19

由于机器人动力学中的固有非线性，腿部机器人全身动作的在线计划具有挑战性。在这项工作中，我们提出了一个非线性MPC框架，该框架可以通过有效利用机器人动力学结构来在线生成全身轨迹。Biconmp用于在真正的四倍机器人上生成各种环状步态，其性能在不同的地形上进行了评估，对抗不同步态之间的不可预见的推动力并在线过渡。此外，提出了双孔在机器人上产生非平凡无环的全身动态运动的能力。同样的方法也被用来在人体机器人（TALOS）上产生MPC的各种动态运动，并在模拟中产生另一个四倍的机器人（Anymal）。最后，报告并讨论了对计划范围和频率对非线性MPC框架的影响的广泛经验分析。

translated by 谷歌翻译

Perceptive Locomotion through Nonlinear Model Predictive Control

Ruben Grandia , Fabian Jenelten , Shaohui Yang , Farbod Farshidian , Marco Hutter

分类：机器人

2022-08-17

在粗糙的地形上的动态运动需要准确的脚部放置，避免碰撞以及系统的动态不足的计划。在存在不完美且常常不完整的感知信息的情况下，可靠地优化此类动作和互动是具有挑战性的。我们提出了一个完整的感知，计划和控制管道，可以实时优化机器人所有自由度的动作。为了减轻地形所带来的数值挑战，凸出不平等约束的顺序被提取为立足性可行性的局部近似值，并嵌入到在线模型预测控制器中。每个高程映射预先计算了步骤性分类，平面分割和签名的距离场，以最大程度地减少优化过程中的计算工作。多次射击，实时迭代和基于滤波器的线路搜索的组合用于可靠地以高速率解决该法式问题。我们在模拟中的间隙，斜率和踏上石头的情况下验证了所提出的方法，并在Anymal四倍的平台上进行实验，从而实现了最新的动态攀登。

translated by 谷歌翻译

Model Predictive Control with Environment Adaptation for Legged Locomotion

Niraj Rathod , Angelo Bratta , Michele Focchi , Mario Zanon , Octavio Villarreal , Claudio Semini , Alberto Bemporad

分类：机器人

2021-05-12

在腿的运动中重新规划对于追踪所需的用户速度，在适应地形并拒绝外部干扰的同时至关重要。在这项工作中，我们提出并测试了实验中的实时非线性模型预测控制（NMPC），用于腿部机器人，以实现各种地形上的动态运动。我们引入了一种基于移动性的标准来定义NMPC成本，增强了二次机器人的运动，同时最大化腿部移动性并提高对地形特征的适应。我们的NMPC基于实时迭代方案，使我们能够以25美元的价格重新计划在线，\ Mathrm {Hz} $ 2 $ 2 $ 2美元的预测地平线。我们使用在质量框架中心中定义的单个刚体动态模型，以提高计算效率。在仿真中，测试NMPC以横穿一组不同尺寸的托盘，走进V形烟囱，并在崎岖的地形上招揽。在真实实验中，我们展示了我们的NMPC与移动功能的有效性，使IIT为87美元\，\ Mathrm {kg} $四分之一的机器人HIQ，以实现平坦地形上的全方位步行，横穿静态托盘，并适应在散步期间重新定位托盘。

translated by 谷歌翻译

Differentiable Optimal Control via Differential Dynamic Programming

Traiko Dinev , Carlos Mastalli , Vladimir Ivan , Steve Tonneau , Sethu Vijayakumar

分类：机器人

2022-09-02

机器人设计优化，模仿学习和系统标识共享一个常见的问题，该问题需要对机器人或任务参数进行优化，同时在优化机器人运动的同时。为了解决这些问题，我们可以使用可区分的最佳控制，以使机器人运动相对于参数的运动的梯度。我们提出了一种通过敏感性分析（SA）通过差分动态编程（DDP）算法进行分析分析计算这些梯度的方法。我们表明，计算梯度时必须包括二阶动力学项。但是，在计算运动时，我们不需要包括它们。我们验证我们在摆和双摆系统上的方法。此外，我们比较使用使用迭代线性二次调节器（ILQR）的衍生物，该线性二次调节器（ILQR）在Kinova ARM的共同设计任务上忽略了这些二阶术语，我们在其中优化了目标机器人的链路长度达到任务。我们表明，使用ILQR梯度忽略二阶动力学的优化会影响衍生物的计算。取而代之的是，使用DDP梯度优化，对于一系列初始设计，使我们的公式扩展到复杂的系统。

translated by 谷歌翻译

HTML版本

Structure-Exploiting Newton-Type Method for Optimal Control of Switched Systems

Sotaro Katayama , Toshiyuki Ohtsuka

分类：机器人

2021-12-14

本研究提出了一种高效的牛顿型方法，用于在给定模式序列下的开关系统的最佳控制。基于网格的方法用于离散连续时间最佳控制问题（OCP）并配制非线性程序（NLP），保证牛顿型方法的局部收敛。建议专用结构利用算法（Riccati递归）（Riccati递归）有效地对NLP进行Newton型方法，因为其稀疏结构与标准OCP不同。所提出的方法通过作为标准Riccati递归算法的分离子化网格总数来计算每个牛顿步骤。另外，如果解决方案足够接近局部最小值，则计算总是成功的。相反，一般二次编程（QP）求解器不能完成这一点，因为Hessian矩阵本质上是无限期的。此外，使用Riccati递归算法的性质作为QP子问题的动态规划来提出对降低的Hessian矩阵的修改，以提高收敛。用现成的NLP溶剂进行数值比较，表明所提出的方法速度高达两个数量级。还证明了全身最佳控制Quadrupeal Gaits并表明该方法可以实现具有刚性触点的机器人系统的全身模型预测控制（MPC）。

translated by 谷歌翻译

Differential Dynamic Programming with Nonlinear Safety Constraints Under System Uncertainties

Gokhan Alcan , Ville Kyrki

分类：机器人

2020-11-02

机器人等系统的安全操作要求它们计划和执行受安全约束的轨迹。当这些系统受到动态的不确定性的影响时，确保不违反限制是具有挑战性的。本文提出了基于受约束差分动态规划（DDP）的附加不确定性和非线性安全约束的安全轨迹，安全轨迹优化和控制方法。在其运动中的机器人的安全性被制定为机会限制了用户所选择的约束满足的概率。通过约束收紧将机会约束转换为DDP制剂中的确定性。为了避免在约束期间的过保守，从受约束的DDP导出的反馈策略的线性控制增益用于预测中的闭环不确定性传播的近似。所提出的算法在三种不同的机器人动态上进行了经验评估，模拟中具有高达12度的自由度。使用物理硬件实现对方法的计算可行性和适用性进行了说明。

translated by 谷歌翻译

ValueNetQP: Learned one-step optimal control for legged locomotion

Julian Viereck , Avadesh Meduri , Ludovic Righetti

分类：机器人

2022-01-11

最佳控制是一种成功的方法，可以为复杂机器人产生运动，特别是对于有腿运动。然而，这些技术往往太慢而无法实时运行，以便模型预测控制或者需要大大简化动力学模型。在这项工作中，我们展示了一种学习来预测问题值函数的梯度和Hessian的方法，可以用一步二次程序来快速解决预测控制问题。此外，我们的方法能够满足像摩擦锥和单侧约束的约束，这对于高动态机器机器任务很重要。我们展示了我们在模拟中的方法和实际的四轮车机器人执行小跑和边界运动的能力。

translated by 谷歌翻译

Trajectory Optimization with Optimization-Based Dynamics

Taylor A. Howell , Simon Le Cleac'h , Sumeet Singh , Pete Florence , Zachary Manchester , Vikas Sindhwani

分类：机器人

2021-09-10

我们为双级轨迹优化提供了一个框架，其中系统的动态被编码为对受约束优化问题的解决方案，并且将该较低级别问题的平滑梯度传递给上限轨迹优化器。基于优化的动态表示可实现约束处理，附加变量和非平滑行为，以便远离上层优化器，并允许经典的无约束优化器合成用于更复杂的系统的轨迹。我们提供了一种路径，以便有效地评估受限的动态，并利用隐式功能定理来计算此表示的平滑梯度。我们通过从机器人，航空航天和操纵域建模系统展示了框架，包括：杂志，带有联合限制，卡车杆受到库仑摩擦，Raibert Hopper，火箭落地的推力限制，以及基于优化的动态的平面推送任务然后使用迭代LQR优化轨迹。

translated by 谷歌翻译

Real-Time Deformable-Contact-Aware Model Predictive Control for Force-Modulated Manipulation

Lasitha Wijayarathne , Ziyi Zhou , Ye Zhao , Frank L. Hammond III

分类：机器人

2022-12-19

Force modulation of robotic manipulators has been extensively studied for several decades. However, it is not yet commonly used in safety-critical applications due to a lack of accurate interaction contact modeling and weak performance guarantees - a large proportion of them concerning the modulation of interaction forces. This study presents a high-level framework for simultaneous trajectory optimization and force control of the interaction between a manipulator and soft environments, which is prone to external disturbances. Sliding friction and normal contact force are taken into account. The dynamics of the soft contact model and the manipulator are simultaneously incorporated in a trajectory optimizer to generate desired motion and force profiles. A constrained optimization framework based on Alternative Direction Method of Multipliers (ADMM) has been employed to efficiently generate real-time optimal control inputs and high-dimensional state trajectories in a Model Predictive Control fashion. Experimental validation of the model performance is conducted on a soft substrate with known material properties using a Cartesian space force control mode. Results show a comparison of ground truth and real-time model-based contact force and motion tracking for multiple Cartesian motions in the valid range of the friction model. It is shown that a contact model-based motion planner can compensate for frictional forces and motion disturbances and improve the overall motion and force tracking accuracy. The proposed high-level planner has the potential to facilitate the automation of medical tasks involving the manipulation of compliant, delicate, and deformable tissues.

translated by 谷歌翻译

CALIPSO: A Differentiable Solver for Trajectory Optimization with Conic and Complementarity Constraints

Taylor A. Howell , Simon Le Cleac'h , Kevin Tracy , Zachary Manchester

分类：机器人

2022-05-19

我们提出了一个用于机器人应用专业的非凸轨迹优化问题的新求解器。Calipso或Conic增强Lagrangian内点求解器，结合了几种约束数值优化的策略，以本机处理二阶锥体和互补性约束。它可靠地解决了具有挑战性的运动规划问题，其中包括影响和库仑摩擦的接触式图形，受锥形约束的推力限制以及受国家触发的约束，而通用非线性编程溶液（如Snopt和iPopt）无法融合。此外，Calipso支持有关问题数据的有效分化，从而实现了双层优化应用程序，例如自动调整反馈策略。求解器的可靠收敛性在操纵，运动和航空航天域的一系列问题上得到了证明。可以使用该求解器的开源实现。

translated by 谷歌翻译

Dynamic Complementarity Conditions and Whole-Body Trajectory Optimization for Humanoid Robot Locomotion

Stefano Dafarra , Giulio Romualdi , Daniele Pucci

分类：机器人

2022-07-07

该论文提出了一个计划者，以使用质心动力学和人形机器人的完整运动学来产生步行轨迹。机器人与行走表面之间的相互作用是通过新条件明确建模的，即\ emph {动态互补性约束}。该方法不需要预定义的接触序列，并自动生成脚步。我们通过一组任务来表征机器人控制目标，并通过解决最佳控制问题来解决它。我们表明，可以通过指定最小的参考集，例如恒定所需的质量速度中心和地面上的参考点来自动实现行走运动。此外，我们分析了接触模型选择如何影响计算时间。我们通过为人形机器人ICUB生成和测试步行轨迹来验证该方法。

translated by 谷歌翻译

Adaptive Complexity Model Predictive Control

Joseph Norby , Ardalan Tajbakhsh , Yanhao Yang , Aaron M. Johnson

分类：机器人

2022-09-06

这项工作介绍了模型预测控制（MPC）的公式，该公式适应基于任务的模型的复杂性，同时保持可行性和稳定性保证。现有的MPC实现通常通过缩短预测范围或简化模型来处理计算复杂性，这两者都可能导致不稳定。受到行为经济学，运动计划和生物力学相关方法的启发，我们的方法通过简单模型解决了MPC问题，用于在地平线区域的动力学和约束，而这种模型是可行的，并且不存在该模型的复杂模型。该方法利用计划和执行的交织来迭代识别这些区域，如果它们满足确切的模板/锚关系，可以安全地简化这些区域。我们表明，该方法不会损害系统的稳定性和可行性特性，并在仿真实验中衡量在四足动物上执行敏捷行为的仿真实验中的性能。我们发现，与固定复杂性实现相比，这种自适应方法可以实现更多的敏捷运动，并扩大可执行任务的范围。

translated by 谷歌翻译

TAMOLS: Terrain-Aware Motion Optimization for Legged Systems

Fabian Jenelten , Ruben Grandia , Farbod Farshidian , Marco Hutter

分类：机器人

2022-06-28

通常，地形几何形状是非平滑的，非线性的，非凸的，如果通过以机器人为中心的视觉单元感知，则似乎部分被遮住且嘈杂。这项工作介绍了能够实时处理上述问题的完整控制管道。我们制定了一个轨迹优化问题，该问题可以在基本姿势和立足点上共同优化，但要遵守高度图。为了避免收敛到不良的本地Optima，我们部署了逐步的优化技术。我们嵌入了一个紧凑的接触式自由稳定性标准，该标准与非平板地面公式兼容。直接搭配用作转录方法，导致一个非线性优化问题，可以在少于十毫秒内在线解决。为了在存在外部干扰的情况下增加鲁棒性，我们用动量观察者关闭跟踪环。我们的实验证明了爬楼梯，踏上垫脚石上的楼梯，并利用各种动态步态在缝隙上。

translated by 谷歌翻译

Planar Bipedal Locomotion with Nonlinear Model Predictive Control: Online Gait Generation using Whole-Body Dynamics

Manuel Y. Galliker , Noel Csomay-Shanklin , Ruben Grandia , Andrew J. Taylor , Farbod Farshidian , Marco Hutter , Aaron D. Ames

分类：机器人

2022-03-14

The ability to generate dynamic walking in real-time for bipedal robots with input constraints and underactuation has the potential to enable locomotion in dynamic, complex and unstructured environments. Yet, the high-dimensional nature of bipedal robots has limited the use of full-order rigid body dynamics to gaits which are synthesized offline and then tracked online. In this work we develop an online nonlinear model predictive control approach that leverages the full-order dynamics to realize diverse walking behaviors. Additionally, this approach can be coupled with gaits synthesized offline via a desired reference to enable a shorter prediction horizon and rapid online re-planning, bridging the gap between online reactive control and offline gait planning. We demonstrate the proposed method, both with and without an offline gait, on the planar robot AMBER-3M in simulation and on hardware.

translated by 谷歌翻译

Whole-body model predictive control with rigid contacts via online switching time optimization

Sotaro Katayama , Toshiyuki Ohtsuka

分类：机器人

2022-03-02

这项研究介绍了具有刚性接触的机器人系统的全身模型预测控制（MPC），使用在线切换时间优化（STO）的给定接触序列下。我们将机器人动力学用刚性接触视为开关系统，并制定开关系统的最佳控制问题以实现MPC。我们为MPC问题使用有效的解决方案算法，该算法同时优化了切换时间和轨迹。与现有的现有方法不同，目前的有效算法可以在线优化和切换时间。通过在传统的MPC上比较了在线STO的提议的MPC，并通过固定的切换时间，通过数值模拟四倍的机器人的动态跳跃运动。在模拟比较中，提出的MPC成功控制了动态跳跃运动的两倍，这是常规MPC的两倍，这表明所提出的方法扩展了整体MPC的能力。我们进一步在四足机器人单位A1上进行硬件实验，并证明所提出的方法在实际机器人上实现了动态运动。

translated by 谷歌翻译

Hybrid iLQR Model Predictive Control for Contact Implicit Stabilization on Legged Robots

Nathan J. Kong , Chuanzheng Li , Aaron M. Johnson

分类：机器人

2022-07-11

模型预测控制（MPC）是控制机器人的流行策略，但由于混合动力学的复杂性质，很难接触系统。为了实现具有联系的系统，动态模型通常被简化或及时固定，以便有效地计划轨迹。在这项工作中，我们将混合迭代线性二次调节器扩展到以MPC方式（HILQR MPC）工作的1）通过1）修改触点模式时如何计算成本函数，2）在模拟刚体动态和3时使用并行处理。）使用刚体动力学的有效分析衍生化计算。结果是一个可以修改参考行为的接触顺序并凝聚力计划的系统 - 在处理大型扰动时至关重要。 HILQR MPC在两个系统上进行了测试：首先，在简单的驱动弹跳球混合系统上验证了混合成本修改。然后将HILQR MPC与在四倍的机器人（Unitree A1）上使用质心动态假设的方法进行比较。 HILQR MPC在模拟和硬件测试中的表现优于质心方法。

translated by 谷歌翻译

Lifted contact dynamics for efficient optimal control of rigid body systems with contacts

Sotaro Katayama , Toshiyuki Ohtsuka

分类：机器人

2021-08-03

我们提出了一种新颖有效的提升方法，以最佳控制与触点的刚体系统的最佳控制，以改善牛顿型方法的收敛性。为了放宽高非线性，我们将状态，加速度，接触力和控制输入扭矩视为优化变量以及接触框架上的逆动力学和加速约束作为平等约束。我们以有效的方式消除了在每个牛顿型迭代中求解的线性方程中的加速度，接触力及其双重变量的更新。结果，牛顿型迭代的计算成本几乎与传统的非牛顿式迭代迭代相同，该牛顿型迭代嵌入了状态方程中的接触动力学。我们对在内部方法中考虑的摩擦锥约束的各种四足步步态的全身最佳控制进行了数值实验，并证明所提出的方法可以将收敛速度显着提高到超过两倍以上的常规非额定速度的两倍以上方法。

translated by 谷歌翻译