我们为双级轨迹优化提供了一个框架,其中系统的动态被编码为对受约束优化问题的解决方案,并且将该较低级别问题的平滑梯度传递给上限轨迹优化器。基于优化的动态表示可实现约束处理,附加变量和非平滑行为,以便远离上层优化器,并允许经典的无约束优化器合成用于更复杂的系统的轨迹。我们提供了一种路径,以便有效地评估受限的动态,并利用隐式功能定理来计算此表示的平滑梯度。我们通过从机器人,航空航天和操纵域建模系统展示了框架,包括:杂志,带有联合限制,卡车杆受到库仑摩擦,Raibert Hopper,火箭落地的推力限制,以及基于优化的动态的平面推送任务然后使用迭代LQR优化轨迹。
translated by 谷歌翻译
我们提出了一个用于机器人应用专业的非凸轨迹优化问题的新求解器。Calipso或Conic增强Lagrangian内点求解器,结合了几种约束数值优化的策略,以本机处理二阶锥体和互补性约束。它可靠地解决了具有挑战性的运动规划问题,其中包括影响和库仑摩擦的接触式图形,受锥形约束的推力限制以及受国家触发的约束,而通用非线性编程溶液(如Snopt和iPopt)无法融合。此外,Calipso支持有关问题数据的有效分化,从而实现了双层优化应用程序,例如自动调整反馈策略。求解器的可靠收敛性在操纵,运动和航空航天域的一系列问题上得到了证明。可以使用该求解器的开源实现。
translated by 谷歌翻译
我们提出了Dojo,这是一种用于机器人技术的可区分物理引擎,优先考虑稳定的模拟,准确的接触物理学以及相对于状态,动作和系统参数的可不同性。Dojo在低样本速率下实现稳定的模拟,并通过使用变异积分器来节省能量和动量。非线性互补性问题,具有用于摩擦的二阶锥体,模型硬接触,并使用自定义的Primal Dual内部点法可靠地解决。使用隐式功能定理利用内点方法的特殊属性,以有效计算通过接触事件提供有用信息的光滑梯度。我们展示了Dojo独特的模拟紧密接触能力,同时提供了许多示例,包括轨迹优化,强化学习和系统识别。
translated by 谷歌翻译
由于机器人动力学中的固有非线性,腿部机器人全身动作的在线计划具有挑战性。在这项工作中,我们提出了一个非线性MPC框架,该框架可以通过有效利用机器人动力学结构来在线生成全身轨迹。Biconmp用于在真正的四倍机器人上生成各种环状步态,其性能在不同的地形上进行了评估,对抗不同步态之间的不可预见的推动力并在线过渡。此外,提出了双孔在机器人上产生非平凡无环的全身动态运动的能力。同样的方法也被用来在人体机器人(TALOS)上产生MPC的各种动态运动,并在模拟中产生另一个四倍的机器人(Anymal)。最后,报告并讨论了对计划范围和频率对非线性MPC框架的影响的广泛经验分析。
translated by 谷歌翻译
在粗糙的地形上的动态运动需要准确的脚部放置,避免碰撞以及系统的动态不足的计划。在存在不完美且常常不完整的感知信息的情况下,可靠地优化此类动作和互动是具有挑战性的。我们提出了一个完整的感知,计划和控制管道,可以实时优化机器人所有自由度的动作。为了减轻地形所带来的数值挑战,凸出不平等约束的顺序被提取为立足性可行性的局部近似值,并嵌入到在线模型预测控制器中。每个高程映射预先计算了步骤性分类,平面分割和签名的距离场,以最大程度地减少优化过程中的计算工作。多次射击,实时迭代和基于滤波器的线路搜索的组合用于可靠地以高速率解决该法式问题。我们在模拟中的间隙,斜率和踏上石头的情况下验证了所提出的方法,并在Anymal四倍的平台上进行实验,从而实现了最新的动态攀登。
translated by 谷歌翻译
差分动态编程(DDP)是用于轨迹优化的直接单射击方法。它的效率来自对时间结构的开发(最佳控制问题固有的)和系统动力学的明确推出/集成。但是,它具有数值不稳定,与直接多个射击方法相比,它的初始化选项有限(允许对控件的初始化,但不能对状态进行初始化),并且缺乏对控制约束的正确处理。在这项工作中,我们采用可行性驱动的方法来解决这些问题,该方法调节数值优化过程中的动态可行性并确保控制限制。我们的可行性搜索模拟了只有动态约束的直接多重拍摄问题的数值解决。我们证明我们的方法(命名为box-fddp)具有比Box-DDP+(单个射击方法)更好的数值收敛性,并且其收敛速率和运行时性能与使用The Solded Sound的最新直接转录配方竞争内部点和主动集算法在Knitro中提供。我们进一步表明,Box-FDP可以单调地降低动态可行性误差 - 与最先进的非线性编程算法相同。我们通过为四足动物和人形机器人产生复杂而运动的运动来证明我们的方法的好处。最后,我们强调说,Box-FDDP适用于腿部机器人中的模型预测控制。
translated by 谷歌翻译
Force modulation of robotic manipulators has been extensively studied for several decades. However, it is not yet commonly used in safety-critical applications due to a lack of accurate interaction contact modeling and weak performance guarantees - a large proportion of them concerning the modulation of interaction forces. This study presents a high-level framework for simultaneous trajectory optimization and force control of the interaction between a manipulator and soft environments, which is prone to external disturbances. Sliding friction and normal contact force are taken into account. The dynamics of the soft contact model and the manipulator are simultaneously incorporated in a trajectory optimizer to generate desired motion and force profiles. A constrained optimization framework based on Alternative Direction Method of Multipliers (ADMM) has been employed to efficiently generate real-time optimal control inputs and high-dimensional state trajectories in a Model Predictive Control fashion. Experimental validation of the model performance is conducted on a soft substrate with known material properties using a Cartesian space force control mode. Results show a comparison of ground truth and real-time model-based contact force and motion tracking for multiple Cartesian motions in the valid range of the friction model. It is shown that a contact model-based motion planner can compensate for frictional forces and motion disturbances and improve the overall motion and force tracking accuracy. The proposed high-level planner has the potential to facilitate the automation of medical tasks involving the manipulation of compliant, delicate, and deformable tissues.
translated by 谷歌翻译
增强学习(RL)在接触式操纵中的经验成功(RL)从基于模型的角度来理解了很多待理解,其中关键困难通常归因于(i)触点模式的爆炸,(ii)僵硬,非平滑接触动力学和由此产生的爆炸 /不连续梯度,以及(iii)计划问题的非转换性。 RL的随机性质通过有效采样和平均接触模式来解决(i)和(ii)。另一方面,基于模型的方法通过分析平滑接触动力学来解决相同的挑战。我们的第一个贡献是建立两种方法的简单系统方法的理论等效性,并在许多复杂示例上提供定性和经验的等效性。为了进一步减轻(II),我们的第二个贡献是凸面的凸面,可区分和准动力的触点动力学表述,这两个方案都可以平滑方案,并且通过实验证明了对接触富含接触的计划非常有效。我们的最终贡献解决了(III),在其中我们表明,当通过平滑度抽取接触模式时,基于经典的运动计划算法在全球计划中可以有效。将我们的方法应用于具有挑战性的接触式操纵任务的集合中,我们证明了基于模型的有效运动计划可以实现与RL相当的结果,而计算却大大较少。视频:https://youtu.be/12ew4xc-vwa
translated by 谷歌翻译
通常,地形几何形状是非平滑的,非线性的,非凸的,如果通过以机器人为中心的视觉单元感知,则似乎部分被遮住且嘈杂。这项工作介绍了能够实时处理上述问题的完整控制管道。我们制定了一个轨迹优化问题,该问题可以在基本姿势和立足点上共同优化,但要遵守高度图。为了避免收敛到不良的本地Optima,我们部署了逐步的优化技术。我们嵌入了一个紧凑的接触式自由稳定性标准,该标准与非平板地面公式兼容。直接搭配用作转录方法,导致一个非线性优化问题,可以在少于十毫秒内在线解决。为了在存在外部干扰的情况下增加鲁棒性,我们用动量观察者关闭跟踪环。我们的实验证明了爬楼梯,踏上垫脚石上的楼梯,并利用各种动态步态在缝隙上。
translated by 谷歌翻译
我们提出了一种新颖有效的提升方法,以最佳控制与触点的刚体系统的最佳控制,以改善牛顿型方法的收敛性。为了放宽高非线性,我们将状态,加速度,接触力和控制输入扭矩视为优化变量以及接触框架上的逆动力学和加速约束作为平等约束。我们以有效的方式消除了在每个牛顿型迭代中求解的线性方程中的加速度,接触力及其双重变量的更新。结果,牛顿型迭代的计算成本几乎与传统的非牛顿式迭代迭代相同,该牛顿型迭代嵌入了状态方程中的接触动力学。我们对在内部方法中考虑的摩擦锥约束的各种四足步步态的全身最佳控制进行了数值实验,并证明所提出的方法可以将收敛速度显着提高到超过两倍以上的常规非额定速度的两倍以上方法。
translated by 谷歌翻译
The ability to generate dynamic walking in real-time for bipedal robots with input constraints and underactuation has the potential to enable locomotion in dynamic, complex and unstructured environments. Yet, the high-dimensional nature of bipedal robots has limited the use of full-order rigid body dynamics to gaits which are synthesized offline and then tracked online. In this work we develop an online nonlinear model predictive control approach that leverages the full-order dynamics to realize diverse walking behaviors. Additionally, this approach can be coupled with gaits synthesized offline via a desired reference to enable a shorter prediction horizon and rapid online re-planning, bridging the gap between online reactive control and offline gait planning. We demonstrate the proposed method, both with and without an offline gait, on the planar robot AMBER-3M in simulation and on hardware.
translated by 谷歌翻译
物体之间的碰撞检测对于机器人系统的模拟,控制和学习至关重要。但是,现有的碰撞检测例程本质上是非差异的,从而限制了它们在基于优化的算法中的实用性。在这项工作中,我们提出了一个完全可区分的碰撞检测框架,该框架的原因是一组可复合和高度表达的凸原始形状之间的距离。这是通过将碰撞检测问题制定为凸优化问题来实现的,该问题旨在在有相交之前找到要应用于每个对象的最小均匀缩放率。优化问题是完全可区分的,并且能够返回每个对象上的碰撞检测状态以及接触点。
translated by 谷歌翻译
接触式轨迹优化提供了一种具有吸引力的方法,可以自动生成用于机器人操纵和运动的复杂和接触型行为。但是,由于确保数值可靠性和物理现实主义的挑战,这种技术的可伸缩性受到限制。在本文中,我们提出了初步结果,表明迭代线性二次调节器(ILQR)算法以及最近提出的基于压力场的水力弹性接触模型可以通过接触实现可靠和物理上现实的轨迹优化。我们使用这种方法来合成富含接触的行为,例如四足动物和全臂操纵。此外,Kinova Gen3机器人臂上的开环播放证明了全臂操纵轨迹的身体精度。代码可在https://bit.ly/ilqr_hc上找到,可以在https://youtu.be/iqxjkbm8_ms上找到视频。
translated by 谷歌翻译
We present a differentiable formulation of rigid-body contact dynamics for objects and robots represented as compositions of convex primitives. Existing optimization-based approaches simulating contact between convex primitives rely on a bilevel formulation that separates collision detection and contact simulation. These approaches are unreliable in realistic contact simulation scenarios because isolating the collision detection problem introduces contact location non-uniqueness. Our approach combines contact simulation and collision detection into a unified single-level optimization problem. This disambiguates the collision detection problem in a physics-informed manner. Compared to previous differentiable simulation approaches, our formulation features improved simulation robustness and a reduction in computational complexity by more than an order of magnitude. We illustrate the contact and collision differentiability on a robotic manipulation task requiring optimization-through-contact. We provide a numerically efficient implementation of our formulation in the Julia language called Silico.jl.
translated by 谷歌翻译
使用逆动力学的最佳控制(OC)提供了数值益处,例如粗略优化,更便宜的衍生物计算和高收敛速率。但是,为了利用腿部机器人的模型预测控制(MPC)中的这些好处,有效处理其大量平等约束至关重要。为此,我们首先(i)提出了一种新的方法来处理基于NullSpace参数化的平等约束。我们的方法可以适当地平衡最优性,以及动态和平等构成可行性,从而增加了吸引到良好本地最小值的盆地。为此,我们(ii)(ii)通过合并功能功能来调整以可行性为导向的搜索。此外,我们介绍了(iii)的(iii)对考虑任意执行器模型的反向动力学的凝结公式。我们还基于感知运动框架中基于反向动力学的新型MPC(iv)。最后,我们提出(v)最佳控制与正向动力学和逆动力学的理论比较,并通过数值评估。我们的方法使逆动力学MPC在硬件上首次应用,从而在Anymal机器人上进行了最新的动态攀登。我们在广泛的机器人问题上进行基准测试,并产生敏捷和复杂的动作。我们显示了我们的无空间分辨率和凝结配方的计算降低(高达47.3%)。我们通过以高收敛速率解决粗略优化问题(最多10 Hz离散化)来提供方法的益处。我们的算法在Crocoddyl内公开可用。
translated by 谷歌翻译
该论文提出了一个计划者,以使用质心动力学和人形机器人的完整运动学来产生步行轨迹。机器人与行走表面之间的相互作用是通过新条件明确建模的,即\ emph {动态互补性约束}。该方法不需要预定义的接触序列,并自动生成脚步。我们通过一组任务来表征机器人控制目标,并通过解决最佳控制问题来解决它。我们表明,可以通过指定最小的参考集,例如恒定所需的质量速度中心和地面上的参考点来自动实现行走运动。此外,我们分析了接触模型选择如何影响计算时间。我们通过为人形机器人ICUB生成和测试步行轨迹来验证该方法。
translated by 谷歌翻译
这项工作介绍了模型预测控制(MPC)的公式,该公式适应基于任务的模型的复杂性,同时保持可行性和稳定性保证。现有的MPC实现通常通过缩短预测范围或简化模型来处理计算复杂性,这两者都可能导致不稳定。受到行为经济学,运动计划和生物力学相关方法的启发,我们的方法通过简单模型解决了MPC问题,用于在地平线区域的动力学和约束,而这种模型是可行的,并且不存在该模型的复杂模型。该方法利用计划和执行的交织来迭代识别这些区域,如果它们满足确切的模板/锚关系,可以安全地简化这些区域。我们表明,该方法不会损害系统的稳定性和可行性特性,并在仿真实验中衡量在四足动物上执行敏捷行为的仿真实验中的性能。我们发现,与固定复杂性实现相比,这种自适应方法可以实现更多的敏捷运动,并扩大可执行任务的范围。
translated by 谷歌翻译
有效的轨迹优化对于避免非结构化环境中的碰撞至关重要,但在解决方案中具有速度和质量仍然具有挑战性。一个原因是二阶最优性需要计算Hessian矩阵,这些矩阵可以使用$ O(n ^ 2)$与航点的数量一起生长。减少航点可以二次降低计算时间。不幸的是,更少的航点导致较低的质量轨迹,可能无法避免碰撞。要拥有密集的航点和计算时间,我们从最近的共识优化研究中获取了灵感,并提出了分布式配方的搭配轨迹优化。它将长期轨迹分成几个段,其中每个段都成为几个航路点的子问题。这些子问题是经典的,但并行解决,并且解决方案与共识约束融合到单个轨迹中,这通过共识更新来强制段的连续性。利用该方案,二次复杂性分布在每个段中,并通过更密集的航点来解决高质量的轨迹。此外,所提出的配方可以使用任何现有的轨迹优化器来解决子问题。我们比较我们对领先运动规划算法的轨迹分裂的实现的性能,并展示了我们方法的改进的计算效率。
translated by 谷歌翻译
在腿部机器人技术中,计划和执行敏捷的机动演习一直是一个长期的挑战。它需要实时得出运动计划和本地反馈政策,以处理动力学动量的非物质。为此,我们提出了一个混合预测控制器,该控制器考虑了机器人的致动界限和全身动力学。它将反馈政策与触觉信息相结合,以在本地预测未来的行动。由于采用可行性驱动的方法,它在几毫秒内收敛。我们的预测控制器使Anymal机器人能够在现实的场景中生成敏捷操作。关键要素是跟踪本地反馈策略,因为与全身控制相反,它们达到了所需的角动量。据我们所知,我们的预测控制器是第一个处理驱动限制,生成敏捷的机动操作以及执行低级扭矩控制的最佳反馈策略,而无需使用单独的全身控制器。
translated by 谷歌翻译
为了使腿部机器人执行敏捷,高度动态和接触率丰富的动作,需要对未经线性动力学的启动不足的复合系统进行全身轨迹计算。在这项工作中,我们介绍了Horizon的动手应用,这是一种针对机器人系统量身定制的新型开源框架,可提供一系列工具来简化动态运动的生成。Horizon在涉及多个机器人平台的广泛行为上进行了测试:我们介绍了其构建块,并描述了使用其直观和直接的API生成三个复杂动作的完整过程。
translated by 谷歌翻译