智能论文笔记

End-to-End Deep Fault Tolerant Control

Daulet Baimukashev , Bexultan Rakhim , Matteo Rubagotti , Huseyin Atakan Varol

分类：机器人

2021-05-28

在机电一体化的IEEE / ASME交易上发布，DOI：10.1109 / TMECH.2021.3100150。理想情况下，需要精确的传感器测量来实现机电系统的闭环控制中的良好性能。因此，传感器故障将阻止系统正常工作，除非采用容错控制（FTC）架构。作为非线性系统的基于模型的FTC算法通常是具有挑战性的设计，本文基于深度学习的传感器故障存在于FTC的新方法。所考虑的方法用单个反复性神经网络替换故障检测和隔离和控制器设计的阶段，其在给定的时间窗口中具有过去的传感器测量值作为输入，以及控制变量的当前值作为输出。该端到端的深FTC方法应用于由球形倒立摆的机电调整系统，其构造通过反应轮改变，又通过电动机致动。模拟和实验结果表明，该方法可以处理连杆位置/速度传感器中发生的突然故障。提供的补充材料包括现实世界实验和软件源代码的视频。

translated by 谷歌翻译

Model Predictive Control for Dynamic Cloth Manipulation: Parameter Learning and Experimental Validation

Adrià Luque , David Parent , Adrià Colomé , Carlos Ocampo-Martinez , Carme Torras

分类：机器人

2022-09-13

机器人布操作是自动机器人系统的相关挑战性问题。高度可变形的对象，因为纺织品在操纵过程中可以采用多种配置和形状。因此，机器人不仅应该了解当前的布料配置，还应能够预测布的未来行为。本文通过使用模型预测控制（MPC）策略在对象的其他部分应用动作，从而解决了间接控制纺织对象某些点的配置的问题，该策略还允许间接控制的行为点。设计的控制器找到了最佳控制信号，以实现所需的未来目标配置。本文中的探索场景考虑了通过抓住其上角，以平方布的下角跟踪参考轨迹。为此，我们提出并验证线性布模型，该模型允许实时解决与MPC相关的优化问题。增强学习（RL）技术用于学习所提出的布模型的最佳参数，并调整所得的MPC。在模拟中获得准确的跟踪结果后，在真实的机器人中实现并执行了完整的控制方案，即使在不利条件下也可以获得准确的跟踪。尽管总观察到的误差达到5 cm标记，但对于30x30 cm的布，分析表明，MPC对该值的贡献少于30％。

translated by 谷歌翻译

Automated Controller Calibration by Kalman Filtering

Marcel Menner , Karl Berntorp , Stefano Di Cairano

分类：人工智能 | 机器学习 | 机器人

2021-11-21

本文提出了一种校准控制参数的方法。这种控制参数的示例是PID控制器的增益，优化控制的成本函数的权重，过滤器系数，滑动模式控制器的滑动表面，或神经网络的权重。因此，所提出的方法可以应用于各种控制器。该方法使用闭环系统操作数据来估计控制参数而不是系统状态的卡尔曼滤波器。控制参数校准由训练目标驱动，其包括对动态系统性能的规范。校准方法在线和强大地调整参数，是计算效率，具有低数据存储要求，并且易于实现对许多实时应用的吸引力。仿真结果表明，该方法能够快速学习控制参数（闭环成本的平均衰减因子大约24％），能够调整参数来补偿干扰（跟踪精度的提高约29％），并且是坚固的噪音。此外，具有高保真车辆模拟器Carim的仿真研究表明，该方法可以在线校准复杂动态系统的控制器，这表明其对现实世界的适用性。

translated by 谷歌翻译

Learning agile and dynamic motor skills for legged robots

Jemin Hwangbo , Joonho Lee , Alexey Dosovitskiy , Dario Bellicoso , Vassilios Tsounis , Vladlen Koltun , Marco Hutter

分类：

2019-01-24

Legged robots pose one of the greatest challenges in robotics. Dynamic and agile maneuvers of animals cannot be imitated by existing methods that are crafted by humans. A compelling alternative is reinforcement learning, which requires minimal craftsmanship and promotes the natural evolution of a control policy. However, so far, reinforcement learning research for legged robots is mainly limited to simulation, and only few and comparably simple examples have been deployed on real systems. The primary reason is that training with real robots, particularly with dynamically balancing systems, is complicated and expensive. In the present work, we report a new method for training a neural network policy in simulation and transferring it to a state-of-the-art legged system, thereby we leverage fast, automated, and cost-effective data generation schemes. The approach is applied to the ANYmal robot, a sophisticated medium-dog-sized quadrupedal system. Using policies trained in simulation, the quadrupedal machine achieves locomotion skills that go beyond what had been achieved with prior methods: ANYmal is capable of precisely and energy-efficiently following high-level body velocity commands, running faster than ever before, and recovering from falling even in complex configurations.

translated by 谷歌翻译

System Resilience through Health Monitoring and Reconfiguration

Ion Matei , Wiktor Piotrowski , Alexandre Perez , Johan de Kleer , Jorge Tierno , Wendy Mungovan , Vance Turnewitsch

分类：人工智能

2022-08-30

我们展示了一个端到端框架，以提高人造系统对不可预见的事件的弹性。该框架基于基于物理的数字双胞胎模型和三个负责实时故障诊断，预后和重新配置的模块。故障诊断模块使用基于模型的诊断算法来检测和分离断层，并在系统中产生干预措施，以消除不确定的诊断解决方案。我们通过使用基于物理学的数字双胞胎的平行化和替代模型来扩展故障诊断算法为所需的实时性能。预后模块跟踪故障进度，并训练在线退化模型，以计算系统组件的剩余使用寿命。此外，我们使用降解模型来评估断层进程对操作要求的影响。重新配置模块使用基于PDDL的计划，并带有语义附件来调整系统控件，从而最大程度地减少了对系统操作的故障影响。我们定义一个弹性度量，并以燃料系统模型的示例来说明该指标如何通过我们的框架改进。

translated by 谷歌翻译

Octocopter Design: Modelling, Control and Motion Planning

Nedim Osmic , Adnan Tahirovic , Bakir Lacevic

分类：机器人

2022-12-02

This book provides a solution to the control and motion planning design for an octocopter system. It includes a particular choice of control and motion planning algorithms which is based on the authors' previous research work, so it can be used as a reference design guidance for students, researchers as well as autonomous vehicles hobbyists. The control is constructed based on a fault tolerant approach aiming to increase the chances of the system to detect and isolate a potential failure in order to produce feasible control signals to the remaining active motors. The used motion planning algorithm is risk-aware by means that it takes into account the constraints related to the fault-dependant and mission-related maneuverability analysis of the octocopter system during the planning stage. Such a planner generates only those reference trajectories along which the octocopter system would be safe and capable of good tracking in case of a single motor fault and of majority of double motor fault scenarios. The control and motion planning algorithms presented in the book aim to increase the overall reliability of the system for completing the mission.

translated by 谷歌翻译

An Adaptive Framework for Reliable Trajectory Following in Changing-Contact Robot Manipulation Tasks

Saif Sidhik , Mohan Sridharan , Dirk Ruiken

分类：机器人

2021-11-15

我们描述了更改 - 联系机器人操作任务的框架，要求机器人与对象和表面打破触点。这种任务的不连续交互动态使得难以构建和使用单个动力学模型或控制策略，并且接触变化期间动态的高度非线性性质可能对机器人和物体造成损害。我们提出了一种自适应控制框架，使机器人能够逐步学习以预测更改联系人任务中的接触变化，从而了解了碎片连续系统的交互动态，并使用任务空间可变阻抗控制器提供平滑且精确的轨迹跟踪。我们通过实验比较我们框架的表现，以确定所需的代表性控制方法，以确定我们框架的自适应控制和增量学习组件需要在变化 - 联系机器人操纵任务中存在不连续动态的平稳控制。

translated by 谷歌翻译

Backflipping with Miniature Quadcopters by Gaussian Process Based Control and Planning

Péter Antal , Tamás Péni , Roland Tóth

分类：机器人

2022-09-29

该论文提出了两种控制方法，用于用微型四轮驱动器进行反弹式操纵。首先，对专门为反转设计设计的现有前馈控制策略进行了修订和改进。使用替代高斯工艺模型的贝叶斯优化通过在模拟环境中反复执行翻转操作来找到最佳运动原语序列。第二种方法基于闭环控制，它由两个主要步骤组成：首先，即使在模型不确定性的情况下，自适应控制器也旨在提供可靠的参考跟踪。控制器是通过通过测量数据调整的高斯过程来增强无人机的标称模型来构建的。其次，提出了一种有效的轨迹计划算法，该算法仅使用二次编程来设计可行的轨迹为反弹操作设计。在模拟和使用BitCraze Crazyflie 2.1四肢旋转器中对两种方法进行了分析。

translated by 谷歌翻译

Unbiased Active Inference for Classical Control

Mohamed Baioumy , Corrado Pezzato , Riccardo Ferrari , Nick Hawes

分类：机器人

2022-07-27

主动推断是源自计算神经科学的数学框架。最近，它被证明是在机器人技术中构建目标驱动行为的一种有前途的方法。具体而言，主动推理控制器（AIC）在多个连续控制和国家估计任务方面取得了成功。尽管取得了相对成功，但一些建立的设计选择导致了机器人控制的许多实际限制。这些包括对国家的偏见估计，以及仅是控制动作的隐式模型。在本文中，我们强调了这些局限性，并提出了无偏见的活动推理控制器（U-AIC）的扩展版本。U-AIC保持AIC的所有引人注目的好处，并消除其局限性。在2多臂臂上的仿真结果和对真正的7-DOF操纵器的实验表明，相对于标准AIC，U-AIC的性能提高了。该代码可以在https://github.com/cpezzato/unbiased_aic上找到。

translated by 谷歌翻译

Emergence of human oculomotor behavior from optimal control of a cable-driven biomimetic robotic eye

Reza Javanmard Alitappeh , Akhil John , Bernardo Dias , A. John van Opstal , Alexandre Bernardino

分类：机器人

2022-03-01

在人类机器人的相互作用中，眼球运动在非语言交流中起着重要作用。但是，控制机器人眼的动作表现出与人眼动物系统相似的性能仍然是一个重大挑战。在本文中，我们研究了如何使用电缆驱动的驱动系统来控制人眼的现实模型，该系统模仿了六个眼外肌肉的自由度。仿生设计引入了解决新的挑战，最值得注意的是，需要控制每种肌肉的支撑，以防止运动过程中的紧张感损失，这将导致电缆松弛和缺乏控制。我们构建了一个机器人原型，并开发了一个非线性模拟器和两个控制器。在第一种方法中，我们使用局部衍生技术线性化了非线性模型，并设计了线性 - 季度最佳控制器，以优化计算准确性，能量消耗和运动持续时间的成本函数。第二种方法使用复发性神经网络，该神经网络从系统的样本轨迹中学习非线性系统动力学，以及一个非线性轨迹优化求解器，可最大程度地减少相似的成本函数。我们专注于具有完全不受限制的运动学的快速saccadic眼球运动，以及六根电缆的控制信号的生成，这些电缆同时满足了几个动态优化标准。该模型忠实地模仿了人类扫视观察到的三维旋转运动学和动力学。我们的实验结果表明，尽管两种方法都产生了相似的结果，但非线性方法对于未来改进该模型的方法更加灵活，该模型的计算是线性化模型的位置依赖性偏向和局部衍生物的计算变得特别乏味。

translated by 谷歌翻译

Global Incremental Flight Control for Agile Maneuvering of a Tailsitter Flying Wing

Ezra Tal , Sertac Karaman

分类：机器人

2022-07-26

本文提出了一项新颖的控制法，以使用尾随机翼无人驾驶飞机（UAV）进行准确跟踪敏捷轨迹，该轨道在垂直起飞和降落（VTOL）和向前飞行之间过渡。全球控制配方可以在整个飞行信封中进行操作，包括与Sideslip的不协调的飞行。显示了具有简化空气动力学模型的非线性尾尾动力学的差异平坦度。使用扁平度变换，提出的控制器结合了位置参考的跟踪及其导数速度，加速度和混蛋以及偏航参考和偏航速率。通过角速度进纸术语包含混蛋和偏航率参考，可以改善随着快速变化的加速度跟踪轨迹。控制器不取决于广泛的空气动力学建模，而是使用增量非线性动态反演（INDI）仅基于局部输入输出关系来计算控制更新，从而导致对简化空气动力学方程中差异的稳健性。非线性输入输出关系的精确反转是通过派生的平坦变换实现的。在飞行测试中对所得的控制算法进行了广泛的评估，在该测试中，它展示了准确的轨迹跟踪和挑战性敏捷操作，例如侧向飞行和转弯时的侵略性过渡。

translated by 谷歌翻译

Soft Robots Modeling: a Literature Unwinding

Costanza Armanini , Conor Messer , Anup Teejo Mathew , Frédéric Boyer , Christian Duriez , Federico Renda

分类：机器人

2021-12-07

机器人社区在为软机器人设备建模提供的理论工具的复杂程度中看到了指数增长。已经提出了不同的解决方案以克服与软机器人建模相关的困难，通常利用其他科学学科，例如连续式机械和计算机图形。这些理论基础通常被认为是理所当然的，这导致复杂的文献，因此，从未得到完整审查的主题。Withing这种情况下，提交的文件的目标是双重的。突出显示涉及建模技术的不同系列的常见理论根源，采用统一语言，以简化其主要连接和差异的分析。因此，对上市接近自然如下，并最终提供在该领域的主要作品的完整，解开，审查。

translated by 谷歌翻译

Constructing Neural Network-Based Models for Simulating Dynamical Systems

Christian Møldrup Legaard , Thomas Schranz , Gerald Schweiger , Ján Drgoňa , Basak Falay , Cláudio Gomes , Alexandros Iosifidis , Mahdi Abkar , Peter Gorm Larsen

分类：机器学习

2021-11-02

动态系统参见在物理，生物学，化学等自然科学中广泛使用，以及电路分析，计算流体动力学和控制等工程学科。对于简单的系统，可以通过应用基本物理法来导出管理动态的微分方程。然而，对于更复杂的系统，这种方法变得非常困难。数据驱动建模是一种替代范式，可以使用真实系统的观察来了解系统的动态的近似值。近年来，对数据驱动的建模技术的兴趣增加，特别是神经网络已被证明提供了解决广泛任务的有效框架。本文提供了使用神经网络构建动态系统模型的不同方式的调查。除了基础概述外，我们还审查了相关的文献，概述了这些建模范式必须克服的数值模拟中最重要的挑战。根据审查的文献和确定的挑战，我们提供了关于有前途的研究领域的讨论。

translated by 谷歌翻译

Data-Efficient Deep Reinforcement Learning for Attitude Control of Fixed-Wing UAVs: Field Experiments

Eivind Bøhn , Erlend M. Coates , Dirk Reinhardt , Tor Arne Johansen

分类：机器学习 | 机器人

2021-11-07

由于非线性动力学，执行器约束和耦合的纵向和横向运动，部分地，固定翼无人驾驶飞行器（无人机）的姿态控制是一个困难的控制问题。目前的最先进的自动驾驶仪基于线性控制，因此有限于其有效性和性能。深度加强学习（DRL）是一种通过与受控系统的交互自动发现最佳控制法的机器学习方法，可以处理复杂的非线性动态。我们在本文中展示DRL可以成功学习直接在原始非线性动态上运行的固定翼UAV的态度控制，需要短至三分钟的飞行数据。我们最初在仿真环境中培训我们的模型，然后在飞行测试中部署无人机的学习控制器，向最先进的ArduplaneProportional-Integry-artivation（PID）姿态控制器的表现展示了可比的性能，而无需进一步的在线学习。为了更好地理解学习控制器的操作，我们呈现了对其行为的分析，包括与现有良好调整的PID控制器的比较。

translated by 谷歌翻译

Constrained Imitation Learning for a Flapping Wing Unmanned Aerial Vehicle

Tejaswi K. C. , Taeyoung Lee

分类：机器人

2022-06-08

本文介绍了微型拍打翼无人机的数据驱动的最佳控制政策。首先，根据动力学的几何公式计算一组最佳轨迹，该动力学的几何公式捕获了大角度拍打运动与准稳态空气动力学之间的非线性耦合。然后，根据模仿学习的框架，它被转换为反馈控制系统。特别是，通过学习过程加入了附加的约束，以增强所得控制动力学的稳定性。与常规方法相比，所提出的约束模仿学习消除了在线生成其他最佳轨迹的需求，而无需牺牲稳定性。因此，计算效率大大提高。此外，这建立了第一个非线性控制系统，该系统稳定了旋转翼航空车辆的耦合纵向和横向动力学，而无需依赖平均或线性化。这些由数值示例说明，该示例的模拟模型受君主蝴蝶的启发。

translated by 谷歌翻译

A Comparative Study of Nonlinear MPC and Differential-Flatness-Based Control for Quadrotor Agile Flight

Sihao Sun , Angel Romero , Philipp Foehn , Elia Kaufmann , Davide Scaramuzza

分类：机器人

2021-09-03

二次运动的准确轨迹跟踪控制对于在混乱环境中的安全导航至关重要。但是，由于非线性动态，复杂的空气动力学效应和驱动约束，这在敏捷飞行中具有挑战性。在本文中，我们通过经验比较两个最先进的控制框架：非线性模型预测控制器（NMPC）和基于差异的控制器（DFBC），通过以速度跟踪各种敏捷轨迹，最多20 m/s（即72 km/h）。比较在模拟和现实世界环境中进行，以系统地评估这两种方法从跟踪准确性，鲁棒性和计算效率的方面。我们以更高的计算时间和数值收敛问题的风险来表明NMPC在跟踪动态不可行的轨迹方面的优势。对于这两种方法，我们还定量研究了使用增量非线性动态反演（INDI）方法添加内环控制器的效果，以及添加空气动力学阻力模型的效果。我们在世界上最大的运动捕获系统之一中进行的真实实验表明，NMPC和DFBC的跟踪误差降低了78％以上，这表明有必要使用内环控制器和用于敏捷轨迹轨迹跟踪的空气动力学阻力模型。

translated by 谷歌翻译

Real-time Neural-MPC: Deep Learning Model Predictive Control for Quadrotors and Agile Robotic Platforms

Tim Salzmann , Elia Kaufmann , Jon Arrizabalaga , Marco Pavone , Davide Scaramuzza , Markus Ryll

分类：机器人 | 机器学习

2022-03-15

模型预测控制（MPC）已成为高性能自治系统嵌入式控制的流行框架。但是，为了使用MPC实现良好的控制性能，准确的动力学模型是关键。为了维持实时操作，嵌入式系统上使用的动力学模型仅限于简单的第一原则模型，该模型实质上限制了其代表性。与此类简单模型相反，机器学习方法，特别是神经网络，已被证明可以准确地建模复杂的动态效果，但是它们的较大的计算复杂性阻碍了与快速实时迭代环路的组合。通过这项工作，我们提出了实时神经MPC，这是一个将大型复杂的神经网络体系结构作为动态模型的框架，在模型预测性控制管道中。，展示了所描述的系统的功能，可以使用基于梯度的在线优化MPC运行以前不可行的大型建模能力。与在线优化MPC中神经网络的先前实现相比，我们可以利用嵌入式平台上50Hz实时窗口中的4000倍的型号。此外，与没有神经网络动力学的最新MPC方法相比，我们通过将位置跟踪误差降低多达82％，从而显示了对现实世界问题的可行性。

translated by 谷歌翻译

Active Inference in Robotics and Artificial Agents: Survey and Challenges

Pablo Lanillos , Cristian Meo , Corrado Pezzato , Ajith Anil Meera , Mohamed Baioumy , Wataru Ohata , Alexander Tschantz , Beren Millidge , Martijn Wisse , Christopher L. Buckley

分类：机器人 | 人工智能 | 机器学习

2021-12-03

有效推论是一种数学框架，它起源于计算神经科学，作为大脑如何实现动作，感知和学习的理论。最近，已被证明是在不确定性下存在国家估算和控制问题的有希望的方法，以及一般的机器人和人工代理人的目标驱动行为的基础。在这里，我们审查了最先进的理论和对国家估计，控制，规划和学习的积极推断的实现;描述当前的成就，特别关注机器人。我们展示了相关实验，以适应，泛化和稳健性而言说明其潜力。此外，我们将这种方法与其他框架联系起来，并讨论其预期的利益和挑战：使用变分贝叶斯推理具有功能生物合理性的统一框架。

translated by 谷歌翻译

Learning Control Policies for Fall prevention and safety in bipedal locomotion

Visak Kumar

分类：机器人 | 人工智能

2022-01-04

从意外的外部扰动中恢复的能力是双模型运动的基本机动技能。有效的答复包括不仅可以恢复平衡并保持稳定性的能力，而且在平衡恢复物质不可行时，也可以保证安全的方式。对于与双式运动有关的机器人，例如人形机器人和辅助机器人设备，可帮助人类行走，设计能够提供这种稳定性和安全性的控制器可以防止机器人损坏或防止伤害相关的医疗费用。这是一个具有挑战性的任务，因为它涉及用触点产生高维，非线性和致动系统的高动态运动。尽管使用基于模型和优化方法的前进方面，但诸如广泛领域知识的要求，诸如较大的计算时间和有限的动态变化的鲁棒性仍然会使这个打开问题。在本文中，为了解决这些问题，我们开发基于学习的算法，能够为两种不同的机器人合成推送恢复控制政策：人形机器人和有助于双模型运动的辅助机器人设备。我们的工作可以分为两个密切相关的指示：1）学习人形机器人的安全下降和预防策略，2）使用机器人辅助装置学习人类的预防策略。为实现这一目标，我们介绍了一套深度加强学习（DRL）算法，以学习使用这些机器人时提高安全性的控制策略。

translated by 谷歌翻译

OPT-Mimic: Imitation of Optimized Trajectories for Dynamic Quadruped Behaviors

Yuni Fuchioka , Zhaoming Xie , Michiel van de Panne

分类：机器人

2022-10-03

Reinforcement Learning (RL) has seen many recent successes for quadruped robot control. The imitation of reference motions provides a simple and powerful prior for guiding solutions towards desired solutions without the need for meticulous reward design. While much work uses motion capture data or hand-crafted trajectories as the reference motion, relatively little work has explored the use of reference motions coming from model-based trajectory optimization. In this work, we investigate several design considerations that arise with such a framework, as demonstrated through four dynamic behaviours: trot, front hop, 180 backflip, and biped stepping. These are trained in simulation and transferred to a physical Solo 8 quadruped robot without further adaptation. In particular, we explore the space of feed-forward designs afforded by the trajectory optimizer to understand its impact on RL learning efficiency and sim-to-real transfer. These findings contribute to the long standing goal of producing robot controllers that combine the interpretability and precision of model-based optimization with the robustness that model-free RL-based controllers offer.

translated by 谷歌翻译