智能论文笔记

Incremental Correction in Dynamic Systems Modelled with Neural Networks for Constraint Satisfaction

Namhoon Cho , Hyo-Sang Shin , Antonios Tsourdos , Davide Amato

分类：机器学习

2022-09-08

这项研究提出了用于完善神经网络参数或进入连续时间动态系统的控制功能的增量校正方法，以提高解决方案精度，以满足对性能输出变量放置的临时点约束。所提出的方法是将其参数基线围绕基线值的动力学线性化，然后求解将扰动轨迹传输到特定时间点（即临时点）处所需的纠正输入。根据要调整的决策变量的类型，参数校正和控制功能校正方法将开发出来。这些增量校正方法可以用作补偿实时应用中预训练的神经网络的预测错误的手段，在实时应用中，必须在规定的时间点上高精度预测动态系统的准确性。在这方面，在线更新方法可用于增强有限摩托控制的整体靶向准确性，但使用神经政策受到点约束。数值示例证明了拟议方法在火星上的动力下降问题中的应用中的有效性。

translated by 谷歌翻译

Optimisation of Structured Neural Controller Based on Continuous-Time Policy Gradient

Namhoon Cho , Hyo-Sang Shin

分类：机器学习 | 机器人

2022-01-17

这项研究为连续时间（确定性）动态系统的结构化非线性控制提供了一个政策优化框架。所提出的方法根据相关科学知识（例如Lyapunov稳定理论或领域经验）规定控制器的结构，同时考虑给定结构内的可调元素作为神经网络的参数化点。为了优化作为神经网络权重的函数代表的成本，提出的方法利用基于伴随灵敏度分析的连续时间策略梯度方法作为正确和性能计算成本梯度的手段。这使得将反馈控制器的分析衍生结构的稳定性，鲁棒性和物理解释性结合在一起，并结合了机器学习技术提供的代表性灵活性和优化的结果性能。这种用于固定结构控制合成的混合范式对于优化适应性非线性控制器以提高在线操作中的性能特别有用，在线操作中，现有理论在结构上占上风，同时缺乏对收益和不确定性调谐的明确分析理解控制性能特征的模型基础函数。航空应用上的数值实验说明了结构化非线性控制器优化框架的实用性。

translated by 谷歌翻译

Constrained Imitation Learning for a Flapping Wing Unmanned Aerial Vehicle

Tejaswi K. C. , Taeyoung Lee

分类：机器人

2022-06-08

本文介绍了微型拍打翼无人机的数据驱动的最佳控制政策。首先，根据动力学的几何公式计算一组最佳轨迹，该动力学的几何公式捕获了大角度拍打运动与准稳态空气动力学之间的非线性耦合。然后，根据模仿学习的框架，它被转换为反馈控制系统。特别是，通过学习过程加入了附加的约束，以增强所得控制动力学的稳定性。与常规方法相比，所提出的约束模仿学习消除了在线生成其他最佳轨迹的需求，而无需牺牲稳定性。因此，计算效率大大提高。此外，这建立了第一个非线性控制系统，该系统稳定了旋转翼航空车辆的耦合纵向和横向动力学，而无需依赖平均或线性化。这些由数值示例说明，该示例的模拟模型受君主蝴蝶的启发。

translated by 谷歌翻译

Neural Moving Horizon Estimation for Robust Flight Control

Bingheng Wang , Zhengtian Ma , Shupeng Lai , Lin Zhao

分类：机器人 | 机器学习

2022-06-21

估计和对外部干扰的反应对于二次驾驶的稳健飞行控制至关重要。现有的估计器通常需要针对特定的飞行方案或具有大量现实世界数据的培训进行重大调整，以实现令人满意的性能。在本文中，我们提出了一个神经移动范围估计器（Neuromhe），该估计量可以自动调整由神经网络建模并适应不同飞行方案的MHE参数。我们通过将MHE估计值的分析梯度推导出相对于可调参数的分析梯度实现这一目标，从而使MHE无缝嵌入作为神经网络中的无缝嵌入以进行高效学习。最有趣的是，我们证明可以从递归形式的卡尔曼过滤器有效地解决梯度。此外，我们开发了一种基于模型的策略梯度算法，可以直接从轨迹跟踪误差中训练神经元，而无需进行基础真相干扰。通过在各种具有挑战性的飞行中对四摩特的模拟和物理实验，通过模拟和物理实验对神经元的有效性进行了广泛的验证。值得注意的是，NeuroMhe的表现优于最先进的估计器，仅使用2.5％的参数量，力估计误差降低了49.4％。所提出的方法是一般的，可以应用于其他机器人系统的稳健自适应控制。

translated by 谷歌翻译

Trajectory Generation and Tracking Control for Aggressive Tail-Sitter Flights

Guozheng Lu , Yixi Cai , Nan Chen , Fanze Kong , Yunfan Ren , Fu Zhang

分类：机器人

2022-12-22

We address the theoretical and practical problems related to the trajectory generation and tracking control of tail-sitter UAVs. Theoretically, we focus on the differential flatness property with full exploitation of actual UAV aerodynamic models, which lays a foundation for generating dynamically feasible trajectory and achieving high-performance tracking control. We have found that a tail-sitter is differentially flat with accurate aerodynamic models within the entire flight envelope, by specifying coordinate flight condition and choosing the vehicle position as the flat output. This fundamental property allows us to fully exploit the high-fidelity aerodynamic models in the trajectory planning and tracking control to achieve accurate tail-sitter flights. Particularly, an optimization-based trajectory planner for tail-sitters is proposed to design high-quality, smooth trajectories with consideration of kinodynamic constraints, singularity-free constraints and actuator saturation. The planned trajectory of flat output is transformed to state trajectory in real-time with consideration of wind in environments. To track the state trajectory, a global, singularity-free, and minimally-parameterized on-manifold MPC is developed, which fully leverages the accurate aerodynamic model to achieve high-accuracy trajectory tracking within the whole flight envelope. The effectiveness of the proposed framework is demonstrated through extensive real-world experiments in both indoor and outdoor field tests, including agile SE(3) flight through consecutive narrow windows requiring specific attitude and with speed up to 10m/s, typical tail-sitter maneuvers (transition, level flight and loiter) with speed up to 20m/s, and extremely aggressive aerobatic maneuvers (Wingover, Loop, Vertical Eight and Cuban Eight) with acceleration up to 2.5g.

translated by 谷歌翻译

Learning from Sparse Demonstrations

Wanxin Jin , Todd D. Murphey , Dana Kulić , Neta Ezer , Shaoshuai Mou

分类：机器人 | 机器学习

2020-08-05

本文开发了连续的蓬松蛋白可区分编程（连续PDP）的方法，该方法使机器人能够从少数稀疏的关键帧中学习目标函数。带有一些时间戳记的密钥帧是所需的任务空间输出，预计机器人将顺序遵循。密钥帧的时间戳可能与机器人的实际执行时间不同。该方法共同找到一个目标函数和一个盘绕函数，以使机器人的产生轨迹顺序遵循关键帧，并以最小的差异损失。连续的PDP通过有效求解机器人轨迹相对于未知参数的梯度，可以最大程度地减少投影梯度下降的差异损失。该方法首先在模拟机器人臂上进行评估，然后应用于6-DOF四极管，以在未建模的环境中学习目标函数。结果表明，该方法的效率，其处理密钥帧和机器人执行之间的时间错位的能力以及将客观学习对看不见的运动条件的概括。

translated by 谷歌翻译

Neural-Rendezvous: Learning-based Robust Guidance and Control to Encounter Interstellar Objects

Hiroyasu Tsukamoto , Soon-Jo Chung , Benjamin Donitz , Michel Ingham , Declan Mages , Yashwanth Kumar Nakka

分类：机器人 | 人工智能 | 机器学习

2022-08-09

星际对象（ISO），与太阳相结合的无重力的天文对象，可能是原始材料的代表，在理解系外星系中无价。然而，由于其倾斜度通常很高和相对速度的限制性较差，因此，使用常规的人类在循环方法中探索ISO非常具有挑战性。本文介绍了神经汇聚 - 一个基于深度学习的指导和控制框架，用于遇到任何快速移动的对象，包括ISO，稳健，准确和实时自主。它在指导策略之上使用最小规范跟踪控制，该指南策略由频谱归一化的深神经网络建模，在该策略策略中，其超级参数通过新引入的损耗函数调节，直接惩罚了状态轨迹跟踪错误。我们严格地表明，即使在ISO探索的挑战性案例中，神经汇聚也提供了1）在预期的航天器递送误差上的高概率指数构成； 2）关于模型预测控制的解决方案的有限最优差距，这两者都是必不可少的，尤其是对于如此关键的空间任务。在数值模拟中，证明神经汇聚可以达到99％具有现实状态不确定性的ISO候选者的终末交付误差小于0.2 km，同时保留足以实现实时实施的计算效率。

translated by 谷歌翻译

Global Incremental Flight Control for Agile Maneuvering of a Tailsitter Flying Wing

Ezra Tal , Sertac Karaman

分类：机器人

2022-07-26

本文提出了一项新颖的控制法，以使用尾随机翼无人驾驶飞机（UAV）进行准确跟踪敏捷轨迹，该轨道在垂直起飞和降落（VTOL）和向前飞行之间过渡。全球控制配方可以在整个飞行信封中进行操作，包括与Sideslip的不协调的飞行。显示了具有简化空气动力学模型的非线性尾尾动力学的差异平坦度。使用扁平度变换，提出的控制器结合了位置参考的跟踪及其导数速度，加速度和混蛋以及偏航参考和偏航速率。通过角速度进纸术语包含混蛋和偏航率参考，可以改善随着快速变化的加速度跟踪轨迹。控制器不取决于广泛的空气动力学建模，而是使用增量非线性动态反演（INDI）仅基于局部输入输出关系来计算控制更新，从而导致对简化空气动力学方程中差异的稳健性。非线性输入输出关系的精确反转是通过派生的平坦变换实现的。在飞行测试中对所得的控制算法进行了广泛的评估，在该测试中，它展示了准确的轨迹跟踪和挑战性敏捷操作，例如侧向飞行和转弯时的侵略性过渡。

translated by 谷歌翻译

Dynamic Complementarity Conditions and Whole-Body Trajectory Optimization for Humanoid Robot Locomotion

Stefano Dafarra , Giulio Romualdi , Daniele Pucci

分类：机器人

2022-07-07

该论文提出了一个计划者，以使用质心动力学和人形机器人的完整运动学来产生步行轨迹。机器人与行走表面之间的相互作用是通过新条件明确建模的，即\ emph {动态互补性约束}。该方法不需要预定义的接触序列，并自动生成脚步。我们通过一组任务来表征机器人控制目标，并通过解决最佳控制问题来解决它。我们表明，可以通过指定最小的参考集，例如恒定所需的质量速度中心和地面上的参考点来自动实现行走运动。此外，我们分析了接触模型选择如何影响计算时间。我们通过为人形机器人ICUB生成和测试步行轨迹来验证该方法。

translated by 谷歌翻译

Backflipping with Miniature Quadcopters by Gaussian Process Based Control and Planning

Péter Antal , Tamás Péni , Roland Tóth

分类：机器人

2022-09-29

该论文提出了两种控制方法，用于用微型四轮驱动器进行反弹式操纵。首先，对专门为反转设计设计的现有前馈控制策略进行了修订和改进。使用替代高斯工艺模型的贝叶斯优化通过在模拟环境中反复执行翻转操作来找到最佳运动原语序列。第二种方法基于闭环控制，它由两个主要步骤组成：首先，即使在模型不确定性的情况下，自适应控制器也旨在提供可靠的参考跟踪。控制器是通过通过测量数据调整的高斯过程来增强无人机的标称模型来构建的。其次，提出了一种有效的轨迹计划算法，该算法仅使用二次编程来设计可行的轨迹为反弹操作设计。在模拟和使用BitCraze Crazyflie 2.1四肢旋转器中对两种方法进行了分析。

translated by 谷歌翻译

Jointly Learning Environments and Control Policies with Projected Stochastic Gradient Ascent

Adrien Bolland , Ioannis Boukas , Mathias Berger , Damien Ernst

分类：机器学习 | (统计)机器学习

2020-06-02

我们考虑在一个有限时间范围内的离散时间随机动力系统的联合设计和控制。我们将问题作为一个多步优化问题，在寻求识别系统设计和控制政策的不确定性下，共同最大化所考虑的时间范围内收集的预期奖励总和。转换函数，奖励函数和策略都是参数化的，假设与其参数有所不同。然后，我们引入了一种深度加强学习算法，将策略梯度方法与基于模型的优化技术相结合以解决这个问题。从本质上讲，我们的算法迭代地估计通过Monte-Carlo采样和自动分化的预期返回的梯度，并在环境和策略参数空间中投影梯度上升步骤。该算法称为直接环境和策略搜索（DEPS）。我们评估我们算法在三个环境中的性能，分别在三种环境中进行了一个群众弹簧阻尼系统的设计和控制，分别小型离网电力系统和无人机。此外，我们的算法是针对用于解决联合设计和控制问题的最先进的深增强学习算法的基准测试。我们表明，在所有三种环境中，DEPS至少在或更好地执行，始终如一地产生更高的迭代返回的解决方案。最后，通过我们的算法产生的解决方案也与由算法产生的解决方案相比，不共同优化环境和策略参数，突出显示在执行联合优化时可以实现更高返回的事实。

translated by 谷歌翻译

Perceptive Locomotion through Nonlinear Model Predictive Control

Ruben Grandia , Fabian Jenelten , Shaohui Yang , Farbod Farshidian , Marco Hutter

分类：机器人

2022-08-17

在粗糙的地形上的动态运动需要准确的脚部放置，避免碰撞以及系统的动态不足的计划。在存在不完美且常常不完整的感知信息的情况下，可靠地优化此类动作和互动是具有挑战性的。我们提出了一个完整的感知，计划和控制管道，可以实时优化机器人所有自由度的动作。为了减轻地形所带来的数值挑战，凸出不平等约束的顺序被提取为立足性可行性的局部近似值，并嵌入到在线模型预测控制器中。每个高程映射预先计算了步骤性分类，平面分割和签名的距离场，以最大程度地减少优化过程中的计算工作。多次射击，实时迭代和基于滤波器的线路搜索的组合用于可靠地以高速率解决该法式问题。我们在模拟中的间隙，斜率和踏上石头的情况下验证了所提出的方法，并在Anymal四倍的平台上进行实验，从而实现了最新的动态攀登。

translated by 谷歌翻译

Soft Robots Modeling: a Literature Unwinding

Costanza Armanini , Conor Messer , Anup Teejo Mathew , Frédéric Boyer , Christian Duriez , Federico Renda

分类：机器人

2021-12-07

机器人社区在为软机器人设备建模提供的理论工具的复杂程度中看到了指数增长。已经提出了不同的解决方案以克服与软机器人建模相关的困难，通常利用其他科学学科，例如连续式机械和计算机图形。这些理论基础通常被认为是理所当然的，这导致复杂的文献，因此，从未得到完整审查的主题。Withing这种情况下，提交的文件的目标是双重的。突出显示涉及建模技术的不同系列的常见理论根源，采用统一语言，以简化其主要连接和差异的分析。因此，对上市接近自然如下，并最终提供在该领域的主要作品的完整，解开，审查。

translated by 谷歌翻译

Fast solver for J2-perturbed Lambert problem using deep neural network

Bin Yang , Shuang Li , Jinglang Feng , Massimiliano Vasile

分类：人工智能 | 机器学习

2022-01-09

本文介绍了J2扰动兰伯特问题的新颖和快速求解器。求解器由智能初始猜测发生器组成，与差分校正过程组合。智能初始猜测生成器是一个深度神经网络，受过训练，以校正来自未受干扰的Lambert问题的解决方案的初始速度矢量。差分校正模块采用初始猜测并使用正向拍摄过程来进一步更新初始速度并准确地满足终端条件。分析了八种样本形式，并比较了解最佳形式，以培训在J2扰动的兰伯特问题上的神经网络。在代表性测试案例上证明了这种新方法的准确性和性能：Jupiter系统中的多转J2扰动兰伯特问题的解决方案。我们将对所提出的方法对经典标准拍摄方法和基于同型扰动Lambert算法的性能进行比较。结果表明，为了相当的精度水平，所提出的方法明显比其他两个更快。

translated by 谷歌翻译

Recursive Feasibility Guided Optimal Parameter Adaptation of Differential Convex Optimization Policies for Safety-Critical Systems

Hardik Parwana , Dimitra Panagou

分类：机器人

2021-09-22

基于二次程序（QP）基于状态反馈控制器，其不等式约束以控制障碍（CBFS）和Lyapunov函数的限制使用类-U \ Mathcal {K k} $函数其值的值，对其值的函数，对其值的参数敏感这些类 - $ \ MATHCAL {K} $ functions。但是，有效CBF的构建并不直接，对于QP的任意选择参数，系统轨迹可能会进入QP最终变得不可行的状态，或者可能无法实现所需的性能。在这项工作中，我们将控制合成问题作为差异策略提出，其参数在高级别的时间范围内被优化，从而导致双层优化常规。在不了解一组可行参数的情况下，我们开发了一种递归可行性引导的梯度下降方法来更新QP的参数，以便新解决方案至少和以前的解决方案的性能至少执行。通过将动力学系统视为有向图，随着时间的推移，这项工作提出了一种新颖的方式，可以通过（1）使用其解决方案的梯度来优化QP控制器在一个时间范围内对多个CBF的性能进行敏感性，从而提出了一种新的方式。分析，以及（2）将这些和系统动力学梯度进行反向传播，以更新参数，同时保持QPS的可行性。

translated by 谷歌翻译

Differential Flatness of Lifting-Wing Quadcopters Subject to Drag and Lift for Accurate Tracking

Shuai Wang , Wenhan Gao , Quan Quan

分类：机器人

2022-12-25

In this paper, we propose an effective unified control law for accurately tracking agile trajectories for lifting-wing quadcopters with different installation angles, which have the capability of vertical takeoff and landing (VTOL) as well as high-speed cruise flight. First, we derive a differential flatness transform for the lifting-wing dynamics with a nonlinear model under coordinated turn condition. To increase the tracking performance on agile trajectories, the proposed controller incorporates the state and input variables calculated from differential flatness as feedforward. In particular, the jerk, the 3-order derivative of the trajectory, is converted into angular velocity as a feedforward item, which significantly improves the system bandwidth. At the same time, feedback and feedforward outputs are combined to deal with external disturbances and model mismatch. The control algorithm has been thoroughly evaluated in the outdoor flight tests, which show that it can achieve accurate trajectory tracking.

translated by 谷歌翻译

Constructing Neural Network-Based Models for Simulating Dynamical Systems

Christian Møldrup Legaard , Thomas Schranz , Gerald Schweiger , Ján Drgoňa , Basak Falay , Cláudio Gomes , Alexandros Iosifidis , Mahdi Abkar , Peter Gorm Larsen

分类：机器学习

2021-11-02

动态系统参见在物理，生物学，化学等自然科学中广泛使用，以及电路分析，计算流体动力学和控制等工程学科。对于简单的系统，可以通过应用基本物理法来导出管理动态的微分方程。然而，对于更复杂的系统，这种方法变得非常困难。数据驱动建模是一种替代范式，可以使用真实系统的观察来了解系统的动态的近似值。近年来，对数据驱动的建模技术的兴趣增加，特别是神经网络已被证明提供了解决广泛任务的有效框架。本文提供了使用神经网络构建动态系统模型的不同方式的调查。除了基础概述外，我们还审查了相关的文献，概述了这些建模范式必须克服的数值模拟中最重要的挑战。根据审查的文献和确定的挑战，我们提供了关于有前途的研究领域的讨论。

translated by 谷歌翻译

Optimization-based Motion Planning for Multirotor Aerial Vehicles: a Review

Geesara Kulathunga , Alexandr Klimchik

分类：机器人

2022-08-31

通常，可以将最佳运动计划作为本地和全球执行。在这样的计划中，支持本地或全球计划技术的选择主要取决于环境条件是动态的还是静态的。因此，最适当的选择是与全球计划一起使用本地计划或本地计划。当设计最佳运动计划是本地或全球的时，要记住的关键指标是执行时间，渐近最优性，对动态障碍的快速反应。与其他方法相比，这种计划方法可以更有效地解决上述目标指标，例如路径计划，然后进行平滑。因此，这项研究的最重要目标是分析相关文献，以了解运动计划，特别轨迹计划，问题，当应用于实时生成最佳轨迹的多局部航空车（MAV），影响力（MAV）时如何提出问题。列出的指标。作为研究的结果，轨迹计划问题被分解为一组子问题，详细列出了解决每个问题的方法列表。随后，总结了2010年至2022年最突出的结果，并以时间表的形式呈现。

translated by 谷歌翻译

Contraction Theory for Nonlinear Stability Analysis and Learning-based Control: A Tutorial Overview

Hiroyasu Tsukamoto , Soon-Jo Chung , Jean-Jacques E. Slotine

分类：机器学习 | 机器人

2021-10-01

收缩理论是一种分析工具，用于研究以均匀的正面矩阵定义的收缩度量下的非自主（即，时变）非线性系统的差动动力学，其存在导致增量指数的必要和充分表征多种溶液轨迹彼此相互稳定性的稳定性。通过使用平方差分长度作为Lyapunov样功能，其非线性稳定性分析向下沸腾以找到满足以表达为线性矩阵不等式的稳定条件的合适的收缩度量，表明可以在众所周知的线性系统之间绘制许多平行线非线性系统理论与收缩理论。此外，收缩理论利用了与比较引理结合使用的指数稳定性的优越稳健性。这产生了基于神经网络的控制和估计方案的急需安全性和稳定性保证，而不借助使用均匀渐近稳定性的更涉及的输入到状态稳定性方法。这种独特的特征允许通过凸优化来系统构造收缩度量，从而获得了由于扰动和学习误差而在外部扰动的时变的目标轨迹和解决方案轨迹之间的距离上的明确指数界限。因此，本文的目的是介绍了收缩理论的课程概述及其在确定性和随机系统的非线性稳定性分析中的优点，重点导出了各种基于学习和数据驱动的自动控制方法的正式鲁棒性和稳定性保证。特别是，我们提供了使用深神经网络寻找收缩指标和相关控制和估计法的技术的详细审查。

translated by 谷歌翻译

DiffTune: Auto-Tuning through Auto-Differentiation

Sheng Cheng , Minkyung Kim , Lin Song , Zhuohuan Wu , Shenlong Wang , Naira Hovakimyan

分类：机器人

2022-09-20

机器人控制器的性能取决于其参数的选择，这需要仔细调整。在本文中，我们提出了DiFftune，这是一个新型，基于梯度的自动调整框架。我们的方法将动态系统和控制器作为计算图展开，并通过基于梯度的优化更新控制器参数。与常用的后传播方案不同，Difftune中的梯度是通过灵敏度传播获得的，这是一种与系统演化平行的前向模式自动分化技术。我们验证了杜宾汽车上提出的自动调节方法和在挑战性模拟环境中的四型旋转。仿真实验表明，该方法对于系统动力学和环境中的不确定性是可靠的，并且可以很好地推广到调整中看不见的轨迹。

translated by 谷歌翻译