It is well known that conservative mechanical systems exhibit local oscillatory behaviours due to their elastic and gravitational potentials, which completely characterise these periodic motions together with the inertial properties of the system. The classification of these periodic behaviours and their geometric characterisation are in an on-going secular debate, which recently led to the so-called eigenmanifold theory. The eigenmanifold characterises nonlinear oscillations as a generalisation of linear eigenspaces. With the motivation of performing periodic tasks efficiently, we use tools coming from this theory to construct an optimization problem aimed at inducing desired closed-loop oscillations through a state feedback law. We solve the constructed optimization problem via gradient-descent methods involving neural networks. Extensive simulations show the validity of the approach.
translated by 谷歌翻译
在这项工作中,我们利用神经网络(NNS)的通用近似特性来设计端口 - Hamiltonian(pH)框架中的完全致动机械系统的互连和阻尼分配(IDA)基于控制(PBC)方案。为此,我们将IDA-PBC方法转换为解决部分差分匹配方程的监督学习问题,并满足均衡分配和Lyapunov稳定条件。这是主要的结果,即学习算法的输出在被动和Lyapunov稳定性方面具有明确的控制理论解释。通过数值模拟验证了所提出的控制设计方法,用于1和两度自由度的机械系统。
translated by 谷歌翻译
如果机器人曾经实现与动物所展示的机器人相当的自动运动,则它们必须获得在损害,故障或环境条件下快速恢复运动行为的能力,从而损害了其有效移动的能力。我们提出了一种方法,该方法使我们的机器人和模拟机器人能够在几十次尝试中恢复自由运动行为的高度。我们的方法采用行为规范,以等级的差异约束来表达所需的行为。我们展示了如何通过编码模板来考虑这些约束,从而产生了将先前优化的行为推广到新情况下以快速学习的形式概括的秘诀。我们进一步说明,在数据驱动的上下文中,足够的限制通常很容易确定。作为例证,我们证明了我们在物理7 DOF六型六杆元机器人上的恢复方法,以及对6 DOF 2D运动机制的模拟。在这两种情况下,我们恢复了与先前优化的运动在功能上无法区分的行为。
translated by 谷歌翻译
Traditionally, robots are regarded as universal motion generation machines. They are designed mainly by kinematics considerations while the desired dynamics is imposed by strong actuators and high-rate control loops. As an alternative, one can first consider the robot's intrinsic dynamics and optimize it in accordance with the desired tasks. Therefore, one needs to better understand intrinsic, uncontrolled dynamics of robotic systems. In this paper we focus on periodic orbits, as fundamental dynamic properties with many practical applications. Algebraic topology and differential geometry provide some fundamental statements about existence of periodic orbits. As an example, we present periodic orbits of the simplest multi-body system: the double-pendulum in gravity. This simple system already displays a rich variety of periodic orbits. We classify these into three classes: toroidal orbits, disk orbits and nonlinear normal modes. Some of these we found by geometrical insights and some by numerical simulation and sampling.
translated by 谷歌翻译
机器人动态的准确模型对于新颖的操作条件安全和稳定控制和概括至关重要。然而,即使在仔细参数调谐后,手工设计的模型也可能是不够准确的。这激励了使用机器学习技术在训练集的状态控制轨迹上近似机器人动力学。根据其SE(3)姿势和广义速度,并满足能量原理的保护,描述了许多机器人的动态,包括地面,天线和水下车辆。本文提出了在神经常规差分方程(ODE)网络结构的SE(3)歧管上的HamiltonIAN制剂,以近似刚体的动态。与黑匣子颂网络相比,我们的配方通过施工保证了总节能。我们为学习的学习,潜在的SE(3)Hamiltonian动力学开发能量整形和阻尼注射控制,以实现具有各种平台的稳定和轨迹跟踪的统一方法,包括摆锤,刚体和四极其系统。
translated by 谷歌翻译
机器人社区在为软机器人设备建模提供的理论工具的复杂程度中看到了指数增长。已经提出了不同的解决方案以克服与软机器人建模相关的困难,通常利用其他科学学科,例如连续式机械和计算机图形。这些理论基础通常被认为是理所当然的,这导致复杂的文献,因此,从未得到完整审查的主题。Withing这种情况下,提交的文件的目标是双重的。突出显示涉及建模技术的不同系列的常见理论根源,采用统一语言,以简化其主要连接和差异的分析。因此,对上市接近自然如下,并最终提供在该领域的主要作品的完整,解开,审查。
translated by 谷歌翻译
在这项工作中,我们介绍了一个非线性动力学观点,可以为腿部系统的充满活力保守的模型生成和连接步态。特别是,我们表明,保守步态的集合构成了步态空间中局部定义的1D子手机的连接空间。这些歧管是通过能级的无坐标参数化的。我们提出了通过使用数值延续方法,生成集合和分叉点来识别步态家族的算法。为此,我们还介绍了数值实现的几个详细信息。最重要的是,我们为德拉斯斯矩阵建立了必要条件,以在影响范围内保持能量。我们工作的一个重要应用是简单的腿部运动模型,通常能够以几个自由度和少量的物理参数来捕获腿部运动的复杂性。我们证明了框架在具有四个自由度的单足料斗中的功效。
translated by 谷歌翻译
由于管理部分微分方程的半差异,例如通过有限元方法。这些系统的复杂性提出了直接应用自动控制的计算挑战。虽然模型还原已在控制中看到无处不在的应用,但在这种情况下使用非线性模型还原方法仍然很困难。问题在于在降低的订单模型中保留非线性动力学的结构,以进行高保真控制。在这项工作中,我们利用光谱亚曼佛(SSM)理论的最新进展来使模型在明确的假设下降低,以有效地合成反馈控制器。
translated by 谷歌翻译
机器学习中的许多新的发展都与基于梯度的优化方法相连。最近,已经使用变分透视研究了这些方法。这已经开辟了使用几何集成引入变分和辛方法的可能性。特别是,在本文中,我们引入了变分集成商,使我们能够导出不同的优化方法。使用汉密尔顿和拉格朗日 - 德尔尔堡的原则,我们在一对一的对应中获得了两个各自的优化方法的一个家庭,即概括Polyak的厚球和众所周知的Nesterov加速梯度方法,其中第二个是模仿行为的第二个对应首先减少经典动量方法的振荡。然而,由于考虑的系统是明确时间依赖的,因此自主系统的杂交的保存仅在这里发生在纤维上。几个实验举例说明结果。
translated by 谷歌翻译
众所周知,混乱的系统对预测的挑战是挑战,因为它们对时间的敏感性和由于阶梯时间而引起的错误和错误。尽管这种不可预测的行为,但对于许多耗散系统,长期轨迹的统计数据仍受到一套被称为全球吸引子的不变措施的管辖。对于许多问题,即使状态空间是无限的维度,该集合是有限维度的。对于马尔可夫系统,长期轨迹的统计特性由解决方案操作员唯一确定,该解决方案操作员将系统的演变映射到任意正时间增量上。在这项工作中,我们提出了一个机器学习框架,以学习耗散混沌系统的基础解决方案操作员,这表明所得的学习操作员准确地捕获了短期轨迹和长期统计行为。使用此框架,我们能够预测湍流Kolmogorov流动动力学的各种统计数据,雷诺数为5000。
translated by 谷歌翻译
由于其固有的非线性和高度的自由度,对连续体软机器人的建模和控制仍然是一项艰巨的任务。这些复杂性阻碍了适合实时控制的高保真模型的构建。尽管已经提出了各种模型和基于学习的方法来应对这些挑战,但它们缺乏普遍性,很少保留动态的结构。在这项工作中,我们提出了一种新的,数据驱动的方法,用于从数据中提取面向控制的模型。我们克服了上面概述的问题,并证明了我们对光谱次级减少(SSMR)的卓越性能 - \'a-vis the Art的状态。
translated by 谷歌翻译
Most impedance control schemes in robotics implement a desired passive impedance, allowing for stable interaction between the controlled robot and the environment. However, there is little guidance on the selection of the desired impedance. In general, finding the best stiffness and damping parameters is a challenging task. This paper contributes to this problem by connecting impedance control to robust control, with the goal of shaping the robot performances via feedback. We provide a method based on linear matrix inequalities with sparsity constraints to derive impedance controllers that satisfy a H-infinity performance criterion. Our controller guarantees passivity of the controlled robot and local performances near key poses.
translated by 谷歌翻译
In this thesis, we consider two simple but typical control problems and apply deep reinforcement learning to them, i.e., to cool and control a particle which is subject to continuous position measurement in a one-dimensional quadratic potential or in a quartic potential. We compare the performance of reinforcement learning control and conventional control strategies on the two problems, and show that the reinforcement learning achieves a performance comparable to the optimal control for the quadratic case, and outperforms conventional control strategies for the quartic case for which the optimal control strategy is unknown. To our knowledge, this is the first time deep reinforcement learning is applied to quantum control problems in continuous real space. Our research demonstrates that deep reinforcement learning can be used to control a stochastic quantum system in real space effectively as a measurement-feedback closed-loop controller, and our research also shows the ability of AI to discover new control strategies and properties of the quantum systems that are not well understood, and we can gain insights into these problems by learning from the AI, which opens up a new regime for scientific research.
translated by 谷歌翻译
动态系统参见在物理,生物学,化学等自然科学中广泛使用,以及电路分析,计算流体动力学和控制等工程学科。对于简单的系统,可以通过应用基本物理法来导出管理动态的微分方程。然而,对于更复杂的系统,这种方法变得非常困难。数据驱动建模是一种替代范式,可以使用真实系统的观察来了解系统的动态的近似值。近年来,对数据驱动的建模技术的兴趣增加,特别是神经网络已被证明提供了解决广泛任务的有效框架。本文提供了使用神经网络构建动态系统模型的不同方式的调查。除了基础概述外,我们还审查了相关的文献,概述了这些建模范式必须克服的数值模拟中最重要的挑战。根据审查的文献和确定的挑战,我们提供了关于有前途的研究领域的讨论。
translated by 谷歌翻译
稳定性和安全性是成功部署自动控制系统的关键特性。作为一个激励示例,请考虑在复杂的环境中自动移动机器人导航。概括到不同操作条件的控制设计需要系统动力学模型,鲁棒性建模错误以及对安全\ newzl {约束}的满意度,例如避免碰撞。本文开发了一个神经普通微分方程网络,以从轨迹数据中学习哈密顿系统的动态。学识渊博的哈密顿模型用于合成基于能量的被动性控制器,并分析其\ emph {鲁棒性},以在学习模型及其\ emph {Safety}中对环境施加的约束。考虑到系统的所需参考路径,我们使用虚拟参考调查员扩展了设计,以实现跟踪控制。州长国家是一个调节点,沿参考路径移动,平衡系统能级,模型不确定性界限以及违反安全性的距离,以确保稳健性和安全性。我们的哈密顿动力学学习和跟踪控制技术在\修订后的{模拟的己谐和四型机器人}在混乱的3D环境中导航。
translated by 谷歌翻译
这项研究提出了用于完善神经网络参数或进入连续时间动态系统的控制功能的增量校正方法,以提高解决方案精度,以满足对性能输出变量放置的临时点约束。所提出的方法是将其参数基线围绕基线值的动力学线性化,然后求解将扰动轨迹传输到特定时间点(即临时点)处所需的纠正输入。根据要调整的决策变量的类型,参数校正和控制功能校正方法将开发出来。这些增量校正方法可以用作补偿实时应用中预训练的神经网络的预测错误的手段,在实时应用中,必须在规定的时间点上高精度预测动态系统的准确性。在这方面,在线更新方法可用于增强有限摩托控制的整体靶向准确性,但使用神经政策受到点约束。数值示例证明了拟议方法在火星上的动力下降问题中的应用中的有效性。
translated by 谷歌翻译
Learning-enabled control systems have demonstrated impressive empirical performance on challenging control problems in robotics, but this performance comes at the cost of reduced transparency and lack of guarantees on the safety or stability of the learned controllers. In recent years, new techniques have emerged to provide these guarantees by learning certificates alongside control policies -- these certificates provide concise, data-driven proofs that guarantee the safety and stability of the learned control system. These methods not only allow the user to verify the safety of a learned controller but also provide supervision during training, allowing safety and stability requirements to influence the training process itself. In this paper, we provide a comprehensive survey of this rapidly developing field of certificate learning. We hope that this paper will serve as an accessible introduction to the theory and practice of certificate learning, both to those who wish to apply these tools to practical robotics problems and to those who wish to dive more deeply into the theory of learning for control.
translated by 谷歌翻译
通过连续静态状态反馈诱导的任务是在本文中考虑了非线性控制系统中的渐近稳定的杂核轨道。主要动机来自确保在欠抖动的机械系统中对所谓的点对点机动的收敛的问题。即,在其状态控制空间中平滑曲线,这与系统动态一致,并连接两个(线性)稳定的平衡点。该方法使用特定的参数化,以及在机动上的状态投影,以便为此目的结合两个线性化技术:沿轨道的边界的均衡和横向线性化的雅蟒线性化。这允许通过求解半纤维编程问题来计算稳定控制增益。由此产生的非线性控制器同时渐近轨道稳定轨道和最终平衡,是局部LipsChitz连续的时间不变,不需要切换,并且具有熟悉的馈送加上反馈状结构。该方法还通过基于同步函数的参数来互补,用于规划具有一定程度的疏松的机械系统的机械系统。 “蝴蝶”机器人在两点之间的球滚动的非预先生操纵任务的数值模拟证明了合成的功效。
translated by 谷歌翻译
收缩理论是一种分析工具,用于研究以均匀的正面矩阵定义的收缩度量下的非自主(即,时变)非线性系统的差动动力学,其存在导致增量指数的必要和充分表征多种溶液轨迹彼此相互稳定性的稳定性。通过使用平方差分长度作为Lyapunov样功能,其非线性稳定性分析向下沸腾以找到满足以表达为线性矩阵不等式的稳定条件的合适的收缩度量,表明可以在众所周知的线性系统之间绘制许多平行线非线性系统理论与收缩理论。此外,收缩理论利用了与比较引理结合使用的指数稳定性的优越稳健性。这产生了基于神经网络的控制和估计方案的急需安全性和稳定性保证,而不借助使用均匀渐近稳定性的更涉及的输入到状态稳定性方法。这种独特的特征允许通过凸优化来系统构造收缩度量,从而获得了由于扰动和学习误差而在外部扰动的时变的目标轨迹和解决方案轨迹之间的距离上的明确指数界限。因此,本文的目的是介绍了收缩理论的课程概述及其在确定性和随机系统的非线性稳定性分析中的优点,重点导出了各种基于学习和数据驱动的自动控制方法的正式鲁棒性和稳定性保证。特别是,我们提供了使用深神经网络寻找收缩指标和相关控制和估计法的技术的详细审查。
translated by 谷歌翻译
本文介绍了微型拍打翼无人机的数据驱动的最佳控制政策。首先,根据动力学的几何公式​​计算一组最佳轨迹,该动力学的几何公式​​捕获了大角度拍打运动与准稳态空气动力学之间的非线性耦合。然后,根据模仿学习的框架,它被转换为反馈控制系统。特别是,通过学习过程加入了附加的约束,以增强所得控制动力学的稳定性。与常规方法相比,所提出的约束模仿学习消除了在线生成其他最佳轨迹的需求,而无需牺牲稳定性。因此,计算效率大大提高。此外,这建立了第一个非线性控制系统,该系统稳定了旋转翼航空车辆的耦合纵向和横向动力学,而无需依赖平均或线性化。这些由数值示例说明,该示例的模拟模型受君主蝴蝶的启发。
translated by 谷歌翻译