智能论文笔记

Data-Driven Machine Learning Models for a Multi-Objective Flapping Fin Unmanned Underwater Vehicle Control System

Julian Lee , Kamal Viswanath , Jason Geder , Alisha Sharma , Marius Pruessner , Brian Zhou

分类：机器人 | 人工智能 | 机器学习

2022-09-14

flaping fin无人管理的水下车辆（UUV）推进系统为海军任务（例如监视和地形勘探）提供了高度机动性。最近的工作探索了时间序列神经网络替代模型的使用，以预测车辆设计和FIN运动学的推力。我们开发了一个基于搜索的逆模型，该模型利用运动学对神经网络模型进行控制系统设计。我们的反向模型找到了一组FIN运动学，其多目标目标是达到目标推力并在拍打周期之间创建平滑的运动学过渡。我们演示了整合此逆模型的控制系统如何使在线，周期周期调整以优先考虑不同的系统目标。

translated by 谷歌翻译

Shaping Individualized Impedance Landscapes for Gait Training via Reinforcement Learning

Yufeng Zhang , Shuai Li , Karen J. Nolan , Damiano Zanotto

分类：机器人

2021-09-05

促进辅助（AAN）控制旨在通过鼓励患者积极参与促进机器人辅助康复的治疗结果。大多数AAN控制器使用阻抗控制来在目标运动周围创建柔性的力字段，以确保在允许中等运动错误的同时进行跟踪精度。然而，由于控制力场的形状的参数通常根据关于关于对象学习能力的简单假设在线手动调整或在线调整，因此可以限制传统AAN控制器的有效性。在这项工作中，我们提出了一种新颖的自适应AAN控制器，其能够根据每个单独的电动机能力和任务要求自动重塑力场以相位相关的方式重塑力场。该拟议的控制器包括使用路径积分算法的修改策略改进，一种无模型的采样的增强学习方法，该方法实时地学习了特定于主题的阻抗景观，以及嵌入AAN PARADIGM的分层策略参数评估结构通过指定性能驱动的学习目标。通过跑步机培训课程通过具有能够在动力踝足矫形器的协助学习改变的步态模式的跑步机培训课程，通过跑步机培训课程进行实验验证，拟议的控制策略及其促进短期运动适应能力的适应性。

translated by 谷歌翻译

Learning Modular Robot Control Policies

Julian Whitman , Matthew Travers , Howie Choset

分类：机器人 | 机器学习

2021-05-20

模块化机器人可以在每天重新排列到新设计中，通过为每项新任务形成定制机器人来处理各种各样的任务。但是，重新配置的机制是不够的：每个设计还需要自己独特的控制策略。人们可以从头开始为每个新设计制作一个政策，但这种方法不可扩展，特别是给出了甚至一小组模块可以生成的大量设计。相反，我们创建了一个模块化策略框架，策略结构在硬件排列上有调节，并仅使用一个培训过程来创建控制各种设计的策略。我们的方法利用了模块化机器人的运动学可以表示为设计图，其中节点作为模块和边缘作为它们之间的连接。给定机器人，它的设计图用于创建具有相同结构的策略图，其中每个节点包含一个深神经网络，以及通过共享参数的相同类型共享知识的模块（例如，Hexapod上的所有腿都相同网络参数）。我们开发了一种基于模型的强化学习算法，交织模型学习和轨迹优化，以培训策略。我们展示了模块化政策推广到培训期间没有看到的大量设计，没有任何额外的学习。最后，我们展示了与模拟和真实机器人一起控制各种设计的政策。

translated by 谷歌翻译

Learning agile and dynamic motor skills for legged robots

Jemin Hwangbo , Joonho Lee , Alexey Dosovitskiy , Dario Bellicoso , Vassilios Tsounis , Vladlen Koltun , Marco Hutter

分类：

2019-01-24

Legged robots pose one of the greatest challenges in robotics. Dynamic and agile maneuvers of animals cannot be imitated by existing methods that are crafted by humans. A compelling alternative is reinforcement learning, which requires minimal craftsmanship and promotes the natural evolution of a control policy. However, so far, reinforcement learning research for legged robots is mainly limited to simulation, and only few and comparably simple examples have been deployed on real systems. The primary reason is that training with real robots, particularly with dynamically balancing systems, is complicated and expensive. In the present work, we report a new method for training a neural network policy in simulation and transferring it to a state-of-the-art legged system, thereby we leverage fast, automated, and cost-effective data generation schemes. The approach is applied to the ANYmal robot, a sophisticated medium-dog-sized quadrupedal system. Using policies trained in simulation, the quadrupedal machine achieves locomotion skills that go beyond what had been achieved with prior methods: ANYmal is capable of precisely and energy-efficiently following high-level body velocity commands, running faster than ever before, and recovering from falling even in complex configurations.

translated by 谷歌翻译

Neural Approaches to Co-Optimization in Robotics

Charles Schaff

分类：机器人

2022-09-01

机器人和与世界相互作用或互动的机器人和智能系统越来越多地被用来自动化各种任务。这些系统完成这些任务的能力取决于构成机器人物理及其传感器物体的机械和电气部件，例如，感知算法感知环境，并计划和控制算法以生产和控制算法来生产和控制算法有意义的行动。因此，通常有必要在设计具体系统时考虑这些组件之间的相互作用。本文探讨了以端到端方式对机器人系统进行任务驱动的合作的工作，同时使用推理或控制算法直接优化了系统的物理组件以进行任务性能。我们首先考虑直接优化基于信标的本地化系统以达到本地化准确性的问题。设计这样的系统涉及将信标放置在整个环境中，并通过传感器读数推断位置。在我们的工作中，我们开发了一种深度学习方法，以直接优化信标的放置和位置推断以达到本地化精度。然后，我们将注意力转移到了由任务驱动的机器人及其控制器优化的相关问题上。在我们的工作中，我们首先提出基于多任务增强学习的数据有效算法。我们的方法通过利用能够在物理设计的空间上概括设计条件的控制器，有效地直接优化了物理设计和控制参数，以直接优化任务性能。然后，我们对此进行跟进，以允许对离散形态参数（例如四肢的数字和配置）进行优化。最后，我们通过探索优化的软机器人的制造和部署来得出结论。

translated by 谷歌翻译

HTML版本

Walk These Ways: Tuning Robot Control for Generalization with Multiplicity of Behavior

Gabriel B Margolis , Pulkit Agrawal

分类：机器人 | 人工智能 | 机器学习

2022-12-06

Learned locomotion policies can rapidly adapt to diverse environments similar to those experienced during training but lack a mechanism for fast tuning when they fail in an out-of-distribution test environment. This necessitates a slow and iterative cycle of reward and environment redesign to achieve good performance on a new task. As an alternative, we propose learning a single policy that encodes a structured family of locomotion strategies that solve training tasks in different ways, resulting in Multiplicity of Behavior (MoB). Different strategies generalize differently and can be chosen in real-time for new tasks or environments, bypassing the need for time-consuming retraining. We release a fast, robust open-source MoB locomotion controller, Walk These Ways, that can execute diverse gaits with variable footswing, posture, and speed, unlocking diverse downstream tasks: crouching, hopping, high-speed running, stair traversal, bracing against shoves, rhythmic dance, and more. Video and code release: https://gmargo11.github.io/walk-these-ways/

translated by 谷歌翻译

On the development of a Bayesian optimisation framework for complex unknown systems

Mike Diessner , Yu Guan , Kevin J. Wilson , Richard D. Whalley

分类：机器学习

2022-07-19

贝叶斯优化提供了一种优化昂贵黑匣子功能的有效方法。它最近已应用于流体动力学问题。本文研究并在一系列合成测试函数上从经验上比较了常见的贝叶斯优化算法。它研究了采集函数和训练样本数量的选择，采集功能的精确计算以及基于蒙特卡洛的方法以及单点和多点优化。该测试功能被认为涵盖了各种各样的挑战，因此是理想的测试床，以了解贝叶斯优化的性能，并确定贝叶斯优化表现良好和差的一般情况。这些知识可以用于应用程序中，包括流体动力学的知识，这些知识是未知的。这项调查的结果表明，要做出的选择与相对简单的功能不相关，而乐观的采集功能（例如上限限制）应首选更复杂的目标函数。此外，蒙特卡洛方法的结果与分析采集函数的结果相当。在目标函数允许并行评估的情况下，多点方法提供了更快的替代方法，但它可能需要进行更多的客观函数评估。

translated by 谷歌翻译

Toward smart composites: small-scale, untethered prediction and control for soft sensor/actuator systems

Sarah Aguasvivas Manzano , Vani Sundaram , Artemis Xu , Khoi Ly , Mark Rentschler , Robert Shepherd , Nikolaus Correll

分类：机器人 | 机器学习

2022-05-22

我们提供了公式和开源工具，以使用学识渊博的前动力学和设备计算来实现传感器/执行器系统的内部模型预测控制。微控制器单元（MCUS）在与传感器和执行器共关联时计算预测和控制任务的微控制器单元（MCUS）可以实现内部不受束缚的行为。在这种方法中，小型参数大小神经网络模型离线学习前进运动学。我们的开源编译器NN4MC生成代码以将这些预测卸载到MCUS上。然后，牛顿 - 拉夫森求解器实时计算控件输入。我们首先基准在质量 - 弹簧抑制剂模拟上针对PID控制器的这种非线性控制方法。然后，我们在两个具有不同传感，驱动和计算硬件的实验钻机上研究实验结果：具有嵌入式照明传感器的基于肌腱的平台和带有磁性传感器的基于HASEL的平台。实验结果表明，具有较小的内存足迹（小于或等于闪存的6.4％）的参考路径（大于或等于120 Hz）的有效高带宽跟踪。在基于肌腱的平台中，测得的误差之后路径不超过2mm。在基于HASEL的平台中，模拟路径以下误差不超过1mm。这种方法在ARM Cortex-M4F设备中的平均功耗为45.4 MW。这种控制方法还与Tensorflow Lite模型和等效的在设备代码兼容。内物质智能使一类新的复合材料将自主权注入具有精制人工本体感受的结构和系统。

translated by 谷歌翻译

Recent Approaches for Perceptive Legged Locomotion

Hersh Sanghvi

分类：机器人

2022-09-21

随着腿部机器人和嵌入式计算都变得越来越有能力，研究人员已经开始专注于这些机器人的现场部署。在非结构化环境中的强大自治需要对机器人周围的世界感知，以避免危害。但是，由于处理机车动力学所需的复杂规划人员和控制器，因此在网上合并在线的同时在线保持敏捷运动对腿部机器人更具挑战性。该报告将比较三种最新的感知运动方法，并讨论可以使用视觉来实现腿部自主权的不同方式。

translated by 谷歌翻译

Learning Control Policies for Fall prevention and safety in bipedal locomotion

Visak Kumar

分类：机器人 | 人工智能

2022-01-04

从意外的外部扰动中恢复的能力是双模型运动的基本机动技能。有效的答复包括不仅可以恢复平衡并保持稳定性的能力，而且在平衡恢复物质不可行时，也可以保证安全的方式。对于与双式运动有关的机器人，例如人形机器人和辅助机器人设备，可帮助人类行走，设计能够提供这种稳定性和安全性的控制器可以防止机器人损坏或防止伤害相关的医疗费用。这是一个具有挑战性的任务，因为它涉及用触点产生高维，非线性和致动系统的高动态运动。尽管使用基于模型和优化方法的前进方面，但诸如广泛领域知识的要求，诸如较大的计算时间和有限的动态变化的鲁棒性仍然会使这个打开问题。在本文中，为了解决这些问题，我们开发基于学习的算法，能够为两种不同的机器人合成推送恢复控制政策：人形机器人和有助于双模型运动的辅助机器人设备。我们的工作可以分为两个密切相关的指示：1）学习人形机器人的安全下降和预防策略，2）使用机器人辅助装置学习人类的预防策略。为实现这一目标，我们介绍了一套深度加强学习（DRL）算法，以学习使用这些机器人时提高安全性的控制策略。

translated by 谷歌翻译

Egocentric Visual Self-Modeling for Legged Robot Locomotion

Yuhang Hu , Boyuan Chen , Hod Lipson

分类：机器人

2022-07-07

惯性测量单元（IMU）在机器人研究中无处不在。它为机器人提供了姿势信息，以实现平衡和导航。但是，人类和动物可以在没有精确的方向或位置值的情况下感知其身体在环境中的运动。这种互动固有地涉及感知和动作之间的快速反馈回路。这项工作提出了一种端到端方法，该方法使用高维视觉观察和动作命令来训练视觉自模型进行腿部运动。视觉自模型学习机器人身体运动与地面纹理之间的空间关系从图像序列变化。我们证明机器人可以利用视觉自模型来实现机器人在训练过程中看不见的现实环境中的各种运动任务。通过我们提出的方法，机器人可以在没有IMU的情况下或在没有GPS或弱地磁场的环境中进行运动，例如该市的室内和Urban Canyons。

translated by 谷歌翻译

Context-Aware Target Classification with Hybrid Gaussian Process prediction for Cooperative Vehicle Safety systems

Rodolfo Valiente , Arash Raftari , Hossein Nourkhiz Mahjoub , Mahdi Razzaghpour , Syed K. Mahmud , Yaser P. Fallah

分类：机器人 | 人工智能

2022-12-24

Vehicle-to-Everything (V2X) communication has been proposed as a potential solution to improve the robustness and safety of autonomous vehicles by improving coordination and removing the barrier of non-line-of-sight sensing. Cooperative Vehicle Safety (CVS) applications are tightly dependent on the reliability of the underneath data system, which can suffer from loss of information due to the inherent issues of their different components, such as sensors failures or the poor performance of V2X technologies under dense communication channel load. Particularly, information loss affects the target classification module and, subsequently, the safety application performance. To enable reliable and robust CVS systems that mitigate the effect of information loss, we proposed a Context-Aware Target Classification (CA-TC) module coupled with a hybrid learning-based predictive modeling technique for CVS systems. The CA-TC consists of two modules: A Context-Aware Map (CAM), and a Hybrid Gaussian Process (HGP) prediction system. Consequently, the vehicle safety applications use the information from the CA-TC, making them more robust and reliable. The CAM leverages vehicles path history, road geometry, tracking, and prediction; and the HGP is utilized to provide accurate vehicles' trajectory predictions to compensate for data loss (due to communication congestion) or sensor measurements' inaccuracies. Based on offline real-world data, we learn a finite bank of driver models that represent the joint dynamics of the vehicle and the drivers' behavior. We combine offline training and online model updates with on-the-fly forecasting to account for new possible driver behaviors. Finally, our framework is validated using simulation and realistic driving scenarios to confirm its potential in enhancing the robustness and reliability of CVS systems.

translated by 谷歌翻译

Perceptive Locomotion through Nonlinear Model Predictive Control

Ruben Grandia , Fabian Jenelten , Shaohui Yang , Farbod Farshidian , Marco Hutter

分类：机器人

2022-08-17

在粗糙的地形上的动态运动需要准确的脚部放置，避免碰撞以及系统的动态不足的计划。在存在不完美且常常不完整的感知信息的情况下，可靠地优化此类动作和互动是具有挑战性的。我们提出了一个完整的感知，计划和控制管道，可以实时优化机器人所有自由度的动作。为了减轻地形所带来的数值挑战，凸出不平等约束的顺序被提取为立足性可行性的局部近似值，并嵌入到在线模型预测控制器中。每个高程映射预先计算了步骤性分类，平面分割和签名的距离场，以最大程度地减少优化过程中的计算工作。多次射击，实时迭代和基于滤波器的线路搜索的组合用于可靠地以高速率解决该法式问题。我们在模拟中的间隙，斜率和踏上石头的情况下验证了所提出的方法，并在Anymal四倍的平台上进行实验，从而实现了最新的动态攀登。

translated by 谷歌翻译

BiConMP: A Nonlinear Model Predictive Control Framework for Whole Body Motion Planning

Avadesh Meduri , Paarth Shah , Julian Viereck , Majid Khadiv , Ioannis Havoutis , Ludovic Righetti

分类：机器人

2022-01-19

由于机器人动力学中的固有非线性，腿部机器人全身动作的在线计划具有挑战性。在这项工作中，我们提出了一个非线性MPC框架，该框架可以通过有效利用机器人动力学结构来在线生成全身轨迹。Biconmp用于在真正的四倍机器人上生成各种环状步态，其性能在不同的地形上进行了评估，对抗不同步态之间的不可预见的推动力并在线过渡。此外，提出了双孔在机器人上产生非平凡无环的全身动态运动的能力。同样的方法也被用来在人体机器人（TALOS）上产生MPC的各种动态运动，并在模拟中产生另一个四倍的机器人（Anymal）。最后，报告并讨论了对计划范围和频率对非线性MPC框架的影响的广泛经验分析。

translated by 谷歌翻译

Supervised learning for improving the accuracy of robot-mounted 3D camera applied to human gait analysis

Diego Guffanti , Alberto Brunete , Miguel Hernando , David Álvarez , Javier Rueda , Enrique Navarro

分类：计算机视觉 | 人工智能

2022-07-03

由于它们过去证明的准确性较低，因此对3D摄像机进行步态分析的使用受到了高度质疑。本文介绍的研究的目的是提高机器人安装在人体步态分析中的估计的准确性，通过应用监督的学习阶段。 3D摄像头安装在移动机器人中，以获得更长的步行距离。这项研究表明，通过使用从认证的Vicon系统获得的数据训练的人工神经网络对相机的原始估计进行后处理，从而改善了运动步态信号和步态描述符的检测。为此，招募了37名健康参与者，并使用ORBBEC ASTRA 3D摄像头收集了207个步态序列的数据。有两种基本的训练方法：使用运动学步态信号并使用步态描述符。前者试图通过减少误差并增加相对于Vicon系统的相关性来改善运动步态信号的波形。第二个是一种更直接的方法，专注于直接使用步态描述符训练人工神经网络。在训练之前和之后测量了3D摄像头的精度。在两种训练方法中，都观察到了改进。运动步态信号显示出较低的错误和相对于地面真理的较高相关性。检测步态描述符的系统的准确性也显示出很大的改进，主要是运动学描述符，而不是时空。在比较两种训练方法时，不可能定义哪个是绝对最好的。因此，我们认为，培训方法的选择将取决于要进行的研究的目的。这项研究揭示了3D摄像机的巨大潜力，并鼓励研究界继续探索他们在步态分析中的使用。

translated by 谷歌翻译

Environment-based Assistance Modulation for a Hip Exosuit via Computer Vision

Enrica Tricomi , Mirko Mossini , Francesco Missiroli , Nicola Lotti , Michele Xiloyannis , Loris Roveda , Lorenzo Masia

分类：机器人

2022-11-28

Just like in humans vision plays a fundamental role in guiding adaptive locomotion, when designing the control strategy for a walking assistive technology, Computer Vision may bring substantial improvements when performing an environment-based assistance modulation. In this work, we developed a hip exosuit controller able to distinguish among three different walking terrains through the use of an RGB camera and to adapt the assistance accordingly. The system was tested with seven healthy participants walking throughout an overground path comprising of staircases and level ground. Subjects performed the task with the exosuit disabled (Exo Off), constant assistance profile (Vision Off ), and with assistance modulation (Vision On). Our results showed that the controller was able to promptly classify in real-time the path in front of the user with an overall accuracy per class above the 85%, and to perform assistance modulation accordingly. Evaluation related to the effects on the user showed that Vision On was able to outperform the other two conditions: we obtained significantly higher metabolic savings than Exo Off, with a peak of about -20% when climbing up the staircase and about -16% in the overall path, and than Vision Off when ascending or descending stairs. Such advancements in the field may yield to a step forward for the exploitation of lightweight walking assistive technologies in real-life scenarios.

translated by 谷歌翻译

Autonomous Aerial Delivery Vehicles, a Survey of Techniques on how Aerial Package Delivery is Achieved

Jack Saunders , Sajad Saeedi , Wenbin Li

分类：机器人

2021-10-06

在过去的十年中，自动驾驶航空运输车辆引起了重大兴趣。这是通过空中操纵器和新颖的握手的技术进步来实现这一目标的。此外，改进的控制方案和车辆动力学能够更好地对有效载荷进行建模和改进的感知算法，以检测无人机（UAV）环境中的关键特征。在这项调查中，对自动空中递送车辆的技术进步和开放研究问题进行了系统的审查。首先，详细讨论了各种类型的操纵器和握手，以及动态建模和控制方法。然后，讨论了降落在静态和动态平台上的。随后，诸如天气状况，州估计和避免碰撞之类的风险以确保安全过境。最后，调查了交付的UAV路由，该路由将主题分为两个领域：无人机操作和无人机合作操作。

translated by 谷歌翻译

Model Predictive Control with Environment Adaptation for Legged Locomotion

Niraj Rathod , Angelo Bratta , Michele Focchi , Mario Zanon , Octavio Villarreal , Claudio Semini , Alberto Bemporad

分类：机器人

2021-05-12

在腿的运动中重新规划对于追踪所需的用户速度，在适应地形并拒绝外部干扰的同时至关重要。在这项工作中，我们提出并测试了实验中的实时非线性模型预测控制（NMPC），用于腿部机器人，以实现各种地形上的动态运动。我们引入了一种基于移动性的标准来定义NMPC成本，增强了二次机器人的运动，同时最大化腿部移动性并提高对地形特征的适应。我们的NMPC基于实时迭代方案，使我们能够以25美元的价格重新计划在线，\ Mathrm {Hz} $ 2 $ 2 $ 2美元的预测地平线。我们使用在质量框架中心中定义的单个刚体动态模型，以提高计算效率。在仿真中，测试NMPC以横穿一组不同尺寸的托盘，走进V形烟囱，并在崎岖的地形上招揽。在真实实验中，我们展示了我们的NMPC与移动功能的有效性，使IIT为87美元\，\ Mathrm {kg} $四分之一的机器人HIQ，以实现平坦地形上的全方位步行，横穿静态托盘，并适应在散步期间重新定位托盘。

translated by 谷歌翻译

Fast and Efficient Locomotion via Learned Gait Transitions

Yuxiang Yang , Tingnan Zhang , Erwin Coumans , Jie Tan , Byron Boots

分类：机器人 | 机器学习

2021-04-09

我们专注于开发Quadrupedal机器人节能控制器的问题。动物可以以不同的速度积极切换Gaits以降低其能量消耗。在本文中，我们设计了一个分层学习框架，其中独特的运动遗传仪和自然步态过渡自动出现，其能量最小化的简单奖励。我们使用进化策略来培训一个高级步态政策，指定每只脚的步态图案，而低级凸MPC控制器优化电机命令，以便机器人可以使用该步态图案以所需的速度行走。我们在四足机器人上测试我们的学习框架，并展示了自动步态过渡，从步行到小跑和飞行，因为机器人增加了速度。我们表明学习的等级控制器在广泛的运动速度范围内消耗的能量要少于基线控制器。

translated by 谷歌翻译

A general locomotion control framework for serially connected multi-legged robots

Baxi Chong , Yasemin O. Aydin , Jennifer M. Rieser , Guillaume Sartoretti , Tianyu Wang , Julian Whitman , Abdul Kaba , Enes Aydin , Ciera McFarland , Howie Choset

分类：机器人

2021-12-01

串联连接的机器人是希望在大规模灾害中的搜索和救援等限制空间中执行任务的候选人。这种机器人通常是韧带，我们假设肢体的添加可以改善移动性。然而，在设计和控制这种装置方面的挑战在于以提高移动性的方式协调高维冗余模块。在这里，我们开发了一个控制串联连接的多腿机器人的一般框架。具体地，我们结合了两种方法来构建一般的形状控制方案，其可以为各种机器人形态的有效运动提供自变形（“Gaits”）的基线模式。首先，我们从维度降低和生物步态分类方案中获取灵感，以产生身体变形和脚提升/降低的循环模式，其促进了任意基板接触图案的产生。其次，我们使用几何力学方法来促进识别这些起伏的最佳相位，以最大化速度和/或稳定性。我们的方案允许在扁平摩擦地形上的多腿机器人机车上的有效Gaits开发有多种数量的四肢（4,6,16，甚至0四肢）和身体致动能力（包括在Limbless设备上的侧壁Gaits）。通过适当协调身体波动和腿部放置，我们的框架结合了Limbless机器人（模块化）和腿机器人（移动性）的优势。我们预计我们的框架可以提供一般的控制方案，以便快速部署一般的多腿机器人，铺平往达在现实条件下遍历复杂环境的机器的方式。

translated by 谷歌翻译