通过学习可变阻抗控制策略,机器人助手可以智能地调整其操纵合规性,以确保在人机交互环境中操作时安全交互和适当的任务完成。在本文中,我们提出了一种基于DMP的框架,其学习和概括人类示范的可变阻抗操纵技能。该框架改善了对环境变化的机器人$'$适应性(即抓地机器人末端效应器上的抓握对象的重量和形状变化)并继承了基于演示 - 方差的刚度估计方法的效率。此外,利用我们的刚度估计方法,我们不仅产生翻译刚度型材,而且产生旋转刚度轮廓,这些轮廓在大多数学习可变阻抗控制论文中被忽略或不完整。已经进行了7 DOF冗余机器人操纵器的现实世界实验,以验证我们框架的有效性。
translated by 谷歌翻译
本文为复杂和物理互动的任务提供了用于移动操纵器的混合学习和优化框架。该框架利用了入学型物理接口,以获得直观而简化的人类演示和高斯混合模型(GMM)/高斯混合物回归(GMR),以根据位置,速度和力剖面来编码和生成学习的任务要求。接下来,使用GMM/GMR生成的所需轨迹和力剖面,通过用二次程序加强能量箱增强笛卡尔阻抗控制器的阻抗参数可以在线优化,以确保受控系统的消极性。进行了两个实验以验证框架,将我们的方法与两种恒定刚度(高和低)的方法进行了比较。结果表明,即使在存在诸如意外的最终效应碰撞等干扰的情况下,该方法在轨迹跟踪和生成的相互作用力方面都优于其他两种情况。
translated by 谷歌翻译
本文提出了一种以非零速度的效果友好型捕捉对象的混合优化和学习方法。通过受约束的二次编程问题,该方法生成最佳轨迹,直至机器人和对象之间的接触点,以最小化其相对速度并减少初始影响力。接下来,生成的轨迹是由基于人类的捕捉演示的旋风动作原始词更新的,以确保围绕接口点的平稳过渡。此外,学习的人类可变刚度(HVS)被发送到机器人的笛卡尔阻抗控制器,以吸收后影响力并稳定捕获位置。进行了三个实验,以将我们的方法与固定位置阻抗控制器(FP-IC)进行比较。结果表明,所提出的方法的表现优于FP-IC,同时添加HVS可以更好地吸收影响后力。
translated by 谷歌翻译
在本次调查中,我们介绍了执行需要不同于环境的操作任务的机器人的当前状态,使得机器人必须隐含地或明确地控制与环境的接触力来完成任务。机器人可以执行越来越多的人体操作任务,并且在1)主题上具有越来越多的出版物,其执行始终需要联系的任务,并且通过利用完美的任务来减轻环境来缓解不确定性信息,可以在没有联系的情况下进行。最近的趋势已经看到机器人在留下的人类留给人类,例如按摩,以及诸如PEG孔的经典任务中,对其他类似任务的概率更有效,更好的误差容忍以及更快的规划或学习任务。因此,在本调查中,我们涵盖了执行此类任务的机器人的当前阶段,从调查开始所有不同的联系方式机器人可以执行,观察这些任务是如何控制和表示的,并且最终呈现所需技能的学习和规划完成这些任务。
translated by 谷歌翻译
每日操纵任务的特征是与动作和对象形状相关的几何基原始人。这样的几何描述符仅通过使用笛卡尔坐标系统而差异很差。在本文中,我们提出了一种学习方法,以从坐标系词典中提取最佳表示,以编码观察到的运动/行为。这是通过在Riemannian歧管上使用高斯分布的扩展来实现的,该分布用于通过将多个几何形状作为任务的候选表示来分析一组用户演示。我们根据迭代线性二次调节器(ILQR)提出了复制问题作为一般最佳控制问题,其中使用提取的坐标系中的高斯分布来定义成本函数。我们将方法应用于模拟和7轴Franka Emika机器人中的对象抓握和箱式打开任务。结果表明,机器人可以利用几个几何形状来执行操纵任务并将其推广到新情况下,通过维护感兴趣的坐标系中任务的不变特征。
translated by 谷歌翻译
在本文中,我们提出了一种学习稳定的动力学系统的方法,该系统在里曼尼亚歧管上不断发展。该方法利用数据效率的程序来学习差异转换,该过程将简单的稳定动力系统映射到复杂的机器人技能上。通过从差异几何形状中利用数学工具,该方法可确保学习的技能满足基础歧管所施加的几何约束,例如用于方向和SPD的刚度矩阵,同时将逆转性保留到给定的目标。首先在公共基准上的模拟中测试了所提出的方法,该方法通过将笛卡尔数据投射到UQ和SPD歧管中,并与现有方法进行了比较。除了评估公共基准测试的方法外,还对在不同条件下进行瓶子的真正机器人进行了几项实验,并与人类操作员合作进行了钻井任务。评估在学习准确性和任务适应能力方面显示出令人鼓舞的结果。
translated by 谷歌翻译
在本文中,我们讨论了通过模仿教授双人操作任务的框架。为此,我们提出了一种从人类示范中学习合规和接触良好的机器人行为的系统和算法。提出的系统结合了入学控制和机器学习的见解,以提取控制政策,这些政策可以(a)从时空和空间中恢复并适应各种干扰,同时(b)有效利用与环境的物理接触。我们使用现实世界中的插入任务证明了方法的有效性,该任务涉及操纵对象和插入钉之间的多个同时接触。我们还研究了为这种双人设置收集培训数据的有效方法。为此,我们进行了人类受试者的研究,并分析用户报告的努力和精神需求。我们的实验表明,尽管很难提供,但在遥控演示中可用的其他力/扭矩信息对于阶段估计和任务成功至关重要。最终,力/扭矩数据大大提高了操纵鲁棒性,从而在多点插入任务中获得了90%的成功率。可以在https://bimanualmanipulation.com/上找到代码和视频
translated by 谷歌翻译
通过改变肌肉僵硬来适应符合性的能力对于人类灵巧的操纵技巧至关重要。在机器人电动机控制中纳入合规性对于执行具有人级敏捷性的现实力量相互作用任务至关重要。这项工作为合规机器人操作提供了一个深层的模型预测性变量阻抗控制器,该阻抗操纵结合了可变阻抗控制与模型预测控制(MPC)。使用最大化信息增益的勘探策略学习了机器人操纵器的广义笛卡尔阻抗模型。该模型在MPC框架内使用,以适应低级变量阻抗控制器的阻抗参数,以实现针对不同操纵任务的所需合规性行为,而无需进行任何重新培训或填充。使用Franka Emika Panda机器人操纵器在模拟和实际实验中运行的操作,使用Franka Emika Panda机器人操纵器评估深层模型预测性变量阻抗控制方法。将所提出的方法与无模型和基于模型的强化方法进行了比较,以可变阻抗控制,以进行任务和性能之间的可传递性。
translated by 谷歌翻译
Imitation learning approaches achieve good generalization within the range of the training data, but tend to generate unpredictable motions when querying outside this range. We present a novel approach to imitation learning with enhanced extrapolation capabilities that exploits the so-called Equation Learner Network (EQLN). Unlike conventional approaches, EQLNs use supervised learning to fit a set of analytical expressions that allows them to extrapolate beyond the range of the training data. We augment the task demonstrations with a set of task-dependent parameters representing spatial properties of each motion and use them to train the EQLN. At run time, the features are used to query the Task-Parameterized Equation Learner Network (TP-EQLN) and generate the corresponding robot trajectory. The set of features encodes kinematic constraints of the task such as desired height or a final point to reach. We validate the results of our approach on manipulation tasks where it is important to preserve the shape of the motion in the extrapolation domain. Our approach is also compared with existing state-of-the-art approaches, in simulation and in real setups. The experimental results show that TP-EQLN can respect the constraints of the trajectory encoded in the feature parameters, even in the extrapolation domain, while preserving the overall shape of the trajectory provided in the demonstrations.
translated by 谷歌翻译
机器人将机器人的无缝集成到人类环境需要机器人来学习如何使用现有的人类工具。学习工具操纵技能的目前方法主要依赖于目标机器人环境中提供的专家演示,例如,通过手动引导机器人操纵器或通过远程操作。在这项工作中,我们介绍了一种自动化方法,取代了一个专家演示,用YouTube视频来学习工具操纵策略。主要贡献是双重的。首先,我们设计一个对齐过程,使模拟环境与视频中观察到的真实世界。这是作为优化问题,找到刀具轨迹的空间对齐,以最大化环境给出的稀疏目标奖励。其次,我们描述了一种专注于工具的轨迹而不是人类的运动的模仿学习方法。为此,我们将加强学习与优化过程相结合,以基于对准环境中的工具运动来找到控制策略和机器人的放置。我们展示了仿真中的铲子,镰刀和锤子工具的建议方法,并展示了训练有素的政策对真正的弗兰卡·埃米卡熊猫机器人示范的卫生政策的有效性。
translated by 谷歌翻译
我们描述了更改 - 联系机器人操作任务的框架,要求机器人与对象和表面打破触点。这种任务的不连续交互动态使得难以构建和使用单个动力学模型或控制策略,并且接触变化期间动态的高度非线性性质可能对机器人和物体造成损害。我们提出了一种自适应控制框架,使机器人能够逐步学习以预测更改联系人任务中的接触变化,从而了解了碎片连续系统的交互动态,并使用任务空间可变阻抗控制器提供平滑且精确的轨迹跟踪。我们通过实验比较我们框架的表现,以确定所需的代表性控制方法,以确定我们框架的自适应控制和增量学习组件需要在变化 - 联系机器人操纵任务中存在不连续动态的平稳控制。
translated by 谷歌翻译
本文提出了一种新颖的互动计划方法,该方法仅使用触觉信息来利用阻抗调谐技术,以应对环境不确定性和不可预测的条件。拟议的算法根据与环境的触觉互动并根据需要调整计划策略的触觉计划。考虑了两种方法:探索和弹跳策略。勘探策略在计划中考虑了机器人的实际运动,而弹跳策略则利用了机器人的力量和运动向量。此外,根据计划的轨迹进行自我调整阻抗,以确保合规接触和低接触力。为了显示拟议方法论的性能,进行了两个具有扭矩控制器机器人臂的实验。第一个认为没有障碍的迷宫探索,而第二个包括障碍。在两种情况下,分析了提出的方法性能并与先前提出的解决方案进行比较。实验结果表明:i)机器人可以根据与环境的相互作用在最可行的方向上成功地计划其轨迹,ii)尽管达到了不确定性,但与未知环境的合规性相互作用。最后,进行了可伸缩性演示,以显示在多种情况下提出的方法的潜力。
translated by 谷歌翻译
我们解决了使四足机器人能够使用强化学习在现实世界中执行精确的射击技巧的问题。开发算法使腿部机器人能够向给定的目标射击足球,这是一个具有挑战性的问题,它将机器人运动控制和计划结合到一项任务中。为了解决这个问题,我们需要考虑控制动态腿部机器人期间的动态限制和运动稳定性。此外,我们需要考虑运动计划,以在地面上射击难以模拟的可变形球,并不确定摩擦到所需的位置。在本文中,我们提出了一个层次结构框架,该框架利用深厚的强化学习来训练(a)强大的运动控制政策,可以跟踪任意动议,以及(b)一项计划政策,以决定所需的踢球运动将足球射击到目标。我们将提议的框架部署在A1四足动物机器人上,使其能够将球准确地射击到现实世界中的随机目标。
translated by 谷歌翻译
强化学习表现出巨大的潜力,可以解决复杂的接触率丰富的机器人操纵任务。但是,在现实世界中使用RL的安全是一个关键问题,因为在培训期间或看不见的情况下,RL政策是不完善的,可能会发生意外的危险碰撞。在本文中,我们提出了一个接触安全的增强增强学习框架,用于接触良好的机器人操纵,该框架在任务空间和关节空间中保持安全性。当RL政策导致机器人组与环境之间的意外冲突时,我们的框架能够立即检测到碰撞并确保接触力量很小。此外,最终效应器被强制执行,同时对外部干扰保持强大的态度。我们训练RL政策以模拟并将其转移到真正的机器人中。关于机器人擦拭任务的现实世界实验表明,即使在策略处于看不见的情况下,我们的方法也能够使接触在任务空间和关节空间中保持较小,同时拒绝对主要任务的干扰。
translated by 谷歌翻译
机器人技术中最重要的挑战之一是产生准确的轨迹并控制其动态参数,以便机器人可以执行不同的任务。提供此类运动控制的能力与此类运动的编码方式密切相关。深度学习的进步在发展动态运动原语的新方法的发展方面产生了强烈的影响。在这项工作中,我们调查了与神经动态运动原始素有关的科学文献,以补充有关动态运动原语的现有调查。
translated by 谷歌翻译
In this paper, we propose a unified whole-body control framework for velocity-controlled mobile collaborative robots which can distribute task motion into the arm and mobile base according to specific task requirements by adjusting weighting factors. Our framework focuses on addressing two challenging issues in whole-body coordination: 1) different dynamic characteristics of the mobile base and the arm; 2) avoidance of violating both safety and configuration constraints. In addition, our controller involves Coupling Dynamic Movement Primitives to enable the essential capabilities for collaboration and interaction applications, such as obstacle avoidance, human teaching, and compliance control. Based on these, we design an adaptive motion mode for intuitive physical human-robot interaction through adjusting the weighting factors. The proposed controller is in closed-form and thus quite computationally efficient. Several typical experiments carried out on a real mobile collaborative robot validate the effectiveness of the proposed controller.
translated by 谷歌翻译
Robots need to be able to adapt to unexpected changes in the environment such that they can autonomously succeed in their tasks. However, hand-designing feedback models for adaptation is tedious, if at all possible, making data-driven methods a promising alternative. In this paper we introduce a full framework for learning feedback models for reactive motion planning. Our pipeline starts by segmenting demonstrations of a complete task into motion primitives via a semi-automated segmentation algorithm. Then, given additional demonstrations of successful adaptation behaviors, we learn initial feedback models through learning from demonstrations. In the final phase, a sample-efficient reinforcement learning algorithm fine-tunes these feedback models for novel task settings through few real system interactions. We evaluate our approach on a real anthropomorphic robot in learning a tactile feedback task.
translated by 谷歌翻译
与人一起工作的协作机器人(配件)必须能够快速学习新技能并适应新的任务配置。从演示中学习(LFD)使柯伯特能够学习并适应不同的使用条件。但是,最先进的LFD方法需要手动调整固有参数,并且很少在没有专家的工业环境中使用。在本文中,介绍了与幼稚用户的工业应用程序开发和实施。我们提出了一种基于概率运动基础的无参数方法,其中所有参数均使用Jensen-Shannon Divergence和贝叶斯优化进行预定。因此,用户不必执行手动参数调整。该方法从用户演示的小数据集中学习动作,并将运动推广到各种情况和条件。我们在两个现场测试中广泛评估了该方法:一个在电梯门维护上工作的方法是一个在其中,其中三名辛德勒工人教授Cobot任务对其工作流程有用。 Cobot最终效果和目标位置之间的错误范围从$ 0 $到$ 1.48 \ pm0.35 $ mm。对于所有测试,没有任何任务失败报告。 Schindler工人完成的问卷突出了该方法的易用性,安全性和重复运动的准确性。我们的代码和记录的轨迹可在线提供以进行复制。
translated by 谷歌翻译
人类仍在执行许多高精度(DIS)任务,而这是自动化的理想机会。本文提供了一个框架,该框架使非专家的人类操作员能够教机器人手臂执行复杂的精确任务。该框架使用可变的笛卡尔阻抗控制器来执行从动力学人类示范中学到的轨迹。可以给出反馈以进行交互重塑或加快原始演示。董事会本地化是通过对任务委员会位置的视觉估算来完成的,并通过触觉反馈进行了完善。我们的框架在机器人基准拆卸挑战上进行了测试,该机器人必须执行复杂的精确任务,例如关键插入。结果显示每个操纵子任务的成功率很高,包括盒子中新型姿势的情况。还进行了消融研究以评估框架的组成部分。
translated by 谷歌翻译
在目标或配置在迭代之间变化的任务中,人机交互(HRI)可以使机器人能够处理可重复的方面,并提供适合当前状态的信息。当前,通过推断人类目标或为了适应机器人阻抗,目前可以实现先进的交互式机器人行为。尽管已经提出了许多针对互动机器人行为的应用程序特定的启发式方法,但它们通常受到范围的限制,例如仅考虑人体工程学或任务绩效。为了提高普遍性,本文提出了一个框架,该框架既计划在线轨迹和阻抗,处理任务和人类目标的混合,并可以有效地应用于新任务。该框架可以考虑多种类型的不确定性:接触约束变化,人类目标的不确定性或任务障碍。不确定性感知的任务模型是从使用高斯流程的一些演示中学到的。该任务模型用于非线性模型预测控制(MPC)问题,以根据对离散人类目标,人运动学,安全限制,接触稳定性和频率障碍抑制的信念来优化机器人轨迹和阻抗。引入了此MPC公式,对凸度进行了分析,并通过多个目标,协作抛光任务和协作组装任务进行了验证。
translated by 谷歌翻译