数据驱动的抓取方法最近取得了显着进展。但这些方法通常需要很多训练数据。为了提高掌握数据采集的效率,本文提出了一种新的把握训练系统,包括从数据采集到模型推理的整个管道。该系统可以通过对映抓取规则辅助​​的纠正策略收集有效的抓取样本,并设计了一个可供性解释器网络,预测像素化抓取可供性图。我们将可读性,不可用性和背景定义为掌握可供性。我们系统的关键优势在于,在对映规则下仅用少量抓取样本训练的像素级示能解释器网络可以在完全看不见的物体和背景上实现显着的性能。仅在模拟中收集训练样本。广泛的定性和定量实验证明了我们提出的方法的准确性和稳健性。在现实世界的实验中,我们在一组家庭用品上获得了93%的成功率,在一组对抗项目上获得了91%的成功率,仅有约6,300个模拟样本。我们在杂乱场景中也达到了87%的准确率。尽管该模型仅使用RGB图像进行训练,但在更改背景纹理时,它也可以执行并且可以在对抗物体组上实现甚至94%的准确度,其优于当前最先进的方法。
translated by 谷歌翻译
今天的机器人系统越来越多地转向计算上昂贵的模型,例如深度神经网络(DNN),用于定位,感知,计划和对象检测等任务。然而,资源受限的机器人,如低功率无人机,通常没有足够的机载计算资源或功率储备来可扩展地运行最准确的,最先进的网络计算模型。云机器人技术允许移动机器人将计算机卸载到集中式服务器,如果它们在本地不确定或想要运行更准确的计算密集型模型。然而,云机器人成为一个关键的,通常低估的成本:与云过度拥塞的无线网络通信可能导致延迟或数据丢失。实际上,通过拥塞网络从多个机器人发送高数据速率视频或LIDAR会导致实时应用程序的延迟过高,我们会通过实验测量。在本文中,我们制定了一个新的机器人卸载问题---机器人如何以及何时卸载传感任务,特别是如果它们不确定,在提高准确性的同时最大限度地降低云通信的成本?我们将卸载制定为机器人的顺序决策问题,并提出使用深度强化学习的解决方案。在使用最先进的视觉DNN的模拟和硬件实验中,我们的卸载策略将视觉任务性能提高了1.3-2.6倍的基准标记卸载策略,使机器人有可能显着超越其板载传感精度,但云通信成本有限。
translated by 谷歌翻译
虽然强化学习(RL)具有使机器人能够自主获取各种技能的潜力,但在实践中,RL通常需要对奖励函数进行手动,按任务设计,特别是在实际环境中,计算进度所需的环境方面并非直接无障碍。为了使机器人能够自主学习技能,我们反而考虑强化学习的问题,而无需获得奖励。 Weaim要学习一个无人监督的嵌入空间,机器人可以在该空间内测量自己的目标。我们的方法明确地优化了对称空间,当目标达到最终状态时,达到特定状态的动作序列是最佳的。这使得学习有效和以控制为中心的表示能够导致更多的自主强化学习算法。我们在三个模拟环境和两个真实操作问题上的实验表明,我们的方法可以从未标记的交互中学习有效的目标指标,并使用学习目标指标进行自主强化学习。
translated by 谷歌翻译
本文基于一种新的力估计方案(称为传动力观测器(TFOB)),开发了一种精确的系数弹性致动器(SEA)力控制算法。所提出的方法旨在改善由弹性传递的非线性和测量噪声以及其变形传感器的误差引起的SEA的较低的力测量。本文首先分析了传统SEA传动力传感方法的局限性,然后研究了它的随机特性,这确实为实现与TFOB结合的精确力控制性能奠定了基础。特别地,从频域中的整体闭环系统分析引入了调整参数。这为实现强制控制的SEA系统的最佳性能提供了指导。所提出的算法在实际SEA硬件设置中通过实验验证。
translated by 谷歌翻译
在机器人手术中,通过可变形材料进行图案切割是一项具有挑战性的研究领域。切割过程需要机器人同时操纵剪刀和夹具以切穿可变形片材上的预定义的轮廓轨迹。夹具通过在片材上钉一个点并在剪刀作用时连续地将夹点张紧到不同方向来确保切割准确性。目标是找到夹点和相应的张紧策略,以最小化对材料的损坏并提高由预定义轮廓和切割轮廓之间的对称差异测量的切割精度。以前的研究考虑在切割过程中找到一个固定的夹点,当轮廓轨迹复杂时,这是不准确和不安全的。在本文中,我们通过使用多个夹点来检查软组织切割任务,这些切点在切割时模仿人工操作。然而,这种方法不需要使用多夹持机器人。我们使用深度强化学习算法来确定夹点的最佳张紧策略。仿真结果表明,在软模式切割任务中,多点方法在精度和可靠性方面均优于最先进的方法。
translated by 谷歌翻译
在多机器人系统文献中,控制策略通常通过用于编码单团级目标的潜在函数的下降规则获得。但是,对于多目标任务,可能很难设计出满足所有目标的单一控制策略。在本文中,我们利用将多目标任务分解为一组简单子任务的思想。我们将每个子任务与潜在的低维流形相关联,并在这些流形上设计黎曼运动策略(RMP)。提出了集中式和分散式算法,以将这些策略组合到机器人执行的配置空间上的最终控制策略。我们为简单的多机器人任务提出了一系列RMP,可用于为更复杂的任务构建控制器。特别地,我们通过组合所提出的RMP来证明许多现有的多机器人控制器可以非常接近。理论分析表明,生成控制策略下的多机器人系统是稳定的。通过模拟任务和机器人实现验证了所提出的框架。
translated by 谷歌翻译
在本文中,我们利用非线性随机最优控制理论,应用数学和机器学习领域的最新进展,提出了一种新的决策不确定性方法。我们的工作基于非线性Feynman-Kac引理和后向非线性偏微分方程与前向 -​​ 后向随机微分方程之间的基本联系。利用这些联系和我们对前后随机微分方程的重要性抽样的前期工作的结果,我们开发了一个可扩展的控制框架,适用于机器人和自治的一般随机系统和决策问题公式。提出了两种随机控制架构,包括前馈和递归神经网络。在两个随机最优控制问题公式中研究了上述算法的性能和可扩展性,包括无约束L2和控制约束情况,以及三个仿真系统。最后,我们讨论了所提算法对机器人和自治系统的影响。
translated by 谷歌翻译
本文介绍了以舒适为中心的可穿戴式机器人的设计原则及其在轻型和可反向驱动的膝外骨骼中的应用。将不适感作为机械设计和控制问题进行处理,本文提出了三种解决方案:1)新的可穿戴结构优化了表带附着结构,适合布局,改善了传统可穿戴结构设计的过度剪切力; 2)滚动接头和双铰链机构分别减少了矢状面正面的不对中,而没有增加机械复杂性和惯性; 3)低阻抗机械传动减少了致动器对人体的反射和阻尼,因此外骨骼是高度可反向驱动的。运动学仿真表明,在最大膝关节处,机器人关节和膝关节之间的不对准可减少74%。在实验中,无动力模式下的外骨骼表现出1.03 Nmroot均方(RMS)低阻力矩。扭矩控制实验证明了三个人类受试者的0.31 Nm RMS扭矩跟踪误差。
translated by 谷歌翻译
最近已证明无模型强化学习成功地从原始传感器数据中获取导航策略。在这项工作中,我们解决了高保真仿真器中自主代理的学习驾驶策略的问题。基于最近将深度加固学习应用于导航问题的研究,我们提出了一种模块化深度加固学习方法,用于从原始图像预测汽车的转向角。第一模块提取图像的低维潜在语义表示。通过强化学习训练的控制模块将潜在向量作为输入来预测正确的转向角。实验结果表明,我们的方法能够学习在没有人为控制信号的情况下操纵汽车。
translated by 谷歌翻译
蚂蚁是六足昆虫,可以携带比体重重十倍的负荷。由于有六条腿,它们本质上是稳定的。它们非常强大,可以承载重物。由于这些原因,本文提出了一种新的平行运动结构,用于六足蚂蚁机器人。机械结构在Solidworks中进行了设计和优化。机械hassix支腿和只有两个直流电机驱动六个支腿,所以从机械角度来看,设计是最佳的。由于使用无线模块,机器人轻巧且自主。此功能使该机器人适用于社交机器人和救援机器人应用。发送器程序在使用LabVIEW的监控计算机中实现,并且amicrocontroller用作主控制器。电子板在Proteus Professional中进行设计和测试,PCB板在Altium Designer中实现。微控制器编程在Code Vision中完成。
translated by 谷歌翻译