训练深度强化学习(DRL)运动策略通常需要大量数据以融合到所需的行为。在这方面,模拟器提供了便宜而丰富的来源。对于成功的SIM到现实转移,通常采用详尽的设计方法,例如系统识别,动态随机化和域的适应性。作为替代方案,我们研究了一种简单的随机力注射策略(RFI),以在训练过程中扰动系统动力学。我们表明,随机力的应用使我们能够模拟动力学随机化。这使我们能够获得对系统动力学变化的强大运动策略。我们通过引入情节驱动偏移,进一步扩展了RFI,称为延长的随机力注射(ERFI)。我们证明,ERFI为系统质量提供的变化提供了额外的鲁棒性,平均提供了比RFI的性能提高61%。我们还表明,ERFI足以在两个不同的四足动物平台(Anymal C和Unitree A1)上成功进行SIM到真实传输,即使在户外环境中对不均匀的地形上的感知运动也是如此。
translated by 谷歌翻译
在腿部机器人技术中,计划和执行敏捷的机动演习一直是一个长期的挑战。它需要实时得出运动计划和本地反馈政策,以处理动力学动量的非物质。为此,我们提出了一个混合预测控制器,该控制器考虑了机器人的致动界限和全身动力学。它将反馈政策与触觉信息相结合,以在本地预测未来的行动。由于采用可行性驱动的方法,它在几毫秒内收敛。我们的预测控制器使Anymal机器人能够在现实的场景中生成敏捷操作。关键要素是跟踪本地反馈策略,因为与全身控制相反,它们达到了所需的角动量。据我们所知,我们的预测控制器是第一个处理驱动限制,生成敏捷的机动操作以及执行低级扭矩控制的最佳反馈策略,而无需使用单独的全身控制器。
translated by 谷歌翻译
由于机器人动力学中的固有非线性,腿部机器人全身动作的在线计划具有挑战性。在这项工作中,我们提出了一个非线性MPC框架,该框架可以通过有效利用机器人动力学结构来在线生成全身轨迹。Biconmp用于在真正的四倍机器人上生成各种环状步态,其性能在不同的地形上进行了评估,对抗不同步态之间的不可预见的推动力并在线过渡。此外,提出了双孔在机器人上产生非平凡无环的全身动态运动的能力。同样的方法也被用来在人体机器人(TALOS)上产生MPC的各种动态运动,并在模拟中产生另一个四倍的机器人(Anymal)。最后,报告并讨论了对计划范围和频率对非线性MPC框架的影响的广泛经验分析。
translated by 谷歌翻译
多年来,运动规划,映射和人类轨迹预测的单独领域显着提出。然而,在提供能够使移动操纵器能够执行全身运动并考虑移动障碍物的预测运动时,文献在提供实际框架方面仍然稀疏。基于以前的优化的运动计划方法,使用距离字段遭受更新环境表示所需的高计算成本。我们证明,与从头划痕计算距离场相比,GPU加速预测的复合距离场显着降低计算时间。我们将该技术与完整的运动规划和感知框架集成,其占据动态环境中的人类的预测运动,从而实现了包含预测动作的反应性和先发制人的运动规划。为实现这一目标,我们提出并实施了一种新颖的人类轨迹预测方法,该方法结合了基于轨迹优化的运动规划的意图识别。我们在现实世界丰田人类支持机器人(HSR)上验证了我们的由Onboard Camera的现场RGB-D传感器数据验证了我们的结果框架。除了在公开的数据集提供分析外,我们还释放了牛津室内人类运动(牛津-IHM)数据集,并在人类轨迹预测中展示了最先进的性能。牛津-IHM数据集是一个人类轨迹预测数据集,人们在室内环境中的兴趣区域之间行走。静态和机器人安装的RGB-D相机都观察了用运动捕获系统跟踪的人员。
translated by 谷歌翻译
四足球运动正在迅速成熟到现在的机器人经常穿越各种非结构化的地形。然而,虽然通过从一系列预计算机样式中选择Gaits可以改变Gaits,但是当机器人处于运动中,当前规划仪不能连续地变化关键的步态参数。具有意外操作特性的综合,现有的Gaits,甚至是动态演习的混合延伸超出了当前最先进的能力。在这项工作中,我们通过学习捕获构成特定步态的关键姿态阶段的潜在空间来解决这种限制。这是通过在单个小跑风格上训练的生成模型来实现的,这鼓励解散,使得将驱动信号应用于潜在的单个维度,诱导合成连续各种跑步的整体计划。我们证明了驱动信号映射的特定性质直接映射到诸如Cadence,脚步高度和完全姿势持续时间的步态参数。由于我们的方法的性质,这些合成的Gaits在机器人操作期间在线在线持续变量,强大地捕获了显着超过培训期间看到的相对狭窄的行为的流动丰富性。此外,使用生成模型的使用促进了对扰动的检测和减轻,以提供多功能和坚固的规划框架。我们在真正的Quadruped机器人上评估我们的方法,并证明我们的方法实现了动态小跑风格的连续混合,同时对外部扰动具有鲁棒性和反应性。
translated by 谷歌翻译
物体重新排列最近被出现为机器人操纵的关键能力,具有实用的解决方案,通常涉及物体检测,识别,掌握和高级规划。描述期望场景配置的目标图像是有希望和越来越多的指令模式。一个关键的突出挑战是机器人前面的物体之间的比赛的准确推理,并且在提供的目标图像中看到的那些,其中最近的作品在没有对象特定的培训数据的情况下挣扎。在这项工作中,我们探讨了现有方法在对象之间推断出匹配的能力,因为观察到的目标场景之间的视觉偏移增加。我们发现当前设置的基本限制是源和目标图像必须包含每个对象的相同$ \ texit {实例} $,它限制了实际部署。我们提出了一种新的对象匹配方法,它使用大型预先训练的vision语言模型来匹配交叉实例设置中的对象,通过利用语义以及视觉特征作为更强大,更通用,相似度的衡量标准。我们证明,这在交叉实例设置中提供了大大改进的匹配性能,并且可用于将多对象重新排列与机器人机械手从分享的图像与机器人的场景共享的图像指导。
translated by 谷歌翻译
由于事件的范围有限,在复杂且高度可变的环境中,避免路径计划和碰撞是具有挑战性的。在文献中,有多种基于模型和学习的方法需要有效地部署大量的计算资源,并且可能具有有限的一般性。我们提出了一种基于全球稳定的被动控制器的计划算法,该算法可以在挑战性的环境条件下使用有限的计算资源计划平滑轨迹。该体系结构将最近提出的分形阻抗控制器与有限时间不变性区域结合在一起。由于该方法基于阻抗控制器,因此它也可以直接用作力/扭矩控制器。我们在模拟中验证了我们的方法,以通过发放Via-toints的发行及其对低带宽反馈的稳健性来分析互动导航在挑战凹域中的能力。使用11个代理的群模拟验证了所提出方法的可扩展性。我们已经在自动式轮式平台上进行了硬件实验,以验证与动态剂(即人和机器人)相互作用的平滑度和稳健性。与依赖数字优化的其他方法相比,所提出的本地规划师的计算复杂性可以通过低功率微控制器的部署降低能源消耗。
translated by 谷歌翻译
In recent years distributional reinforcement learning has produced many state of the art results. Increasingly sample efficient Distributional algorithms for the discrete action domain have been developed over time that vary primarily in the way they parameterize their approximations of value distributions, and how they quantify the differences between those distributions. In this work we transfer three of the most well-known and successful of those algorithms (QR-DQN, IQN and FQF) to the continuous action domain by extending two powerful actor-critic algorithms (TD3 and SAC) with distributional critics. We investigate whether the relative performance of the methods for the discrete action space translates to the continuous case. To that end we compare them empirically on the pybullet implementations of a set of continuous control tasks. Our results indicate qualitative invariance regarding the number and placement of distributional atoms in the deterministic, continuous action setting.
translated by 谷歌翻译
Data scarcity is one of the main issues with the end-to-end approach for Speech Translation, as compared to the cascaded one. Although most data resources for Speech Translation are originally document-level, they offer a sentence-level view, which can be directly used during training. But this sentence-level view is single and static, potentially limiting the utility of the data. Our proposed data augmentation method SegAugment challenges this idea and aims to increase data availability by providing multiple alternative sentence-level views of a dataset. Our method heavily relies on an Audio Segmentation system to re-segment the speech of each document, after which we obtain the target text with alignment methods. The Audio Segmentation system can be parameterized with different length constraints, thus giving us access to multiple and diverse sentence-level views for each document. Experiments in MuST-C show consistent gains across 8 language pairs, with an average increase of 2.2 BLEU points, and up to 4.7 BLEU for lower-resource scenarios in mTEDx. Additionally, we find that SegAugment is also applicable to purely sentence-level data, as in CoVoST, and that it enables Speech Translation models to completely close the gap between the gold and automatic segmentation at inference time.
translated by 谷歌翻译
The cyber-physical convergence is opening up new business opportunities for industrial operators. The need for deep integration of the cyber and the physical worlds establishes a rich business agenda towards consolidating new system and network engineering approaches. This revolution would not be possible without the rich and heterogeneous sources of data, as well as the ability of their intelligent exploitation, mainly due to the fact that data will serve as a fundamental resource to promote Industry 4.0. One of the most fruitful research and practice areas emerging from this data-rich, cyber-physical, smart factory environment is the data-driven process monitoring field, which applies machine learning methodologies to enable predictive maintenance applications. In this paper, we examine popular time series forecasting techniques as well as supervised machine learning algorithms in the applied context of Industry 4.0, by transforming and preprocessing the historical industrial dataset of a packing machine's operational state recordings (real data coming from the production line of a manufacturing plant from the food and beverage domain). In our methodology, we use only a single signal concerning the machine's operational status to make our predictions, without considering other operational variables or fault and warning signals, hence its characterization as ``agnostic''. In this respect, the results demonstrate that the adopted methods achieve a quite promising performance on three targeted use cases.
translated by 谷歌翻译