自主机器人应在现实世界中的动态环境中运行,并与人类在紧密的空间中合作。允许机器人离开结构化实验室和制造设置的关键组成部分是他们与周围世界的在线和实时碰撞评估的能力。基于距离的约束是使机器人计划行动并安全采取行动,保护人类及其硬件的基础。但是,不同的应用需要不同的距离分辨率,从而导致各种启发式方法测量距离场W.R.T.障碍物在计算上很昂贵,并阻碍了他们在动态障碍避免用例中的应用。我们提出了正则签名的距离距离(REDSDF),这是一个单个神经隐式函数,可以在任何规模上计算平滑距离场,并在高维歧管上具有细粒度的分辨率和像人类这样的明确物体,这要归功于我们的有效数据生成和A训练过程中简单的感应偏置。我们证明了我们的方法在共享工作区中的全身控制(WBC)和安全的人类机器人相互作用(HRI)中的代表性模拟任务中的有效性。最后,我们在使用移动操纵器机器人的HRI移交任务中提供了现实世界应用的概念证明。
translated by 谷歌翻译
安全是每个机器人平台的关键特性:任何控制政策始终遵守执行器限制,并避免与环境和人类发生冲突。在加强学习中,安全对于探索环境而不会造成任何损害更为基础。尽管有许多针对安全勘探问题的建议解决方案,但只有少数可以处理现实世界的复杂性。本文介绍了一种安全探索的新公式,用于强化各种机器人任务。我们的方法适用于广泛的机器人平台,即使在通过探索约束歧管的切线空间从数据中学到的复杂碰撞约束下也可以执行安全。我们提出的方法在模拟的高维和动态任务中实现了最先进的表现,同时避免与环境发生冲突。我们在Tiago ++机器人上展示了安全的现实部署,在操纵和人类机器人交互任务中取得了显着的性能。
translated by 谷歌翻译
尽管移动操作在工业和服务机器人技术方面都重要,但仍然是一个重大挑战,因为它需要将最终效应轨迹的无缝整合与导航技能以及对长匹马的推理。现有方法难以控制大型配置空间,并导航动态和未知环境。在先前的工作中,我们建议将移动操纵任务分解为任务空间中最终效果的简化运动生成器,并将移动设备分解为训练有素的强化学习代理,以说明移动基础的运动基础,以说明运动的运动可行性。在这项工作中,我们引入了移动操作的神经导航(n $^2 $ m $^2 $),该导航将这种分解扩展到复杂的障碍环境,并使其能够解决现实世界中的广泛任务。最终的方法可以在未探索的环境中执行看不见的长马任务,同时立即对动态障碍和环境变化做出反应。同时,它提供了一种定义新的移动操作任务的简单方法。我们证明了我们提出的方法在多个运动学上多样化的移动操纵器上进行的广泛模拟和现实实验的能力。代码和视频可在http://mobile-rl.cs.uni-freiburg.de上公开获得。
translated by 谷歌翻译
内部计算模型的物理体是机器人和动物的能力来规划和控制行动的基础。这些“自我模型”允许机器人考虑多种可能的未来行动的结果,而不会在物理现实中尝试。最近的完全数据驱动自建模中的进展使机器能够直接从任务 - 不可行的交互数据学习自己的前瞻性运动学。然而,前进kinema \ -tics模型只能预测形态的有限方面,例如关节和肿块的最终效果或速度的位置。一个关键的挑战是模拟整个形态和运动学,而无需先验知识的形态的哪些方面与未来的任务相关。在这里,我们建议,而不是直接建模前瞻性,更有用的自我建模形式是一个可以回答空间占用查询的形式,而是在机器人的状态下调节空间占用疑问。这种查询驱动的自模型在空间域中是连续的,内存高效,完全可分辨:运动感知。在物理实验中,我们展示了视觉自我模型是如何准确到工作空间的百分比,使机器人能够执行各种运动规划和控制任务。视觉自我建模还可以让机器人从真实世界损坏中检测,本地化和恢复,从而提高机器弹性。我们的项目网站是:https://robot-morphology.cs.columbia.edu/
translated by 谷歌翻译
机器人操纵计划是找到一系列机器人配置的问题,该配置涉及与场景中的对象的交互,例如掌握,放置,工具使用等来实现这种相互作用,传统方法需要手工设计的特征和对象表示,它仍然是如何以灵活有效的方式描述与任意对象的这种交互的开放问题。例如,通过3D建模的最新进步启发,例如,NERF,我们提出了一种方法来表示对象作为神经隐式功能,我们可以在其中定义和共同列车交互约束函数。所提出的像素对准表示直接从具有已知相机几何形状的相机图像推断出,当时在整个操纵管道中作为感知组件,同时能够实现连续的机器人操纵计划。
translated by 谷歌翻译
对于移动机器人而言,与铰接式对象的交互是一项具有挑战性但重要的任务。为了应对这一挑战,我们提出了一条新型的闭环控制管道,该管道将负担能力估计的操纵先验与基于采样的全身控制相结合。我们介绍了完全反映了代理的能力和体现的代理意识提供的概念,我们表明它们的表现优于其最先进的对应物,这些对应物仅以最终效果的几何形状为条件。此外,发现闭环负担推论使代理可以将任务分为多个非连续运动,并从失败和意外状态中恢复。最后,管道能够执行长途移动操作任务,即在现实世界中开放和关闭烤箱,成功率很高(开放:71%,关闭:72%)。
translated by 谷歌翻译
在本文中,我们关注将基于能量的模型(EBM)作为运动优化的指导先验的问题。 EBM是一组神经网络,可以用合适的能量函数参数为参数的GIBBS分布来表示表达概率密度分布。由于其隐含性,它们可以轻松地作为优化因素或运动优化问题中的初始采样分布整合在一起,从而使它们成为良好的候选者,以将数据驱动的先验集成在运动优化问题中。在这项工作中,我们提出了一组所需的建模和算法选择,以使EBMS适应运动优化。我们调查了将其他正规化器在学习EBM中的好处,以将它们与基于梯度的优化器一起使用,并提供一组EBM架构,以学习用于操纵任务的可通用分布。我们提出了多种情况,可以将EBM集成以进行运动优化,并评估学到的EBM的性能,以指导模拟和真实机器人实验的指导先验。
translated by 谷歌翻译
为了实现成功的实地自主权,移动机器人需要自由适应环境的变化。视觉导航系统(如视觉教学和重复(VT&R)通常会假设参考轨迹周围的空间是自由的,但如果环境受阻,则路径跟踪可能会失败,或者机器人可以与先前看不见的障碍物碰撞。在这项工作中,我们为VT&R系统提供了一个局部反应控制器,允许机器人尽管对环境进行物理变化,但是尽管环境变化。我们的控制器使用本地高程映射来计算矢量表示,并输出10 Hz导航的Twist命令。它们组合在Riemannian运动策略(RMP)控制器中,该控制器需要<2 ms以在CPU上运行。我们将我们的控制器与VT&R系统集成在内的ANYMAL COMOT,并在室内杂乱的空间和大规模地下矿井中进行了测试。我们表明,当发生诸如靠近墙壁,交叉门口或穿越狭窄的走廊时,当发生视觉跟踪时,我们的本地反应控制器保持机器人安全。视频:https://youtu.be/g_awnec5awu.
translated by 谷歌翻译
In this paper a global reactive motion planning framework for robotic manipulators in complex dynamic environments is presented. In particular, the circular field predictions (CFP) planner from Becker et al. (2021) is extended to ensure obstacle avoidance of the whole structure of a robotic manipulator. Towards this end, a motion planning framework is developed that leverages global information about promising avoidance directions from arbitrary configuration space motion planners, resulting in improved global trajectories while reactively avoiding dynamic obstacles and decreasing the required computational power. The resulting motion planning framework is tested in multiple simulations with complex and dynamic obstacles and demonstrates great potential compared to existing motion planning approaches.
translated by 谷歌翻译
我们介绍了栖息地2.0(H2.0),这是一个模拟平台,用于培训交互式3D环境和复杂物理的场景中的虚拟机器人。我们为体现的AI堆栈 - 数据,仿真和基准任务做出了全面的贡献。具体来说,我们提出:(i)复制:一个由艺术家的,带注释的,可重新配置的3D公寓(匹配真实空间)与铰接对象(例如可以打开/关闭的橱柜和抽屉); (ii)H2.0:一个高性能物理学的3D模拟器,其速度超过8-GPU节点上的每秒25,000个模拟步骤(实时850x实时),代表先前工作的100倍加速;和(iii)家庭助理基准(HAB):一套辅助机器人(整理房屋,准备杂货,设置餐桌)的一套常见任务,以测试一系列移动操作功能。这些大规模的工程贡献使我们能够系统地比较长期结构化任务中的大规模加固学习(RL)和经典的感官平面操作(SPA)管道,并重点是对新对象,容器和布局的概括。 。我们发现(1)与层次结构相比,(1)平面RL政策在HAB上挣扎; (2)具有独立技能的层次结构遭受“交接问题”的困扰,(3)水疗管道比RL政策更脆。
translated by 谷歌翻译
多年来,运动规划,映射和人类轨迹预测的单独领域显着提出。然而,在提供能够使移动操纵器能够执行全身运动并考虑移动障碍物的预测运动时,文献在提供实际框架方面仍然稀疏。基于以前的优化的运动计划方法,使用距离字段遭受更新环境表示所需的高计算成本。我们证明,与从头划痕计算距离场相比,GPU加速预测的复合距离场显着降低计算时间。我们将该技术与完整的运动规划和感知框架集成,其占据动态环境中的人类的预测运动,从而实现了包含预测动作的反应性和先发制人的运动规划。为实现这一目标,我们提出并实施了一种新颖的人类轨迹预测方法,该方法结合了基于轨迹优化的运动规划的意图识别。我们在现实世界丰田人类支持机器人(HSR)上验证了我们的由Onboard Camera的现场RGB-D传感器数据验证了我们的结果框架。除了在公开的数据集提供分析外,我们还释放了牛津室内人类运动(牛津-IHM)数据集,并在人类轨迹预测中展示了最先进的性能。牛津-IHM数据集是一个人类轨迹预测数据集,人们在室内环境中的兴趣区域之间行走。静态和机器人安装的RGB-D相机都观察了用运动捕获系统跟踪的人员。
translated by 谷歌翻译
我们提出了一种算法,以(i)在线学习具有带有激光雷达的机器人的深度签名距离功能(SDF),以代表3D环境几何形状,以及(ii)鉴于此深度学习的地图,(ii)计划无碰撞轨迹。我们的算法采用了传入的激光扫描,并不断优化神经网络,以代表其当前附近环境的SDF。当SDF网络质量饱和时,我们将缓存网络的副本,以及学习的置信度指标,并初始化新的SDF网络以继续映射环境的新区域。然后,我们通过信心加权的计划来串联所有缓存的本地SDF,以提供全球SDF进行计划。为了计划,我们使用顺序凸模型预测控制(MPC)算法。 MPC规划师优化了机器人动态可行的轨迹,同时没有与全局SDF中映射的障碍物相撞。我们表明,与现有在线SDF培训的现有方法相比,我们的在线映射算法产生的地图更高。在Webots Simulator中,我们进一步展示了在线运行的组合映射器和计划者 - 自动导航,并且在未知环境中没有碰撞。
translated by 谷歌翻译
为了安全操作,机器人必须能够避免在不确定的环境中发生碰撞。现有的不确定性运动计划方法通常会对高斯和障碍几何形状做出保守的假设。尽管视觉感知可以对环境提供更准确的表示,但其用于安全运动计划的使用受到神经网络的固有错误校准的限制以及获得足够数据集的挑战。为了解决这些模仿,我们建议采用经过系统增强数据集训练的深层语义分割网络的合奏,以确保可靠的概率占用信息。为了避免在运动计划中进行保守主义,我们通过基于场景的路径计划方法直接采用了概率感知。速度调度方案被应用于路径上,以确保跟踪不准确的情况。我们证明了系统数据增强与深层合奏结合的有效性以及与最新方法相比的基于方案的计划方法,并在涉及人手的实验中验证了我们的框架。
translated by 谷歌翻译
在粗糙的地形上的动态运动需要准确的脚部放置,避免碰撞以及系统的动态不足的计划。在存在不完美且常常不完整的感知信息的情况下,可靠地优化此类动作和互动是具有挑战性的。我们提出了一个完整的感知,计划和控制管道,可以实时优化机器人所有自由度的动作。为了减轻地形所带来的数值挑战,凸出不平等约束的顺序被提取为立足性可行性的局部近似值,并嵌入到在线模型预测控制器中。每个高程映射预先计算了步骤性分类,平面分割和签名的距离场,以最大程度地减少优化过程中的计算工作。多次射击,实时迭代和基于滤波器的线路搜索的组合用于可靠地以高速率解决该法式问题。我们在模拟中的间隙,斜率和踏上石头的情况下验证了所提出的方法,并在Anymal四倍的平台上进行实验,从而实现了最新的动态攀登。
translated by 谷歌翻译
Reliably planning fingertip grasps for multi-fingered hands lies as a key challenge for many tasks including tool use, insertion, and dexterous in-hand manipulation. This task becomes even more difficult when the robot lacks an accurate model of the object to be grasped. Tactile sensing offers a promising approach to account for uncertainties in object shape. However, current robotic hands tend to lack full tactile coverage. As such, a problem arises of how to plan and execute grasps for multi-fingered hands such that contact is made with the area covered by the tactile sensors. To address this issue, we propose an approach to grasp planning that explicitly reasons about where the fingertips should contact the estimated object surface while maximizing the probability of grasp success. Key to our method's success is the use of visual surface estimation for initial planning to encode the contact constraint. The robot then executes this plan using a tactile-feedback controller that enables the robot to adapt to online estimates of the object's surface to correct for errors in the initial plan. Importantly, the robot never explicitly integrates object pose or surface estimates between visual and tactile sensing, instead it uses the two modalities in complementary ways. Vision guides the robots motion prior to contact; touch updates the plan when contact occurs differently than predicted from vision. We show that our method successfully synthesises and executes precision grasps for previously unseen objects using surface estimates from a single camera view. Further, our approach outperforms a state of the art multi-fingered grasp planner, while also beating several baselines we propose.
translated by 谷歌翻译
操纵可变形的线性对象(DLOS)在有障碍的受约束环境中实现所需的形状是一项有意义但具有挑战性的任务。对于这项高度约束的任务是必要的;但是,由于规划人员的可变形性质,计划人员需要的准确模型很难获得,并且不可避免的建模错误会显着影响计划结果,如果机器人只是以开环的方式执行计划的路径,则可能导致任务失败。在本文中,我们提出了一个粗到精细的框架,以结合全球计划和局部控制,以进行双臂操纵DLO,能够精确实现所需的配置并避免DLO,机器人和障碍物之间的潜在碰撞。具体而言,全球规划师是指一个简单而有效的DLO能量模型,并计算出一条粗略的途径,以确保任务的可行性。然后,本地控制器遵循该路径作为指导,并通过闭环反馈进一步塑造它,以补偿计划错误并保证任务的准确性。仿真和现实世界实验都表明,我们的框架可以在使用不精确的DLO模型的受约束环境中稳健地实现所需的DLO配置。仅通过计划或控制就无法可靠地实现。
translated by 谷歌翻译
神经辐射场(NERF)最近被成为自然,复杂3D场景的代表的强大范例。 NERFS表示神经网络中的连续体积密度和RGB值,并通过射线跟踪从看不见的相机观点生成照片逼真图像。我们提出了一种算法,用于通过仅使用用于本地化的板载RGB相机表示为NERF的3D环境导航机器人。我们假设现场的NERF已经预先训练了离线,机器人的目标是通过NERF中的未占用空间导航到目标姿势。我们介绍了一种轨迹优化算法,其避免了基于NERF中的高密度区域的碰撞,其基于差分平整度的离散时间版本,其可用于约束机器人的完整姿势和控制输入。我们还介绍了基于优化的过滤方法,以估计单位的RGB相机中的NERF中机器人的6dof姿势和速度。我们将轨迹策划器与在线重新循环中的姿势过滤器相结合,以提供基于视觉的机器人导航管道。我们使用丛林健身房环境,教堂内部和巨石阵线导航的四轮车机器人,使用RGB相机展示仿真结果。我们还展示了通过教会导航的全向地面机器人,要求它重新定位以缩小差距。这项工作的视频可以在https://mikh3x4.github.io/nerf-navigation/找到。
translated by 谷歌翻译
在装满静态或动态障碍物的混乱环境中,机器人手臂对快速移动物体的实时拦截只允许几十毫秒的反应时间,因此,对先进的机器人计划算法非常具有挑战性和艰巨例如,多种机器人技能并行捕获动态对象并避免障碍。本文提出了一个统一的机器人路径计划框架,该框架通过嵌入事件流中包含的高维时间信息,以将安全的轨迹和碰撞轨迹区分到具有预先构造的2D密度连接图的低维空间中。然后,我们利用快速的图形传感策略来生成必要的电动机命令,以有效地避免接近障碍物,同时拦截快速移动的对象。我们方法论的最独特的特征是在基于深层流形学习的相同算法框架内进行对象截距和避免障碍物。通过利用高效的基于扩散图的变异自动编码和扩展的卡尔曼滤波器(EKF),我们仅使用板载感应和计算来证明我们的方法在自主的7-DOF机器人臂上的有效性。我们的机器人操纵器能够避免使用不同尺寸和形状的多个障碍,同时成功捕获了以正常速度以不同角度手动扔的快速移动的软球。可以在https://sites.google.com/view/multirobotskill/home中找到我们实验的完整视频演示。
translated by 谷歌翻译
为了实现无冲突的人机合作,机器人代理需要巧妙地避免在实现集体目标的同时不断地移动障碍。有时,这些障碍甚至可以同时改变其3D形状和形式,因此是“无定形的”。为此,本文提出了动态的无定形障碍物避免(DAO-A)的问题,在该问题中,机器人的手臂可以右翼避免动态产生的障碍,从而不断改变其轨迹和3D形式。具体来说,我们为机器人臂引入了一种新颖的控制策略,该策略既利用拓扑流形学习,又利用最新的深度学习进步。我们在模拟和物理实验中使用7多型机器人操纵器测试我们的学习框架,该机器人令人满意地学习并综合了避免以前未见的障碍的现实技能,同时产生了新颖的动作,以实现预定的运动目标。最值得注意的是,对于给定的机器人操纵器而言,我们学到的学到的方法可以避免使用任意和看不见的移动轨迹的任何数量的3D障碍
translated by 谷歌翻译
We present a generalised architecture for reactive mobile manipulation while a robot's base is in motion toward the next objective in a high-level task. By performing tasks on-the-move, overall cycle time is reduced compared to methods where the base pauses during manipulation. Reactive control of the manipulator enables grasping objects with unpredictable motion while improving robustness against perception errors, environmental disturbances, and inaccurate robot control compared to open-loop, trajectory-based planning approaches. We present an example implementation of the architecture and investigate the performance on a series of pick and place tasks with both static and dynamic objects and compare the performance to baseline methods. Our method demonstrated a real-world success rate of over 99%, failing in only a single trial from 120 attempts with a physical robot system. The architecture is further demonstrated on other mobile manipulator platforms in simulation. Our approach reduces task time by up to 48%, while also improving reliability, gracefulness, and predictability compared to existing architectures for mobile manipulation. See https://benburgesslimerick.github.io/ManipulationOnTheMove for supplementary materials.
translated by 谷歌翻译