有效可靠的全局路径计划是为了安全执行和部署自主系统。为了产生充分解决给定环境的拓扑的规划图,许多基于样的运动规划师度假胜地,粗略的启发式驱动的策略,这些策略通常不能概括到新的和各种各样的环境。此外,许多这些方法不设计用于抗争于偏心性。我们在环境几何中的这种不确定性实际上可以帮助\ Texit {Drive}在生成可行的采样过程和概率 - 安全规划图中。我们提出了一种概率路线图的方法,其依赖于基于粒子的变分推理,以有效地覆盖配置空间中可行区域的后部分布。我们的方法,Stein变分概率路线图(SV-PRM)导致样品有效地产生规划图和传统采样方法的大量改进。我们展示了各种具有挑战性的规划问题的方法,包括机器人中常见的现实概率占用地图和高速控制问题。
translated by 谷歌翻译
在本文中,我们关注将基于能量的模型(EBM)作为运动优化的指导先验的问题。 EBM是一组神经网络,可以用合适的能量函数参数为参数的GIBBS分布来表示表达概率密度分布。由于其隐含性,它们可以轻松地作为优化因素或运动优化问题中的初始采样分布整合在一起,从而使它们成为良好的候选者,以将数据驱动的先验集成在运动优化问题中。在这项工作中,我们提出了一组所需的建模和算法选择,以使EBMS适应运动优化。我们调查了将其他正规化器在学习EBM中的好处,以将它们与基于梯度的优化器一起使用,并提供一组EBM架构,以学习用于操纵任务的可通用分布。我们提出了多种情况,可以将EBM集成以进行运动优化,并评估学到的EBM的性能,以指导模拟和真实机器人实验的指导先验。
translated by 谷歌翻译
点云匹配中不确定性的量化在许多任务中是关键的,例如姿势估计,传感器融合和抓握。迭代最近的点(ICP)是一种常用的姿势估计算法,它提供了两个点云之间的变换的点估计。在该过程中存在许多不确定性来源,这可能由于传感器噪声,含糊不清的环境和遮挡而产生。然而,对于自主驾驶等安全性问题,对于姿势变换的点估计是不足的,因为它不提供关于多解决方案的信息。目前的概率ICP方法通常不会捕获所有不确定性的来源,并且可以提供不可靠的变换估计,这可能在状态估计或使用此信息的任务中具有不利影响。在这项工作中,我们提出了一种新的算法来对齐两个点云,可以精确估计ICP的变换参数的不确定性。我们开发了基于梯度的ICP成本函数优化的Stein变分推断框架。该方法提供了对变换的非参数估计,可以模拟复杂的多模态分布,并且可以在GPU上有效地平行化。使用3D Kinect数据以及稀疏室内/室外激光雷达数据的实验表明,我们的方法能够有效地生产准确的构成不确定性估计。
translated by 谷歌翻译
在本章中,我们确定了基本的几何结构,这些几何结构是采样,优化,推理和自适应决策问题的基础。基于此识别,我们得出了利用这些几何结构来有效解决这些问题的算法。我们表明,在这些领域中自然出现了广泛的几何理论,范围从测量过程,信息差异,泊松几何和几何整合。具体而言,我们解释了(i)如何利用汉密尔顿系统的符合性几何形状,使我们能够构建(加速)采样和优化方法,(ii)希尔伯特亚空间和Stein操作员的理论提供了一种通用方法来获得可靠的估计器,(iii)(iii)(iii)保留决策的信息几何形状会产生执行主动推理的自适应剂。在整个过程中,我们强调了这些领域之间的丰富联系。例如,推论借鉴了抽样和优化,并且自适应决策通过推断其反事实后果来评估决策。我们的博览会提供了基本思想的概念概述,而不是技术讨论,可以在本文中的参考文献中找到。
translated by 谷歌翻译
我们为运动计划问题提出了高斯变异推理框架。在此框架中,运动计划是对轨迹分布的优化,以通过可拖动的高斯分布近似所需的轨迹分布。同等地,提议的框架可以视为具有熵正则化的标准运动计划。因此,获得的解决方案是从最佳确定溶液到随机溶液的过渡,并且所提出的框架可以通过控制随机性水平来恢复确定性解决方案。为了解决这种优化,我们采用了自然梯度下降方案。进一步利用了由分解的目标函数引起的提议配方的稀疏性结构,以提高算法的可扩展性。我们在模拟环境中评估了几个机器人系统的方法,并表明它可以通过平滑的轨迹来避免碰撞,同时为确定性基线结果带来了鲁棒性,尤其是在具有挑战性的环境和任务中。
translated by 谷歌翻译
工业机器人操纵器(例如柯机)的应用可能需要在具有静态和非静态障碍物组合的环境中有效的在线运动计划。当可用的计算时间受到限制或无法完全产生解决方案时,现有的通用计划方法通常会产生较差的质量解决方案。我们提出了一个新的运动计划框架,旨在在用户定义的任务空间中运行,而不是机器人的工作空间,该框架有意将工作空间一般性交易,以计划和执行时间效率。我们的框架自动构建在线查询的轨迹库,类似于利用离线计算的以前方法。重要的是,我们的方法还提供了轨迹长度上有限的次级优势保证。关键的想法是建立称为$ \ epsilon $ -Gromov-Hausdorff近似值的近似异构体,以便在任务空间附近的点也很接近配置空间。这些边界关系进一步意味着可以平稳地串联轨迹,这使我们的框架能够解决批次查询方案,目的是找到最小长度的轨迹顺序,这些轨迹访问一组无序的目标。我们通过几种运动型配置评估了模拟框架,包括安装在移动基础上的操纵器。结果表明,我们的方法可实现可行的实时应用,并为扩展其功能提供了有趣的机会。
translated by 谷歌翻译
We propose a general purpose variational inference algorithm that forms a natural counterpart of gradient descent for optimization. Our method iteratively transports a set of particles to match the target distribution, by applying a form of functional gradient descent that minimizes the KL divergence. Empirical studies are performed on various real world models and datasets, on which our method is competitive with existing state-of-the-art methods. The derivation of our method is based on a new theoretical result that connects the derivative of KL divergence under smooth transforms with Stein's identity and a recently proposed kernelized Stein discrepancy, which is of independent interest.
translated by 谷歌翻译
我们向连续状态马尔可夫决策过程(MDP)提出了一种扩散近似方法,该方法可用于解决非结构化的越野环境中的自主导航和控制。与呈现完全已知的状态转换模型的大多数决策定理计划框架相比,我们设计了一种方法,该方法消除了这种强烈假设,这些假设通常非常难以在现实中工程师。我们首先采用价值函数的二阶泰勒扩展。然后通过部分微分方程近似贝尔曼的最优性方程,其仅依赖于转换模型的第一和第二矩。通过组合价值函数的内核表示,然后设计一种有效的策略迭代算法,其策略评估步骤可以表示为特征的方程式的线性系统,其特征是由有限组支持状态。我们首先通过大量的仿真以2D美元的$ 2D $避让和2.5d $地形导航问题进行验证。结果表明,拟议的方法在几个基线上导致了卓越的性能。然后,我们开发一个系统,该系统将我们的决策框架整合,与船上感知,并在杂乱的室内和非结构化的户外环境中进行现实世界的实验。物理系统的结果进一步展示了我们在挑战现实世界环境中的方法的适用性。
translated by 谷歌翻译
我们提出了一种分层骨骼引导的运动计划算法来指导移动机器人。良好的骨骼绘制了C空间子空间的连接性,该子空间包含显着的自由度,并能够引导计划者快速找到所需的解决方案。但是,有时骨骼并不能密切代表自由的C空间,这通常会误导当前的骨架引导的计划者。分层骨骼指导的计划策略逐渐放松其对工作区骨骼的依赖,因为C空间被采样,从而逐渐返回了一条次优路径,该路径在标准骨架引导的算法中无法保证。与标准骨骼指导计划者和其他懒惰计划策略的实验比较显示了路线图施工时间的显着改善,同时保持混乱环境中多电量问题的路径质量。
translated by 谷歌翻译
We propose a path planning methodology for a mobile robot navigating through an obstacle-filled environment to generate a reference path that is traceable with moderate sensing efforts. The desired reference path is characterized as the shortest path in an obstacle-filled Gaussian belief manifold equipped with a novel information-geometric distance function. The distance function we introduce is shown to be an asymmetric quasi-pseudometric and can be interpreted as the minimum information gain required to steer the Gaussian belief. An RRT*-based numerical solution algorithm is presented to solve the formulated shortest-path problem. To gain insight into the asymptotic optimality of the proposed algorithm, we show that the considered path length function is continuous with respect to the topology of total variation. Simulation results demonstrate that the proposed method is effective in various robot navigation scenarios to reduce sensing costs, such as the required frequency of sensor measurements and the number of sensors that must be operated simultaneously.
translated by 谷歌翻译
我们为在危险环境中运行的机器人提供最佳运动规划(OMP)算法的新配方,称为自适应高斯过程的随机轨迹优化(AGP-STO)。它首先将加速梯度下降重新启动,通过重新定义的Lipschitz常数(L-REAGD)来提高计算效率,只需要第一个动量。然而,它仍然无法推断出于高斯过程(GP)和障碍物的先前信息的非耦合问题的全球最优。因此,它可以集成L-ReeStimation过程中的自适应随机轨迹优化(ASTO),以通过加速移动平均(AMA)来学习重要样本的GP先前奖励。此外,我们介绍了增量的最佳运动计划(IMPH),将AGP-STO升级到IAGP-STO。它在先前优化的航路点之间逐步地插入轨迹,以确保连续的安全性。最后,我们将IAGP-STO基于数值(CHOMP,TRAJOPT,GPMP)和采样(STOMP,RRT-CONNECT)方法,并进行关键参数的调整实验,以显示L-REAGD,ASTO和IOMP的集成如何提升计算效率和可靠性。此外,在LBR-IIWA,MULTI-AGV和RETHINK-BAXTER上实施IAGP-STO,证明其在操纵,协作和援助中的应用。
translated by 谷歌翻译
为了解决复杂环境中的自主导航问题,本文新呈现了一种有效的运动规划方法。考虑到大规模,部分未知的复杂环境的挑战,精心设计了三层运动规划框架,包括全局路径规划,本地路径优化和时间最佳速度规划。与现有方法相比,这项工作的新颖性是双重的:1)提出了一种新的动作原语的启发式引导剪枝策略,并完全集成到基于国家格子的全球路径规划器中,以进一步提高图表搜索的计算效率,以及2)提出了一种新的软限制局部路径优化方法,其中充分利用底层优化问题的稀疏带系统结构以有效解决问题。我们在各种复杂的模拟场景中验证了我们方法的安全,平滑,灵活性和效率,并挑战真实世界的任务。结果表明,与最近的近期B型zier曲线的状态空间采样方法相比,全球规划阶段,计算效率提高了66.21%,而机器人的运动效率提高了22.87%。我们命名拟议的运动计划框架E $ \ mathrm {^ 3} $拖把,其中3号不仅意味着我们的方法是三层框架,而且还意味着所提出的方法是三个阶段有效。
translated by 谷歌翻译
为了安全操作,机器人必须能够避免在不确定的环境中发生碰撞。现有的不确定性运动计划方法通常会对高斯和障碍几何形状做出保守的假设。尽管视觉感知可以对环境提供更准确的表示,但其用于安全运动计划的使用受到神经网络的固有错误校准的限制以及获得足够数据集的挑战。为了解决这些模仿,我们建议采用经过系统增强数据集训练的深层语义分割网络的合奏,以确保可靠的概率占用信息。为了避免在运动计划中进行保守主义,我们通过基于场景的路径计划方法直接采用了概率感知。速度调度方案被应用于路径上,以确保跟踪不准确的情况。我们证明了系统数据增强与深层合奏结合的有效性以及与最新方法相比的基于方案的计划方法,并在涉及人手的实验中验证了我们的框架。
translated by 谷歌翻译
长期以来,PATH规划一直是机器人技术的主要研究领域之一,PRM和RRT是最有效的计划者之一。尽管通常非常有效,但这些基于抽样的计划者在“狭窄通道”的重要情况下可能会变得昂贵。本文开发了专门为狭窄通道问题制定的路径规划范例。核心是基于计划由椭圆形工会封装的刚体机器人的计划。每个环境特征都使用具有$ \ Mathcal {C}^1 $边界的严格凸面来表示几何(例如,超级方面)。这样做的主要好处是,配置空间障碍物可以以封闭形式明确地进行参数化,从而可以使用先验知识来避免采样不可行的配置。然后,通过表征针对多个椭圆形的紧密体积,可以保证涉及旋转的机器人过渡无碰撞,而无需执行传统的碰撞检测。此外,通过与随机抽样策略结合使用,可以将提出的计划框架扩展到解决较高的维度问题,在该问题中,机器人具有移动的基础和铰接的附属物。基准结果表明,所提出的框架通常优于基于采样的计划者的计算时间和成功率,在找到单身机器人和具有较高维度配置空间的狭窄走廊的路径方面。使用建议的框架进行了物理实验,在人形机器人中进一步证明,该机器人在几个混乱的环境中行走,通道狭窄。
translated by 谷歌翻译
Sampling-based methods have become a cornerstone of contemporary approaches to Model Predictive Control (MPC), as they make no restrictions on the differentiability of the dynamics or cost function and are straightforward to parallelize. However, their efficacy is highly dependent on the quality of the sampling distribution itself, which is often assumed to be simple, like a Gaussian. This restriction can result in samples which are far from optimal, leading to poor performance. Recent work has explored improving the performance of MPC by sampling in a learned latent space of controls. However, these methods ultimately perform all MPC parameter updates and warm-starting between time steps in the control space. This requires us to rely on a number of heuristics for generating samples and updating the distribution and may lead to sub-optimal performance. Instead, we propose to carry out all operations in the latent space, allowing us to take full advantage of the learned distribution. Specifically, we frame the learning problem as bi-level optimization and show how to train the controller with backpropagation-through-time. By using a normalizing flow parameterization of the distribution, we can leverage its tractable density to avoid requiring differentiability of the dynamics and cost function. Finally, we evaluate the proposed approach on simulated robotics tasks and demonstrate its ability to surpass the performance of prior methods and scale better with a reduced number of samples.
translated by 谷歌翻译
主动同时定位和映射(SLAM)是规划和控制机器人运动以构建周围环境中最准确,最完整的模型的问题。自从三十多年前出现了积极感知的第一项基础工作以来,该领域在不同科学社区中受到了越来越多的关注。这带来了许多不同的方法和表述,并回顾了当前趋势,对于新的和经验丰富的研究人员来说都是非常有价值的。在这项工作中,我们在主动大满贯中调查了最先进的工作,并深入研究了仍然需要注意的公开挑战以满足现代应用程序的需求。为了实现现实世界的部署。在提供了历史观点之后,我们提出了一个统一的问题制定并审查经典解决方案方案,该方案将问题分解为三个阶段,以识别,选择和执行潜在的导航措施。然后,我们分析替代方法,包括基于深入强化学习的信念空间规划和现代技术,以及审查有关多机器人协调的相关工作。该手稿以讨论新的研究方向的讨论,解决可再现的研究,主动的空间感知和实际应用,以及其他主题。
translated by 谷歌翻译
路径计划是设计机器人行为的关键算法方法。基于抽样的方法,例如快速探索随机树(RRT)或概率路线图,是针对路径计划问题的突出算法解决方案。尽管其指数收敛速率,RRT只能找到次优路径。另一方面,$ \ textrm {rrt}^*$是RRT广泛​​使用的扩展名,保证了寻找最佳路径的概率完整性,但在复杂环境中缓慢收敛而在实践中遭受痛苦。此外,现实世界中的机器人环境通常是可观察到的,或者描述的动力学不好,施放了$ \ textrm {rrt}^*$在复杂任务中的应用。本文研究了用于机器人路径计划的流行蒙特卡洛树搜索(MCTS)算法的新型算法公式。值得注意的是,我们通过分析和证明其指数的收敛速率(MCPP)在完全可观察到的马尔可夫决策过程(MDP)的一部分中,并证明其指数收敛速率,而另一部分则是其概率的完整性假设有限的距离可观察性(证明草图),在部分可观察的MDP(POMDP)中找到可行的路径。我们的算法贡献使我们能够采用最近提出的MCT的变体,并具有不同的勘探策略来进行机器人路径计划。我们在模拟的2D和3D环境中进行了7度自由度(DOF)操纵器以及现实世界机器人路径计划任务中的实验评估,证明了MCPP在POMDP任务中的优势。
translated by 谷歌翻译
学习涉及时变和不断发展的系统动态的控制政策通常对主流强化学习算法构成了巨大的挑战。在大多数标准方法中,通常认为动作是一组刚性的,固定的选择,这些选择以预定义的方式顺序应用于状态空间。因此,在不诉诸于重大学习过程的情况下,学识渊博的政策缺乏适应动作集和动作的“行为”结果的能力。此外,标准行动表示和动作引起的状态过渡机制固有地限制了如何将强化学习应用于复杂的现实世界应用中,这主要是由于所得大的状态空间的棘手性以及缺乏概括的学术知识对国家空间未知部分的政策。本文提出了一个贝叶斯味的广义增强学习框架,首先建立参数动作模型的概念,以更好地应对不确定性和流体动作行为,然后将增强领域的概念作为物理启发的结构引入通过“极化体验颗粒颗粒建立) “维持在学习代理的工作记忆中。这些粒子有效地编码了以自组织方式随时间演变的动态学习体验。在强化领域之上,我们将进一步概括策略学习过程,以通过将过去的记忆视为具有隐式图结构来结合高级决策概念,在该结构中,过去的内存实例(或粒子)与决策之间的相似性相互联系。定义,因此,可以应用“关联记忆”原则来增强学习代理的世界模型。
translated by 谷歌翻译
本文主要研究范围传感机器人在置信度富的地图(CRM)中的定位和映射,这是一种持续信仰的密集环境表示,然后扩展到信息理论探索以减少姿势不确定性。大多数关于主动同时定位和映射(SLAM)和探索的作品始终假设已知的机器人姿势或利用不准确的信息指标来近似姿势不确定性,从而导致不知名的环境中的勘探性能和效率不平衡。这激发了我们以可测量的姿势不确定性扩展富含信心的互信息(CRMI)。具体而言,我们为CRMS提出了一种基于Rao-Blackwellized粒子过滤器的定位和映射方案(RBPF-CLAM),然后我们开发了一种新的封闭形式的加权方法来提高本地化精度而不扫描匹配。我们通过更准确的近似值进一步计算了使用加权颗粒的不确定的CRMI(UCRMI)。仿真和实验评估显示了在非结构化和密闭场景中提出的方法的定位准确性和探索性能。
translated by 谷歌翻译
本文介绍了用于增量平滑和映射(NF-ISAM)的归一化流,这是一种新型算法,用于通过非线性测量模型和非高斯因素来推断SLAM问题中完整的后验分布。NF-ISAM利用了神经网络的表达能力,并将正常的流量训练以建模和对完整的后部进行采样。通过利用贝叶斯树,NF-ISAM启用了类似于ISAM2的有效增量更新,尽管在更具挑战性的非高斯环境中。我们证明了NF-ISAM使用数据关联模棱两可的仅范围的SLAM问题来证明NF-ISAM比最先进的点和分布估计算法的优势。NF-ISAM在描述连续变量(例如位置)和离散变量(例如数据关联)的后验信仰方面提出了卓越的准确性。
translated by 谷歌翻译