我们描述了一种使用机器人应用程序中常见的一类离散连续因子图进行平滑和映射的通用方法。虽然有公开可用的工具提供灵活且易于使用的接口,以指定和解决以离散或连续图形模型提出的优化问题,但目前尚无类似的一般工具,可以为混合离散性问题提供相同的功能。我们旨在解决这个问题。特别是,我们提供了一个库DC-SAM,将现有的工具扩展为以因子图定义的优化问题,以设置离散模型的设置。我们工作的关键贡献是一种新颖的解决方案,用于有效地回收离散连续优化问题的近似解决方案。我们方法的关键见解是,虽然对连续和离散状态空间的共同推断通常很难,但许多通常遇到的离散连续问题自然可以分为“离散部分”,并且可以轻松地解决的“连续部分” 。利用这种结构,我们以交替的方式优化离散和连续变量。因此,我们提出的工作可以直接表示离散图形模型的直接表示和近似推断。我们还提供了一种方法来恢复离散变量和连续变量的估计值的不确定性。我们通过应用于三个不同的机器人感知应用程序的应用来证明我们的方法的多功能性:点云注册,健壮的姿势图优化以及基于对象的映射和本地化。
translated by 谷歌翻译
本文介绍了用于增量平滑和映射(NF-ISAM)的归一化流,这是一种新型算法,用于通过非线性测量模型和非高斯因素来推断SLAM问题中完整的后验分布。NF-ISAM利用了神经网络的表达能力,并将正常的流量训练以建模和对完整的后部进行采样。通过利用贝叶斯树,NF-ISAM启用了类似于ISAM2的有效增量更新,尽管在更具挑战性的非高斯环境中。我们证明了NF-ISAM使用数据关联模棱两可的仅范围的SLAM问题来证明NF-ISAM比最先进的点和分布估计算法的优势。NF-ISAM在描述连续变量(例如位置)和离散变量(例如数据关联)的后验信仰方面提出了卓越的准确性。
translated by 谷歌翻译
我们为平面姿势图优化提供了一个强大的框架,该框架被环闭合离群值污染。我们的框架首先将截短的最小二乘内核包裹的强大的PGO问题拒绝了异常值,从而拒绝了异常值。然后,该框架引入了线性角度表示,以重写最初用旋转矩阵配制的第一个子问题。该框架配置为渐变的非凸度(GNC)算法,以连续解决两个非凸子问题,而无需初始猜测。得益于两个子问题的线性属性,我们的框架只需要线性求解器才能最佳地解决GNC中遇到的优化问题。我们在平面PGO基准中广泛验证了所提出的框架,称为Degnc-Laf(脱钩的非跨性别量均具有线性角度公式)。事实证明,它比标准和通用GNC的速度显着(有时达到30倍以上),同时导致高质量的估计值。
translated by 谷歌翻译
我们提出了因子图(NSFG)的嵌套采样,这是一种新型的嵌套采样方法,用于近似推断在因子图上表达的后验分布。执行这种推理是同时定位和映射(SLAM)的关键步骤。尽管高斯近似通常效果很好,但在其他更具挑战性的SLAM情况下,后验分布是非高斯的,不能用标准分布明确表示。我们的技术适用于后验分布基本上非高斯(例如多模式)的设置,因此需要更具表现力的表示。 NSFG利用嵌套采样方法直接采样后部以表示没有参数密度模型的分布。尽管嵌套采样方法以其在采样多模式分布方面的强大能力而闻名,但该方法在猛击因子图中的应用并不简单。 NSFG利用因子图的结构来构建有效采样的信息的先验分布,并为嵌套采样方法提供显着的计算益处。我们提出了模拟实验,这些实验表明NSFG比最先进的采样技术更快地计算出更快的数量级解决方案。同样,我们将NSFG与最先进的高斯和非高斯大满贯方法进行了比较,并证明NSFG在描述非高斯后代方面更加强大。
translated by 谷歌翻译
Spatial perception is a key task in several robotics applications. In general, it involves the nonlinear estimation of hidden variables that represent the state of the robot/environment. However, in the presence of outliers the standard nonlinear least squared formulation results in poor estimates. Several methods have been considered in the literature to improve the reliability of the estimation process. Most methods are based on heuristics since guaranteed global robust estimation is not generally practical due to high computational costs. Recently general purpose robust estimation heuristics have been proposed that leverage existing non-minimal solvers available for the outlier-free formulations without the need for an initial guess. In this work, we propose two similar heuristics backed by Bayesian theory. We evaluate these heuristics in practical scenarios to demonstrate their merits in different applications including 3D point cloud registration, mesh registration and pose graph optimization.
translated by 谷歌翻译
Outier-bubust估计是一个基本问题,已由统计学家和从业人员进行了广泛的研究。在过去的几年中,整个研究领域的融合都倾向于“算法稳定统计”,该统计数据的重点是开发可拖动的异常体 - 固定技术来解决高维估计问题。尽管存在这种融合,但跨领域的研究工作主要彼此断开。本文桥接了有关可认证的异常抗衡器估计的最新工作,该估计是机器人技术和计算机视觉中的几何感知,并在健壮的统计数据中并行工作。特别是,我们适应并扩展了最新结果对可靠的线性回归(适用于<< 50%异常值的低外壳案例)和列表可解码的回归(适用于>> 50%异常值的高淘汰案例)在机器人和视觉中通常发现的设置,其中(i)变量(例如旋转,姿势)属于非convex域,(ii)测量值是矢量值,并且(iii)未知的异常值是先验的。这里的重点是绩效保证:我们没有提出新算法,而是为投入测量提供条件,在该输入测量值下,保证现代估计算法可以在存在异常值的情况下恢复接近地面真相的估计值。这些条件是我们所谓的“估计合同”。除了现有结果的拟议扩展外,我们认为本文的主要贡献是(i)通过指出共同点和差异来统一平行的研究行,(ii)在介绍先进材料(例如,证明总和证明)中的统一行为。对从业者的可访问和独立的演讲,(iii)指出一些即时的机会和开放问题,以发出异常的几何感知。
translated by 谷歌翻译
本文提出了Kimera-Multi,第一个多机器人系统,(i)是强大的,并且能够识别和拒绝由感知混叠产生的不正确和内部机器人循环闭合,(ii)完全分布,仅依赖于本地(点对点)通信实现分布式本地化和映射,(iii)实时构建环境的全球一致的度量标准三维网状模型,其中网格的面部用语义标签注释。 Kimera-Multi由配备有视觉惯性传感器的机器人团队实现。每个机器人都构建了局部轨迹估计和使用Kimera的本地网格。当通信可用时,机器人基于一种基于新型分布式刻度非凸性算法发起分布式地点识别和鲁棒姿态图优化协议。所提出的协议允许机器人通过利用机器人间循环闭合而鲁棒到异常值来改善其局部轨迹估计。最后,每个机器人使用其改进的轨迹估计来使用网格变形技术来校正本地网格。我们在光逼真模拟,SLAM基准测试数据集中展示了Kimera-Multi,以及使用地机器人收集的靠户外数据集。真实和模拟实验都涉及长轨迹(例如,每个机器人高达800米)。实验表明,在鲁棒性和准确性方面,kimera-multi(i)优于现有技术,(ii)在完全分布的同时实现与集中式大满贯系统相当的估计误差,(iii)在通信带宽方面是显着的(iv)产生精确的公制语义3D网格,并且(v)是模块化的,也可以用于标准3D重建(即,没有语义标签)或轨迹估计(即,不重建3D网格)。
translated by 谷歌翻译
姿势图优化是在机器人感知的许多领域遇到的非凸优化问题。它的收敛到准确的解决方案由两个因素来调节:使用成本函数的非线性和姿势变量的初始配置。在本文中,我们提出了Hipe,这是一种用于姿势图初始化的新型分层算法。我们的方法利用了一个粗粒图,该图编码了问题几何形状的抽象表示。我们通过结合来自输入本地区域的最大似然估计来构建此图。通过利用这种表示的稀疏性,我们可以以非线性方式初始化姿势图,而无需与现有方法相比,没有计算开销。最终的初始猜测可以有效地引导用于获得最终解决方案的细粒优化。此外,我们对不同成本函数对最终估计的影响进行了经验分析。我们的实验评估表明,HIPE的使用导致更有效,更健壮的优化过程,与最先进的方法相比。
translated by 谷歌翻译
We propose AstroSLAM, a standalone vision-based solution for autonomous online navigation around an unknown target small celestial body. AstroSLAM is predicated on the formulation of the SLAM problem as an incrementally growing factor graph, facilitated by the use of the GTSAM library and the iSAM2 engine. By combining sensor fusion with orbital motion priors, we achieve improved performance over a baseline SLAM solution. We incorporate orbital motion constraints into the factor graph by devising a novel relative dynamics factor, which links the relative pose of the spacecraft to the problem of predicting trajectories stemming from the motion of the spacecraft in the vicinity of the small body. We demonstrate the excellent performance of AstroSLAM using both real legacy mission imagery and trajectory data courtesy of NASA's Planetary Data System, as well as real in-lab imagery data generated on a 3 degree-of-freedom spacecraft simulator test-bed.
translated by 谷歌翻译
我们考虑了一个类别级别的感知问题,其中给定的2D或3D传感器数据描绘了给定类别的对象(例如,汽车),并且必须重建尽管级别的可变性,但必须重建对象的3D姿势和形状(即,不同的汽车模型具有不同的形状)。我们考虑了一个主动形状模型,其中 - 对于对象类别 - 我们获得了一个潜在的CAD模型库,描述该类别中的对象,我们采用了标准公式,其中姿势和形状是通过非非2D或3D关键点估算的-convex优化。我们的第一个贡献是开发PACE3D*和PACE2D*,这是第一个使用3D和2D关键点进行姿势和形状估计的最佳最佳求解器。这两个求解器都依赖于紧密(即精确)半决赛的设计。我们的第二个贡献是开发两个求解器的异常刺激版本,命名为PACE3D#和PACE2D#。为了实现这一目标,我们提出了Robin,Robin是一种一般的图理论框架来修剪异常值,该框架使用兼容性超图来建模测量的兼容性。我们表明,在类别级别的感知问题中,这些超图可以是通过关键点(以2D)或其凸壳(以3D为单位)构建的,并且可以通过最大的超级计算来修剪许多异常值。最后的贡献是广泛的实验评估。除了在模拟数据集和Pascal数据集上提供消融研究外,我们还将求解器与深关键点检测器相结合,并证明PACE3D#在Apolloscape数据集中在车辆姿势估算中改进了最新技术,并且其运行时间是兼容的使用实际应用。
translated by 谷歌翻译
近年来我们目睹了巨大进展的动机,本文提出了对协作同时定位和映射(C-SLAM)主题的科学文献的调查,也称为多机器人猛击。随着地平线上的自动驾驶车队和工业应用中的多机器人系统的兴起,我们相信合作猛击将很快成为未来机器人应用的基石。在本调查中,我们介绍了C-Slam的基本概念,并呈现了彻底的文献综述。我们还概述了C-Slam在鲁棒性,通信和资源管理方面的主要挑战和限制。我们通过探索该地区目前的趋势和有前途的研究途径得出结论。
translated by 谷歌翻译
在这项工作中,我们介绍了配备有明确性能的第一个初始化方法,该方法适用于姿势图同时定位和映射(SLAM)和旋转平均(RA)问题。 SLAM和旋转平均通常正义为大规模的非渗透点估计问题,具有许多糟糕的本地最小值,可以捕获通常应用的平滑优化方法来解决它们;因此,标准SLAM和RA算法的性能至关重要取决于用于初始化该本地搜索的估计的质量。虽然在文献中出现了SLAM和RA的许多初始化方法,但通常可以获得纯粹的启发式近似值,这使得难以确定是否(或在什么情况下)这些技术可以可靠地部署这些技术。相比之下,在这项工作中,我们研究通过光谱松弛镜头初始化的问题。具体而言,我们推出了SLAM和RA的简单谱弛豫,其形式使我们能够利用经典的线性代数技术(特征向量扰动界限)来控制从我们的光谱估计到(未知)地基实际和该距离作为测量噪声的函数的估计问题的全局最小化器。我们的结果揭示了测量网络在控制估计精度下播放的光谱图 - 理论性能的关键作用;此外,作为我们分析的副产物,我们在估计误差上获得了最大似然估计的估计误差,这可能具有独立兴趣。最后,我们在实验上展示了我们的光谱估计器在实践中非常有效,与现有的最先进技术相比,在较低的计算成本下生产可比或优异质量的初始化。
translated by 谷歌翻译
We argue the case for Gaussian Belief Propagation (GBP) as a strong algorithmic framework for the distributed, generic and incremental probabilistic estimation we need in Spatial AI as we aim at high performance smart robots and devices which operate within the constraints of real products. Processor hardware is changing rapidly, and GBP has the right character to take advantage of highly distributed processing and storage while estimating global quantities, as well as great flexibility. We present a detailed tutorial on GBP, relating to the standard factor graph formulation used in robotics and computer vision, and give several simulation examples with code which demonstrate its properties.
translated by 谷歌翻译
我们提出了Theseus,这是一个有效的应用程序不合时宜的开源库,用于在Pytorch上构建的可区分非线性最小二乘(DNL)优化,为机器人技术和视觉中的端到端结构化学习提供了一个共同的框架。现有的DNLS实施是特定应用程序的,并且并不总是纳入许多对效率重要的成分。 Theseus是应用程序不可静止的,正如我们使用的几个示例应用程序所用的,这些应用程序是使用相同的基础可区分组件构建的,例如二阶优化器,标准成本功能和Lie组。为了提高效率,TheseUS纳入了对稀疏求解器,自动矢量化,批处理,GPU加速度和梯度计算的支持,并具有隐式分化和直接损耗最小化。我们在一组应用程序中进行了广泛的性能评估,显示出这些功能时显示出明显的效率提高和更好的可扩展性。项目页面:https://sites.google.com/view/theseus-ai
translated by 谷歌翻译
本文介绍了一种在同时定位和映射(SLAM)框架中进行可靠测量的方法。现有方法在成对的基础上检查一致性或兼容性,但是在成对场景中,许多测量类型都没有足够的约束,以确定是否与其他测量不一致。本文介绍了组-K $一致性最大化(G $ K $ cm),该估计最大的测量值是内部组的一致性。可以为最大的组$ k $一致测量的求解作为广义图上最大集团问题的实例,并可以通过调整电流方法来解决。本文使用模拟数据评估了G $ K $ CM的性能,并将其与以前工作中介绍的成对一致性最大化(PCM)进行比较。
translated by 谷歌翻译
同时本地化和映射(SLAM)是自动移动机器人中的基本问题之一,在该机器人需要重建以前看不见的环境的同时,同时在地图上进行了本身。特别是,Visual-Slam使用移动机器人中的各种传感器来收集和感测地图的表示。传统上,基于几何模型的技术被用来解决大满贯问题,在充满挑战的环境下,该问题往往容易出错。诸如深度学习技术之类的计算机视觉方面的最新进展提供了一种数据驱动的方法来解决视觉范围问题。这篇综述总结了使用各种基于学习的方法的视觉 - 峰领域的最新进展。我们首先提供了基于几何模型的方法的简洁概述,然后进行有关SLAM当前范式的技术评论。然后,我们介绍了从移动机器人那里收集感官输入并执行场景理解的各种基于学习的方法。讨论并将基于深度学习的语义理解中的当前范式讨论并置于视觉峰的背景下。最后,我们讨论了在视觉 - 峰中基于学习的方法方向上的挑战和进一步的机会。
translated by 谷歌翻译
我们解决了学习观察模型的问题,用于估计的结束到底。在部分可观察环境中运行的机器人必须使用捕捉潜在状态和观察之间的联合分布的观测模型来推断潜在的状态。该推理问题可以作为使用所有先前测量的最可能的状态序列优化的图表中的目标。前工作使用观察模型,即已知先验,或者独立于图形优化器的代理损耗培训。在本文中,我们提出了一种方法,通过在循环中使用图形优化器学习观察模型来直接优化端到端跟踪性能。然而,可能出现这种直接方法,要求推断算法完全可分辨率,这很多最先进的图表优化器不是。我们的主要洞察力是推出作为基于能源学习的问题。我们提出了一种新颖的方法,Leo,用于学习观察模型的结束,具有可能是不可差异的图优化器。 Leo在从图形后面的采样轨迹之间交替,并更新模型以将这些样本与地面真相轨迹匹配。我们建议使用增量高斯牛顿溶剂有效地生成这些样品。我们将Leo与来自两个独特任务的数据集上的基线进行比较:导航和现实世界的平面推动。我们表明Leo能够学习具有较低误差和更少样本的复杂观测模型。补充视频:https://youtu.be/yqzlupudfka
translated by 谷歌翻译
在这项工作中,我们研究了在不确定性下的在线决策问题,我们将其制定为在信仰空间的规划中。在高维状态(例如,整个轨迹)上维护信仰(即,整个轨迹)不仅被证明可以显着提高准确性,而且还允许在主动SLAM和信息收集的任务所需的情况下规划信息理论目标。尽管如此,根据这种“平滑”范式的规划持有高计算复杂性,这使得在线解决方案具有挑战性。因此,我们建议以下想法:在规划之前,在初始信念上执行独立状态可变重新排序过程,并“推进”所有预测的环路关闭变量。由于初始可变顺序确定将受到传入更新影响的它们的哪个子集,因此这种重新排序允许我们最小化受影响变量的总数,并在规划期间降低候选评估的计算复杂性。我们称之为Pivot:预测增量变量订购策略。应用此策略也可以提高国家推理效率;如果我们在规划会议后维持枢轴令,那么我们应该同样降低循环闭合的成本,当实际发生时。为了展示其有效性,我们将枢轴应用于一个现实的主动Slam仿真中,在那里我们设法显着减少了规划和推理会话的计算时间。该方法适用于一般分布,并不能准确地损失。
translated by 谷歌翻译
对象姿势预测的最新进展为机器人在导航期间构建对象级场景表示形式提供了有希望的途径。但是,当我们在新颖环境中部署机器人时,分发数据可能会降低预测性能。为了减轻域间隙,我们可以使用机器人捕获图像作为伪标签的预测在目标域中进行自我训练,以微调对象姿势估计器。不幸的是,姿势预测通常是折磨的,很难量化它们的不确定性,这可能会导致低质量的伪标记数据。为了解决这个问题,我们提出了一种猛烈支持的自我训练方法,利用机器人对3D场景几何形状的理解来增强对象姿势推断性能。将姿势预测与机器人探光仪相结合,我们制定并求解姿势图优化以完善对象姿势估计,并使伪标签在整个帧中更加一致。我们将姿势预测协方差纳入变量中,以自动建模其不确定性。这种自动协方差调整(ACT)过程可以在组件级别拟合6D姿势预测噪声,从而导致高质量的伪训练数据。我们在YCB视频数据集和实际机器人实验中使用深对象姿势估计器(DOPE)测试我们的方法。它在两种测试中的姿势预测中分别达到34.3%和17.8%的精度提高。我们的代码可在https://github.com/520xyxyzq/slam-super-6d上找到。
translated by 谷歌翻译
主动同时定位和映射(SLAM)是规划和控制机器人运动以构建周围环境中最准确,最完整的模型的问题。自从三十多年前出现了积极感知的第一项基础工作以来,该领域在不同科学社区中受到了越来越多的关注。这带来了许多不同的方法和表述,并回顾了当前趋势,对于新的和经验丰富的研究人员来说都是非常有价值的。在这项工作中,我们在主动大满贯中调查了最先进的工作,并深入研究了仍然需要注意的公开挑战以满足现代应用程序的需求。为了实现现实世界的部署。在提供了历史观点之后,我们提出了一个统一的问题制定并审查经典解决方案方案,该方案将问题分解为三个阶段,以识别,选择和执行潜在的导航措施。然后,我们分析替代方法,包括基于深入强化学习的信念空间规划和现代技术,以及审查有关多机器人协调的相关工作。该手稿以讨论新的研究方向的讨论,解决可再现的研究,主动的空间感知和实际应用,以及其他主题。
translated by 谷歌翻译