本文研究了从深度摄像机读数中构建平面区域的多重代表的问题。这个问题对于复杂环境中的地形映射非常重要,并且在腿部运动应用中具有巨大的潜力。为了解决多重平面区域的表征问题,我们提出了一个两阶段的解决方案方案。在第一阶段,嵌入深度图像序列中的平面区域首先单独提取,然后合并以建立一个仅包含所选框架中平面区域的地形图。为了简化适用于腿部机器人立足计划的平面区域的表示,我们在第二阶段通过低维度的多面体进一步近似提取的平面区域。借助多重代表,所提出的方法在准确性和简单性之间取得了巨大的平衡。对RGB-D相机进行了实验验证,以证明所提出的方案的性能。所提出的方案成功地通过多面体以可接受的精度来表征平面区域。更重要的是,在整个测试中,整体感知方案的运行时间小于10ms(即> 100Hz),这强烈说明了本文中我们发展的方法的优势。
translated by 谷歌翻译
激光雷达传感器是在未知环境中同时定位和映射(SLAM)的强大工具,但是它们产生的原始点云是密集的,计算量昂贵,并且不适合下游自治任务(例如运动计划)直接使用。为了与运动计划集成,希望大满贯管道生成轻量级的几何图表示。这样的表示也特别适合人造环境,通常可以将其视为在笛卡尔网格上建造的所谓“曼哈顿世界”。在这项工作中,我们为曼哈顿世界环境提出了一种3D激光雷达大满贯算法,该算法从点云中提取平面特征,以实现轻便,实时的定位和映射。我们的方法生成基于平面的地图,其记忆占其位置的记忆力明显少得多,并且适合于快速碰撞检查运动计划。通过利用曼哈顿世界的假设,我们靶向正交平面的提取,以生成比现有基于平面的LIDAR SLAM方法更结构化和组织的地图。我们证明了我们在高保真的AirSim模拟器以及配备有速蛋白底激光片的地面漫游车的现实实验中。在这两种情况下,我们都能够以匹配10 Hz的传感器速率的速率生成高质量的图和轨迹估计值。
translated by 谷歌翻译
根据一般静态障碍物检测的要求,本文提出了无人接地车辆局部静态环境的紧凑型矢量化表示方法。首先,通过融合LiDAR和IMU的数据,获得了高频姿势信息。然后,通过二维(2D)障碍物点的生成,提出了具有固定尺寸的网格图维护过程。最后,通过多个凸多边形描述了局部静态环境,该多边形实现了基于双阈值的边界简化和凸多边形分割。我们提出的方法已应用于公园的一个实用无人驾驶项目中,典型场景的定性实验结果验证了有效性和鲁棒性。此外,定量评估表明,与传统的基于网格地图的方法相比,使用较少的点信息(减少约60%)来代表局部静态环境。此外,运行时间(15ms)的性能表明,所提出的方法可用于实时局部静态环境感知。可以在https://github.com/ghm0819/cvr_lse上访问相应的代码。
translated by 谷歌翻译
在本文中,我们提出了一种从3D点云生成分层的体积拓扑图的方法。我们的地图中有三个基本的分层级别:$ Storey - Region - 卷$。我们的方法的优点在输入和输出中反映。在输入方面,我们接受多层点云和建筑结构,倾斜的屋顶或天花板。在输出方面,我们可以使用不同维度的度量信息来生成结果,适用于不同的机器人应用。算法通过从3D Voxel占用映射生成$卷$来生成体积表示。然后,我们加入$段落$ s($卷$之间的连接),将小$卷$组合成一个大多数$地区$,并使用2D分段方法进行更好的拓扑表示。我们在几个可自由的数据集中评估我们的方法。实验突出了我们的方法的优势。
translated by 谷歌翻译
尽管常规机器人系统中的每个不同任务都需要专用的场景表示形式,但本文表明,统一表示形式可以直接用于多个关键任务。我们提出了用于映射,进程和计划(LOG-GPIS-MOP)的log-gaussian过程隐式表面:基于统一表示形式的表面重建,本地化和导航的概率框架。我们的框架将对数转换应用于高斯过程隐式表面(GPIS)公式,以恢复全局表示,该表示可以准确地捕获具有梯度的欧几里得距离场,同时又是隐式表面。通过直接估计距离字段及其通过LOG-GPIS推断的梯度,提出的增量进程技术计算出传入帧的最佳比对,并在全球范围内融合以生成MAP。同时,基于优化的计划者使用相同的LOG-GPIS表面表示计算安全的无碰撞路径。我们根据最先进的方法验证了2D和3D和3D和基准测试的模拟和真实数据集的拟议框架。我们的实验表明,LOG-GPIS-MOP在顺序的音程,表面映射和避免障碍物中产生竞争结果。
translated by 谷歌翻译
本文提出了一种新颖的方法,用于在具有复杂拓扑结构的地下领域的搜索和救援行动中自动合作。作为CTU-Cras-Norlab团队的一部分,拟议的系统在DARPA SubT决赛的虚拟轨道中排名第二。与专门为虚拟轨道开发的获奖解决方案相反,该建议的解决方案也被证明是在现实世界竞争极为严峻和狭窄的环境中飞行的机上实体无人机的强大系统。提出的方法可以使无缝模拟转移的无人机团队完全自主和分散的部署,并证明了其优于不同环境可飞行空间的移动UGV团队的优势。该论文的主要贡献存在于映射和导航管道中。映射方法采用新颖的地图表示形式 - 用于有效的风险意识长距离计划,面向覆盖范围和压缩的拓扑范围的LTVMAP领域,以允许在低频道通信下进行多机器人合作。这些表示形式与新的方法一起在导航中使用,以在一般的3D环境中可见性受限的知情搜索,而对环境结构没有任何假设,同时将深度探索与传感器覆盖的剥削保持平衡。所提出的解决方案还包括一条视觉感知管道,用于在没有专用GPU的情况下在5 Hz处进行四个RGB流中感兴趣的对象的板上检测和定位。除了参与DARPA SubT外,在定性和定量评估的各种环境中,在不同的环境中进行了广泛的实验验证,UAV系统的性能得到了支持。
translated by 谷歌翻译
休眠季节葡萄树修剪需要熟练的季节性工人,这在冬季变得越来越缺乏。随着在短期季节性招聘文化和低工资的短期季节性招聘文化和低工资的时间内,随着工人更少的葡萄藤,葡萄藤往往被修剪不一致地导致葡萄化物不平衡。除此之外,目前现有的机械方法无法选择性地修剪葡萄园和手动后续操作,通常需要进一步提高生产成本。在本文中,我们展示了崎岖,全自治机器人的设计和田间评估,用于休眠季节葡萄园的端到最终修剪。该设计的设计包括新颖的相机系统,运动冗余机械手,地面机器人和在感知系统中的新颖算法。所提出的研究原型机器人系统能够在213秒/葡萄藤中完全从两侧刺激一排藤蔓,总修枝精度为87%。与机械预灌浆试验相比,商业葡萄园中自治系统的初始现场测试显示出休眠季节修剪的显着变化。在手稿中描述了设计方法,系统组件,经验教训,未来增强以及简要的经济分析。
translated by 谷歌翻译
在这项研究中,我们提出了一种新型的视觉定位方法,以根据RGB摄像机的可视数据准确估计机器人在3D激光镜头内的六个自由度(6-DOF)姿势。使用基于先进的激光雷达的同时定位和映射(SLAM)算法,可获得3D地图,能够收集精确的稀疏图。将从相机图像中提取的功能与3D地图的点进行了比较,然后解决了几何优化问题,以实现精确的视觉定位。我们的方法允许使用配备昂贵激光雷达的侦察兵机器人一次 - 用于映射环境,并且仅使用RGB摄像头的多个操作机器人 - 执行任务任务,其本地化精度高于常见的基于相机的解决方案。该方法在Skolkovo科学技术研究所(Skoltech)收集的自定义数据集上进行了测试。在评估本地化准确性的过程中,我们设法达到了厘米级的准确性;中间翻译误差高达1.3厘米。仅使用相机实现的确切定位使使用自动移动机器人可以解决需要高度本地化精度的最复杂的任务。
translated by 谷歌翻译
本文介绍了使用腿收割机进行精密收集任务的集成系统。我们的收割机在狭窄的GPS拒绝了森林环境中的自主导航和树抓取了一项挑战性的任务。提出了映射,本地化,规划和控制的策略,并集成到完全自主系统中。任务从使用定制的传感器模块开始使用人员映射感兴趣区域。随后,人类专家选择树木进行收获。然后将传感器模块安装在机器上并用于给定地图内的本地化。规划算法在单路径规划问题中搜索一个方法姿势和路径。我们设计了一个路径,后面的控制器利用腿的收割机的谈判粗糙地形的能力。在达接近姿势时,机器用通用夹具抓住一棵树。此过程重复操作员选择的所有树。我们的系统已经在与树干和自然森林中的测试领域进行了测试。据我们所知,这是第一次在现实环境中运行的全尺寸液压机上显示了这一自主权。
translated by 谷歌翻译
在过去几年中,自动驾驶一直是最受欢迎,最具挑战性的主题之一。在实现完全自治的道路上,研究人员使用了各种传感器,例如LIDAR,相机,惯性测量单元(IMU)和GPS,并开发了用于自动驾驶应用程序的智能算法,例如对象检测,对象段,障碍,避免障碍物,避免障碍物和障碍物,以及路径计划。近年来,高清(HD)地图引起了很多关注。由于本地化中高清图的精度和信息水平很高,因此它立即成为自动驾驶的关键组成部分之一。从Baidu Apollo,Nvidia和TomTom等大型组织到个别研究人员,研究人员创建了用于自主驾驶的不同场景和用途的高清地图。有必要查看高清图生成的最新方法。本文回顾了最新的高清图生成技术,这些技术利用了2D和3D地图生成。这篇评论介绍了高清图的概念及其在自主驾驶中的有用性,并详细概述了高清地图生成技术。我们还将讨论当前高清图生成技术的局限性,以激发未来的研究。
translated by 谷歌翻译
我们提出了一种准确而坚固的多模态传感器融合框架,Metroloc,朝着最极端的场景之一,大规模地铁车辆本地化和映射。 Metroloc在以IMU为中心的状态估计器上构建,以较轻耦合的方法紧密地耦合光检测和测距(LIDAR),视觉和惯性信息。所提出的框架由三个子模块组成:IMU Odometry,LiDar - 惯性内径术(LIO)和视觉惯性内径(VIO)。 IMU被视为主要传感器,从LIO和VIO实现了从LIO和VIO的观察,以限制加速度计和陀螺仪偏差。与以前的点LIO方法相比,我们的方法通过将线路和平面特征引入运动估计来利用更多几何信息。 VIO还通过使用两条线和点来利用环境结构信息。我们所提出的方法在具有维护车辆的长期地铁环境中广泛测试。实验结果表明,该系统比使用实时性能的最先进的方法更准确和强大。此外,我们开发了一系列虚拟现实(VR)应用,以实现高效,经济,互动的轨道车辆状态和轨道基础设施监控,已经部署到室外测试铁路。
translated by 谷歌翻译
我们提出了地形遍历映射(TTM),是一个非结构化环境中自主挖掘机的地形推动性估算和路径规划的实时映射方法。我们提出了一种高效的基于学习的几何方法,可以从RGB图像和3D PointClouds中提取地形特征,并将它们纳入全球地图以进行自主挖掘的规划和导航。我们的方法使用了挖掘机的物理特性,包括最大攀爬程度和其他机器规格,以确定可遍历的区域。我们的方法可以适应更改环境并实时更新地形信息。此外,我们准备了一个小说数据集,自主挖掘机地形(AET)数据集,由来自施工站点的RGB图像,根据导航性,七个类别。我们将我们的映射方法与自动挖掘机导航系统中的规划和控制模块集成在一起,这在基于现有规划计划的成功率方面优于前面的方法49.3%。通过我们的映射,挖掘机可以通过由深坑,陡峭的山丘,岩石桩和其他复杂地形特征的非结构化环境导航。
translated by 谷歌翻译
Object SLAM使用其他语义信息来检测和映射场景中的对象,以提高系统的感知和地图表示功能。四边形和立方体通常用于表示对象,但是它们的单个形状限制了对象图的准确性,从而影响下游任务的应用。在本文中,我们将具有形状参数的超Quadicrics(SQ)引入猛击中以表示对象,并提出了一种单独的参数估计方法,该方法可以准确估算对象姿势并适应不同的形状。此外,我们提出了一种轻巧的数据关联策略,用于将多个视图中的语义观察与对象地标正确关联。我们通过实时性能实施一个单眼语义大满贯系统,并在公共数据集上进行全面的实验。结果表明,我们的方法能够构建准确的对象映射,并且在对象表示中具有优势。代码将在接受后发布。
translated by 谷歌翻译
现有的LIDAR基金​​标记系统具有使用限制。特别是,利达塔格(Lidartag)需要特定的标记放置和基于图像的激光雷达基准标记,要求从一个角度对点云进行采样。结果,随着点云从多个角度采样,基准标记的检测仍然是一个未解决的问题。在这封信中,我们开发了一种新颖的算法来检测多视点云中的基准标记。提出的算法包括两个阶段。首先,感兴趣的区域(ROI)检测发现可能包含基准标记的点簇。具体而言,由于从空间的角度来看,从强度的角度提取ROI的方法是引入的,即从空间角度来看,标记是纸张或薄板的床单,与它们所连接的平面是不可区分的。其次,标记检测验证候选ROI是否包含基金标记,并输出有效ROI中标记的ID号和顶点位置。特别是,将ROI传输到预定义的中间平面,目的是采用球形投影以生成强度图像,然后通过强度图像完成标记检测。提供定性和定量实验结果以验证所提出的算法。代码和结果可在以下网址获得:https://github.com/york-sdcnlab/marker?detection-general
translated by 谷歌翻译
传统的LIDAR射测(LO)系统主要利用从经过的环境获得的几何信息来注册激光扫描并估算Lidar Ego-Motion,而在动态或非结构化环境中可能不可靠。本文提出了Inten-loam,一种低饮用和健壮的激光镜和映射方法,该方法完全利用激光扫描的隐式信息(即几何,强度和时间特征)。扫描点被投影到圆柱形图像上,这些图像有助于促进各种特征的有效和适应性提取,即地面,梁,立面和反射器。我们提出了一种新型基于强度的点登记算法,并将其纳入LIDAR的探光仪,从而使LO系统能够使用几何和强度特征点共同估计LIDAR EGO-MOTION。为了消除动态对象的干扰,我们提出了一种基于时间的动态对象删除方法,以在MAP更新之前过滤它们。此外,使用与时间相关的体素网格滤波器组织并缩减了本地地图,以维持当前扫描和静态局部图之间的相似性。在模拟和实际数据集上进行了广泛的实验。结果表明,所提出的方法在正常驾驶方案中实现了类似或更高的精度W.R.T,在非结构化环境中,最先进的方法优于基于几何的LO。
translated by 谷歌翻译
结合同时定位和映射(SLAM)估计和动态场景建模可以高效地在动态环境中获得机器人自主权。机器人路径规划和障碍避免任务依赖于场景中动态对象运动的准确估计。本文介绍了VDO-SLAM,这是一种强大的视觉动态对象感知SLAM系统,用于利用语义信息,使得能够在场景中进行准确的运动估计和跟踪动态刚性物体,而无需任何先前的物体形状或几何模型的知识。所提出的方法识别和跟踪环境中的动态对象和静态结构,并将这些信息集成到统一的SLAM框架中。这导致机器人轨迹的高度准确估计和对象的全部SE(3)运动以及环境的时空地图。该系统能够从对象的SE(3)运动中提取线性速度估计,为复杂的动态环境中的导航提供重要功能。我们展示了所提出的系统对许多真实室内和室外数据集的性能,结果表明了对最先进的算法的一致和实质性的改进。可以使用源代码的开源版本。
translated by 谷歌翻译
主动映射的传统方法专注于构建几何图。但是,对于大多数真实世界应用程序,可行的信息与环境中的语义有意义的对象有关。我们提出了一种用于主动度量语义映射问题的方法,该方法使多个异质机器人能够协作构建环境地图。这些机器人积极探索以最大程度地减少语义(对象分类)和几何(对象建模)信息中的不确定性。我们使用信息丰富但稀疏的对象模型表示环境,每个模型由基本形状和语义类标签组成,并使用大量现实世界数据在经验上表征不确定性。鉴于先前的地图,我们使用此模型为每个机器人选择动作以最大程度地减少不确定性。通过多种现实世界环境中的多机器人实验证明了我们的算法的性能。所提出的框架适用于广泛的现实问题,例如精确农业,基础设施检查和工厂中的资产映射。
translated by 谷歌翻译
自动驾驶的车辆和自动地面机器人需要一种可靠,准确的方法来分析周围环境的遍历以进行安全导航。本文提出并评估了一种基于机器学习的遍历性分析方法,该方法将基于SVM分类器的混合方法中的几何特征与基于外观的特征相结合。特别是,我们表明,整合一组新的几何和视觉特征并专注于重要的实施细节,可以显着提高性能和可靠性。已提出的方法已与最先进的深度学习方法进行了比较。在不同的复杂性方面,它的准确性为89.2%,表明其有效性和鲁棒性。该方法在CPU上完全运行,并在其他方法方面达到可比的结果,运行速度更快,并且需要更少的硬件资源。
translated by 谷歌翻译
本文通过底层云的表面表示,在不平坦的环境中引入了一种新的机器人运动计划和导航的方法。所提出的方法通过将机器人的运动学和物理约束与标准运动计划算法(例如,来自开放运动计划库的机器人)纳入了最先进的导航方法的缺点,从而实现了有效的基于采样的计划者在原始点云图上挑战不平衡的地形导航。与基于数字高程图(DEMS)的技术不同,我们的新型基于表面的状态空间公式和实现是基于原始点云图,从而允许建模重叠的表面,例如桥梁,码头和隧道。实验结果证明了在真实和模拟的非结构化环境中提出的机器人导航方法的鲁棒性。拟议的方法还通过将基于我们基于Surfel的方法的机器人约束抽样策略提高其成功率的成功率,从而优化了计划者的表现。最后,我们提供了拟议方法的开源实施,以使机器人社区受益。
translated by 谷歌翻译
在本文中,我们考虑了视觉同时定位和映射(SLAM)的实际应用中的问题。随着技术在广泛范围中的普及和应用,SLAM系统的可实用性已成为一个在准确性和鲁棒性之后,例如,如何保持系统的稳定性并实现低文本和低文本和中的准确姿势估计动态环境以及如何在真实场景中改善系统的普遍性和实时性能。动态对象在高度动态的环境中的影响。我们还提出了一种新型的全局灰色相似性(GGS)算法,以实现合理的钥匙扣选择和有效的环闭合检测(LCD)。受益于GGS,PLD-SLAM可以在大多数真实场景中实现实时准确的姿势估计,而无需预先训练和加载巨大的功能词典模型。为了验证拟议系统的性能,我们将其与公共数据集Kitti,Euroc MAV和我们提供的室内立体声数据集的现有最新方法(SOTA)方法进行了比较。实验表明,实验表明PLD-SLAM在大多数情况下确保稳定性和准确性,具有更好的实时性能。此外,通过分析GGS的实验结果,我们可以发现它在关键帧选择和LCD中具有出色的性能。
translated by 谷歌翻译