基于点云的3D建模需要从非接地物体分开地面的地面过滤算法。本研究提出了两个地面过滤算法。第一个基于正常载体。它有两个变体,具体取决于计算K-Collect邻居的过程。第二算法基于将云点转换为体素结构。为了评估它们,根据其执行时间,有效性和效率进行比较这两种算法。结果表明,基于体素结构的地面滤波算法在执行时间,有效性和效率方面比法线矢量接地滤波更快。
translated by 谷歌翻译
准确的轨道位置是铁路支持驱动系统的重要组成部分,用于安全监控。激光雷达可以获得携带铁路环境的3D信息的点云,特别是在黑暗和可怕的天气条件下。在本文中,提出了一种基于3D点云的实时轨识别方法来解决挑战,如无序,不均匀的密度和大量点云的挑战。首先呈现Voxel Down-采样方法,用于铁路点云的密度平衡,并且金字塔分区旨在将3D扫描区域划分为具有不同卷的体素。然后,开发了一个特征编码模块以找到最近的邻点并聚合它们的局部几何特征。最后,提出了一种多尺度神经网络以产生每个体素和轨道位置的预测结果。该实验是在铁路的3D点云数据的9个序列下进行的。结果表明,该方法在检测直,弯曲和其他复杂的拓扑轨道方面具有良好的性能。
translated by 谷歌翻译
建筑物的表面裂缝,天然墙壁和地下矿井隧道可以表示严重的结构完整性问题,威胁到环境中的结构和人们的安全。及时检测和监测裂缝对于管理这些风险至关重要,特别是如果系统可以通过机器人提供高度自动化。使用深神经网络的视觉裂缝检测算法表现出墙壁或土木工程隧道等结构表面的承诺,但是工作的少量工作已经解决了高度非结构化的环境,例如岩石悬崖和裸露的采矿隧道。为了解决这一挑战,本文介绍了一个用于非结构化表面的新的3D点云的裂缝检测算法。该方法包括三个关键组件:一种自适应的下采样方法,其保持足够的裂缝点密度,将每个点作为裂缝或非裂缝分类的DNN,以及将裂缝点分成裂缝的后处理聚类方法。该方法在新的大型天然岩数据集上通过实验验证,包括跨越900米^ 2和412个单独裂缝的彩色激光雷达云。结果证明裂缝检出率为97%,最大宽度为3厘米以上的裂缝100%,显着优于现有技术。此外,对于交叉验证,PointCrack3D应用于在不同位置获取的完全新数据集,并且在培训中根本不使用,并显示为检测其100%的裂缝实例。我们还表征了检测性能,裂缝宽度和点数的点数之间的关系,为其提供了对实际部署和未来研究方向作出决策的基础。
translated by 谷歌翻译
从点云中自动创建几何模型在CAD(例如,逆向工程,制造,组装)中具有许多应用,并且通常在形状建模和处理中。给定一个代表人造对象的分段点云,我们提出了一种识别简单几何原语及其相互关系的方法。我们的方法基于Hough Transform(HT),以应对噪音,缺失零件和离群值的能力。在我们的方法中,我们介绍了一种用于处理分段点云的新技术,该技术通过投票程序能够提供表征每种原始类型的几何参数的初始估计。通过使用这些估计值,我们将对最佳解决方案的搜索定位在尺寸还原的参数空间中,从而使将HT扩展到比文献(即平面和球体中通常发现的)更有效。然后,我们提取了许多以唯一特征段的几何描述符,并且根据这些描述符,我们展示了如何汇总原语(段)(段)。对合成和工业扫描的实验揭示了原始拟合方法的鲁棒性及其在推断细分之间关系的有效性。
translated by 谷歌翻译
自动驾驶的车辆和自动地面机器人需要一种可靠,准确的方法来分析周围环境的遍历以进行安全导航。本文提出并评估了一种基于机器学习的遍历性分析方法,该方法将基于SVM分类器的混合方法中的几何特征与基于外观的特征相结合。特别是,我们表明,整合一组新的几何和视觉特征并专注于重要的实施细节,可以显着提高性能和可靠性。已提出的方法已与最先进的深度学习方法进行了比较。在不同的复杂性方面,它的准确性为89.2%,表明其有效性和鲁棒性。该方法在CPU上完全运行,并在其他方法方面达到可比的结果,运行速度更快,并且需要更少的硬件资源。
translated by 谷歌翻译
在这项工作中,我们介绍了一个新颖的全球描述符,称为3D位置识别的稳定三角形描述符(STD)。对于一个三角形,其形状由侧面或包含角度的长度唯一决定。此外,三角形的形状对于刚性转换完全不变。基于此属性,我们首先设计了一种算法,以从3D点云中有效提取本地密钥点,并将这些关键点编码为三角形描述符。然后,通过匹配点云之间描述符的侧面长度(以及其他一些信息)来实现位置识别。从描述符匹配对获得的点对应关系可以在几何验证中进一步使用,从而大大提高了位置识别的准确性。在我们的实验中,我们将我们提出的系统与公共数据集(即Kitti,NCLT和Complex-ublan)和我们自我收集的数据集(即M2DP,扫描上下文)进行了广泛的比较(即M2DP,扫描上下文)(即带有非重复扫描固态激光雷达)。所有定量结果表明,性病具有更强的适应性,并且在其对应物方面的精度有了很大的提高。为了分享我们的发现并为社区做出贡献,我们在GitHub上开放代码:https://github.com/hku-mars/std。
translated by 谷歌翻译
LIDAR传感器提供有关周围场景的丰富3D信息,并且对于自动驾驶汽车的任务(例如语义细分,对象检测和跟踪)变得越来越重要。模拟激光雷达传感器的能力将加速自动驾驶汽车的测试,验证和部署,同时降低成本并消除现实情况下的测试风险。为了解决以高保真度模拟激光雷达数据的问题,我们提出了一条管道,该管道利用移动映射系统获得的现实世界点云。基于点的几何表示,更具体地说,已经证明了它们能够在非常大点云中准确对基础表面进行建模的能力。我们引入了一种自适应夹层生成方法,该方法可以准确地对基础3D几何形状进行建模,尤其是对于薄结构。我们还通过在GPU上铸造Ray铸造的同时,在有效处理大点云的同时,我们还开发了更快的时间激光雷达模拟。我们在现实世界中测试了激光雷达的模拟,与基本的碎片和网格划分技术相比,表现出定性和定量结果,证明了我们的建模技术的优势。
translated by 谷歌翻译
在使用3D LiDAR传感器的3D感知领域中,地面分割是各种目的的必不可少的任务,例如可穿越的区域检测和对象识别。在这种情况下,已经提出了几种地面分割方法。但是,仍然遇到一些限制。首先,某些地面分割方法需要根据周围环境进行微调,这是过于费力且耗时的。此外,即使参数进行了充分的调整,部分分割问题仍然可能出现,这意味着某些地区的地面细分失败。最后,当地面在另一个结构(例如固定壁)之上时,地面分割方法通常无法估计适当的接地平面。为了解决这些问题,我们提出了一种称为PatchWork ++的强大地面分割方法,该方法是拼布的扩展。 Patchwork ++利用自适应地面可能性估计(A-GLE),根据先前的地面分割结果适应适当的参数。此外,暂时的地面还原(TGR)通过使用临时地面财产来减轻部分不及分段问题。同样,即使用不同的层抬高地面,也会引入区域垂直平面拟合(R-VPF),以正确分割接地平面。最后,我们提出反射的噪声去除(RNR),以根据3D激光雷达反射模型有效地消除虚拟噪声点。我们使用Semantickitti数据集证明了定性和定量评估。我们的代码可从https://github.com/url-kaist/patchwork-plusplus获得
translated by 谷歌翻译
循环闭合检测是在复杂环境中长期机器人导航的关键技术。在本文中,我们提出了一个全局描述符,称为正态分布描述符(NDD),用于3D点云循环闭合检测。描述符编码点云的概率密度分数和熵作为描述符。我们还提出了快速旋转对准过程,并将相关系数用作描述符之间的相似性。实验结果表明,我们的方法在准确性和效率上都优于最新点云描述符。源代码可用,可以集成到现有的LIDAR射测和映射(壤土)系统中。
translated by 谷歌翻译
在多个会话中处理环境图的能力对于长时间运行的机器人至关重要。具体而言,自主代理人希望检测不同会话的地图之间的变化,以便对当前环境产生无冲突的理解。在本文中,我们研究了基于新的地图表示的变化检测问题,称为平面签名距离场(PlanesDF),其中密集的地图表示为平面的集合及其SDF体积中的相关几何成分。给定的源场和目标场景的点云,我们提出了一种基于三步的平面变更检测方法:(1)平面DF卷在每个场景中实例化并使用平面姿势在场景中注册;通过高度投影和连接的组件分析提取2D高度图和对象图。 (2)比较高度图并与对象图相交,以生成2D更改位置掩码,以用于源场景中更改的对象候选者。 (3)使用SDF衍生的每个对象候选者进行更改掩码细化的功能进行3D几何验证。我们在合成数据集和现实世界数据集上评估我们的方法,并通过更改对象检测的任务来证明其有效性。
translated by 谷歌翻译
混凝土是建筑,桥梁和道路的标准施工材料。由于安全在这种结构的设计,监测和维护中起着核心作用,因此了解混凝土的开裂行为非常重要。计算机断层扫描捕获建筑材料的微观结构,并允许研究裂纹启动和传播。大3D图像中的裂缝表面的手动分割是不可行的。在本文中,综述了3D图像的自动裂缝分段方法并进行了比较。经典图像处理方法(边缘检测滤波器,模板匹配,最小路径和区域生长算法)和学习方法(卷积神经网络,随机林)在半合成3D图像上进行测试和测试。它们的性能强烈依赖于参数选择,该参数选择应适应图像的灰度范围和混凝土的几何特性。通常,学习方法表现最佳,特别是对于薄裂缝和低灰度对比度。
translated by 谷歌翻译
注册森林环境的点云是精密林业局部激光雷达应用的必要先决条件。最先进的森林点云登记方法需要提取单个树属性,并且在处理具有致密树的真实森林点云时,它们具有效率的瓶颈。我们提出了一种自动,坚固,高效的方法,用于登记森林点云。我们的方法首先定位树从原料点云茎,然后根据他们的相对空间关系确定准变换茎匹配。相较于现有的方法,我们的算法不需要额外的单株属性,具有线性复杂的环境中的树木数量,允许它的大森林环境对齐点云。广泛的实验表明,我们的方法优于关于登记精度和稳健性的最先进的方法,并且在效率方面显着优于现有技术。此外,我们引入一个新的基准数据集,补充的开发和注册方法评价森林点云的极少数现有的开放的数据集。
translated by 谷歌翻译
学习3D点云的新表示形式是3D视觉中的一个活跃研究领域,因为订单不变的点云结构仍然对神经网络体系结构的设计构成挑战。最近的作品探索了学习全球或本地功能或两者兼而有之,但是均未通过分析点的局部方向分布来捕获上下文形状信息的早期方法。在本文中,我们利用点附近的点方向分布,以获取点云的表现力局部邻里表示。我们通过将给定点的球形邻域分为预定义的锥体来实现这一目标,并将每个体积内部的统计数据用作点特征。这样,本地贴片不仅可以由所选点的最近邻居表示,还可以考虑沿该点周围多个方向定义的点密度分布。然后,我们能够构建涉及依赖MLP(多层感知器)层的Odfblock的方向分布函数(ODF)神经网络。新的ODFNET模型可实现ModelNet40和ScanObjectNN数据集的对象分类的最新精度,并在Shapenet S3DIS数据集上进行分割。
translated by 谷歌翻译
从3D点云中对可遍历区域和感兴趣的对象的感知是自主导航中的关键任务之一。一辆地面车辆需要寻找可以通过车轮探索的可遍历的地形。然后,为了做出安全的导航决定,必须跟踪位于这些地形上的物体的分割。但是,过度分割和分割不足可能会对此类导航决策产生负面影响。为此,我们提出了旅行,该行程使用3D点云的图表表示可遍历的地面检测和对象聚类。为了将可穿越的接地段分割,将点云编码为图形结构,即三个格里德字段,该场将每个三个格里德视为节点。然后,通过检查连接节点的边缘的局部凸度和凹度来搜索和重新定义可遍历的区域。另一方面,我们的地上对象分割通过表示球形预测空间中的一组水平相邻的3D点作为节点和节点之间的垂直/水平关系,以使用图形结构。充分利用节点边缘结构,上面的分割可确保实时操作并减轻过度分割。通过使用模拟,城市场景和我们自己的数据集的实验,我们已经证明,根据常规指标,我们提出的遍历地面分割算法优于其他最新方法,并且我们新提出的评估指标对于评估是有意义的地上细分。我们将在https://github.com/url-kaist/travel上向公开提供代码和自己的数据集。
translated by 谷歌翻译
3D图像分割是许多医学分析和识别方案的最新至关重要的步骤。实际上,由于其重要性和影响力,它代表了一个相关的研究主题和基本挑战。本文提供了一个基于深度学习的系统,该系统杂交了各种有效的方法,以获取最佳的3D分割输出。首先,为了减少数据量并加速处理时间,建议并证明了脱节压缩技术的应用。然后,我们使用CNN模型将牙科图像分为15个分离的类。最后,采用特殊的基于KNN的转换,目的是为了去除孤立的网格和校正牙齿形式。实验证明了在私人临床基准内应用于3D牙科图像的所选框架的精度和鲁棒性。
translated by 谷歌翻译
尽管深度神经网络在各个领域中受到欢迎,但从机载激光扫描(ALS)点云中提取数字地形模型(DTM)仍然具有挑战性。这可能是由于缺乏专用的大规模注释数据集以及点云和DTMS之间的数据结构差异。为了促进数据驱动的DTM提取,本文从开源的ALS点云和相应的DTM中收集了带有各种城市,森林和山区场景的相应DTM。提出了一种基线方法,作为第一次尝试通过栅格化技术(即涂层的深层)从ALS点云中直接从ALS点云中提取数字地形模型的尝试。进行了良好的方法进行广泛的研究,以基准数据集对数据集进行基准测试,并分析学习从点云中提取DTM的挑战。实验结果显示了不可知论数据驱动的方法的兴趣,与为DTM提取设计的方法相比,次级误差级别。数据和源代码可在https://lhoangan.github.io/deepterra/上提供可重复性和进一步的类似研究。
translated by 谷歌翻译
LIDAR数据可用于生成点云,用于导航自动驾驶汽车或移动机器人平台。扫描匹配是估计最能使两个点云的刚性转换的过程,是LiDAR探射仪的基础,这是一种死亡估算的形式。当没有GPS(例如GPS)(例如GPS)(例如GPS)时,LIDAR的探光仪特别有用。在这里,我们提出了迭代最接近的椭圆形变换(ICET),这是一种扫描匹配算法,可对当前最新的正常分布变换(NDT)进行两种新颖的改进。像NDT一样,ICET将激光雷达数据分解为体素,并将高斯分布拟合到每个体素内的点。 ICET的第一个创新通过沿着这些方向抑制溶液来降低沿着大型平坦表面的几何歧义。 ICET的第二个创新是推断与连续点云之间的位置和方向转换相关的输出误差协方差;当将ICET纳入诸如扩展的卡尔曼滤波器之类的状态估计例程中时,误差协方差特别有用。我们构建了一个模拟,以比较有或没有几何歧义的2D空间中ICET和NDT的性能,并发现ICET产生了出色的估计值,同时可以准确预测溶液的准确性。
translated by 谷歌翻译
Paris-Carla-3d是由移动激光器和相机系统构建的几个浓彩色点云的数据集。数据由两组具有来自开源Carla模拟器(700百万分)的合成数据和在巴黎市中获取的真实数据(6000万分),因此Paris-Carla-3d的名称。此数据集的一个优点是在开源Carla模拟器中模拟了相同的LIDAR和相机平台,因为用于生产真实数据的开源Carla Simulator。此外,使用Carla的语义标记的手动注释在真实数据上执行,允许将转移方法从合成到实际数据进行测试。该数据集的目的是提供一个具有挑战性的数据集,以评估和改进户外环境3D映射的困难视觉任务的方法:语义分段,实例分段和场景完成。对于每项任务,我们描述了评估协议以及建立基线的实验。
translated by 谷歌翻译
Distribution-to-distribution (D2D) point cloud registration techniques such as the Normal Distributions Transform (NDT) can align point clouds sampled from unstructured scenes and provide accurate bounds of their own solution error covariance-- an important feature for safety-of life navigation tasks. D2D methods rely on the assumption of a static scene and are therefore susceptible to bias from range-shadowing, self-occlusion, moving objects, and distortion artifacts as the recording device moves between frames. Deep Learning-based approaches can achieve higher accuracy in dynamic scenes by relaxing these constraints, however, DNNs produce uninterpratable solutions which can be problematic from a safety perspective. In this paper, we propose a method of down-sampling LIDAR point clouds to exclude voxels that violate the assumption of a static scene and introduce error to the D2D scan matching process. Our approach uses a solution consistency filter, identifying and flagging voxels where D2D contributions disagree with local estimates from a PointNet-based registration network.
translated by 谷歌翻译
We propose a novel deep learning-based framework to tackle the challenge of semantic segmentation of largescale point clouds of millions of points. We argue that the organization of 3D point clouds can be efficiently captured by a structure called superpoint graph (SPG), derived from a partition of the scanned scene into geometrically homogeneous elements. SPGs offer a compact yet rich representation of contextual relationships between object parts, which is then exploited by a graph convolutional network. Our framework sets a new state of the art for segmenting outdoor LiDAR scans (+11.9 and +8.8 mIoU points for both Semantic3D test sets), as well as indoor scans (+12.4 mIoU points for the S3DIS dataset).
translated by 谷歌翻译