无人机已成为广泛使用的遥感平台之一,并在智能城市的建设中发挥了关键作用。但是,由于城市场景中的复杂环境,安全,准确的数据获取为3D建模和场景更新带来了巨大挑战。无人机的最佳轨迹计划和机载摄像机的准确数据收集是城市建模中的非平凡问题。这项研究介绍了优化观点的摄影测量原理,并在大规模3D建模中验证其精度和潜力。与倾斜的摄影测量法不同,优化的视图摄影测量法使用粗糙模型来生成和优化无人机轨迹,这是通过考虑模型点可重构性和视图点冗余性来实现的。基于优化视图的原理摄影测量法,本研究首先通过使用优化视图的无人机图像对3D模型进行精确分析潜在的。通过使用GCP进行图像方向精确分析和TLS(陆地激光扫描)点云进行模型质量分析,实验结果表明,优化的视图摄影测量法可以构建稳定的图像连接网络,并可以达到可比的图像方向准确性。从准确的图像采集策略中受益,网格模型的质量显着提高,尤其是对于严重阻塞的城市地区,在这种城市地区实现了3至5倍的精度。此外,青岛城的案例研究验证了优化视图摄影测量法可能是在复杂的城市场景中大规模3D建模的可靠和强大解决方案。
translated by 谷歌翻译
运动(ISFM)的增量结构已被广泛用于无人机图像方向。然而,由于顺序约束,其效率大大降低。尽管已经利用了分裂和纠纷策略来提高效率,但集群合并变得困难或取决于认真设计的重叠结构。本文提出了一种算法,以提取群集合并的全局模型,并设计平行的SFM解决方案,以实现有效,准确的无人机图像方向。首先,基于词汇树检索,选择了匹配对来构建一个无方向的加权匹配图,其边缘权重是通过考虑特征匹配的数量和分布来计算的。其次,一种称为加权连接的主导集(WCD)的算法旨在实现匹配图的简化并构建全局模型,该模型将边缘权重结合到图形节点选择中,并实现了全局模型的成功重建。第三,将匹配图同时分为紧凑型和非重叠簇。在平行重建后,借助全局模型和群集模型之间的共同3D点进行聚类合并。最后,通过使用经典倾斜和最新优化视图捕获的三个UAV数据集,通过全面的分析和比较来验证所提出的解决方案的验证。实验结果表明,所提出的平行SFM可以实现提高效率的17.4倍和比较取向精度。在绝对BA中,地理引用精度分别是水平和垂直方向中GSD(接地采样距离)值的2.0倍和3.0倍。对于并行SFM,提出的解决方案是更可靠的替代方案。
translated by 谷歌翻译
我们提出了Urbanscene3D,这是一个大规模的数据平台,用于研究城市场景感知和重建。 Urbanscene3D包含超过128K的高分辨率图像,其中涵盖了16个场景,包括大规模的真实城市区域和合成城市,总共有136 km^2区域。该数据集还包含具有不同观察模式的高精度激光扫描和数百个图像集,它们为设计和评估空中路径计划和3D重建算法提供了全面的基准。此外,该数据集是基于虚幻引擎和AirSim模拟器构建的数据集以及数据集中每个建筑物的手动注释的唯一实例标签,启用了各种数据的生成,例如2D/3D边界框, ,以及3D点云/网状分段等。具有物理发动机和照明系统的模拟器不仅产生各种数据,而且还使用户能够在拟议的城市环境中模拟汽车或无人机以进行未来的研究。
translated by 谷歌翻译
我们为来自多视图立体声(MVS)城市场景的3D建筑物的实例分割了一部小说框架。与关注城市场景的语义分割的现有作品不同,即使它们安装在大型和不精确的3D表面模型中,这项工作的重点是检测和分割3D构建实例。通过添加高度图,首先将多视图RGB图像增强到RGBH图像,并且被分段以使用微调的2D实例分割神经网络获得所有屋顶实例。然后将来自不同的多视图图像的屋顶实例掩码被聚集到全局掩码中。我们的面具聚类占空间闭塞和重叠,可以消除多视图图像之间的分割歧义。基于这些全局掩码,3D屋顶实例由掩码背部投影分割,并通过Markov随机字段(MRF)优化扩展到整个建筑实例。定量评估和消融研究表明了该方法的所有主要步骤的有效性。提供了一种用于评估3D建筑模型的实例分割的数据集。据我们所知,它是一个在实例分割级别的3D城市建筑的第一个数据集。
translated by 谷歌翻译
我们介绍了第一个基于学习的可重建性预测指标,以改善使用无人机的大规模3D城市场景获取的视图和路径计划。与以前的启发式方法相反,我们的方法学习了一个模型,该模型明确预测了从一组观点重建3D城市场景的能力。为了使这种模型可训练并同时适用于无人机路径计划,我们在培训期间模拟了基于代理的3D场景重建以设置预测。具体而言,我们设计的神经网络经过训练,可以预测场景的重构性,这是代理几何学的函数,一组观点,以及在飞行中获得的一系列场景图像。为了重建一个新的城市场景,我们首先构建了3D场景代理,然后依靠我们网络的预测重建质量和不确定性度量,基于代理几何形状,以指导无人机路径计划。我们证明,与先前的启发式措施相比,我们的数据驱动的可重建性预测与真实的重建质量更加紧密相关。此外,我们学到的预测变量可以轻松地集成到现有的路径计划中,以产生改进。最后,我们根据学习的可重建性设计了一个新的迭代视图计划框架,并在重建合成场景和真实场景时展示新计划者的卓越性能。
translated by 谷歌翻译
This paper presents trajectory planning for three-dimensional autonomous multi-UAV volume coverage and visual inspection based on the Heat Equation Driven Area Coverage (HEDAC) algorithm. The method designs a potential field to achieve the target density and generate trajectories using potential gradients to direct UAVs to regions of a higher potential. Collisions are prevented by implementing a distance field and correcting the agent's directional vector if the distance threshold is reached. The method is successfully tested for volume coverage and visual inspection of complex structures such as wind turbines and a bridge. For visual inspection, the algorithm is supplemented with camera direction control. A field containing the nearest distance from any point in the domain to the structure is designed and this field's gradient provides the camera orientation throughout the trajectory. The bridge inspection test case is compared with a state-of-the-art method where the HEDAC algorithm allowed more surface area to be inspected under the same conditions. The limitations of the HEDAC method are analyzed, focusing on computational efficiency and adequacy of spatial coverage to approximate the surface coverage. The proposed methodology offers flexibility in various setup parameters and is applicable to real-world inspection tasks.
translated by 谷歌翻译
使用FASS-MVS,我们提出了一种具有表面感知半全局匹配的快速多视图立体声的方法,其允许从UAV捕获的单眼航空视频数据中快速深度和正常地图估计。反过来,由FASS-MVS估计的数据促进在线3D映射,这意味着在获取或接收到图像数据时立即和递增地生成场景的3D地图。 FASS-MVS由分层处理方案组成,其中深度和正常数据以及相应的置信度分数以粗略的方式估计,允许有效地处理由倾斜图像所固有的大型场景深度低无人机。实际深度估计采用用于致密多图像匹配的平面扫描算法,以产生深度假设,通过表面感知半全局优化来提取实际深度图,从而减少了SGM的正平行偏压。给定估计的深度图,然后通过将深度图映射到点云中并计算狭窄的本地邻域内的普通向量来计算像素 - 方面正常信息。在彻底的定量和消融研究中,我们表明,由FASS-MV计算的3D信息的精度接近离线多视图立体声的最先进方法,误差甚至没有一个幅度而不是科麦。然而,同时,FASS-MVS的平均运行时间估计单个深度和正常地图的距离小于ColMAP的14%,允许在1-中执行全高清图像的在线和增量处理2 Hz。
translated by 谷歌翻译
现代光学卫星传感器使高分辨率立体声重建。但是在观察地球从空间推动立体声匹配时挑战成像条件。在实践中,由此产生的数字表面模型(DSM)相当嘈杂,并且通常不会达到3D城市建模等高分辨率应用所需的准确性。可以说,基于低电平图像相似性的立体声对应不足,并且应该互补关于超出基本局部平滑度的预期表面几何的先验知识。为此,我们介绍了Resptepth,这是一个卷积神经网络,其在示例数据之前学习如此表达几何。 Restepth在调节图像上的细化时改进初始原始的立体声DSM。即,它充当了一个智能,学习的后处理过滤器,可以无缝地补充任何立体声匹配管道。在一系列实验中,我们发现所提出的方法始终如一地改善了定量和定性的立体声DSM。我们表明,网络权重中的先前编码捕获了城市设计的有意义的几何特征,这也概括了不同地区,甚至从一个城市到另一个城市。此外,我们证明,通过对各种立体对的训练,RESPTH可以在成像条件和采集几何体中获得足够的不变性。
translated by 谷歌翻译
本文提出了一种新颖的方法,用于在具有复杂拓扑结构的地下领域的搜索和救援行动中自动合作。作为CTU-Cras-Norlab团队的一部分,拟议的系统在DARPA SubT决赛的虚拟轨道中排名第二。与专门为虚拟轨道开发的获奖解决方案相反,该建议的解决方案也被证明是在现实世界竞争极为严峻和狭窄的环境中飞行的机上实体无人机的强大系统。提出的方法可以使无缝模拟转移的无人机团队完全自主和分散的部署,并证明了其优于不同环境可飞行空间的移动UGV团队的优势。该论文的主要贡献存在于映射和导航管道中。映射方法采用新颖的地图表示形式 - 用于有效的风险意识长距离计划,面向覆盖范围和压缩的拓扑范围的LTVMAP领域,以允许在低频道通信下进行多机器人合作。这些表示形式与新的方法一起在导航中使用,以在一般的3D环境中可见性受限的知情搜索,而对环境结构没有任何假设,同时将深度探索与传感器覆盖的剥削保持平衡。所提出的解决方案还包括一条视觉感知管道,用于在没有专用GPU的情况下在5 Hz处进行四个RGB流中感兴趣的对象的板上检测和定位。除了参与DARPA SubT外,在定性和定量评估的各种环境中,在不同的环境中进行了广泛的实验验证,UAV系统的性能得到了支持。
translated by 谷歌翻译
在本文中,我们提出了一种资源有效的方法,提供了一种自主无人机,并在车载感知方法中检测飞行在复杂的3D地形飞行期间的安全性危险的着陆位点。我们通过结构 - 从运动方法将从一系列单眼图像序列中获取的3D测量聚合到溢出地形的本地,机器人的多分析高度贴图中,其熔化根据其横向表面分辨率的深度测量(像素 - 基于动态细节概念的概率框架中的足迹。映射聚合仅需要深度映射和关联的姿势,该映射是从板载视觉测量算法获得的。然后,高效的着陆网站检测方法利用底层多分辨率映射的特征,以基于重建地形表面的斜坡,粗糙度和质量来检测安全着陆网站。在模拟和现实世界实验中独立和共同分析了对映射和着陆现场检测模块的性能的评估,以确定所提出的方法的功效。
translated by 谷歌翻译
随着商业深度传感器和3D扫描仪的最近可用性和可承受能力,越来越多的3D(即RGBD,点云)数据集已被宣传以促进3D计算机视觉的研究。但是,现有的数据集覆盖相对较小的区域或具有有限的语义注释。对城市规模3D场景的细粒度理解仍处于起步阶段。在本文中,我们介绍了Sensaturban,一个城市规模的UAV摄影测量点云数据集,包括从三个英国城市收集的近30亿积分,占地7.6公里^ 2。 DataSet中的每个点已标记为具有细粒度的语义注释,导致数据集是上一个现有最大摄影测量点云数据集的三倍的三倍。除了诸如道路和植被等诸如道路和植被的常见类别之外,我们的数据集还包含包括轨道,桥梁和河流的城市水平类别。基于此数据集,我们进一步构建了基准,以评估最先进的分段算法的性能。特别是,我们提供了全面的分析,确定了限制城市规模点云理解的几个关键挑战。数据集可在http://point-cloud-analysis.cs.ox.ac.uk中获取。
translated by 谷歌翻译
两栖地面汽车将飞行和驾驶模式融合在一起,以实现更灵活的空中行动能力,并且最近受到了越来越多的关注。通过分析现有的两栖车辆,我们强调了在复杂的三维城市运输系统中有效使用两栖车辆的自动驾驶功能。我们审查并总结了现有两栖车辆设计中智能飞行驾驶的关键促成技术,确定主要的技术障碍,并提出潜在的解决方案,以实现未来的研究和创新。本文旨在作为研究和开发智能两栖车辆的指南,以实现未来的城市运输。
translated by 谷歌翻译
最初在具有基于图像的图像的机器人和自主驾驶等领域开发的领域,基于图像的单图像深度估计(侧面)发现了对更广泛的图像分析界的兴趣。遥感也不例外,因为在地形重建的背景下估计来自单个空中或卫星图像的高度地图的可能性很大。少数开创性的调查已经证明了从光学遥感图像的单个图像高度预测的一般可行性,并激发了这种方向的进一步研究。借鉴了本文,我们介绍了对遥感中的其他重要传感器模式的基于深度学习的单图像高度预测的第一次演示:合成孔径雷达(SAR)数据。除了用于SAR强度图像的卷积神经网络(CNN)架构的适应外,我们还为不同SAR成像模式和测试站点提供了用于生成训练数据的工作流程,以及广泛的实验结果。由于我们特别强调可转换性,我们能够确认基于深度的学习的单图像高度估计不仅可能,而且也是不可能的,而且也转移到未经看的数据,即使通过不同的成像模式和成像参数获取。
translated by 谷歌翻译
在目前的实践中,现场调查由使用总站的工人进行。该方法精度高,但如果需要连续监测,它会引起高成本。基于摄影测量的技术,具有相对更便宜的数码相机,在许多领域中获得了广泛的应用。除点测量外,摄影测量还可以创建场景的三维(3D)模型。精确的3D模型重建取决于高质量的图像。降级图像将导致重建的3D模型中的大错误。在本文中,我们提出了一种可用于提高图像的可见性的方法,最终降低3D场景模型的错误。这个想法是由图像脱落的启发。通过伽马校正操作和自适应直方图均衡首先将每个原始图像变为多个曝光图像。通过计算局部二进制模式来分析变换的图像。然后增强图像,其中每个像素由由本地模式特征的函数和图像饱和度加权的变换的图像像素组生成的每个像素。在基准图像脱水数据集上执行了性能评估。实验已经在室外和室内调查中进行。我们的分析发现,该方法适用于户外和室内图像中存在的不同类型的退化。当馈入摄影测量软件时,增强的图像可以重建具有子毫米均值误差的3D场景模型。
translated by 谷歌翻译
与计算机视觉合并的基于无人机的遥感系统(UAV)遥感系统具有协助建筑物建设和灾难管理的潜力,例如地震期间的损害评估。可以通过检查来评估建筑物到地震的脆弱性,该检查考虑到相关组件的预期损害进展以及组件对结构系统性能的贡献。这些检查中的大多数是手动进行的,导致高利用人力,时间和成本。本文提出了一种通过基于无人机的图像数据收集和用于后处理的软件库来自动化这些检查的方法,该方法有助于估算地震结构参数。这里考虑的关键参数是相邻建筑物,建筑计划形状,建筑计划区域,屋顶上的对象和屋顶布局之间的距离。通过使用距离测量传感器以及通过Google Earth获得的数据进行的现场测量,可以验证所提出的方法在估计上述参数估算上述参数方面的准确性。可以从https://uvrsabi.github.io/访问其他详细信息和代码。
translated by 谷歌翻译
休眠季节葡萄树修剪需要熟练的季节性工人,这在冬季变得越来越缺乏。随着在短期季节性招聘文化和低工资的短期季节性招聘文化和低工资的时间内,随着工人更少的葡萄藤,葡萄藤往往被修剪不一致地导致葡萄化物不平衡。除此之外,目前现有的机械方法无法选择性地修剪葡萄园和手动后续操作,通常需要进一步提高生产成本。在本文中,我们展示了崎岖,全自治机器人的设计和田间评估,用于休眠季节葡萄园的端到最终修剪。该设计的设计包括新颖的相机系统,运动冗余机械手,地面机器人和在感知系统中的新颖算法。所提出的研究原型机器人系统能够在213秒/葡萄藤中完全从两侧刺激一排藤蔓,总修枝精度为87%。与机械预灌浆试验相比,商业葡萄园中自治系统的初始现场测试显示出休眠季节修剪的显着变化。在手稿中描述了设计方法,系统组件,经验教训,未来增强以及简要的经济分析。
translated by 谷歌翻译
图像数据集的大小一直在稳步增长,损害了大规模3D重建方法的可行性和效率。在本文中,提出了一种新颖的方法,用于将多视图立体声(MVS)算法扩展到任意大量图像集合。具体而言,重建整个城市的3D模型的问题是针对目标的,从一组配备了多个高分辨率摄像头的移动车辆收购的视频开始。最初,提出的方法利用了姿势和几何形状的大约均匀分布,并构建了一组重叠的簇。然后,为每个群集制定了整数线性编程(ILP)问题,以选择一个最佳的视图子集,以保证可见性和可匹配性。最后,分别计算并合并每个集群的本地点云。由于聚类独立于成对可见性信息,因此所提出的算法运行速度比现有文献更快,并且可以进行大规模的并行化。讨论了对城市数据的广泛测试,以显示该方法的有效性和可扩展性。
translated by 谷歌翻译
由于它可能对粮食安全,可持续性,资源利用效率,化学处理的降低以及人类努力和产量的优化,因此,自主机器人在农业中的应用正在越来越受欢迎。有了这一愿景,蓬勃发展的研究项目旨在开发一种适应性的机器人解决方案,用于精确耕作,该解决方案结合了小型自动无人驾驶飞机(UAV)(UAV)的空中调查能力以及由多功能无人驾驶的无人接地车(UGV)执行的针对性干预措施。本文概述了该项目中获得的科学和技术进步和结果。我们引入了多光谱感知算法以及空中和地面系统,用于监测农作物密度,杂草压力,作物氮营养状况,并准确地对杂草进行分类和定位。然后,我们介绍了针对我们在农业环境中机器人身份量身定制的导航和映射系统,以及用于协作映射的模块。我们最终介绍了我们在不同的现场条件和不同农作物中实施和测试的地面干预硬件,软件解决方案以及接口。我们描述了一个真正的用例,在该案例中,无人机与UGV合作以监视该领域并进行选择性喷涂而无需人工干预。
translated by 谷歌翻译
凭借在运动扫描系统生产的LIDAR点云注册的目的,我们提出了一种新颖的轨迹调整程序,可以利用重叠点云和关节集成之间所选可靠的3D点对应关系的自动提取。 (调整)与所有原始惯性和GNSS观察一起。这是使用紧密耦合的方式执行的动态网络方法来执行,这通过在传感器处的错误而不是轨迹等级来实现最佳补偿的轨迹。 3D对应关系被制定为该网络内的静态条件,并且利用校正的轨迹和可能在调整内确定的其他参数,以更高的精度生成注册点云。我们首先描述了选择对应关系以及将它们作为新观察模型作为动态网络插入的方法。然后,我们描述了对具有低成本MEMS惯性传感器的实用空气激光扫描场景中提出框架的性能进行评估。在进行的实验中,建议建立3D对应关系的方法在确定各种几何形状的点对点匹配方面是有效的,例如树木,建筑物和汽车。我们的结果表明,该方法提高了点云登记精度,否则在确定的平台姿态或位置(以标称和模拟的GNSS中断条件)中的错误受到强烈影响,并且可能仅使用总计的一小部分确定未知的触觉角度建立的3D对应数量。
translated by 谷歌翻译
该技术报告是关于在柏林大火之后有危险物质的工业大厅侦察期间获得的特派团和经验。在此操作期间,仅用于获取有关网站和建筑物的信息。首先,创建建筑物的地理参考3D模型,以便将进入大厅进入大厅。随后,uvs被用来飞入严重损坏的内部,并从大厅里面拍摄照片。安装在UAV下的360 {\ DEG}相机用于收集周围区域的图像,特别是从难以飞行的部分。由于收集的数据集包含了类似的图像以及模糊图像,因此使用视觉SLAM,束调节和模糊检测从非最佳图像清除它,从而可以计算3D模型和概述。结果表明,紧急服务无法从3D模型中提取必要的信息。因此,实现了与其他360 {\ DEG}图像的链接的交互式全景观看者,其中与其他图像的链接取决于视觉SLAM算法的半密度云和定位的相机位置,以便紧急力可以查看周围环境。
translated by 谷歌翻译