深度学习最近证明了其出色的多视点立体声(MVS)性能。然而,当前学习的MVS方法的一个主要限制是可伸缩性:消耗存储器的成本量正则化使得学习的MVS难以应用于高分辨率场景。在本文中,我们介绍了一种基于当前神经网络的可扩展多视图立体框架。建议的循环多视图立体网络(R-MVSNet)不是将整个3D成本量合理化,而是通过门控循环单元(GRU)顺序地规划沿深度方向的2D成本图。这大大减少了内存消耗并使高分辨率重建成为可能。我们首先展示了拟议的R-MVSNet在最近的MVS基准测试中所取得的最先进的性能。然后,我们进一步演示了所提出的方法在几个大规模场景中的可扩展性,其中先前学习的方法由于内存约束而失败。代码可以通过以下网址获得://github.com/YoYo000/MVSNet。
translated by 谷歌翻译
准确的相对姿势是视觉测距(VO)和同时定位和映射(SLAM)的关键组成部分之一。最近,联合优化相对姿态和目标图像深度的自我监督学习框架引起了社会的关注。以前的工作依赖于相邻帧之间的深度和姿势产生的光度误差,其由于反射表面和遮挡而在真实场景下包含大的系统误差。在本文中,我们通过在自我监督的框架中引入由极性几何约束的匹配损失来弥合几何损耗和光度损失之间的差距。在KITTIdataset上进行评估,我们的方法大大超过了最先进的无监督自我运动估计方法。代码和数据可从以下网址获得://github.com/hlzz/DeepMatchVO。
translated by 谷歌翻译
卷积神经网络(CNNs)在物体图像检索方面取得了卓越的性能,而具有手工制作的局部特征的Bag-of-Words(BoW)模型仍然主导着3D重建中重叠图像的检索。在本文中,我们通过提供有效的基于CNN的方法来检索具有重叠的图像来缩小这一差距,我们将其称为可匹配的图像检索问题。与以往基于稀疏重构生成训练数据的方法不同,我们创建了一个具有丰富三维几何的大规模图像数据库,并利用表面重构的信息来获得细粒度的训练数据。我们提出了一种基于batchedtriplet的损失函数与网格重投影相结合,以有效地学习CNN表示。所提出的方法显着加速了3D重建中的图像检索过程,并且优于用于可匹配图像检索的最先进的基于CNN和BoW的方法。代码和数据可从https://github.com/hlzz/mirror获得。
translated by 谷歌翻译
基于卷积神经网络(CNN)的学习局部描述符已经在基于补丁的基准测试中取得了显着的改进,而在基于图像的3D重建的最近基准测试中没有具备强大的泛化能力。在本文中,我们通过提出新的局部描述符学习方法来缓解这种限制,该方法集成了来自多视图重建的几何约束,这有利于数据生成,数据采样和损失计算方面的学习过程。我们将提出的描述符称为GeoDesc,并展示其在各种大型基准测试中的卓越性能,特别是在具有挑战性的重建任务方面取得了巨大成功。此外,我们提供了关于学习描述符在结构动态(SfM)管道中的实际集成的指南,显示了GeoDesc在准确性和效率之间为3D重构任务提供的良好折衷。
translated by 谷歌翻译
点云注册的关键是在3D空间中的点之间建立一组准确的对应关系。通信问题一般通过判别式3D局部描述符的设计和另一方面稳健匹配策略的发展来解决。在这项工作中,我们首先提出了一个多视图本地描述符,它是从多个视图的图像中获取的,用于3D关键点的描述。然后,我们开发了一种强大的匹配方法,旨在基于通过信念的有效推理来拒绝异常匹配。在定义的图形模型上传播。我们已经证明了我们在公共扫描和多视图立体数据集上注册的方法的推进。通过对多种描述符和匹配方法的深入比较,验证了优越的性能。
translated by 谷歌翻译
我们提出了一种端到端的深度学习架构,用于从多视图图像中进行深度图推理。在网络中,我们首先提取深度视觉图像特征,然后通过可微分的单应性变形在参考相机上构建3D成本量。接下来,我们应用3D卷积来初始化和回归初始深度图,然后使用参考图像对其进行细化以生成最终输出。我们的框架使用基于方差的成本度量灵活地适应任意N视图输入,该成本度量将多个特征映射到一个成本特征。拟议的MVSNet在大规模室内DTU数据集上进行了演示。通过简单的后处理,我们的方法不仅明显优于以前的技术水平,而且在运行时也快几倍。我们还在复杂的室外Tanksand Temples数据集上评估MVSNet,我们的方法在2018年4月18日之前排名第一,没有进行任何微调,显示出MVSNet强大的泛化能力。
translated by 谷歌翻译
预测气味的愉悦性简化了气味的评估,并且具有应用于香水和环境监测行业的潜力。用于预测气味愉悦性的经典算法通常使用手动特征提取器和独立分类器。手动设计良好的特征提取器取决于专家知识和经验是算法准确性的关键。为了克服这个困难,我们提出了一种通过卷积神经网络预测气味愉悦的模型。在我们的模型中,卷积神经层取代了手动特征提取器并显示出更好的性能。实验表明,我们的模型与人类之间的相关性在愉悦程度上超过90%。 Andour模型在区分绝对令人愉快或令人不快的气味方面具有99.9%的准确度。
translated by 谷歌翻译
电动汽车(EV)共享系统最近在全球范围内经历了前所未有的增长。在快速扩张期间,成功的一个基本决定因素是当整个系统不断发展时,能够动态预测站点的需求。这种动态需求预测问题存在几个挑战。首先,与预测只需要静态系统或在几个扩展阶段的大多数现有工作不同,在现实世界中,我们经常需要在站点部署或关闭之前预测需求,以便为决策提供信息和支持。其次,对于要部署的台站,没有可用于帮助预测其需求的历史记录或额外的移动数据。最后,部署/关闭站到系统中其余站的影响可能非常复杂。为了解决这些挑战,本文提出了一种基于图序列学习的新型动态需求预测方法,能够对系统扩展过程中的动态进行建模,并相应地预测需求。我们使用局部temporalencoding过程来处理个人站点的可用历史数据,并使用动态空间编码过程来考虑图表卷积神经网络之间的相关性。编码特征被馈送到多尺度预测网络,该网络预测电台的长期预期需求及其在近期的即时需求。我们对从上海的主要EV共享平台收集的实际数据进行了为期一年的评估。实验结果证明我们的方法明显优于现有技术,在预测快速扩展的EV共享系统的需求方面表现出高达三倍的性能提升。
translated by 谷歌翻译
本文利用UR机器人的分析和几何技术相结合,提出了逆运动学(IK)闭合形式推导步骤。该工作的创新应用用于精确定位穿刺机器人系统。末端执行器是穿刺针引导管,需要在穿刺插入点上精确定位。 IKclosed形式解决方案带来了最多8种解决方案,代表了8种不同的机器人关节配置。这些多种解决方案有助于穿刺机器人系统,它允许医生在操作过程中选择最合适的配置。因此,工作空间变得更加适合人类和机器人的共存。此外,与其他数值方法相比,IK闭合形式解决方案在医疗穿刺手术的定位方面更精确。我们包括通过封闭形式解决方案和数值方法获得的两者的性能评估。
translated by 谷歌翻译
我们通过图形结构的递归神经网络(GSRNN)研究真实世界健康数据的流行病预测。我们在基准CDC数据集上实现了最先进的预测准确性。为了提高模型效率,我们通过转换 - $ \ ell_1 $惩罚来稀疏网络权重,并在70%的网络权重为零的情况下将预测准确度保持在同一水平。
translated by 谷歌翻译