智能论文笔记

Fast and Robust Non-Rigid Registration Using Accelerated Majorization-Minimization

Yuxin Yao , Bailin Deng , Weiwei Xu , Juyong Zhang

分类：计算机视觉

2022-06-07

非刚性注册以非刚性方式与目标形状保持一致的源形状变形，是计算机视觉中的经典问题。由于数据（噪声，离群值和部分重叠）和高度自由度，因此此类问题可能具有挑战性。现有方法通常采用$ \ ell_ {p} $键入鲁棒标准来测量对齐误差并规范变形的平滑度，并使用近端算法来解决所得的非平滑优化问题。但是，这种算法的缓慢收敛性限制了其广泛的应用。在本文中，我们提出了一种基于全球平稳的稳健标准进行对齐和正则化的稳健非刚性登记的公式，该规范可以有效地处理异常值和部分重叠。使用大型最小化算法解决了该问题，该算法将每次迭代减少到使用封闭形式的解决方案的凸二次问题。我们进一步应用安德森加速度以加快求解器的收敛性，使求解器能够在具有有限的计算能力的设备上有效运行。广泛的实验证明了我们方法在两种形状之间具有异常值和部分重叠的形状之间的非刚性比对的有效性，并进行定量评估表明，就注册准确性和计算速度而言，它的表现优于最先进的方法。源代码可从https://github.com/yaoyx689/amm_nrr获得。

translated by 谷歌翻译

Registration Techniques for Deformable Objects

Alireza Ahmadi

分类：计算机视觉

2021-11-07

通常，非刚性登记的问题是匹配在两个不同点拍摄的动态对象的两个不同扫描。这些扫描可以进行刚性动作和非刚性变形。由于模型的新部分可能进入视图，而其他部件在两个扫描之间堵塞，则重叠区域是两个扫描的子集。在最常规的设置中，没有给出先前的模板形状，并且没有可用的标记或显式特征点对应关系。因此，这种情况是局部匹配问题，其考虑了随后的扫描在具有大量重叠区域的情况下进行的扫描经历的假设[28]。本文在环境中寻址的问题是同时在环境中映射变形对象和本地化摄像机。

translated by 谷歌翻译

Multiway Non-rigid Point Cloud Registration via Learned Functional Map Synchronization

Jiahui Huang , Tolga Birdal , Zan Gojcic , Leonidas J. Guibas , Shi-Min Hu

分类：计算机视觉 | 人工智能

2021-11-25

我们通过同步在点云上定义的学习函数的地图同步地图来共同寄存多种非刚性形状的新方法。尽管处理非刚性形状的能力在从计算机动画到3D数字化的各种应用中都是至关重要的，但文献仍然缺乏围绕闭塞观察到的真实，嘈杂的扫描的集合的稳健和灵活的框架。给定一组这样的点云，我们的方法首先计算通过功能映射参数化的成对对应关系。我们同时学习潜在的非正交基础函数，以有效地规范变形，同时以优雅的方式处理闭塞。为了最大限度地受益于推断成对变形字段提供的多向信息，我们通过我们的新颖和原则优化配方将成对功能映射与周期一致的整体同步。我们通过广泛的实验证明了我们的方法在注册准确性中实现了最先进的性能，同时可以灵活，高效，因为我们在统一框架中处理非刚性和多体案例并避免昂贵的优化优化通过使用基函数映射的置换。

translated by 谷歌翻译

Geometric and Learning-based Mesh Denoising: A Comprehensive Survey

Honghua Chen , Mingqiang Wei , Jun Wang

分类：计算机视觉

2022-09-02

网状denoising是数字几何处理中的基本问题。它试图消除表面噪声，同时尽可能准确地保留表面固有信号。尽管传统的智慧是基于专门的先验来平稳表面的，但基于学习的方法在概括和自动化方面取得了巨大的成功。在这项工作中，我们对网格denoising的进步进行了全面的综述，其中包含传统的几何方法和最近的基于学习的方法。首先，要熟悉读者的denoising任务，我们总结了网格denoising中的四个常见问题。然后，我们提供了两种现有的脱氧方法的分类。此外，分别详细介绍和分析了三个重要类别，包括优化，过滤器和基于数据驱动的技术。说明了定性和定量比较，以证明最先进的去核方法的有效性。最后，指出未来工作的潜在方向来解决这些方法的共同问题。这项工作还建立了网格denoising基准测试，未来的研究人员将通过最先进的方法轻松方便地评估其方法。

translated by 谷歌翻译

HTML版本

Non-rigid Point Cloud Registration with Neural Deformation Pyramid

Yang Li , Tatsuya Harada

分类：计算机视觉

2022-05-25

非刚性点云注册是许多计算机视觉和计算机图形应用程序中的关键组件。未知的非刚性运动的高复杂性使这项任务成为一个具有挑战性的问题。在本文中，我们通过层次运动分解分解了这个问题。我们称为神经变形金字塔（NDP）的方法代表使用金字塔结构的非刚性运动。用多层感知表示的每个金字塔级别（MLP）表示为正弦编码的3D点，并从上一个级别输出其运动增量。正弦函数从低输入频率开始，当金字塔水平下降时逐渐增加。与现有的基于MLP的方法相比，这允许多层刚性进行非辅助运动分解，并加快求解的速度50倍。我们的方法在未经学习和监督的设置下，在4DMatch/4Dlomatch基准测试的4DMATCH/4DLOMATCH基准上实现了高级部分非刚性点云注册结果。

translated by 谷歌翻译

Accurate Point Cloud Registration with Robust Optimal Transport

Zhengyang Shen , Jean Feydy , Peirong Liu , Ariel Hernán Curiale , Ruben San Jose Estepar , Raul San Jose Estepar , Marc Niethammer

分类：计算机视觉

2021-11-01

这项工作调查了鲁棒优化运输（OT）的形状匹配。具体而言，我们表明最近的OT溶解器改善了基于优化和深度学习方法的点云登记，以实惠的计算成本提高了准确性。此手稿从现代OT理论的实际概述开始。然后，我们为使用此框架进行形状匹配的主要困难提供解决方案。最后，我们展示了在广泛的具有挑战性任务上的运输增强的注册模型的性能：部分形状的刚性注册;基蒂数据集的场景流程估计;肺血管树的非参数和肺部血管树。我们基于OT的方法在准确性和可扩展性方面实现了基蒂的最先进的结果，并为挑战性的肺登记任务。我们还释放了PVT1010，这是一个新的公共数据集，1,010对肺血管树，具有密集的采样点。此数据集提供了具有高度复杂形状和变形的点云登记算法的具有挑战性用例。我们的工作表明，强大的OT可以为各种注册模型进行快速预订和微调，从而为计算机视觉工具箱提供新的键方法。我们的代码和数据集可在线提供：https：//github.com/uncbiag/robot。

translated by 谷歌翻译

Robust Motion Averaging for Multi-view Registration of Point Sets Based Maximum Correntropy Criterion

Yugeng Huang , Haitao Liu , Tian Huang

分类：计算机视觉

2022-08-24

作为解决多视图注册问题的有效算法，已经对运动平均（MA）算法进行了广泛的研究，并引入了许多基于MA的算法。他们旨在从相对动作中恢复全球动作，并利用信息冗余到平均累积错误。但是，这些方法的一个属性是，它们使用ugas-newton方法来解决最小二乘问题以增加全球运动的增加，这可能会导致效率低下，并且对异常值的稳健性差。在本文中，我们提出了一个新的运动平均框架，用于使用Laplacian基于Laplacian的最大Correntropy Criterion（LMCC）进行多视图注册。利用Lie代数运动框架和CorrentRopy量度，我们提出了一种新的成本函数，该功能应考虑相对动作提供的所有约束。获得用于纠正全局动作的增量，可以进一步提出为旨在最大化成本函数的优化问题。凭借二次技术，可以通过分为两个子问题来解决优化问题，即根据当前残差计算每个相对运动的重量，并解决二阶锥体程序问题（SOCP）以增加下一个迭代。我们还提供了一种新的策略来确定内核宽度，以确保我们的方法可以有效利用许多异常值的相对运动提供的信息冗余。最后，我们将提出的方法与其他基于MA的多视图注册方法进行比较，以验证其性能。关于合成和实际数据的实验测试表明，我们的方法在效率，准确性和鲁棒性方面取得了卓越的性能。

translated by 谷歌翻译

Lepard: Learning partial point cloud matching in rigid and deformable scenes

Yang Li , Tatsuya Harada

分类：计算机视觉

2021-11-24

我们提出了一种基于学习的刚性和可变形场景的基于学习方法的方法。LePard的关键特征是利用点云匹配的3D位置知识的以下方法：1）将点云表示分为特征空间和3D位置空间的架构。2）一种位置编码方法，其通过向量的点产品明确地明确地揭示了3D相对距离信息。3）修改交叉点云相对位置的重新定位技术。消融研究证明了上述技术的有效性。对于刚性点云匹配，Lepard在3DMatch / 3DLomatch基准上为93.6％/ 69.0％的注册召回设置了新的最先进的。在可变形的情况下，Lepard达到+ 27.1％/ + 34.8％的非刚性特征匹配召回，而不是我们新建的4dmatch / 4dlomatch基准测试的现有技术。

translated by 谷歌翻译

Kimera-Multi: Robust, Distributed, Dense Metric-Semantic SLAM for Multi-Robot Systems

Yulun Tian , Yun Chang , Fernando Herrera Arias , Carlos Nieto-Granda , Jonathan P. How , Luca Carlone

分类：机器人 | 计算机视觉

2021-06-28

本文提出了Kimera-Multi，第一个多机器人系统，（i）是强大的，并且能够识别和拒绝由感知混叠产生的不正确和内部机器人循环闭合，（ii）完全分布，仅依赖于本地（点对点）通信实现分布式本地化和映射，（iii）实时构建环境的全球一致的度量标准三维网状模型，其中网格的面部用语义标签注释。 Kimera-Multi由配备有视觉惯性传感器的机器人团队实现。每个机器人都构建了局部轨迹估计和使用Kimera的本地网格。当通信可用时，机器人基于一种基于新型分布式刻度非凸性算法发起分布式地点识别和鲁棒姿态图优化协议。所提出的协议允许机器人通过利用机器人间循环闭合而鲁棒到异常值来改善其局部轨迹估计。最后，每个机器人使用其改进的轨迹估计来使用网格变形技术来校正本地网格。我们在光逼真模拟，SLAM基准测试数据集中展示了Kimera-Multi，以及使用地机器人收集的靠户外数据集。真实和模拟实验都涉及长轨迹（例如，每个机器人高达800米）。实验表明，在鲁棒性和准确性方面，kimera-multi（i）优于现有技术，（ii）在完全分布的同时实现与集中式大满贯系统相当的估计误差，（iii）在通信带宽方面是显着的（iv）产生精确的公制语义3D网格，并且（v）是模块化的，也可以用于标准3D重建（即，没有语义标签）或轨迹估计（即，不重建3D网格）。

translated by 谷歌翻译

NIMBLE: A Non-rigid Hand Model with Bones and Muscles

Yuwei Li , Longwen Zhang , Zesong Qiu , Yingwenqi Jiang , Nianyi Li , Yuexin Ma , Yuyao Zhang , Lan Xu , Jingyi Yu

分类：计算机视觉

2022-02-09

新兴的元应用需要人类手的可靠，准确和逼真的复制品，以便在物理世界中进行复杂的操作。虽然真实的人手代表了骨骼，肌肉，肌腱和皮肤之间最复杂的协调之一，但最先进的技术一致专注于仅建模手的骨架。在本文中，我们提出了Nimble，这是一种新型的参数手模型，其中包括缺少的密钥组件，将3D手模型带入了新的现实主义水平。我们首先在最近的磁共振成像手（MRI手）数据集上注释肌肉，骨骼和皮肤，然后在数据集中的单个姿势和受试者上注册一个体积模板手。敏捷由20个骨头组成，作为三角形网格，7个肌肉群作为四面体网眼和一个皮肤网。通过迭代形状的注册和参数学习，它进一步产生形状的混合形状，姿势混合形状和关节回归器。我们证明将敏捷性应用于建模，渲染和视觉推理任务。通过强制执行内部骨骼和肌肉以符合解剖学和运动学规则，Nimble可以使3D手动画为前所未有的现实主义。为了建模皮肤的外观，我们进一步构建了一个光度法，以获取高质量的纹理和正常地图，以模型皱纹和棕榈印刷。最后，敏捷还通过合成丰富的数据或直接作为推理网络中的可区分层来使基于学习的手姿势和形状估计受益。

translated by 谷歌翻译

Robust Point Cloud Registration Framework Based on Deep Graph Matching(TPAMI Version)

Kexue Fu , Jiazheng Luo , Xiaoyuan Luo , Shaolei Liu , Chenxi Zhang , Manning Wang

分类：计算机视觉

2022-11-09

3D point cloud registration is a fundamental problem in computer vision and robotics. Recently, learning-based point cloud registration methods have made great progress. However, these methods are sensitive to outliers, which lead to more incorrect correspondences. In this paper, we propose a novel deep graph matching-based framework for point cloud registration. Specifically, we first transform point clouds into graphs and extract deep features for each point. Then, we develop a module based on deep graph matching to calculate a soft correspondence matrix. By using graph matching, not only the local geometry of each point but also its structure and topology in a larger range are considered in establishing correspondences, so that more correct correspondences are found. We train the network with a loss directly defined on the correspondences, and in the test stage the soft correspondences are transformed into hard one-to-one correspondences so that registration can be performed by a correspondence-based solver. Furthermore, we introduce a transformer-based method to generate edges for graph construction, which further improves the quality of the correspondences. Extensive experiments on object-level and scene-level benchmark datasets show that the proposed method achieves state-of-the-art performance. The code is available at: \href{https://github.com/fukexue/RGM}{https://github.com/fukexue/RGM}.

translated by 谷歌翻译

Optimal and Robust Category-level Perception: Object Pose and Shape Estimation from 2D and 3D Semantic Keypoints

Jingnan Shi , Heng Yang , Luca Carlone

分类：计算机视觉 | 机器人

2022-06-24

我们考虑了一个类别级别的感知问题，其中给定的2D或3D传感器数据描绘了给定类别的对象（例如，汽车），并且必须重建尽管级别的可变性，但必须重建对象的3D姿势和形状（即，不同的汽车模型具有不同的形状）。我们考虑了一个主动形状模型，其中 - 对于对象类别 - 我们获得了一个潜在的CAD模型库，描述该类别中的对象，我们采用了标准公式，其中姿势和形状是通过非非2D或3D关键点估算的-convex优化。我们的第一个贡献是开发PACE3D*和PACE2D*，这是第一个使用3D和2D关键点进行姿势和形状估计的最佳最佳求解器。这两个求解器都依赖于紧密（即精确）半决赛的设计。我们的第二个贡献是开发两个求解器的异常刺激版本，命名为PACE3D＃和PACE2D＃。为了实现这一目标，我们提出了Robin，Robin是一种一般的图理论框架来修剪异常值，该框架使用兼容性超图来建模测量的兼容性。我们表明，在类别级别的感知问题中，这些超图可以是通过关键点（以2D）或其凸壳（以3D为单位）构建的，并且可以通过最大的超级计算来修剪许多异常值。最后的贡献是广泛的实验评估。除了在模拟数据集和Pascal数据集上提供消融研究外，我们还将求解器与深关键点检测器相结合，并证明PACE3D＃在Apolloscape数据集中在车辆姿势估算中改进了最新技术，并且其运行时间是兼容的使用实际应用。

translated by 谷歌翻译

Point Cloud Registration of non-rigid objects in sparse 3D Scans with applications in Mixed Reality

Manorama Jha

分类：计算机视觉

2022-12-07

Point Cloud Registration is the problem of aligning the corresponding points of two 3D point clouds referring to the same object. The challenges include dealing with noise and partial match of real-world 3D scans. For non-rigid objects, there is an additional challenge of accounting for deformations in the object shape that happen to the object in between the two 3D scans. In this project, we study the problem of non-rigid point cloud registration for use cases in the Augmented/Mixed Reality domain. We focus our attention on a special class of non-rigid deformations that happen in rigid objects with parts that move relative to one another about joints, for example, robots with hands and machines with hinges. We propose an efficient and robust point-cloud registration workflow for such objects and evaluate it on real-world data collected using Microsoft Hololens 2, a leading Mixed Reality Platform.

translated by 谷歌翻译

Deformable Surface Reconstruction via Riemannian Metric Preservation

Oriol Barbany , Adrià Colomé , Carme Torras

分类：计算机视觉

2022-12-22

Estimating the pose of an object from a monocular image is an inverse problem fundamental in computer vision. The ill-posed nature of this problem requires incorporating deformation priors to solve it. In practice, many materials do not perceptibly shrink or extend when manipulated, constituting a powerful and well-known prior. Mathematically, this translates to the preservation of the Riemannian metric. Neural networks offer the perfect playground to solve the surface reconstruction problem as they can approximate surfaces with arbitrary precision and allow the computation of differential geometry quantities. This paper presents an approach to inferring continuous deformable surfaces from a sequence of images, which is benchmarked against several techniques and obtains state-of-the-art performance without the need for offline training.

translated by 谷歌翻译

Garment Avatars: Realistic Cloth Driving using Pattern Registration

Oshri Halimi , Fabian Prada , Tuur Stuyck , Donglai Xiang , Timur Bagautdinov , He Wen , Ron Kimmel , Takaaki Shiratori , Chenglei Wu , Yaser Sheikh

分类：计算机视觉

2022-06-07

虚拟网格是在线通信的未来。服装是一个人身份和自我表达的重要组成部分。然而，目前，在培训逼真的布置动画的远程介绍模型的必需分子和准确性中，目前无法使用注册衣服的地面真相数据。在这里，我们提出了一条端到端的管道，用于建造可驱动的服装代表。我们方法的核心是一种多视图图案的布跟踪算法，能够以高精度捕获变形。我们进一步依靠跟踪方法生产的高质量数据来构建服装头像：一件衣服的表达和完全驱动的几何模型。可以使用一组稀疏的视图来对所得模型进行动画，并产生高度逼真的重建，这些重建忠于驾驶信号。我们证明了管道对现实的虚拟电视应用程序的功效，在该应用程序中，从两种视图中重建了衣服，并且用户可以根据自己的意愿进行选择和交换服装设计。此外，当仅通过身体姿势驱动时，我们表现出一个具有挑战性的场景，我们可驾驶的服装Avatar能够生产出比最先进的面包质量明显更高的逼真的布几何形状。

translated by 谷歌翻译

3D Labeling Tool

John Rachwan , Charbel Zalaket

分类：计算机视觉 | 人工智能

2022-07-23

培训和测试监督对象检测模型需要大量带有地面真相标签的图像。标签定义图像中的对象类及其位置，形状以及可能的其他信息，例如姿势。即使存在人力，标签过程也非常耗时。我们引入了一个新的标签工具，用于2D图像以及3D三角网格：3D标记工具（3DLT）。这是一个独立的，功能丰富和跨平台软件，不需要安装，并且可以在Windows，MacOS和基于Linux的发行版上运行。我们不再像当前工具那样在每个图像上分别标记相同的对象，而是使用深度信息从上述图像重建三角形网格，并仅在上述网格上标记一次对象。我们使用注册来简化3D标记，离群值检测来改进2D边界框的计算和表面重建，以将标记可能性扩展到大点云。我们的工具经过最先进的方法测试，并且在保持准确性和易用性的同时，它极大地超过了它们。

translated by 谷歌翻译

Elastic shape analysis of surfaces with second-order Sobolev metrics: a comprehensive numerical framework

Emmanuel Hartman , Yashil Sukurdeep , Eric Klassen , Nicolas Charon , Martin Bauer

分类：计算机视觉

2022-04-08

本文介绍了一组数字方法，用于在不变（弹性）二阶Sobolev指标的设置中对3D表面进行Riemannian形状分析。更具体地说，我们解决了代表为3D网格的参数化或未参数浸入式表面之间的测量学和地球距离的计算。在此基础上，我们为表面集的统计形状分析开发了工具，包括用于估算Karcher均值并在形状群体上执行切线PCA的方法，以及计算沿表面路径的平行传输。我们提出的方法从根本上依赖于通过使用Varifold Fidelity术语来为地球匹配问题提供轻松的变异配方，这使我们能够在计算未参数化表面之间的地理位置时强制执行重新训练的独立性，同时还可以使我们能够与多用途算法相比，使我们能够将表面与vare表面进行比较。采样或网状结构。重要的是，我们演示了如何扩展放松的变分框架以解决部分观察到的数据。在合成和真实的各种示例中，说明了我们的数值管道的不同好处。

translated by 谷歌翻译

REALY: Rethinking the Evaluation of 3D Face Reconstruction

Zenghao Chai , Haoxian Zhang , Jing Ren , Di Kang , Zhengzhuo Xu , Xuefei Zhe , Chun Yuan , Linchao Bao

分类：计算机视觉

2022-03-18

3D面重建结果的评估通常取决于估计的3D模型和地面真相扫描之间的刚性形状比对。我们观察到，将两个形状与不同的参考点进行排列可以在很大程度上影响评估结果。这给精确诊断和改进3D面部重建方法带来了困难。在本文中，我们提出了一种新的评估方法，并采用了新的基准测试，包括100张全球对齐的面部扫描，具有准确的面部关键点，高质量的区域口罩和拓扑符合的网格。我们的方法执行区域形状比对，并导致计算形状误差期间更准确，双向对应关系。细粒度，区域评估结果为我们提供了有关最先进的3D面部重建方法表现的详细理解。例如，我们对基于单图像的重建方法的实验表明，DECA在鼻子区域表现最好，而Ganfit在脸颊区域的表现更好。此外，使用与我们构造的相同过程以对齐和重新构造几个3D面部数据集的新型和高质量的3DMM基础HIFI3D ++。我们将在https://realy3dface.com上发布真正的HIFI3D ++以及我们的新评估管道。

translated by 谷歌翻译

Embodied Hands: Modeling and Capturing Hands and Bodies Together

Javier Romero , Dimitrios Tzionas , Michael J. Black

分类：计算机视觉

2022-01-07

人类将他们的手和身体一起移动，沟通和解决任务。捕获和复制此类协调活动对于虚拟字符至关重要，以实际行为行为。令人惊讶的是，大多数方法分别对待身体和手的3D建模和跟踪。在这里，我们制定了一种手和身体的型号，并将其与全身4D序列合理。当扫描或捕获3D中的全身时，手很小，通常是部分闭塞，使其形状和难以恢复。为了应对低分辨率，闭塞和噪音，我们开发了一种名为Mano（具有铰接和非刚性变形的手模型）的新型号。曼诺从大约1000个高分辨率的3D扫描中学到了31个受试者的手中的大约一定的手。该模型是逼真的，低维，捕获非刚性形状的姿势变化，与标准图形封装兼容，可以适合任何人类的手。 Mano提供从手姿势的紧凑型映射，以构成混合形状校正和姿势协同效应的线性歧管。我们将Mano附加到标准参数化3D体形状模型（SMPL），导致完全铰接的身体和手部模型（SMPL + H）。我们通过用4D扫描仪捕获的综合体，自然，自然，自然的受试者的活动来说明SMPL + H.该配件完全自动，并导致全身型号，自然地移动详细的手动运动和在全身性能捕获之前未见的现实主义。模型和数据在我们的网站上自由用于研究目的（http://mano.is.tue.mpg.de）。

translated by 谷歌翻译

Implicit field supervision for robust non-rigid shape matching

Ramana Sundararaman , Gautam Pai , Maks Ovsjanikov

分类：计算机视觉

2022-03-15

在两个非辅助变形形状之间建立对应关系是视觉计算中最根本的问题之一。当对现实世界中的挑战（例如噪声，异常值，自我结合等）挑战时，现有方法通常会显示出弱的弹性。另一方面，自动描述器在学习几何学上有意义的潜在嵌入方面表现出强大的表现力。但是，它们在\ emph {形状分析}中的使用受到限制。在本文中，我们介绍了一种基于自动码头框架的方法，该方法在固定模板上学习了一个连续形状的变形字段。通过监督点在表面上的变形场，并通过小说\ emph {签名距离正则化}（SDR）正规化点偏面的正规化，我们学习了模板和Shape \ Emph {卷}之间的对齐。经过干净的水密网眼培训，\ emph {没有}任何数据启发，我们证明了在受损的数据和现实世界扫描上表现出令人信服的性能。

translated by 谷歌翻译