智能论文笔记

3D Shape Sequence of Human Comparison and Classification using Current and Varifolds

Emery Pierson , Mohamed Daoudi , Sylvain Arguillere

分类：计算机视觉

2022-07-25

在本文中，我们解决了人类3D形状序列的比较和分类的任务。随着时间的推移，人类运动的非线性动力学和表面参数化的变化使这项任务非常具有挑战性。为了解决这个问题，我们建议将3D形状序列嵌入无限的尺寸空间，即Varifolds的空间，并具有来自给定的正定核的内部产品。更具体地说，我们的方法涉及两个步骤：1）表面表示为varifolds，该表示形式将指标等效到刚体运动，而不是参数化的不变性； 2）3D形状的序列由其无限尺寸Hankel矩阵得出的革兰氏矩阵表示。两个人类的两个3D序列的比较问题是作为两个革兰氏赫克矩阵的比较。关于CVSSP3D和DYNA数据集的广泛实验表明，我们的方法在3D人类序列运动检索中与最新的方法具有竞争力。实验代码可在https://github.com/cristal-3dsam/humancomparisonvarifolds上获得。

translated by 谷歌翻译

Elastic shape analysis of surfaces with second-order Sobolev metrics: a comprehensive numerical framework

Emmanuel Hartman , Yashil Sukurdeep , Eric Klassen , Nicolas Charon , Martin Bauer

分类：计算机视觉

2022-04-08

本文介绍了一组数字方法，用于在不变（弹性）二阶Sobolev指标的设置中对3D表面进行Riemannian形状分析。更具体地说，我们解决了代表为3D网格的参数化或未参数浸入式表面之间的测量学和地球距离的计算。在此基础上，我们为表面集的统计形状分析开发了工具，包括用于估算Karcher均值并在形状群体上执行切线PCA的方法，以及计算沿表面路径的平行传输。我们提出的方法从根本上依赖于通过使用Varifold Fidelity术语来为地球匹配问题提供轻松的变异配方，这使我们能够在计算未参数化表面之间的地理位置时强制执行重新训练的独立性，同时还可以使我们能够与多用途算法相比，使我们能够将表面与vare表面进行比较。采样或网状结构。重要的是，我们演示了如何扩展放松的变分框架以解决部分观察到的数据。在合成和真实的各种示例中，说明了我们的数值管道的不同好处。

translated by 谷歌翻译

LoRD: Local 4D Implicit Representation for High-Fidelity Dynamic Human Modeling

Boyan Jiang , Xinlin Ren , Mingsong Dou , Xiangyang Xue , Yanwei Fu , Yinda Zhang

分类：计算机视觉

2022-08-18

4D隐式表示中的最新进展集中在全球控制形状和运动的情况下，低维潜在向量，这很容易缺少表面细节和累积跟踪误差。尽管许多深层的本地表示显示了3D形状建模的有希望的结果，但它们的4D对应物尚不存在。在本文中，我们通过提出一个新颖的局部4D隐性代表来填补这一空白，以动态穿衣人，名为Lord，具有4D人类建模和局部代表的优点，并实现具有详细的表面变形的高保真重建，例如衣服皱纹。特别是，我们的主要见解是鼓励网络学习本地零件级表示的潜在代码，能够解释本地几何形状和时间变形。为了在测试时间进行推断，我们首先估计内部骨架运动在每个时间步中跟踪本地零件，然后根据不同类型的观察到的数据通过自动编码来优化每个部分的潜在代码。广泛的实验表明，该提出的方法具有强大的代表4D人类的能力，并且在实际应用上胜过最先进的方法，包括从稀疏点，非刚性深度融合（质量和定量）进行的4D重建。

translated by 谷歌翻译

Characterization of surface motion patterns in highly deformable soft tissue organs from dynamic MRI: An application to assess 4D bladder motion

Karim Makki , Amine Bohi , Augustin . C Ogier , Marc Emmanuel Bellemare

分类：计算机视觉

2020-10-05

动态MRI可以捕获具有高对比度的软组织器官中的时间解剖变化，但是获得的序列通常遭受有限的体积覆盖，这使得器官形状轨迹的高分辨率重建在时间研究中的主要挑战。由于腹部器官形状的变异性跨越时间和受试者，本研究的目的是朝向3D致密速度测量来完全覆盖整个表面并提取有意义的特征，其特征在于观察到的器官变形并实现临床作用或决定。我们在深呼吸运动期间提出了一种用于表征膀胱表面动力学的管道。对于紧凑的形状表示，首先使用重建的时间体积来使用LDDMM框架建立专用的动态4D网状序列。然后，我们从诸如网格伸长和失真的机械参数执行器官动力学的统计表征。由于我们将器官引用作为非平面，因此我们还使用平均曲率变化为度量来量化表面演变。然而，曲率的数值计算强烈地取决于表面参数化。为了应对这一依赖性，我们采用了一种用于表面变形分析的新方法。独立于参数化并最小化测地曲线的长度，通过最小化Dirichlet能量，它使表面曲线平滑地朝向球体。 eulerian PDE方法用于从曲线缩短流中导出形状描述符。使用Laplace Beltrami操作员特征函数来计算各个运动模式之间的接口，用于球形映射。用于提取用于局部控制的模拟形状轨迹的表征相关曲线的应用演示了所提出的形状描述符的稳定性。

translated by 谷歌翻译

Frame Averaging for Equivariant Shape Space Learning

Matan Atzmon , Koki Nagano , Sanja Fidler , Sameh Khamis , Yaron Lipman

分类：计算机视觉 | 机器学习

2021-12-03

形状空间学习的任务涉及使用良好的概括性属性映射到从潜在表示空间的列车组。通常，真实世界的形状系列具有对称性，可以定义为不改变形状本质的转换。在形状空间学习中纳入对称性的自然方式是要求将其映射到形状空间（编码器）和从形状空间（解码器）映射到相关的对称。在本文中，我们通过引入两个贡献，提出了一种在编码器和解码器中融入设备和解码器的框架：（i）适应建设通用，高效和最大富有表现力的Autorencoders的最近帧平均（FA）框架; （ii）构建自动化器等于分段欧几里德运动的分段应用于形状的不同部分。据我们所知，这是第一个完全分段的欧几里德的欧洲等自动化器建设。培训我们的框架很简单：它使用标准的重建损失，不需要引入新的损失。我们的体系结构由标准（骨干网）架构构成，具有适当的帧平均，使其成为等效。使用隐式的神经表示，在两个刚性形状数据集上测试我们的框架，并使用基于网格的神经网络的铰接形状数据集显示出技术的概括，以通过大边缘改善相关基线。特别地，我们的方法表明了概括铰接姿势的概括性的显着改善。

translated by 谷歌翻译

A structured latent space for human body motion generation

Mathieu Marsot , Stefanie Wuhrer , Jean-Sebastien Franco , Stephane Durocher

分类：计算机视觉

2021-06-07

我们提出了一个框架来学习一个结构化的潜在空间来代表4D人体运动，其中每个潜在向量都编码整个3D人类形状的全部运动。一方面，存在一些数据驱动的骨骼动画模型，提出了时间密集运动信号的运动空间，但基于几何稀疏的运动学表示。另一方面，存在许多方法来构建密集的3D几何形状的形状空间，但对于静态帧。我们将两个概念汇总在一起，提出一个运动空间，该运动空间在时间和几何上都很密集。经过训练后，我们的模型将基于低维潜在空间中的单个点生成多帧序列。该潜在空间是构建为结构化的，因此类似的运动形成簇。它还嵌入了潜在矢量中的持续时间变化，允许语义上的接近序列，这些序列仅因时间展开而不同以共享相似的潜在矢量。我们通过实验证明了潜在空间的结构特性，并表明它可用于在不同动作之间生成合理的插值。我们还将模型应用于4D人类运动的完成，显示其有希望学习人类运动时空特征的能力。

translated by 谷歌翻译

Embodied Hands: Modeling and Capturing Hands and Bodies Together

Javier Romero , Dimitrios Tzionas , Michael J. Black

分类：计算机视觉

2022-01-07

人类将他们的手和身体一起移动，沟通和解决任务。捕获和复制此类协调活动对于虚拟字符至关重要，以实际行为行为。令人惊讶的是，大多数方法分别对待身体和手的3D建模和跟踪。在这里，我们制定了一种手和身体的型号，并将其与全身4D序列合理。当扫描或捕获3D中的全身时，手很小，通常是部分闭塞，使其形状和难以恢复。为了应对低分辨率，闭塞和噪音，我们开发了一种名为Mano（具有铰接和非刚性变形的手模型）的新型号。曼诺从大约1000个高分辨率的3D扫描中学到了31个受试者的手中的大约一定的手。该模型是逼真的，低维，捕获非刚性形状的姿势变化，与标准图形封装兼容，可以适合任何人类的手。 Mano提供从手姿势的紧凑型映射，以构成混合形状校正和姿势协同效应的线性歧管。我们将Mano附加到标准参数化3D体形状模型（SMPL），导致完全铰接的身体和手部模型（SMPL + H）。我们通过用4D扫描仪捕获的综合体，自然，自然，自然的受试者的活动来说明SMPL + H.该配件完全自动，并导致全身型号，自然地移动详细的手动运动和在全身性能捕获之前未见的现实主义。模型和数据在我们的网站上自由用于研究目的（http://mano.is.tue.mpg.de）。

translated by 谷歌翻译

AMASS: Archive of Motion Capture as Surface Shapes

Naureen Mahmood , Nima Ghorbani , Nikolaus F. Troje , Gerard Pons-Moll , Michael J. Black

分类：

2019-04-05

and ACCAD [5] datasets. The input is sparse markers and the output is SMPL body models.

translated by 谷歌翻译

Expressive Body Capture: 3D Hands, Face, and Body from a Single Image

Georgios Pavlakos , Vasileios Choutas , Nima Ghorbani , Timo Bolkart , Ahmed A. A. Osman , Dimitrios Tzionas , Michael J. Black

分类：

2019-04-11

To facilitate the analysis of human actions, interactions and emotions, we compute a 3D model of human body pose, hand pose, and facial expression from a single monocular image. To achieve this, we use thousands of 3D scans to train a new, unified, 3D model of the human body, SMPL-X, that extends SMPL with fully articulated hands and an expressive face. Learning to regress the parameters of SMPL-X directly from images is challenging without paired images and 3D ground truth. Consequently, we follow the approach of SMPLify, which estimates 2D features and then optimizes model parameters to fit the features. We improve on SMPLify in several significant ways: (1) we detect 2D features corresponding to the face, hands, and feet and fit the full SMPL-X model to these; (2) we train a new neural network pose prior using a large MoCap dataset; (3) we define a new interpenetration penalty that is both fast and accurate; (4) we automatically detect gender and the appropriate body models (male, female, or neutral); (5) our PyTorch implementation achieves a speedup of more than 8× over Chumpy. We use the new method, SMPLify-X, to fit SMPL-X to both controlled images and images in the wild. We evaluate 3D accuracy on a new curated dataset comprising 100 images with pseudo ground-truth. This is a step towards automatic expressive human capture from monocular RGB data. The models, code, and data are available for research purposes at https://smpl-x.is.tue.mpg.de.

translated by 谷歌翻译

Action2video: Generating Videos of Human 3D Actions

Chuan Guo , Xinxin Zuo , Sen Wang , Xinshuang Liu , Shihao Zou , Minglun Gong , Li Cheng

分类：计算机视觉

2021-11-12

我们的目标是从规定的行动类别中解决从规定的行动类别创造多元化和自然人动作视频的有趣但具有挑战性的问题。关键问题在于能够在视觉外观中综合多种不同的运动序列。在本文中通过两步过程实现，该两步处理维持内部3D姿势和形状表示，Action2Motion和Motion2Video。 Action2Motion随机生成规定的动作类别的合理的3D姿势序列，该类别由Motion2Video进行处理和呈现，以形成2D视频。具体而言，Lie代数理论从事人类运动学的物理法之后代表自然人动作;开发了一种促进输出运动的分集的时间变化自动编码器（VAE）。此外，给定衣服人物的额外输入图像，提出了整个管道以提取他/她的3D详细形状，并在视频中呈现来自不同视图的合理运动。这是通过改进从单个2D图像中提取3D人类形状和纹理，索引，动画和渲染的现有方法来实现这一点，以形成人类运动的2D视频。它还需要3D人类运动数据集的策策和成果进行培训目的。彻底的经验实验，包括消融研究，定性和定量评估表现出我们的方法的适用性，并展示了解决相关任务的竞争力，其中我们的方法的组成部分与最先进的方式比较。

translated by 谷歌翻译

Why you should learn functional basis

Riccardo Marin , Souhaib Attaiki , Simone Melzi , Emanuele Rodolà , Maks Ovsjanikov

分类：计算机视觉

2021-12-14

几何数据的高效和实际表示是几何处理中的几种应用的普遍存在问题。广泛使用的选择是通过它们的光谱嵌入对3D对象进行编码，与每个表面点相关联通过差分操作员的特征函数的截断子集在该点处假定的值（通常是拉普拉斯人）。几次尝试为不同应用程序定义新的，优选的嵌入物在过去十年中看到了光明。尽管有限制，但标准拉普利亚特征障碍仍然在可用解决方案的顶部保持稳定，例如限于近体形状匹配的近等待物。最近，一个新的趋势表明了学习Laplacian特征障碍的替代品的优势。与此同时，许多研究问题仍未解决：新的基础比LBO特征功能更好，以及它们如何与他们联系？它们如何在功能形式的角度下采取行动？以及如何与其他功能和描述符在新配置中利用这些基础？在这项研究中，我们正确地提出了这些问题，以改善我们对这种新兴的研究方向的理解。我们在不同的背景下展示了他们的应用相关性，揭示了他们的一些见解和令人兴奋的未来方向。

translated by 谷歌翻译

UNIF: United Neural Implicit Functions for Clothed Human Reconstruction and Animation

Shenhan Qian , Jiale Xu , Ziwei Liu , Liqian Ma , Shenghua Gao

分类：计算机视觉

2022-07-20

我们提出了联合隐式功能（UNIF），这是一种基于原始扫描和骨骼作为输入的人类重建和动画的零件方法。先前的基于部分的人重建方法依赖于SMPL的地面零件标签，因此仅限于最小衣服。相比之下，我们的方法学会了将部分与身体运动分开，而不是部分监督，因此可以扩展到穿衣服的人类和其他铰接的物体。我们的分区从动作进行分区是通过以骨骼为中心的初始化，骨限度损失和正常损失来实现的，即使训练姿势受到限制，也可以确保稳定的零件分裂。我们还为SDF提供了最小的周边损失，以抑制额外的表面和部分重叠。我们方法的另一个核心是一种相邻的部分接缝算法，该算法会产生非刚性变形，以维持显着缓解基于部分伪像的部分之间的连接。在该算法下，我们进一步提出了“竞争部分”，该方法通过点对骨骼而不是绝对位置的相对位置定义了重量，从而避免了神经隐式函数的概括性问题（线性混合皮肤）。我们通过在CAPE和ClothSeq数据集上穿衣服的人体重建和动画来证明我们方法的有效性。

translated by 谷歌翻译

Non-Isometric Shape Matching via Functional Maps on Landmark-Adapted Bases

Mikhail Panine , Maxime Kirgo , Maks Ovsjanikov

分类：计算机视觉

2022-05-10

我们提出了一种针对非等级地标的非刚性形状匹配的原则方法。我们的方法基于功能地图框架，但我们没有促进异构体，而是集中在近乎符号的地图上，这些图可准确地保留地标。首先，我们通过使用固有的Dirichlet-Steklov本本特征来引入新颖的地标适应性基础来实现这一目标。其次，我们建立了在此基础上表达的保形图的功能分解。最后，我们制定了一种构成形式不变的能量，该能量促进了高质量的具有里程碑式的保留地图，并展示了如何通过我们扩展到设置的最近提出的Zoomout方法的变体来求解它。我们的方法是无描述符，有效且可靠的，可显着网格变异性。我们在一系列基准数据集上评估了我们的方法，并在非等法基准测试和等距范围内的最新性能上展示了最先进的性能。

translated by 谷歌翻译

LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human Bodies

Sandro Lombardi , Bangbang Yang , Tianxing Fan , Hujun Bao , Guofeng Zhang , Marc Pollefeys , Zhaopeng Cui

分类：计算机视觉

2021-11-30

在计算机愿景中已经过了很长一段时间的3D表示和人体重建。传统方法主要依赖于参数统计线性模型，将可能的身体的空间限制在线性组合。近来，一些方法才试图利用人体建模的神经隐式表示，同时展示令人印象深刻的结果，它们是通过表示能力的限制或没有物理有意义和可控的。在这项工作中，我们提出了一种用于人体的新型神经隐含表示，其具有完全可分辨：无戒开的形状和姿势潜在空间的优化。与事先工作相反，我们的代表是基于运动模型设计的，这使得可以为姿势动画等任务提供可控制的表示，同时允许为3D配件和姿势跟踪等任务进行整形和姿势。我们的模型可以直接培训和精细调整，直接在具有精心设计的损失的非水密原始数据上。实验展示了SOTA方法的改进的3D重建性能，并显示了我们的方法来形状插值，模型拟合，姿势跟踪和运动重新定位的适用性。

translated by 谷歌翻译

Geometric deep learning: going beyond Euclidean data

Michael M. Bronstein , Joan Bruna , Yann LeCun , Arthur Szlam , Pierre Vandergheynst

分类：

2016-11-24

Many scientific fields study data with an underlying structure that is a non-Euclidean space. Some examples include social networks in computational social sciences, sensor networks in communications, functional networks in brain imaging, regulatory networks in genetics, and meshed surfaces in computer graphics. In many applications, such geometric data are large and complex (in the case of social networks, on the scale of billions), and are natural targets for machine learning techniques. In particular, we would like to use deep neural networks, which have recently proven to be powerful tools for a broad range of problems from computer vision, natural language processing, and audio analysis. However, these tools have been most successful on data with an underlying Euclidean or grid-like structure, and in cases where the invariances of these structures are built into networks used to model them.Geometric deep learning is an umbrella term for emerging techniques attempting to generalize (structured) deep neural models to non-Euclidean domains such as graphs and manifolds. The purpose of this paper is to overview different examples of geometric deep learning problems and present available solutions, key difficulties, applications, and future research directions in this nascent field.

translated by 谷歌翻译

Total Capture: A 3D Deformation Model for Tracking Faces, Hands, and Bodies

Hanbyul Joo , Tomas Simon , Yaser Sheikh

分类：

2018-01-05

Figure 1: Frankenstein (silver) and Adam (gold). This paper presents a 3D human model capable of concurrently tracking the large-scale posture of the body along with the smaller details of a persons facial expressions and hand gestures.

translated by 谷歌翻译

Learning Spectral Unions of Partial Deformable 3D Shapes

Luca Moschella , Simone Melzi , Luca Cosmo , Filippo Maggioli , Or Litany , Maks Ovsjanikov , Leonidas Guibas , Emanuele Rodolà

分类：机器学习

2021-03-31

Spectral geometric methods have brought revolutionary changes to the field of geometry processing. Of particular interest is the study of the Laplacian spectrum as a compact, isometry and permutation-invariant representation of a shape. Some recent works show how the intrinsic geometry of a full shape can be recovered from its spectrum, but there are approaches that consider the more challenging problem of recovering the geometry from the spectral information of partial shapes. In this paper, we propose a possible way to fill this gap. We introduce a learning-based method to estimate the Laplacian spectrum of the union of partial non-rigid 3D shapes, without actually computing the 3D geometry of the union or any correspondence between those partial shapes. We do so by operating purely in the spectral domain and by defining the union operation between short sequences of eigenvalues. We show that the approximated union spectrum can be used as-is to reconstruct the complete geometry [MRC*19], perform region localization on a template [RTO*19] and retrieve shapes from a database, generalizing ShapeDNA [RWP06] to work with partialities. Working with eigenvalues allows us to deal with unknown correspondence, different sampling, and different discretizations (point clouds and meshes alike), making this operation especially robust and general. Our approach is data-driven and can generalize to isometric and non-isometric deformations of the surface, as long as these stay within the same semantic class (e.g., human bodies or horses), as well as to partiality artifacts not seen at training time.

translated by 谷歌翻译

Complex Functional Maps : a Conformal Link Between Tangent Bundles

Nicolas Donati , Etienne Corman , Simone Melzi , Maks Ovsjanikov

分类：计算机视觉

2021-12-17

在本文中，我们介绍了复杂的功能映射，它将功能映射框架扩展到表面上切线矢量字段之间的共形图。这些地图的一个关键属性是他们的方向意识。更具体地说，我们证明，与连锁两个歧管的功能空间的常规功能映射不同，我们的复杂功能图在面向的切片束之间建立了一个链路，从而允许切线矢量场的稳健和有效地传输。通过首先赋予和利用复杂的结构利用各个形状的切线束，所得到的操作变得自然导向，从而有利于横跨形状保持对应的取向和角度，而不依赖于描述符或额外的正则化。最后，也许更重要的是，我们演示了这些对象如何在功能映射框架内启动几个实际应用。我们表明功能映射及其复杂的对应物可以共同估算，以促进定向保存，规范的管道，前面遭受取向反转对称误差的误差。

translated by 谷歌翻译

Implicit field supervision for robust non-rigid shape matching

Ramana Sundararaman , Gautam Pai , Maks Ovsjanikov

分类：计算机视觉

2022-03-15

在两个非辅助变形形状之间建立对应关系是视觉计算中最根本的问题之一。当对现实世界中的挑战（例如噪声，异常值，自我结合等）挑战时，现有方法通常会显示出弱的弹性。另一方面，自动描述器在学习几何学上有意义的潜在嵌入方面表现出强大的表现力。但是，它们在\ emph {形状分析}中的使用受到限制。在本文中，我们介绍了一种基于自动码头框架的方法，该方法在固定模板上学习了一个连续形状的变形字段。通过监督点在表面上的变形场，并通过小说\ emph {签名距离正则化}（SDR）正规化点偏面的正规化，我们学习了模板和Shape \ Emph {卷}之间的对齐。经过干净的水密网眼培训，\ emph {没有}任何数据启发，我们证明了在受损的数据和现实世界扫描上表现出令人信服的性能。

translated by 谷歌翻译

Annotating Motion Primitives for Simplifying Action Search in Reinforcement Learning

Isaac J. Sledge , Darshan W. Bryner , Jose C. Principe

分类：机器学习 | 人工智能 | 机器人

2021-02-24

由于在特定情况下可以采取的许多可能采取的行动，大规模环境中的强化学习是具有挑战性的。我们以前开发了一种限制的方法，因此通过使用运动原语来加速搜索过程;运动原语是跨国系列采取的预先指定行动的序列。作为这项工作的副产品，我们发现，如果标记运动基元的动作和动作，则可以进一步加速搜索。由于运动原语最初可能缺乏这些细节，因此理论上提出了一种自动注释潜在动作和动作的观点出不敏感和速度不敏感的手段。我们通过差分几何时空运动学描述符进行这一点，这分析了两个运动序列中的实体的姿势如何随时间而变化。我们将此描述符与加权最近邻邻分类器一起使用，以使用有限的培训示例标记基元。在我们的实验中，我们为人类动作衍生的原语进行了高运动和动作注释率，只有一个训练样本。我们还证明，使用精确标记的轨迹的强化学习比标准加固学习技术更快地导致高性能的政策。这部分是因为运动原语编码了现有域知识并抢先在培训期间重新发现该知识的需要。这也是因为代理可以利用标签来系统地忽略不促进任务目标的动作类，从而减少动作空间。

translated by 谷歌翻译