智能论文笔记

Theoretical and empirical analysis of a fast algorithm for extracting polygons from signed distance bounds

Nenad Markuš

分类：计算机视觉

2021-11-10

我们研究了将符号距离界限转换为多边形网格的渐近快速方法。这是通过将球形追踪（也称为光线游行）和传统的多边形方案之一（例如，行进立方体）组合来实现的。让我们称之为这个方法网格普通。我们提供的理论和实验证据表明，它是$ O（n ^ 2 \ log n）$ o的多边形网格的$ o（n ^ 2 \ log n），具有$ n ^ 3 $细胞。通过机器学习从点云生成的一组原始形状以及从点云生成的符号距离字段进行测试。鉴于其速度，简单性和可移植性，我们认为它可以在建模阶段和形状压缩过程中证明是有用的。该代码可在此处提供：https://github.com/nenadmarkus/gridhopping

translated by 谷歌翻译

Spelunking the Deep: Guaranteed Queries on General Neural Implicit Surfaces via Range Analysis

Nicholas Sharp , Alec Jacobson

分类：计算机视觉 | 机器学习

2022-02-05

神经隐式表示将表面编码为应用于空间坐标的神经网络的水平集，已证明对优化，压缩和生成3D几何形状非常有效。尽管这些表示易于拟合，但尚不清楚如何最好地评估形状上的几何查询，例如与射线相交或找到最接近的点。主要的方法是鼓励网络具有签名的距离属性。但是，该属性通常仅持有大约导致鲁棒性问题，并且仅在培训结束时持有，从而抑制了在损失功能中使用查询的使用。取而代之的是，这项工作提出了一种新的方法，可以直接针对广泛的现有架构进行一般神经隐式功能进行查询。我们的关键工具是使用自动算术规则将范围分析应用于神经网络，以限制网络在区域上的输出。我们对神经网络的范围分析进行了研究，并确定了非常有效的仿射算术变体。我们使用所得边界来开发几何查询，包括射线铸造，交叉测试，构建空间层次结构，快速网格提取，最接近的点评估，评估批量特性等。我们的疑问可以在GPU上有效评估，并在随机定位的网络上提供具体的准确性，从而可以在培训目标及其他方面使用。我们还展示了对反渲染的初步应用。

translated by 谷歌翻译

3D Neural Sculpting (3DNS): Editing Neural Signed Distance Functions

Petros Tzathas , Petros Maragos , Anastasios Roussos

分类：计算机视觉

2022-09-28

近年来，通过编码签名距离的神经网络的隐式表面表示已获得流行，并获得了最先进的结果。但是，与传统的形状表示（例如多边形网格）相反，隐式表示不容易编辑，并且试图解决此问题的现有作品非常有限。在这项工作中，我们提出了第一种通过神经网络表达的签名距离函数有效互动编辑的方法，从而可以自由编辑。受到网格雕刻软件的启发，我们使用了一个基于刷子的框架，该框架是直观的，将来可以由雕塑家和数字艺术家使用。为了定位所需的表面变形，我们通过使用其副本来调节网络来采样先前表达的表面。我们引入了一个新型框架，用于模拟雕刻风格的表面编辑，并结合交互式表面采样和网络重量的有效适应。我们在各种不同的3D对象和许多不同的编辑下进行定性和定量评估我们的方法。报告的结果清楚地表明，我们的方法在实现所需的编辑方面产生了很高的精度，同时保留了交互区域之外的几何形状。

translated by 谷歌翻译

DIST: Rendering Deep Implicit Signed Distance Function with Differentiable Sphere Tracing

Shaohui Liu , Yinda Zhang , Songyou Peng , Boxin Shi , Marc Pollefeys , Zhaopeng Cui

分类：

2019-11-29

We propose a differentiable sphere tracing algorithm to bridge the gap between inverse graphics methods and the recently proposed deep learning based implicit signed distance function. Due to the nature of the implicit function, the rendering process requires tremendous function queries, which is particularly problematic when the function is represented as a neural network. We optimize both the forward and backward passes of our rendering layer to make it run efficiently with affordable memory consumption on a commodity graphics card. Our rendering method is fully differentiable such that losses can be directly computed on the rendered 2D observations, and the gradients can be propagated backwards to optimize the 3D geometry. We show that our rendering method can effectively reconstruct accurate 3D shapes from various inputs, such as sparse depth and multi-view images, through inverse optimization. With the geometry based reasoning, our 3D shape prediction methods show excellent generalization capability and robustness against various noises. * Work done while Shaohui Liu was an academic guest at ETH Zurich.

translated by 谷歌翻译

PRIF: Primary Ray-based Implicit Function

Brandon Yushan Feng , Yinda Zhang , Danhang Tang , Ruofei Du , Amitabh Varshney

分类：计算机视觉 | 机器学习

2022-08-12

我们引入了一个新的隐式形状表示，称为基于射线的隐式函数（PRIF）。与基于处理空间位置的签名距离函数（SDF）的大多数现有方法相反，我们的表示形式在定向射线上运行。具体而言，PRIF的配制是直接产生给定输入射线的表面命中点，而无需昂贵的球体跟踪操作，因此可以有效地提取形状提取和可区分的渲染。我们证明，经过编码PRIF的神经网络在各种任务中取得了成功，包括单个形状表示，类别形状的生成，从稀疏或嘈杂的观察到形状完成，相机姿势估计的逆渲染以及带有颜色的神经渲染。

translated by 谷歌翻译

FC2T2: The Fast Continuous Convolutional Taylor Transform with Applications in Vision and Graphics

Henning Lange , J. Nathan Kutz

分类：机器学习 | 人工智能 | 计算机视觉

2021-10-29

各系列扩张是几个世纪以来的应用数学和工程的基石。在本文中，我们从现代机器学习角度重新审视了泰勒系列扩张。具体地，我们介绍了快速连续的卷积泰勒变换（FC2T2），这是快速多极法（FMM）的变型，其允许在连续空间中有效地逼近低维卷积操作者。我们建立在FMM上，这是一种近似算法，其降低了从O（nm）到o（n + m）的n身体问题的计算复杂度，并在例如，在例如，在例如，在例如，在ev中找到应用。粒子模拟。作为中间步骤，FMM为网格上的每个单元产生串联扩展，我们引入直接作用于该表示的算法。这些算法分析但大致计算了反向衰减算法的前向和后向通过所需的数量，因此可以在神经网络中用作（隐式）层。具体地，我们引入了一种根隐性层，其输出表面法线和对象距离以及输出给定3D姿势的辐射场的渲染的积分隐式层。在机器学习的背景下，可以理解为N $和M $的$和M $分别被理解为型号参数和模型评估的数量，这对于需要在计算机视觉和图形中普遍存在的重复函数评估的应用程序，与常规神经网络不同网络，该技术以参数优雅地介绍了本文。对于某些应用，这导致拖鞋的200倍减少，与最先进的方法以合理的或不存在的准确性损失相比。

translated by 谷歌翻译

MeshUDF: Fast and Differentiable Meshing of Unsigned Distance Field Networks

Benoit Guillard , Federico Stella , Pascal Fua

分类：计算机视觉

2021-11-29

最近的工作建模3D开放表面培训深度神经网络以近似无符号距离字段（UDF）并隐含地代表形状。要将此表示转换为显式网格，它们要么使用计算上昂贵的方法来对表面的致密点云采样啮合，或者通过将其膨胀到符号距离字段（SDF）中来扭曲表面。相比之下，我们建议直接将深度UDFS直接以延伸行进立方体的开放表面，通过本地检测表面交叉。我们的方法是幅度的序列，比啮合致密点云，比膨胀开口表面更准确。此外，我们使我们的表面提取可微分，并显示它可以帮助稀疏监控信号。

translated by 谷歌翻译

Neural Geometric Level of Detail: Real-time Rendering with Implicit 3D Shapes

Towaki Takikawa , Joey Litalien , Kangxue Yin , Karsten Kreis , Charles Loop , Derek Nowrouzezahrai , Alec Jacobson , Morgan McGuire , Sanja Fidler

分类：

2021-01-26

Neural signed distance functions (SDFs) are emerging as an effective representation for 3D shapes. State-of-theart methods typically encode the SDF with a large, fixedsize neural network to approximate complex shapes with implicit surfaces. Rendering with these large networks is, however, computationally expensive since it requires many forward passes through the network for every pixel, making these representations impractical for real-time graphics. We introduce an efficient neural representation that, for the first time, enables real-time rendering of high-fidelity neural SDFs, while achieving state-of-the-art geometry reconstruction quality. We represent implicit surfaces using an octree-based feature volume which adaptively fits shapes with multiple discrete levels of detail (LODs), and enables continuous LOD with SDF interpolation. We further develop an efficient algorithm to directly render our novel neural SDF representation in real-time by querying only the necessary LODs with sparse octree traversal. We show that our representation is 2-3 orders of magnitude more efficient in terms of rendering speed compared to previous works. Furthermore, it produces state-of-the-art reconstruction quality for complex shapes under both 3D geometric and 2D image-space metrics.

translated by 谷歌翻译

NeuralODF: Learning Omnidirectional Distance Fields for 3D Shape Representation

Trevor Houchens , Cheng-You Lu , Shivam Duggal , Rao Fu , Srinath Sridhar

分类：计算机视觉

2022-06-12

在视觉计算中，3D几何形状以许多不同的形式表示，包括网格，点云，体素电网，水平集和深度图像。每个表示都适用于不同的任务，从而使一个表示形式转换为另一个表示（前向地图）是一个重要且常见的问题。我们提出了全向距离字段（ODF），这是一种新的3D形状表示形式，该表示通过将深度从任何观看方向从任何3D位置存储到对象的表面来编码几何形状。由于射线是ODF的基本单元，因此可以轻松地从通用的3D表示和点云等常见的3D表示。与限制代表封闭表面的水平集方法不同，ODF是未签名的，因此可以对开放表面进行建模（例如服装）。我们证明，尽管在遮挡边界处存在固有的不连续性，但可以通过神经网络（Neururodf）有效地学习ODF。我们还引入了有效的前向映射算法，以转换odf to＆从常见的3D表示。具体而言，我们引入了一种有效的跳跃立方体算法，用于从ODF生成网格。实验表明，神经模型可以通过过度拟合单个对象学会学会捕获高质量的形状，并学会概括对共同的形状类别。

translated by 谷歌翻译

Volume Rendering of Neural Implicit Surfaces

Lior Yariv , Jiatao Gu , Yoni Kasten , Yaron Lipman

分类：计算机视觉

2021-06-22

由于其成功在从稀疏的输入图像集合中合成了场景的新颖视图，最近越来越受欢迎。到目前为止，通过通用密度函数建模了神经体积渲染技术的几何形状。此外，使用通向嘈杂的任意水平函数的任意水平集合来提取几何形状本身，通常是低保真重建。本文的目标是改善神经体积渲染中的几何形象和重建。我们通过将体积密度建模为几何形状来实现这一点。这与以前的工作与体积密度的函数建模几何。更详细地，我们将音量密度函数定义为Laplace的累积分发功能（CDF）应用于符号距离功能（SDF）表示。这种简单的密度表示有三个好处：（i）它为神经体积渲染过程中学到的几何形状提供了有用的电感偏差; （ii）它促进了缺陷近似误差的束缚，导致观看光线的准确采样。精确的采样对于提供几何和光线的精确耦合非常重要; （iii）允许高效无监督的脱位形状和外观在体积渲染中。将此新密度表示应用于具有挑战性的场景多视图数据集生产了高质量的几何重建，表现优于相关的基线。此外，由于两者的解剖学，场景之间的切换形状和外观是可能的。

translated by 谷歌翻译

Shape As Points: A Differentiable Poisson Solver

Songyou Peng , Chiyu "Max" Jiang , Yiyi Liao , Michael Niemeyer , Marc Pollefeys , Andreas Geiger

分类：计算机视觉

2021-06-07

近年来，由于其表达力和灵活性，神经隐式表示在3D重建中获得了普及。然而，神经隐式表示的隐式性质导致缓慢的推理时间并且需要仔细初始化。在本文中，我们重新审视经典且无处不在的点云表示，并使用泊松表面重建（PSR）的可分辨率配方引入可分化的点对网格层，其允许给予定向的GPU加速的指示灯的快速解决方案点云。可微分的PSR层允许我们通过隐式指示器字段有效地和分散地桥接与3D网格的显式3D点表示，从而实现诸如倒角距离的表面重建度量的端到端优化。因此，点和网格之间的这种二元性允许我们以面向点云表示形状，这是显式，轻量级和富有表现力的。与神经内隐式表示相比，我们的形状 - 点（SAP）模型更具可解释，轻量级，并通过一个级别加速推理时间。与其他显式表示相比，如点，补丁和网格，SAP产生拓扑无关的水密歧管表面。我们展示了SAP对无知点云和基于学习的重建的表面重建任务的有效性。

translated by 谷歌翻译

BACON: Band-limited Coordinate Networks for Multiscale Scene Representation

David B. Lindell , Dave Van Veen , Jeong Joon Park , Gordon Wetzstein

分类：计算机视觉 | 机器学习

2021-12-09

基于坐标的网络成为3D表示和场景重建的强大工具。这些网络训练以将连续输入坐标映射到每个点处的信号的值。尽管如此，当前的架构是黑色盒子：不能轻易分析它们的光谱特性，并且在无监督点处的行为难以预测。此外，这些网络通常接受训练以以单个刻度表示信号，并且如此天真的下采样或上采样导致伪像。我们引入带限量坐标网络（BACON），具有分析傅里叶谱的网络架构。培根在无监督点处具有可预测的行为，可以基于所代表信号的光谱特性设计，并且可以在没有明确的监督的情况下代表多个尺度的信号。我们向培根展示用于使用符号距离功能的图像，辐射字段和3D场景的多尺度神经表示的培根，并表明它在可解释性和质量方面优于传统的单尺度坐标网络。

translated by 谷歌翻译

AdaSplats: Adaptive Splats from Semantic Point Cloud for Fast and High-Fidelity LiDAR Simulation

Jean Pierre Richa , Jean-Emmanuel Deschaud , François Goulette , Nicolas Dalmasso

分类：机器人

2022-03-17

LIDAR传感器提供有关周围场景的丰富3D信息，并且对于自动驾驶汽车的任务（例如语义细分，对象检测和跟踪）变得越来越重要。模拟激光雷达传感器的能力将加速自动驾驶汽车的测试，验证和部署，同时降低成本并消除现实情况下的测试风险。为了解决以高保真度模拟激光雷达数据的问题，我们提出了一条管道，该管道利用移动映射系统获得的现实世界点云。基于点的几何表示，更具体地说，已经证明了它们能够在非常大点云中准确对基础表面进行建模的能力。我们引入了一种自适应夹层生成方法，该方法可以准确地对基础3D几何形状进行建模，尤其是对于薄结构。我们还通过在GPU上铸造Ray铸造的同时，在有效处理大点云的同时，我们还开发了更快的时间激光雷达模拟。我们在现实世界中测试了激光雷达的模拟，与基本的碎片和网格划分技术相比，表现出定性和定量结果，证明了我们的建模技术的优势。

translated by 谷歌翻译

A Deep Signed Directional Distance Function for Object Shape Representation

Ehsan Zobeidi , Nikolay Atanasov

分类：计算机视觉

2021-07-23

将3D坐标映射到签名距离函数（SDF）或占用值的神经网络具有启用对象形状的高保真隐式表示。本文开发了一种新的形状模型，允许通过优化连续符号定向距离功能（SDDF）来合成新颖距离视图。与Deep SDF模型类似，我们的SDDF配方可以代表整个类别的形状并从部分输入数据中跨越形状填写或插入。与SDF不同，该SDF在任何方向上测量到最近表面的距离，SDDF测量给定方向的距离。这允许训练没有3D形状监控的SDDF模型，仅使用距离测量，从深度相机或激光雷达传感器易获得。我们的模型还通过直接在任意位置和观察方向上直接预测距离，去除像表面提取或渲染的后处理步骤。与深色视角综合技术不同，例如培训高容量黑盒型号的神经辐射字段，我们的模型通过构造SDDF值沿着观察方向线性降低的性质。这种结构约束不仅导致维度降低，而且还提供了关于SDDF预测的准确性的分析信心，无论到物体表面的距离如何。

translated by 谷歌翻译

Multiview Neural Surface Reconstruction by Disentangling Geometry and Appearance

Lior Yariv , Yoni Kasten , Dror Moran , Meirav Galun , Matan Atzmon , Ronen Basri , Yaron Lipman

分类：

2020-03-22

In this work we address the challenging problem of multiview 3D surface reconstruction. We introduce a neural network architecture that simultaneously learns the unknown geometry, camera parameters, and a neural renderer that approximates the light reflected from the surface towards the camera. The geometry is represented as a zero level-set of a neural network, while the neural renderer, derived from the rendering equation, is capable of (implicitly) modeling a wide set of lighting conditions and materials. We trained our network on real world 2D images of objects with different material properties, lighting conditions, and noisy camera initializations from the DTU MVS dataset. We found our model to produce state of the art 3D surface reconstructions with high fidelity, resolution and detail.

translated by 谷歌翻译

SurfGen: Adversarial 3D Shape Synthesis with Explicit Surface Discriminators

Andrew Luo , Tianqin Li , Wen-Hao Zhang , Tai Sing Lee

分类：计算机视觉

2022-01-01

深度生成模型的最新进展导致了3D形状合成的巨大进展。虽然现有模型能够合成表示为体素，点云或隐式功能的形状，但这些方法仅间接强制执行最终3D形状表面的合理性。在这里，我们提出了一种直接将对抗训练施加到物体表面的3D形状合成框架（Surfgen）。我们的方法使用可分解的球面投影层来捕获并表示隐式3D发生器的显式零IsoSurface作为在单元球上定义的功能。通过在对手设置中用球形CNN处理3D对象表面的球形表示，我们的发电机可以更好地学习自然形状表面的统计数据。我们在大规模形状数据集中评估我们的模型，并证明了端到端训练的模型能够产生具有不同拓扑的高保真3D形状。

translated by 谷歌翻译

3D Labeling Tool

John Rachwan , Charbel Zalaket

分类：计算机视觉 | 人工智能

2022-07-23

培训和测试监督对象检测模型需要大量带有地面真相标签的图像。标签定义图像中的对象类及其位置，形状以及可能的其他信息，例如姿势。即使存在人力，标签过程也非常耗时。我们引入了一个新的标签工具，用于2D图像以及3D三角网格：3D标记工具（3DLT）。这是一个独立的，功能丰富和跨平台软件，不需要安装，并且可以在Windows，MacOS和基于Linux的发行版上运行。我们不再像当前工具那样在每个图像上分别标记相同的对象，而是使用深度信息从上述图像重建三角形网格，并仅在上述网格上标记一次对象。我们使用注册来简化3D标记，离群值检测来改进2D边界框的计算和表面重建，以将标记可能性扩展到大点云。我们的工具经过最先进的方法测试，并且在保持准确性和易用性的同时，它极大地超过了它们。

translated by 谷歌翻译

Advances in Neural Rendering

Ayush Tewari , Justus Thies , Ben Mildenhall , Pratul Srinivasan , Edgar Tretschk , Yifan Wang , Christoph Lassner , Vincent Sitzmann , Ricardo Martin-Brualla , Stephen Lombardi

分类：计算机视觉

2021-11-10

综合照片 - 现实图像和视频是计算机图形的核心，并且是几十年的研究焦点。传统上，使用渲染算法（如光栅化或射线跟踪）生成场景的合成图像，其将几何形状和材料属性的表示为输入。统称，这些输入定义了实际场景和呈现的内容，并且被称为场景表示（其中场景由一个或多个对象组成）。示例场景表示是具有附带纹理的三角形网格（例如，由艺术家创建），点云（例如，来自深度传感器），体积网格（例如，来自CT扫描）或隐式曲面函数（例如，截短的符号距离）字段）。使用可分辨率渲染损耗的观察结果的这种场景表示的重建被称为逆图形或反向渲染。神经渲染密切相关，并将思想与经典计算机图形和机器学习中的思想相结合，以创建用于合成来自真实观察图像的图像的算法。神经渲染是朝向合成照片现实图像和视频内容的目标的跨越。近年来，我们通过数百个出版物显示了这一领域的巨大进展，这些出版物显示了将被动组件注入渲染管道的不同方式。这种最先进的神经渲染进步的报告侧重于将经典渲染原则与学习的3D场景表示结合的方法，通常现在被称为神经场景表示。这些方法的一个关键优势在于它们是通过设计的3D-一致，使诸如新颖的视点合成捕获场景的应用。除了处理静态场景的方法外，我们还涵盖了用于建模非刚性变形对象的神经场景表示...

translated by 谷歌翻译

Differentiable Rendering of Neural SDFs through Reparameterization

Sai Praveen Bangaru , Michaël Gharbi , Tzu-Mao Li , Fujun Luan , Kalyan Sunkavalli , Miloš Hašan , Sai Bi , Zexiang Xu , Gilbert Bernstein , Frédo Durand

分类：计算机视觉

2022-06-10

我们提出了一种方法，可以在神经SDF渲染器中相对于几何场景参数自动计算正确的梯度。最近基于物理的可区分渲染技术用于网格采样来处理不连续性，尤其是在对象轮廓上，但是SDF没有简单的参数形式，可用于采样。取而代之的是，我们的方法建立在区域采样技术的基础上，并为SDFS开发了连续的翘曲功能，以解决这些不连续性。我们的方法利用了在SDF中编码的表面的距离，并在球形示踪剂点上使用正交来计算此翘曲功能。我们进一步表明，这可以通过对要点进行次采样来使神经SDF的方法进行。我们可区分的渲染器可用于优化从多视图图像中的神经形状，并对最近基于SDF的反向渲染方法产生可比较的3D重建，而无需2D分割掩码来指导几何形状优化，而无需对几何形状进行体积近似。

translated by 谷歌翻译

Deep Local Shapes: Learning Local SDF Priors for Detailed 3D Reconstruction

Rohan Chabra , Jan Eric Lenssen , Eddy Ilg , Tanner Schmidt , Julian Straub , Steven Lovegrove , Richard Newcombe

分类：

2020-03-24

translated by 谷歌翻译