智能论文笔记

Robust and Accurate Cylinder Triangulation

Anna Gummeson , Magnus Oskarsson

分类：计算机视觉

2022-12-05

In this paper we present methods for triangulation of infinite cylinders from image line silhouettes. We show numerically that linear estimation of a general quadric surface is inherently a badly posed problem. Instead we propose to constrain the conic section to a circle, and give algebraic constraints on the dual conic, that models this manifold. Using these constraints we derive a fast minimal solver based on three image silhouette lines, that can be used to bootstrap robust estimation schemes such as RANSAC. We also present a constrained least squares solver that can incorporate all available image lines for accurate estimation. The algorithms are tested on both synthetic and real data, where they are shown to give accurate results, compared to previous methods.

translated by 谷歌翻译

Trifocal Relative Pose from Lines at Points and its Efficient Solution

Ricardo Fabbri , Timothy Duff , Hongyi Fan , Margaret Regan , David da Costa de Pinho , Elias Tsigaridas , Charles Wampler , Jonathan Hauenstein , Benjamin Kimia , Anton Leykin

分类：计算机视觉

2019-03-23

We present a method for solving two minimal problems for relative camera pose estimation from three views, which are based on three view correspondences of i) three points and one line and the novel case of ii) three points and two lines through two of the points. These problems are too difficult to be efficiently solved by the state of the art Groebner basis methods. Our method is based on a new efficient homotopy continuation (HC) solver framework MINUS, which dramatically speeds up previous HC solving by specializing HC methods to generic cases of our problems. We characterize their number of solutions and show with simulated experiments that our solvers are numerically robust and stable under image noise, a key contribution given the borderline intractable degree of nonlinearity of trinocular constraints. We show in real experiments that i) SIFT feature location and orientation provide good enough point-and-line correspondences for three-view reconstruction and ii) that we can solve difficult cases with too few or too noisy tentative matches, where the state of the art structure from motion initialization fails.

translated by 谷歌翻译

P1AC: Revisiting Absolute Pose From a Single Affine Correspondence

Jonathan Ventura , Zuzana Kukelova , Torsten Sattler , Dániel Baráth

分类：计算机视觉

2020-11-17

Affine correspondences have traditionally been used to improve feature matching over wide baselines. While recent work has successfully used affine correspondences to solve various relative camera pose estimation problems, less attention has been given to their use in absolute pose estimation. We introduce the first general solution to the problem of estimating the pose of a calibrated camera given a single observation of an oriented point and an affine correspondence. The advantage of our approach (P1AC) is that it requires only a single correspondence, in comparison to the traditional point-based approach (P3P), significantly reducing the combinatorics in robust estimation. P1AC provides a general solution that removes restrictive assumptions made in prior work and is applicable to large-scale image-based localization. We propose two parameterizations of the P1AC problem and evaluate our novel solvers on synthetic data showing their numerical stability and performance under various types of noise. On standard image-based localization benchmarks we show that P1AC achieves more accurate results than the widely used P3P algorithm.

translated by 谷歌翻译

On the Instability of Relative Pose Estimation and RANSAC's Role

Hongyi Fan , Joe Kileel , Benjamin Kimia

分类：计算机视觉

2021-12-29

在本文中，我们研究了多视图几何中基本和基本矩阵估计的5-和7点问题的数值不太稳定性。在这两种情况下，我们表征了末极估计的条件号是无限的呈现不良世界场景。我们还以给定的图像数据表征不良实例。为了达到这些结果，我们提出了一般的框架，用于分析基于Riemannian歧管的多视图几何体中最小问题的调理。综合性和现实世界数据的实验然后揭示了一个引人注目的结论：在结构 - 从 - 动作（SFM）中的随机样本共识（RANSAC）不仅用于过滤输出异常值，而且RANSAC还选择用于良好的良好的图像数据，足够分离我们的理论预测的不良座位。我们的研究结果表明，在未来的工作中，人们可以试图通过仅测试良好的图像数据来加速和增加Ransac的成功。

translated by 谷歌翻译

Estimation Contracts for Outlier-Robust Geometric Perception

Luca Carlone

分类： (统计)机器学习 | 计算机视觉 | 机器学习 | 机器人

2022-08-22

Outier-bubust估计是一个基本问题，已由统计学家和从业人员进行了广泛的研究。在过去的几年中，整个研究领域的融合都倾向于“算法稳定统计”，该统计数据的重点是开发可拖动的异常体 - 固定技术来解决高维估计问题。尽管存在这种融合，但跨领域的研究工作主要彼此断开。本文桥接了有关可认证的异常抗衡器估计的最新工作，该估计是机器人技术和计算机视觉中的几何感知，并在健壮的统计数据中并行工作。特别是，我们适应并扩展了最新结果对可靠的线性回归（适用于<< 50％异常值的低外壳案例）和列表可解码的回归（适用于>> 50％异常值的高淘汰案例）在机器人和视觉中通常发现的设置，其中（i）变量（例如旋转，姿势）属于非convex域，（ii）测量值是矢量值，并且（iii）未知的异常值是先验的。这里的重点是绩效保证：我们没有提出新算法，而是为投入测量提供条件，在该输入测量值下，保证现代估计算法可以在存在异常值的情况下恢复接近地面真相的估计值。这些条件是我们所谓的“估计合同”。除了现有结果的拟议扩展外，我们认为本文的主要贡献是（i）通过指出共同点和差异来统一平行的研究行，（ii）在介绍先进材料（例如，证明总和证明）中的统一行为。对从业者的可访问和独立的演讲，（iii）指出一些即时的机会和开放问题，以发出异常的几何感知。

translated by 谷歌翻译

Perspective Phase Angle Model for Polarimetric 3D Reconstruction

Guangcheng Chen , Li He , Yisheng Guan , Hong Zhang

分类：计算机视觉

2022-07-20

当前的极化3D重建方法，包括具有偏振文献的良好形状的方法，均在正交投影假设下开发。但是，在较大的视野中，此假设不存在，并且可能导致对此假设的方法发生重大的重建错误。为了解决此问题，我们介绍适用于透视摄像机的透视相位角（PPA）模型。与拼字法模型相比，提出的PPA模型准确地描述了在透视投影下极化相位角与表面正常之间的关系。此外，PPA模型使得仅从一个单视相位映射估算表面正态，并且不遭受所谓的{\ pi} - ambiguity问题。实际数据上的实验表明，PPA模型对于具有透视摄像机的表面正常估计比拼字法模型更准确。

translated by 谷歌翻译

Absolute Triangulation Algorithms for Space Exploration

Sebastien Henry , John A. Christian

分类：计算机视觉

2022-05-24

图像是航天器导航和观察到的空间对象的三维重建的重要信息来源。当相机具有已知态度时，这两种应用都采用三角剖分问题的形式，并且从图像中提取的测量值是视线（LOS）方向。这项工作对三角剖分的历史和理论基础进行了全面的综述。回顾了多种经典三角算法，包括许多次优线性方法（许多LOS测量值）和Hartley和Sturm的最佳方法（只有两个LOS测量）。结果表明，使用新的线性最佳正弦三角剖分（丢失）方法，可以在没有迭代作为线性系统的情况下解决最佳的多测量情况。在仅进行两次测量的情况下，Hartley和Sturm的丢失和多项式方法都提供了相同的结果。通过一些数值示例评估了各种三角测量算法，包括行星地形相对导航，天王星的仅角度光学导航，巴黎圣母院的3-D重建以及仅角度的相对导航。

translated by 谷歌翻译

A flexible new technique for camera calibration

分类：

We propose a flexible new technique to easily calibrate a camera. It is well suited for use without specialized knowledge of 3D geometry or computer vision. The technique only requires the camera to observe a planar pattern shown at a few (at least two) different orientations. Either the camera or the planar pattern can be freely moved. The motion need not be known. Radial lens distortion is modeled. The proposed procedure consists of a closed-form solution, followed by a nonlinear refinement based on the maximum likelihood criterion. Both computer simulation and real data have been used to test the proposed technique, and very good results have been obtained. Compared with classical techniques which use expensive equipment such as two or three orthogonal planes, the proposed technique is easy to use and flexible. It advances 3D computer vision one step from laboratory environments to real world use.

translated by 谷歌翻译

Direct Triangulation with Spherical Projection for Omnidirectional Cameras

Ciarán Eising

分类：计算机视觉

2022-06-08

在本文中，提议通过优化投影球上的射线对来解决校准全向相机的三角剖分问题。所提出的解决方案归结为找到二次函数的根，因此与以前的方法相比，封闭形式是完全非介绍性和计算便宜的。此外，甚至认为动机显然是解决全向相机的三角剖分问题，也证明了所提出的方法可以应用于非运动，狭窄的视野摄像机。

translated by 谷歌翻译

Learning to Solve Hard Minimal Problems

Petr Hruby , Timothy Duff , Anton Leykin , Tomas Pajdla

分类：计算机视觉

2021-12-06

我们提出了一种解决RANSAC框架中的硬几何优化问题的方法。难度最小的问题是从放宽原始几何优化问题中的许多虚假解决方案的最小问题。我们的方法避免了计算大量杂散解决方案。我们设计一种学习策略，用于选择一个启动问题解决方案对，可以在数值上继续存在问题和感兴趣的解决方案。我们通过开发RANSAC求解器来展示我们的方法，以通过在每个视图中使用四个点计算三个校准相机的相对姿势的问题。平均而言，我们可以在70美元\ mu s下解决一个问题。$我们还通过两个校准相机的相对姿势计算和研究我们的工程选择，通过两个校准相机的相对姿势。意见。

translated by 谷歌翻译

Perspective-1-Ellipsoid: Formulation, Analysis and Solutions of the Ellipsoid Pose Estimation Problem in Euclidean Space

Vincent Gaudillière , Gilles Simon , Marie-Odile Berger

分类：计算机视觉

2022-08-26

在计算机视觉中，从3D几何实体之间的对应关系及其对图像的投影进行了摄影姿势估计已被广泛研究。尽管大多数最先进的方法利用了诸如点或线之类的低级原始方法，但近年来非常有效的基于CNN的对象探测器的出现为使用具有有意义语义有意义的高级功能铺平了道路信息。开拓性朝这个方向起作用，表明通过椭圆形对3D对象进行建模，而椭圆检测2D检测则提供了方便的方式来链接2D和3D数据。但是，相关垃圾中最常使用的数学形式主义不能轻易将椭圆形和椭圆形和其他四边形和圆锥形区分开，从而导致某些发展中可能有害的特异性丧失。此外，投影方程的线性化过程产生了相机参数的过度代表，也可能导致效率损失。因此，在本文中，我们引入了一个特定于椭圆形的理论框架，并在姿势估计的背景下证明了其有益的特性。更确切地说，我们首先表明拟议的形式主义使椭圆形姿势估计问题将其减少到仅位置或方向估计问题，其中剩余未知数可以以封闭形式得出。然后，我们证明它可以进一步简化为1个自由度（1DOF）问题，并提供姿势的分析表达，这是该唯一标量未知的函数。我们通过视觉示例说明了我们的理论考虑。最后，我们发布了这项工作，以便为更有效的椭圆形相关姿势估计问题做出贡献。

translated by 谷歌翻译

HTML版本

Optimal and Robust Category-level Perception: Object Pose and Shape Estimation from 2D and 3D Semantic Keypoints

Jingnan Shi , Heng Yang , Luca Carlone

分类：计算机视觉 | 机器人

2022-06-24

我们考虑了一个类别级别的感知问题，其中给定的2D或3D传感器数据描绘了给定类别的对象（例如，汽车），并且必须重建尽管级别的可变性，但必须重建对象的3D姿势和形状（即，不同的汽车模型具有不同的形状）。我们考虑了一个主动形状模型，其中 - 对于对象类别 - 我们获得了一个潜在的CAD模型库，描述该类别中的对象，我们采用了标准公式，其中姿势和形状是通过非非2D或3D关键点估算的-convex优化。我们的第一个贡献是开发PACE3D*和PACE2D*，这是第一个使用3D和2D关键点进行姿势和形状估计的最佳最佳求解器。这两个求解器都依赖于紧密（即精确）半决赛的设计。我们的第二个贡献是开发两个求解器的异常刺激版本，命名为PACE3D＃和PACE2D＃。为了实现这一目标，我们提出了Robin，Robin是一种一般的图理论框架来修剪异常值，该框架使用兼容性超图来建模测量的兼容性。我们表明，在类别级别的感知问题中，这些超图可以是通过关键点（以2D）或其凸壳（以3D为单位）构建的，并且可以通过最大的超级计算来修剪许多异常值。最后的贡献是广泛的实验评估。除了在模拟数据集和Pascal数据集上提供消融研究外，我们还将求解器与深关键点检测器相结合，并证明PACE3D＃在Apolloscape数据集中在车辆姿势估算中改进了最新技术，并且其运行时间是兼容的使用实际应用。

translated by 谷歌翻译

Fitting and recognition of geometric primitives in segmented 3D point clouds using a localized voting procedure

Andrea Raffo , Chiara Romanengo , Bianca Falcidieno , Silvia Biasotti

分类：计算机视觉

2022-05-30

从点云中自动创建几何模型在CAD（例如，逆向工程，制造，组装）中具有许多应用，并且通常在形状建模和处理中。给定一个代表人造对象的分段点云，我们提出了一种识别简单几何原语及其相互关系的方法。我们的方法基于Hough Transform（HT），以应对噪音，缺失零件和离群值的能力。在我们的方法中，我们介绍了一种用于处理分段点云的新技术，该技术通过投票程序能够提供表征每种原始类型的几何参数的初始估计。通过使用这些估计值，我们将对最佳解决方案的搜索定位在尺寸还原的参数空间中，从而使将HT扩展到比文献（即平面和球体中通常发现的）更有效。然后，我们提取了许多以唯一特征段的几何描述符，并且根据这些描述符，我们展示了如何汇总原语（段）（段）。对合成和工业扫描的实验揭示了原始拟合方法的鲁棒性及其在推断细分之间关系的有效性。

translated by 谷歌翻译

Registration Techniques for Deformable Objects

Alireza Ahmadi

分类：计算机视觉

2021-11-07

通常，非刚性登记的问题是匹配在两个不同点拍摄的动态对象的两个不同扫描。这些扫描可以进行刚性动作和非刚性变形。由于模型的新部分可能进入视图，而其他部件在两个扫描之间堵塞，则重叠区域是两个扫描的子集。在最常规的设置中，没有给出先前的模板形状，并且没有可用的标记或显式特征点对应关系。因此，这种情况是局部匹配问题，其考虑了随后的扫描在具有大量重叠区域的情况下进行的扫描经历的假设[28]。本文在环境中寻址的问题是同时在环境中映射变形对象和本地化摄像机。

translated by 谷歌翻译

Safe and Smooth: Certified Continuous-Time Range-Only Localization

Frederike Dümbgen , Connor Holmes , Timothy D. Barfoot

分类：机器人

2022-09-09

定位移动机器人的一种常见方法是测量已知位置点的距离，称为锚点。从距离测量值中定位设备通常是由于测量模型的非线性而作为非凸优化问题。当使用局部迭代求解器（如高斯 - 牛顿）时，非凸优化问题可能会产生次优的解决方案。在本文中，我们为连续范围的本地化设计了最佳证书。我们的公式可以整合运动，从而确保溶液的平滑度，并且对于仅从几个距离测量值进行定位至关重要。拟议的证书几乎没有额外的成本，因为它的复杂性与稀疏本地求解器本身的复杂性相同：位置数量的线性。我们在仿真和现实世界数据集中显示，有效的本地求解器通常会找到全球最佳解决方案（通过我们的证书确认），而当没有证书确认时，简单的随机重新初始化最终会导致可认证的最佳选择。

translated by 谷歌翻译

Wide-angle Image Rectification: A Survey

Jinlong Fan , Jing Zhang , Stephen J. Maybank , Dacheng Tao

分类：计算机视觉

2020-10-30

捕获比窄FOV相机的宽视野（FOV）相机，其捕获更大的场景区域，用于许多应用，包括3D重建，自动驾驶和视频监控。然而，广角图像包含违反针孔摄像机模型底层的假设的扭曲，导致对象失真，估计场景距离，面积和方向困难，以及防止在未造成的图像上使用现成的深层模型。下游计算机视觉任务。图像整流，旨在纠正这些扭曲，可以解决这些问题。本文从转换模型到整流方法的广角图像整流的全面调查进展。具体地，我们首先介绍了不同方法中使用的相机模型的详细描述和讨论。然后，我们总结了几种失真模型，包括径向失真和投影失真。接下来，我们审查了传统的基于几何图像整流方法和基于深度学习的方法，其中前者将失真参数估计作为优化问题，并且后者通过利用深神经网络的力量来将其作为回归问题。我们评估在公共数据集上最先进的方法的性能，并显示虽然两种方法都可以实现良好的结果，但这些方法仅适用于特定的相机型号和失真类型。我们还提供了强大的基线模型，并对合成数据集和真实世界广角图像进行了对不同失真模型的实证研究。最后，我们讨论了几个潜在的研究方向，预计将来进一步推进这一领域。

translated by 谷歌翻译

In Search of Projectively Equivariant Neural Networks

Georg Bökman , Axel Flinth , Fredrik Kahl

分类：计算机视觉

2022-09-29

线性神经网络层的模棱两可。在这项工作中，我们放宽了肩variance条件，只有在投影范围内才是真实的。特别是，我们研究了投射性和普通的肩那样的关系，并表明对于重要的例子，这些问题实际上是等效的。3D中的旋转组在投影平面上投影起作用。在设计用于过滤2D-2D对应的网络时，我们在实验上研究了旋转肩位的实际重要性。完全模型的模型表现不佳，虽然简单地增加了不变的特征，从而在强大的基线产量中得到了改善，但这似乎并不是由于改善的均衡性。

translated by 谷歌翻译

GPU-Based Homotopy Continuation for Minimal Problems in Computer Vision

Chiang-Heng Chien , Hongyi Fan , Ahmad Abdelfattah , Elias Tsigaridas , Stanimire Tomov , Benjamin Kimia

分类：计算机视觉

2021-12-07

多项式方程系统经常在计算机视觉中产生，特别是在多视图几何问题中。用于解决这些系统的传统方法通常旨在消除变量达到单变量多项式，例如5点姿势估计的第十阶多项式，使用巧妙的操纵，或者更普遍使用Grobner基础，结果和消除模板，导致多视图几何和其他问题的成功算法。然而，当问题复杂时，这些方法不起作用，当他们这样做时，它们面临效率和稳定性问题。同型延续（HC）可以解决更复杂的问题而没有稳定性问题，并且保证全球解决方案，但已知它们是缓慢的。在本文中，我们表明HC可以在GPU上并行化，在多项式基准测试中显示出高达26倍的显着加速。我们还表明，GPU-HC可以在一系列计算机视觉问题上应用于一系列计算机视觉问题，包括具有未知焦距的4视图三角测量和三焦点姿态估计，其无法用消除模板解决，但它们可以用HC有效地解决它们。 GPU-HC打开门，以轻松配方和解决一系列计算机视觉问题。

translated by 谷歌翻译

3D Labeling Tool

John Rachwan , Charbel Zalaket

分类：计算机视觉 | 人工智能

2022-07-23

培训和测试监督对象检测模型需要大量带有地面真相标签的图像。标签定义图像中的对象类及其位置，形状以及可能的其他信息，例如姿势。即使存在人力，标签过程也非常耗时。我们引入了一个新的标签工具，用于2D图像以及3D三角网格：3D标记工具（3DLT）。这是一个独立的，功能丰富和跨平台软件，不需要安装，并且可以在Windows，MacOS和基于Linux的发行版上运行。我们不再像当前工具那样在每个图像上分别标记相同的对象，而是使用深度信息从上述图像重建三角形网格，并仅在上述网格上标记一次对象。我们使用注册来简化3D标记，离群值检测来改进2D边界框的计算和表面重建，以将标记可能性扩展到大点云。我们的工具经过最先进的方法测试，并且在保持准确性和易用性的同时，它极大地超过了它们。

translated by 谷歌翻译

The 8-Point Algorithm as an Inductive Bias for Relative Pose Prediction by ViTs

Chris Rockwell , Justin Johnson , David F. Fouhey

分类：计算机视觉

2022-08-18

我们提出了一个简单的基线，用于直接估计两个图像之间的相对姿势（旋转和翻译，包括比例）。深度方法最近显示出很强的进步，但通常需要复杂或多阶段的体系结构。我们表明，可以将少数修改应用于视觉变压器（VIT），以使其计算接近八点算法。这种归纳偏见使一种简单的方法在多种环境中具有竞争力，通常在有限的数据制度中具有强劲的性能增长，从而实质上有所改善。

translated by 谷歌翻译