我们采用新颖的视角来看待数据不是作为概率分布而是作为当前。主要研究几何测量理论领域,$ k $ -currents是连续线性泛函,作用于紧凑支持的平滑微分形式,可以理解为定向$ k $ - 维数流形的广义注记。通过从分布($ 0 $ -currents)移动到$ k $ -currents,我们可以通过在每个采​​样点上附加一个$ k $的三维切平面来明确定位数据。基于作为电流之间的基本距离的平坦度量,我们推导出了平面GAN,这是一种在生成对抗网络的精神中的公式,但是一般化为$ k $ -currents。在我们的理论贡献中,我们证明参数化电流和参考电流之间的平衡度量在参数中是Lipschitzcontinuous。在实验中,我们证明了建议的shift $ k> 0 $导致可解释和解开的潜在表示与指定的定向切平面等效。
translated by 谷歌翻译
进化和学习是生命适应生存和超越限制的两个基本机制。这些生物学现象启发了成功的计算方法,如进化算法和深度学习。进化依赖于随机突变和随机遗传重组。在这里,我们表明,学习进化,即学习变异和重组比在任意时更好,改善了每代健身增加的进化结果,甚至在可达到的健康方面。我们使用深度强化学习来学习动态调整进化算法的策略以适应不同的环境。我们的方法在组合和连续优化问题上优于经典的进化算法。
translated by 谷歌翻译
成像和视觉方面的许多任务可以表示为矢量值图上的变分问题。我们通过提升到电流空间来解决这种矢量变分问题的松弛和凸化。为此,我们记得具有polyconvexLagrangians的函数可以在函数的图上重新参数化为凸一齐函数。这导致在域和密码域的产品空间中的等效形状优化问题定向表面。然后通过将搜索空间从定向表面放松到更一般的电流来获得凸形式。我们提出使用Whitney形式对所得到的无限维优化问题进行离散化,这也是最近的“子标签精确”多标记方法的概括。
translated by 谷歌翻译
SLAM的直接方法在测距任务中表现出了非凡的性能。然而,它们仍然受到动态照明/天气变化以及大基线上的不良初始化的影响。为了减轻这两种影响,我们提出了一种方法,它为每个像素提供深度视觉描述符作为SLAM系统的输入。在这项工作中,我们介绍了GN-Net:一个用新颖的Gauss-Newton损失优化的网络,用于训练深层特征。它旨在最大化高斯 - 牛顿算法内正确像素对应的概率。与通常在基于SLAM的方法中使用的单通道灰度图像相比,这导致具有更大会聚面的特征。我们的网络可以通过不同图像之间的地面实况像素对应进行训练,这些图像可以通过任何最先进的SLAM算法从模拟数据或生成。我们表明,我们的方法更能够抵御错误的初始化,白天的变化以及天气变化,从而超越了最先进的直接和间接方法。此外,我们发布了一个评估基准,用于我们所谓的本地化跟踪。它是使用CARLA模拟器创建的,以及取自Oxford RobotCar Dataset的序列。
translated by 谷歌翻译
从图像中理解3D场景是一个具有挑战性的问题,它在机器人,增强现实和自动驾驶场景中得到了应用。在本文中,我们提出了一种从道路场景的立体图像中联合推断车辆的3D刚体和车身形状的新方法。与先前依赖于具有密集立体构造的形状几何对齐的工作不同,我们的方法直接在图像上工作,并通过3D形状先验与立体图像的组合光度和轮廓对齐来有效地推断形状和效果。我们使用先前的形状来表示汽车的体积符号距离函数的低维线性嵌入。使用两个对齐项有效地测量一致性,我们提出了一种适应性稀疏点选择方案。在实验中,我们证明了我们的方法在姿态估计和形状重建方面的卓越性能,而不是使用具有密集立体构造的几何对齐的最先进方法。我们的方法还可以提高基于深度学习的3D对象检测方法的性能,作为一种改进方法。我们证明了我们的方法显着提高了最近几种检测方法的准确性。
translated by 谷歌翻译
摄像机和惯性测量单元是互补传感器放大运动估计和环境映射。它们的组合使得视觉惯性测距(VIO)系统更加准确和稳健。然而,对于全局一致的映射,结合视觉和惯性信息并不是直截了当的。要使用一组图像估计运动和几何,需要使用大基线。因此,大多数系统在关键帧上运行,这些关键帧之间的时间间隔很长。另一方面,惯性数据随着间隔的持续时间快速降低,并且在几秒的积分之后,它通常仅包含很少的有用信息。在本文中,我们建议使用非线性因子恢复从视觉惯性测距中提取视觉惯性映射的相关信息。我们构造了一组非线性因子,这些因子可以对VIO累积的轨迹信息进行最佳近似。为了获得全局一致的地图,我们使用捆绑调整将这些因素与循环闭合约束相结合。 VIO因子使全局图的滚动和俯仰角度可观察,并提高了映射的鲁棒性和准确性。在公共基准测试的实验中,我们展示了我们的方法优于最先进方法的性能。
translated by 谷歌翻译
在这项工作中,我们考虑涉及带有勒让德函数的非卷积的非凸复合问题,这引起了近端映射和莫罗包络的各向异性概括。在凸起的设置中,这些问题可以通过交叉最小化分裂公式来解决,其中共识约束受到Legendre函数的惩罚。相比之下,对于非凸模型,通常不清楚这种方法会产生对于内部卷积问题的固定点。为此,我们在近似规律下分析研究了莫尔包络函数的局部正则性,这使我们能够建立分裂模型的静止点与原始的非卷积模型之间的等价性。我们应用我们的理论来描述惩罚目标的固定点,通过分布式训练的弹性平均SGD(EASGD)方法使其最小化。在数值上,我们证明了所提方法在深度神经网络分布式训练这一重要任务中的实际意义。
translated by 谷歌翻译
概率图形模型传统上以其在生成建模中的成功而闻名。在这项工作中,我们提倡用于概率辨别学习的分层图形模型(LGM)。为此,我们设计了与神经网络(NN)近似的LGM,也就是说,它们具有深层次结构和层之间的卷积或局部连接。配备了强化截断变分推理,我们的LGM可以通过反向传播主流深度学习框架(如PyTorch)进行有效训练。具有连续值输入的Todeal,我们使用简单而有效的软钳位策略进行有效推理。通过对MNIST和FashionMNIST数据集的图像分类的广泛实验,我们证明了LGM能够获得与类似建筑物的NN相当的竞争结果,同时保留透明的概率建模。
translated by 谷歌翻译
我们提出了一种新方法,通过真实数据捕获生成准确和真实的服装变形。以前用于逼真布料模型的方法主要依赖于基于物理的模拟的密集计算(具有许多启发式参数),而从视觉观察重建的模型通常缺乏几何细节。在这里,我们提出了由两个模块组成的原始框架,这两个模块共同工作以表示全局形状变形以及高保真度的表面细节。 Globalshape变形是从从运动中穿着的人的3D数据中学习的子空间模型中恢复的,而高频细节被添加到使用条件生成对抗网络创建的法线图中,该网络的结构旨在强制实现真实性和时间一致性。这导致了服装变形序列的前所未有的高质量渲染,其中可以恢复来自(真实)高分辨率观察的细皱纹。此外,由于模型是独立于身体形状和姿势学习的,因此框架适用于需要重新定位(例如,身体动画)的应用。我们的实验通过灵活的模型显示了原始的高质量结果。我们声称采用完全数据驱动的方法来实现真实的皱纹再生。
translated by 谷歌翻译
我们提出了一种新颖的实时直接单目视觉测距仪,用于单向摄像机。我们的方法通过使用统一的全方位模型作为投影函数来扩展直接稀疏测距(DSO),可以应用于具有远大于180度的视场(FoV)的鱼眼摄像机。这种公式允许使用整个区域。输入图像甚至具有强烈的失真,而大多数现有的视觉测距方法只能使用其成像和裁剪部分。有效关键帧窗口内的模型参数被联合优化,包括内在/外在相机参数,点的3D位置和仿射亮度参数。由于宽的FoV,帧之间的图像重叠变得更大并且点更具空间分布。我们的结果表明,我们的方法提供了比最先进的视觉odometrogngorithms更高的准确性和鲁棒性。
translated by 谷歌翻译