摄像机和惯性测量单元是互补传感器放大运动估计和环境映射。它们的组合使得视觉惯性测距(VIO)系统更加准确和稳健。然而,对于全局一致的映射,结合视觉和惯性信息并不是直截了当的。要使用一组图像估计运动和几何,需要使用大基线。因此,大多数系统在关键帧上运行,这些关键帧之间的时间间隔很长。另一方面,惯性数据随着间隔的持续时间快速降低,并且在几秒的积分之后,它通常仅包含很少的有用信息。在本文中,我们建议使用非线性因子恢复从视觉惯性测距中提取视觉惯性映射的相关信息。我们构造了一组非线性因子,这些因子可以对VIO累积的轨迹信息进行最佳近似。为了获得全局一致的地图,我们使用捆绑调整将这些因素与循环闭合约束相结合。 VIO因子使全局图的滚动和俯仰角度可观察,并提高了映射的鲁棒性和准确性。在公共基准测试的实验中,我们展示了我们的方法优于最先进方法的性能。
translated by 谷歌翻译
在本文中,我们提出了直接稀疏测距(DSO)到具有环闭合检测和姿态图优化(LDSO)的单目视觉SLAM系统的扩展。作为一种直接技术,DSO可以利用具有足够强度梯度的任何图像像素,这使其即使在无特征区域也能够稳健。 LDSO保留了这种稳健性,同时通过支持跟踪前端的角落特征来确保其中一些点的可重复性。这种可重复性允许使用传统的基于特征的词袋(BoW)方法可靠地检测闭环候选。 Loopclosure候选者在几何上被验证,并且通过联合最小化2D和3D几何错误来估计Sim(3)相对姿势约束。这些约束与从DSO的滑动窗口优化中提取的相对姿势的共同可见性图融合。我们对公开可用数据集的评估表明,修改后的点选择策略保持了跟踪精度和鲁棒性,并且集成的姿势图优化显着减少了累积的旋转,平移和尺度漂移,从而产生了与该状态相当的整体性能。基于artfeature的系统,即使没有全局捆绑调整。
translated by 谷歌翻译
忽视滚动快门相机对视觉里程(VO)的影响会严重降低准确性和稳健性。在本文中,我们提出了一种包含滚动快门模型的noveldirect单眼VO方法。 Ourapproach扩展了直接稀疏测距,可以对一组最近的关键帧姿势和稀疏的图像点集的深度进行直接束调整。我们估计每个关键帧的速度,并在优化之前施加aconstant-velocity。通过这种方式,我们获得了近实时,准确的直接VO方法。我们的方法通过最先进的全局快门VO实现了具有挑战性的滚动快门序列的改进结果。
translated by 谷歌翻译
具有多种应用的基于视觉的运动估计和3D重建(例如,自动驾驶,用于机载设备的导航系统和增强现实)正受到重要的研究关注。为了提高准确性和稳健性,一些研究人员最近证明了使用大型视野相机进行应用的好处。在本文中,我们对大型视场相机的现有模型进行了广泛的回顾。对于每个模型,我们提供投影和投影函数以及导致有效投影的点的子空间。然后,我们提出双球相机模型,它非常适合大视场镜头,计算成本低,并且具有闭合形式的反转。我们使用具有几个不同镜头的校准数据集来评估模型,并使用与视觉测距相关的度量(即重投影误差)以及投影和非投影函数及其雅可比行列式的计算时间来比较模型。我们还提供定性结果并讨论所有模型的性能。
translated by 谷歌翻译
视觉里程计和SLAM方法具有各种各样的应用,例如增强现实或机器人技术。通过惯性测量补充视觉传感器极大地提高了跟踪精度和鲁棒性,因此引起了对视觉 - 惯性(VI)测距方法的开发的极大兴趣。在本文中,我们提出了TUM VIbenchmark,这是一种新颖的数据集,在不同的场景中具有多种序列,用于评估VI测距。它提供具有1024x1024分辨率,20 Hz,高动态范围和光度校准的相机图像。 IMU以200 Hz的频率测量3轴上的加速度和角速度,而摄像机和IMU传感器在硬件中进行时间同步。对于轨迹评估,我们还可以在运动捕捉系统中以高频(120 Hz)在序列的开始和结束处提供准确的姿态地面实况,我们通过摄像机和IMU测量精确对准。具有原始和校准数据的完整数据集是公开可用的。我们还在数据集上评估最先进的VIodometry方法。
translated by 谷歌翻译
我们提出了一个框架来构建一个单目标的多目标算法。该框架解决了在n维搜索空间中找到p解的$ p \ times n $ -dimensional问题,通过动态子空间优化最大化指示符。每个单目标算法在给定$ p - 1 $固定解决方案的情况下优化指标函数。至关重要的是,主导的解决方案可以最大限度地减少与这些$ p - 1 $解决方案所定义的经验Pareto前提的距离。我们使用CMA-ES assingle-objective优化器来实例化框架。新算法COMO-CMA-ES经验证明可以线性收敛于双目标凸二次问题,并与MO-CMA-ES,NSGA-II和SMS-EMOA相比较。
translated by 谷歌翻译
计算社区联盟(CCC)于2018年4月23日至24日在华盛顿举办了一次关于“机器人材料”的研讨会。该工作室是一系列跨学科研讨会的第二次,旨在将我们的材料概念转变为“机器人” “,这有能力感知和影响他们的环境。 2017年3月10日至12日在科罗拉多大学举办的第一次研讨会的成果已经在一份有远见的论文(Correll,2017)中进行了总结,并确定了“机器人材料”的关键技术挑战,即能够以最低限度创造智能功能。依靠无线电力和通信的附加布线。第二次研讨会的目的是将这些研究结果转化为政府行动的建议。计算将成为未来材料系统的重要组成部分,并且将以单独使用机械或化学过程无法实现的方式分析,更改,存储和交流状态。大多数材料科学家都不清楚“计算”是什么以及可能性是什么,而计算机科学家基本上没有意识到最近所谓的主动和智能材料的进步。目前这种差距在缩小,计算机科学家们正在积极研究新型基板,如忆阻器和其他神经形态计算设备。进一步追求这些想法将需要强调化学家,工程师和计算机科学家之间的跨学科合作,可能会使人类进入一个新的物质时代,这个时代同样具有破坏性,从石头到塑料时代。
translated by 谷歌翻译
大批量培训方法使研究人员能够利用大规模分布式处理并大大加速深度神经网络(DNN)培训。例如,通过将批量大小从256扩展到32K,研究人员已经能够将ImageNet上ResNet50的培训时间从29小时缩短到2.2分钟(Ying等,2018)。在本文中,我们提出了一种新的方法,称为线性 - 时期渐进 - 预热(LEGW),用于更好的大批量训练。通过LEGW,我们能够使用Sqrt Scaling方案对CNN和RNN进行大批量培训。 LEGW使Sqrt Scaling方案在实践中有用,因此我们获得了比线性缩放学习速率方案更好的结果。对于LSTM应用程序,我们能够将批量大小调整64倍而不会丢失准确性并且不会调整超参数。对于CNN应用,即使我们将批量大小扩展到32K,LEGW也能够达到相同的准确度。 LEGW比以前的大批量自动调整技术更好。 LEGW在同一硬件上的四个基于LSTM的应用程序的基线平均速度达到5.3倍。我们还为LEGW提供了一些理论解释。
translated by 谷歌翻译
在本文中,我们分析了双目标凸二次问题的理论性质。我们对他们的帕累托序列进行了完整的描述,证明了他们帕累托前线的凸性。我们证明当两个Hessian矩阵成比例时,Pareto集是aline段。然后,我们提出了一组凸二次检验问题,描述了它们的理论性质和这些测试问题所需的算法能力。这尤其包括测试关于可分离性,病态问题,旋转不变性以及帕累托集是否与坐标轴对齐的灵敏度。
translated by 谷歌翻译
基于有限样本测试两个潜在的多变量变量的统计依赖性是一个基本的统计挑战。在这里,我们探索一系列测试,以适应变量之间关系的复杂性,在各种情景中提供强大的功能。在距离相关性的基础上,我们引入了一系列基于距离非线性单调变换的自适应独立性标准。我们表明,这些标准,如距离相关性和基于RKHS的标准,提供了依赖性指标。我们提出了一类自适应(多阈值)测试统计,它构成了置换测试的基础。这些测试在一系列单变量和多变量关系中的平均和最差情况统计敏感性中经验性地优于一些已建立的测试,并且可能值得进一步探索。
translated by 谷歌翻译