最近,数据驱动的惯性导航方法已经证明了它们使用训练有素的神经网络的能力,以获得来自惯性测量单元(IMU)测量的精确位置估计。在本文中,我们提出了一种用于惯性导航〜(CTIN)的基于鲁棒的基于变压器的网络,以准确地预测速度和轨迹。为此,我们首先通过本地和全局多头自我注意力增强基于Reset的编码器,以捕获来自IMU测量的空间上下文信息。然后,我们通过在变压器解码器中利用多针头注意,使用时间知识来熔化这些空间表示。最后,利用不确定性减少的多任务学习,以提高速度和轨迹的学习效率和预测准确性。通过广泛的实验在各种惯性数据集中〜(例如,ridi,oxiod,ronin,偶像和我们自己的),CTIN非常坚固,优于最先进的模型。
translated by 谷歌翻译
由于低成本的惯性传感器误差积累,行人死的估算是一项具有挑战性的任务。最近的研究表明,深度学习方法可以在处理此问题时获得令人印象深刻的性能。在这封信中,我们使用基于深度学习的速度估计方法提出了惯性的进程。基于RES2NET模块和两个卷积块注意模块的深神经网络被利用,以恢复智能手机的水平速度矢量与原始惯性数据之间的潜在连接。我们的网络仅使用百分之五十的公共惯性探子仪数据集(RONIN)数据进行培训。然后,在Ronin测试数据集和另一个公共惯性探针数据集(OXIOD)上进行了验证。与传统的阶梯长度和基于标题的基于系统的算法相比,我们的方法将绝对翻译误差(ATE)降低了76%-86%。此外,与最先进的深度学习方法(Ronin)相比,我们的方法将其ATE提高了6%-31.4%。
translated by 谷歌翻译
Visual Inertial Odometry (VIO) is one of the most established state estimation methods for mobile platforms. However, when visual tracking fails, VIO algorithms quickly diverge due to rapid error accumulation during inertial data integration. This error is typically modeled as a combination of additive Gaussian noise and a slowly changing bias which evolves as a random walk. In this work, we propose to train a neural network to learn the true bias evolution. We implement and compare two common sequential deep learning architectures: LSTMs and Transformers. Our approach follows from recent learning-based inertial estimators, but, instead of learning a motion model, we target IMU bias explicitly, which allows us to generalize to locomotion patterns unseen in training. We show that our proposed method improves state estimation in visually challenging situations across a wide range of motions by quadrupedal robots, walking humans, and drones. Our experiments show an average 15% reduction in drift rate, with much larger reductions when there is total vision failure. Importantly, we also demonstrate that models trained with one locomotion pattern (human walking) can be applied to another (quadruped robot trotting) without retraining.
translated by 谷歌翻译
本文提出了一种轻巧,有效的校准神经网络模型,用于降低低成本微电力系统(MEMS)陀螺仪,并实时估算机器人的态度。关键思想是从惯性测量单元(IMU)测量的时间窗口中提取本地和全局特征,以动态地回归陀螺仪的输出补偿组件。遵循精心推导的数学校准模型,LGC-NET利用深度可分离的卷积捕获截面特征并减少网络模型参数。较大的内核注意力旨在更好地学习远程依赖性和特征表示。在EUROC和TUM-VI数据集中评估了所提出的算法,并在具有更轻巧模型结构的(看不见的)测试序列上实现了最先进的测试。尽管它不采用视觉传感器,但与我们的LGC-NET的估计取向与排名最高的视觉惯性探针系统相当。我们在:https://github.com/huazai665/lgc-net上进行开源方法
translated by 谷歌翻译
本文介绍了旋转等级,作为训练惯性内径型号的自我主管。我们证明自我监督方案在训练阶段以及推理阶段提供了强大的监督信号。它降低了对训练鲁棒模型的大量标记数据的依赖性,并且可以使用各种未标记的数据更新模型。此外,我们基于不确定性估计提出了自适应测试时间训练(TTT),以便提高惯性内径术的概括性与各种看不见的数据。我们在实验中展示了具有30%数据训练的旋转等因素监督的惯性内径(RIO)验证的训练,达到了与整个数据库训练的模型的对比。Adaptive TTT在所有情况下提高了模型性能,在若干方案下会产生超过25%的改进。
translated by 谷歌翻译
惯性导航系统与全球导航卫星系统之间的融合经常用于许多平台,例如无人机,陆地车辆和船舶船只。融合通常是在基于模型的扩展卡尔曼过滤框架中进行的。过滤器的关键参数之一是过程噪声协方差。它负责实时解决方案的准确性,因为它考虑了车辆动力学不确定性和惯性传感器质量。在大多数情况下,过程噪声被认为是恒定的。然而,由于整个轨迹的车辆动力学和传感器测量变化,过程噪声协方差可能会发生变化。为了应对这种情况,文献中建议了几种基于自适应的Kalman过滤器。在本文中,我们提出了一个混合模型和基于学习的自适应导航过滤器。我们依靠基于模型的Kalman滤波器和设计深神网络模型来调整瞬时系统噪声协方差矩阵,仅基于惯性传感器读数。一旦学习了过程噪声协方差,就可以将其插入建立的基于模型的Kalman滤波器中。在推导了提出的混合框架后,提出了使用四极管的现场实验结果,并给出了与基于模型的自适应方法进行比较。我们表明,所提出的方法在位置误差中获得了25%的改善。此外,提出的混合学习方法可以在任何导航过滤器以及任何相关估计问题中使用。
translated by 谷歌翻译
近年来,基于数据驱动的导航和定位方法吸收了注意力,并且在准确性和效率方面优于其所有竞争对手方法。本文介绍了一种称为IMUNET的新体系结构,该架构是对边缘设备实现的位置估算的准确和有效效率,该估算接收了一系列RAW IMU测量。该体系结构已与最新的CNN网络的一维版本进行了比较,该网络最近介绍了用于Edge设备实现的精确性和效率。此外,已经提出了一种使用IMU传感器和Google Arcore API收集数据集的新方法,并已记录了公开可用的数据集。使用四个不同的数据集以及提出的数据集和实际设备实现的全面评估已经证明了体系结构的性能。 Pytorch和Tensorflow框架以及Android应用程序代码中的所有代码都已共享,以改善进一​​步的研究。
translated by 谷歌翻译
A reliable self-contained navigation system is essential for autonomous vehicles. Based on our previous study on Wheel-INS \cite{niu2019}, a wheel-mounted inertial measurement unit (Wheel-IMU)-based dead reckoning (DR) system, in this paper, we propose a multiple IMUs-based DR solution for the wheeled robots. The IMUs are mounted at different places of the wheeled vehicles to acquire various dynamic information. In particular, at least one IMU has to be mounted at the wheel to measure the wheel velocity and take advantages of the rotation modulation. The system is implemented through a distributed extended Kalman filter structure where each subsystem (corresponding to each IMU) retains and updates its own states separately. The relative position constraints between the multiple IMUs are exploited to further limit the error drift and improve the system robustness. Particularly, we present the DR systems using dual Wheel-IMUs, one Wheel-IMU plus one vehicle body-mounted IMU (Body-IMU), and dual Wheel-IMUs plus one Body-IMU as examples for analysis and comparison. Field tests illustrate that the proposed multi-IMU DR system outperforms the single Wheel-INS in terms of both positioning and heading accuracy. By comparing with the centralized filter, the proposed distributed filter shows unimportant accuracy degradation while holds significant computation efficiency. Moreover, among the three multi-IMU configurations, the one Body-IMU plus one Wheel-IMU design obtains the minimum drift rate. The position drift rates of the three configurations are 0.82\% (dual Wheel-IMUs), 0.69\% (one Body-IMU plus one Wheel-IMU), and 0.73\% (dual Wheel-IMUs plus one Body-IMU), respectively.
translated by 谷歌翻译
一组稀疏(例如六个)可穿戴的IMU提供的实时人类运动重建提供了一种非侵入性和经济的运动捕获方法。没有直接从IMU中获取位置信息的能力,最近的作品采用了数据驱动的方法,这些方法利用大型人类运动数据集解决了这一不确定的问题。尽管如此,挑战仍然存在,例如时间一致性,全球和关节动作的漂移以及各种地形上运动类型的各种覆盖范围。我们提出了一种同时估计全身运动的新方法,并实时从六个IMU传感器中产生合理的访问地形。我们的方法包含1.有条件的变压器解码器模型通过明确推理预测历史记录提供一致的预测,2。一个简单而通用的学习目标,称为“固定体点”(SBP),可以由变压器模型稳定地预测并通过分析例程使用要纠正关节和全球漂移,以及3.算法从嘈杂的SBP预测产生正则地形高度图,进而可以纠正嘈杂的全球运动估计。我们对合成和真实的IMU数据以及实时实时演示进行了广泛的评估框架,并显示出优于强基线方法的性能。
translated by 谷歌翻译
本文介绍了一种基于来自IMU数据的学习的位移测量的腿机器人的新型概述状态估计。最近的行人跟踪研究表明,可以使用卷积神经网络从惯性数据推断出运动。学习的惯性位移测量可以提高具有挑战性的场景的状态估计,其中腿部内径是不可靠的,例如滑动和可压缩的地形。我们的工作学会从IMU数据估算从IMU数据融合的位移测量,然后与传统的腿部腿部融合。我们的方法大大降低了诸如在视觉中部署的腿部机器人和Lidar被否定的环境(如有雾的下水道或尘土飞扬的地雷)至关重要。我们使用来自几个真正的机器人实验的数据与交叉挑战性地形的几个真正的机器人实验进行了比较了来自EKF和增量固定滞后因子图估计的结果。与传统的运动惯用估计器相比,我们的结果在挑战情景中表明相对姿势误差的减少37%,而无需学习测量。当在视觉降级环境中的视觉系统中使用时,我们还展示了22%的误差减少,例如地下矿井。
translated by 谷歌翻译
与单个IMU相比,多个刚性连接的惯性测量单元(IMU)传感器提供了更丰富的数据流。最先进的方法遵循IMU测量的概率模型,基于在贝叶斯框架下组合的错误的随机性质。但是,负担得起的低级IMU此外,由于其不受相应的概率模型所掩盖的缺陷而遭受了系统的错误。在本文中,我们提出了一种方法,即合并多个IMU(MIMU)传感器数据的最佳轴组成(BAC),以进行准确的3D置置估计,该数据通过从集合中动态选择最佳的IMU轴来考虑随机和系统误差所有可用的轴。我们在MIMU视觉惯性传感器上评估了我们的方法,并将方法的性能与MIMU数据融合的最新方法进行比较。我们表明,BAC的表现优于后者,并且在开放环路中的方向和位置估计都可以提高20%的精度,但需要适当的处理以保持获得的增益。
translated by 谷歌翻译
准确而健壮的本地化是移动代理的基本需求。视觉惯性进程(VIO)算法将信息从摄像机和惯性传感器中利用到估计位置和翻译。最近基于深度学习的VIO模型以数据驱动的方式提供姿势信息,而无需设计手工制作的算法,因此吸引了注意力。现有的基于学习的VIO模型依赖于经常性模型来融合多模式数据和过程传感器信号,这些模型很难训练并且不够有效。我们提出了一个基于学习的新型VIO框架,并有效地结合了视觉和惯性特征,以供各州估计。我们提出的模型也能够准确,稳健地估计,即使在具有挑战性的情况下,例如在阴天和充满水的地面上,对于传统的Vio算法而言,这很难提取视觉特征。实验验证了它在不同场景中的表现优于传统和基于学习的VIO基线。
translated by 谷歌翻译
A monocular visual-inertial system (VINS), consisting of a camera and a low-cost inertial measurement unit (IMU), forms the minimum sensor suite for metric six degreesof-freedom (DOF) state estimation. However, the lack of direct distance measurement poses significant challenges in terms of IMU processing, estimator initialization, extrinsic calibration, and nonlinear optimization. In this work, we present VINS-Mono: a robust and versatile monocular visual-inertial state estimator. Our approach starts with a robust procedure for estimator initialization and failure recovery. A tightly-coupled, nonlinear optimization-based method is used to obtain high accuracy visual-inertial odometry by fusing pre-integrated IMU measurements and feature observations. A loop detection module, in combination with our tightly-coupled formulation, enables relocalization with minimum computation overhead. We additionally perform four degrees-of-freedom pose graph optimization to enforce global consistency. We validate the performance of our system on public datasets and real-world experiments and compare against other state-of-the-art algorithms. We also perform onboard closed-loop autonomous flight on the MAV platform and port the algorithm to an iOS-based demonstration. We highlight that the proposed work is a reliable, complete, and versatile system that is applicable for different applications that require high accuracy localization. We open source our implementations for both PCs 1 and iOS mobile devices 2 .
translated by 谷歌翻译
滑动检测对于在外星人表面驾驶的流浪者的安全性和效率至关重要。当前的行星流动站滑移检测系统依赖于视觉感知,假设可以在环境中获得足够的视觉特征。然而,基于视觉的方法容易受到感知降解的行星环境,具有主要低地形特征,例如岩石岩,冰川地形,盐散发物以及较差的照明条件,例如黑暗的洞穴和永久阴影区域。仅依靠视觉传感器进行滑动检测也需要额外的计算功率,并降低了流动站的遍历速率。本文回答了如何检测行星漫游者的车轮滑移而不取决于视觉感知的问题。在这方面,我们提出了一个滑动检测系统,该系统从本体感受的本地化框架中获取信息,该框架能够提供数百米的可靠,连续和计算有效的状态估计。这是通过使用零速度更新,零角度更新和非独立限制作为惯性导航系统框架的伪测量更新来完成的。对所提出的方法进行了对实际硬件的评估,并在行星 - 分析环境中进行了现场测试。该方法仅使用IMU和车轮编码器就可以达到150 m左右的92%滑动检测精度。
translated by 谷歌翻译
使用诸如嵌入惯性测量单元(IMU)传感器的可穿戴设备(如智能手表)的人类活动识别(Har)具有与我们日常生活相关的各种应用,例如锻炼跟踪和健康监控。在本文中,我们使用在不同身体位置佩戴的多个IMU传感器提出了一种基于人类活动识别的新颖性方法。首先,设计传感器设计特征提取模块以提取具有卷积神经网络(CNNS)的各个传感器的最辨别特征。其次,开发了一种基于注意的融合机制,以了解不同车身位置处的传感器的重要性,并产生细节特征表示。最后,应用传感器间特征提取模块来学习与分类器连接的传感器间相关性以输出预测的活动。所提出的方法是使用五个公共数据集进行评估,并且在各种活动类别上优于最先进的方法。
translated by 谷歌翻译
机器人应用不断努力朝着更高的自主权努力。为了实现这一目标,高度健壮和准确的状态估计是必不可少的。事实证明,结合视觉和惯性传感器方式可以在短期应用中产生准确和局部一致的结果。不幸的是,视觉惯性状态估计器遭受长期轨迹漂移的积累。为了消除这种漂移,可以将全球测量值融合到状态估计管道中。全球测量的最著名和广泛可用的来源是全球定位系统(GPS)。在本文中,我们提出了一种新颖的方法,该方法完全结合了立体视觉惯性同时定位和映射(SLAM),包括视觉循环封闭,并在基于紧密耦合且基于优化的框架中融合了全球传感器模式。结合了测量不确定性,我们提供了一个可靠的标准来解决全球参考框架初始化问题。此外,我们提出了一个类似环路的优化方案,以补偿接收GPS信号中断电中累积的漂移。在数据集和现实世界中的实验验证表明,与现有的最新方法相比,与现有的最新方法相比,我们对GPS辍学方法的鲁棒性以及其能够估算高度准确且全球一致的轨迹的能力。
translated by 谷歌翻译
Wearable sensor-based human activity recognition (HAR) has emerged as a principal research area and is utilized in a variety of applications. Recently, deep learning-based methods have achieved significant improvement in the HAR field with the development of human-computer interaction applications. However, they are limited to operating in a local neighborhood in the process of a standard convolution neural network, and correlations between different sensors on body positions are ignored. In addition, they still face significant challenging problems with performance degradation due to large gaps in the distribution of training and test data, and behavioral differences between subjects. In this work, we propose a novel Transformer-based Adversarial learning framework for human activity recognition using wearable sensors via Self-KnowledgE Distillation (TASKED), that accounts for individual sensor orientations and spatial and temporal features. The proposed method is capable of learning cross-domain embedding feature representations from multiple subjects datasets using adversarial learning and the maximum mean discrepancy (MMD) regularization to align the data distribution over multiple domains. In the proposed method, we adopt the teacher-free self-knowledge distillation to improve the stability of the training procedure and the performance of human activity recognition. Experimental results show that TASKED not only outperforms state-of-the-art methods on the four real-world public HAR datasets (alone or combined) but also improves the subject generalization effectively.
translated by 谷歌翻译
对深度神经网络(DNN)进行了训练,以估计在城市区域驾驶的汽车速度,并输入来自低成本六轴惯性测量单元(IMU)的测量流。通过在配备了全球导航卫星系统(GNSS)实时运动学(RTK)定位设备和同步IMU的汽车中,通过驾驶以色列阿什杜德市(Ashdod)驾驶以色列市Ashdod市收集了三个小时的数据。使用以50 Hz的高速率获得的位置测量值计算了汽车速度的地面真实标签。提出了具有长短期内存层的DNN体系结构,以实现高频速度估计,以说明以前的输入历史记录和速度,加速度和角速度之间的非线性关系。制定了简化的死亡算法定位方案,以评估训练有素的模型,该模型提供了速度伪测量。训练有素的模型显示可在4分钟车程中大大提高位置准确性,而无需使用GNSS位置更新。
translated by 谷歌翻译
我们提出了一种新颖的基于变压器的架构,用于3D人类运动的生成建模任务。以前的工作通常依赖于基于RNN的模型,考虑到更短的预测视野迅速达到静止和通常难以置信的状态。最近的研究表明,频域中的隐式时间表示也是有效地制定预定地平线的预测。我们的重点是学习自向学习时空陈述,从而在短期和长期生成合理的未来发展。该模型学习骨骼关节的高尺寸嵌入,以及如何通过去耦的时间和空间自我关注机制来组成时间相干的姿势。我们的双重关注概念允许模型直接访问电流和过去信息,并明确捕获结构和时间依赖项。我们凭经验显示,这有效地了解潜在的运动动态,并减少自动回归模型中观察到的误差累积。我们的模型能够在长视程中产生准确的短期预测和产生合理的运动序列。我们在HTTPS://github.com/eth-Ation-Transformer中公开公开提供我们的代码。
translated by 谷歌翻译
安装在微空中车辆(MAV)上的地面穿透雷达是有助于协助人道主义陆地间隙的工具。然而,合成孔径雷达图像的质量取决于雷达天线的准确和精确运动估计以及与MAV产生信息性的观点。本文介绍了一个完整的自动空气缩进的合成孔径雷达(GPSAR)系统。该系统由空间校准和时间上同步的工业级传感器套件组成,使得在地面上方,雷达成像和光学成像。自定义任务规划框架允许在地上控制地上的Stripmap和圆形(GPSAR)轨迹的生成和自动执行,以及空中成像调查飞行。基于因子图基于Dual接收机实时运动(RTK)全局导航卫星系统(GNSS)和惯性测量单元(IMU)的测量值,以获得精确,高速平台位置和方向。地面真理实验表明,传感器时机为0.8美元,正如0.1美元的那样,定位率为1 kHz。与具有不确定标题初始化的单个位置因子相比,双位置因子配方可提高高达40%,批量定位精度高达59%。我们的现场试验验证了本地化准确性和精度,使得能够相干雷达测量和检测在沙子中埋入的雷达目标。这验证了作为鸟瞰着地图检测系统的潜力。
translated by 谷歌翻译