我们介绍了基于两种称为延迟边缘化的新技术的单眼视觉惯性径流系统和姿势图束调节。 DM-VIO使用动态重量进行光度束调节,可视于可视残留。我们采用边缘化,这是一种流行的策略,以保持更新时间约束,但它不易颠倒,连接变量的线性化点必须固定。为了克服这一点,我们提出了延迟边缘化:这个想法是维持第二个因素图,其中边缘化被延迟。这允许我们稍后再读这种延迟图,在新的和一致的线性化点之前产生更新的边缘化。此外,延迟边缘化使我们能够将IMU信息注入已经边缘化的状态。这是所提出的姿势图束调整的基础,我们用于IMU初始化。与先前的IMU初始化的工作相比,它能够捕获完整的光度不确定性,从而提高规模估计。为了应对最初的不可观察的规模,在IMU初始化完成后,我们将继续优化主系统中的比例和重力方向。我们在EUROC,TUM-VI和4SEASONS数据集中评估我们的系统,该数据集包括飞行无人机,大规模手持设备和汽车场景。由于建议的IMU初始化,我们的系统超过了视觉惯性内径测量仪的最新状态,即使仅使用单个摄像头和IMU的同时表现出立体惯性方法。该代码将在http://vision.in.tum.de/dm-vio发布
translated by 谷歌翻译
关键字斑点(kWs)是一个重要的功能,使我们的周围环境中许多无处不在的智能设备进行交互,可以通过唤醒词或直接作为人机界面激活它们。对于许多应用程序,KWS是我们与设备交互的进入点,因此,始终是ON工作负载。许多智能设备都是移动的,并且它们的电池寿命受到持续运行的服务受到严重影响。因此,KWS和类似的始终如一的服务是在优化整体功耗时重点。这项工作解决了低成本微控制器单元(MCU)的KWS节能。我们将模拟二元特征提取与二元神经网络相结合。通过用拟议的模拟前端取代数字预处理,我们表明数据采集和预处理所需的能量可以减少29倍,将其份额从主导的85%的份额削减到仅为我们的整体能源消耗的16%参考KWS应用程序。语音命令数据集的实验评估显示,所提出的系统分别优于最先进的准确性和能效,在10级数据集中分别在10级数据集上达到1%和4.3倍,同时提供令人信服的精度 - 能源折衷包括71倍能量减少2%的精度下降。
translated by 谷歌翻译
高质量的人类解释需要语言和事实准备以及实时检索信息的能力。这种情况在远程同步解释(RSI)的背景下尤为重要,其中发生时间可能是短暂的,对专业口译员构成新挑战以及他们对提供高质量服务的承诺。为了减轻这些挑战,我们提出了解释器辅助,这是一个专门为RSI场景集成而设计的计算机辅助解释工具。翻译辅助包括两个主要功能集:自动词汇表创作工具和实时建议系统。在本文中,我们描述了我们工具的整体设计,其集成到典型的RSI工作流程,以及在词汇表创作的质量和相关性的基准测试中实现的结果,以及实时的精度和回忆建议功能。
translated by 谷歌翻译
我们介绍了Pythest,一个Python包,它提供了同时估算了分布式静止时间序列的分布中多个转换点的工具。实现的非参数算法在一般框架中可被证明是一致的:当样本由未知的片断静止过程产生时。在该设置中,样本可以具有任意形式的远程依赖性,并且在变换点之前和之后的任何(未知)固定尺寸的有限尺寸边际的边缘依赖性可以是相同的。包装中包括的算法的强度在它们能够始终如一地检测变化,而不会强加在底层过程分布上的任何假设之外的任何假设。我们通过比较包装的性能与设计用于样本独立地和相同分布的设置的最先进模型来说明这种区别特征。
translated by 谷歌翻译
现实世界中的大规模图形数据通常是动态而不是静态。数据随着时间的推移而出现的新节点,边缘,甚至是类,例如引用网络和研发协作网络。图形神经网络(GNNS)已成为众多关于图形结构数据的任务的标准方法。在这项工作中,我们采用了两步程序来探索GNN如何递增地适应新的未完成图形数据。首先,我们分析标准基准数据集的转换和归纳学习之间的边缘。在归纳预测后,我们将未标记的数据添加到图表中并显示模型稳定。然后,我们探索不断添加越来越多的标记数据的情况,同时考虑案例,在任何情况下都没有使用类标签注释。此外,我们在图表演变时介绍了新的类,并探索了自动检测来自先前看不见的类学的方法。为了以原则的方式处理不断发展的图形,我们提出了一个终身学习框架,用于图表数据以及评估协议。在本框架中,我们评估代表性的GNN架构。我们观察到模型参数内的隐式知识在显式知识时变得更加重要,即来自过去任务的数据,是有限的。我们发现,在开放世界节点分类中,令人惊讶地少数过去任务的数据足以达到通过从所有过去任务中记住数据达到的性能。在看不见的类检测的具有挑战性任务中,我们发现使用加权交叉熵损失对于稳定性很重要。
translated by 谷歌翻译
自然语言处理领域(NLP)最近看到使用预先接受训练的语言模型来解决几乎任何任务的大量变化。尽管对各种任务的基准数据集显示了很大的改进,但这些模型通常在非标准域中对临床领域的临床域进行次优,其中观察到预训练文件和目标文件之间的巨大差距。在本文中,我们的目标是通过对语言模型的域特定培训结束这种差距,我们调查其对多种下游任务和设置的影响。我们介绍了预先训练的Clin-X(临床XLM-R)语言模型,并展示了Clin-X如何通过两种语言的十个临床概念提取任务的大幅度优于其他预先训练的变压器模型。此外,我们展示了如何通过基于随机分裂和交叉句子上下文的集合来利用我们所提出的任务和语言 - 无人机模型架构进一步改善变压器模型。我们在低资源和转移设置中的研究显​​示,尽管只有250个标记的句子,但在只有250个标记的句子时,缺乏带注释数据的稳定模型表现。我们的结果突出了专业语言模型作为非标准域中的概念提取的Clin-X的重要性,但也表明我们的任务 - 无人机模型架构跨越测试任务和语言是强大的,以便域名或任务特定的适应不需要。 Clin-Xlanguage模型和用于微调和传输模型的源代码在https://github.com/boschresearch/clin\_x/和Huggingface模型集线器上公开使用。
translated by 谷歌翻译
探索未知环境是许多域中的基本任务,例如机器人导航,网络安全和互联网搜索。我们通过添加对机器学习的预测的访问来启动古典卓越的在线图探索问题的学习增强变体。我们提出了一种自然地将预测集成到众所周知的最近邻居(NN)算法中的算法,并且如果预测具有高精度,则在预测时保持良好的保证的情况下显着优于任何已知的在线算法。我们提供了理论上的最坏情况界,以预测误差优雅地降低,我们通过确认我们的结果的计算实验来补充它们。此外,我们将我们的概念扩展到稳定算法的一般框架。通过在给定的算法和NN之间仔细插值,我们证明了新的性能界限,这些界限在特定输入上利用各个良好的性能,同时建立了任意输入的鲁棒性。
translated by 谷歌翻译
我们根据梯度匹配的思想设计了一种Coreset选择方法:Coreset引起的梯度应该尽可能地匹配原始训练数据集的那些。我们在持续学习的背景下评估该方法,可用于策划排练内存。我们的方法在一系列内存大小上执行强大的竞争对手,如水库采样。
translated by 谷歌翻译
Wikidata是公开可用的最大的一般兴趣知识库。自2012年成立以来,这是由数千名志愿者编辑的协同编辑。在本文中,我们展示了WikiData的全部修订历史数据集的WikiDate 1.0,它将Wikidata修订版的更改为删除和添加RDF三元组。据我们所知,它构成了一个在语义网络社区中最近出现的研究主题的不断发展知识图表的第一个大型数据集。我们介绍了从Wikidata的转储生成WikiDated 1.0的方法,讨论其实现和限制,以及数据集的统计特征。
translated by 谷歌翻译
与人类在环境中共存的通用机器人必须学会将人类语言与其在一系列日常任务中有用的看法和行动联系起来。此外,他们需要获取各种曲目的一般专用技能,允许通过遵循无约束语言指示来组成长地平任务。在本文中,我们呈现了凯文(从语言和愿景撰写的行动),是一个露天模拟基准,用于学习Long-Horizo​​ n语言条件的任务。我们的目的是使可以开发能够通过船上传感器解决许多机器人操纵任务的代理商,并且仅通过人类语言指定。 Calvin任务在序列长度,动作空间和语言方面更复杂,而不是现有的视觉和语言任务数据集,并支持灵活的传感器套件规范。我们评估零拍摄的代理商以新颖的语言指示以及新的环境和对象。我们表明,基于多语境模仿学习的基线模型在凯文中表现不佳,表明有很大的空间,用于开发创新代理,了解学习将人类语言与这款基准相关的世界模型。
translated by 谷歌翻译