智能论文笔记

MUI-TARE: Multi-Agent Cooperative Exploration with Unknown Initial Position

Jingtian Yan , Xingqiao Lin , Zhongqiang Ren , Shiqi Zhao , Jieqiong Yu , Chao Cao , Peng Yin , Ji Zhang , Sebastian Scherer

分类：机器人 | 人工智能

2022-09-22

对具有代理商初始位置未知的有限3D环境的多代理探索是一个具有挑战性的问题。它需要快速探索环境，并坚定合并代理商构建的子图。我们认为现有方法是侵略性或保守的：在检测到重叠时，积极的策略合并了两种由不同代理构建的子图，这可能导致由于对重叠的错误阳性检测而导致不正确的合并，因此是如此。不健全。保守策略指导一个代理人在合并之前重新审视另一个代理商的过量验证历史轨迹，这可以降低由于对同一空间的反复探索而引起的勘探效率。为了巧妙地平衡子图合并和勘探效率的鲁棒性，我们为基于激光雷达的多代理探索开发了一种新方法，该方法可以指导一个代理商以\ emph {自适应}方式重复另一个代理商的轨迹子图合并过程的指标。此外，我们的方法通过计划合并子图的代理人共同计划，以进一步提高勘探效率，以\ emph {Cooperative}方式将最近的单格分层勘探策略扩展到多个代理。我们的实验表明，我们的方法平均比基线高出50 \％，同时稳固地合并子映射。

translated by 谷歌翻译

General Place Recognition Survey: Towards the Real-world Autonomy Age

Peng Yin , Shiqi Zhao , Ivan Cisneros , Abulikemu Abuduweili , Guoquan Huang , Micheal Milford , Changliu Liu , Howie Choset , Sebastian Scherer

分类：机器人 | 计算机视觉

2022-09-09

位置识别是可以协助同时定位和映射（SLAM）进行循环闭合检测和重新定位以进行长期导航的基本模块。在过去的20美元中，该地点认可社区取得了惊人的进步，这吸引了在计算机视觉和机器人技术等多个领域的广泛研究兴趣和应用。但是，在复杂的现实世界情景中，很少有方法显示出有希望的位置识别性能，在复杂的现实世界中，长期和大规模的外观变化通常会导致故障。此外，在最先进的方法之间缺乏集成框架，可以应对所有挑战，包括外观变化，观点差异，对未知区域的稳健性以及现实世界中的效率申请。在这项工作中，我们调查针对长期本地化并讨论未来方向和机会的最先进方法。首先，我们研究了长期自主权中的位置识别以及在现实环境中面临的主要挑战。然后，我们回顾了最新的作品，以应对各种位置识别挑战的不同传感器方式和当前的策略的认可。最后，我们回顾了现有的数据集以进行长期本地化，并为不同的方法介绍了我们的数据集和评估API。本文可以成为该地点识别界新手的研究人员以及关心长期机器人自主权的研究人员。我们还对机器人技术中的常见问题提供了意见：机器人是否需要准确的本地化来实现长期自治？这项工作以及我们的数据集和评估API的摘要可向机器人社区公开，网址为：https：//github.com/metaslam/gprs。

translated by 谷歌翻译

A Weakly Supervised Learning Framework for Salient Object Detection via Hybrid Labels

Runmin Cong , Qi Qin , Chen Zhang , Qiuping Jiang , Shiqi Wang , Yao Zhao , Sam Kwong

分类：计算机视觉

2022-09-07

完全监督的显着对象检测（SOD）方法取得了长足的进步，但是这种方法通常依赖大量的像素级注释，这些注释耗时且耗时。在本文中，我们专注于混合标签下的新的弱监督SOD任务，其中监督标签包括传统无监督方法生成的大量粗标签和少量的真实标签。为了解决此任务中标签噪声和数量不平衡问题的问题，我们设计了一个新的管道框架，采用三种复杂的培训策略。在模型框架方面，我们将任务分解为标签细化子任务和显着对象检测子任务，它们相互合作并交替训练。具体而言，R-NET设计为配备有指导和聚合机制的搅拌机的两流编码器模型（BGA），旨在纠正更可靠的伪标签的粗标签，而S-NET是可更换的。由当前R-NET生成的伪标签监督的SOD网络。请注意，我们只需要使用训练有素的S-NET进行测试。此外，为了确保网络培训的有效性和效率，我们设计了三种培训策略，包括替代迭代机制，小组智慧的增量机制和信誉验证机制。五个草皮基准的实验表明，我们的方法在定性和定量上都针对弱监督/无监督/无监督的方法实现了竞争性能。

translated by 谷歌翻译

BioSLAM: A Bio-inspired Lifelong Memory System for General Place Recognition

Peng Yin , Abulikemu Abuduweili , Shiqi Zhao , Changliu Liu , Sebastian Scherer

分类：机器人 | 计算机视觉 | 机器学习

2022-08-30

我们提出了BioSlam，这是一个终生的SLAM框架，用于逐步学习各种新出现，并在先前访问的地区保持准确的位置识别。与人类不同，人工神经网络遭受灾难性遗忘的困扰，并在接受新来者训练时可能会忘记先前访问的地区。对于人类而言，研究人员发现，大脑中存在一种记忆重播机制，可以使神经元保持活跃。受到这一发现的启发，Bioslam设计了一个封闭式的生成重播，以根据反馈奖励来控制机器人的学习行为。具体而言，BioSlam提供了一种新型的双记忆机制来维护：1）动态记忆有效地学习新观察结果，以及2）平衡新老知识的静态记忆。当与基于视觉/激光雷达的SLAM系统结合使用时，完整的处理管道可以帮助代理逐步更新位置识别能力，从而强大，从而增强长期位置识别的复杂性。我们在两个渐进式猛击场景中展示了Bioslam。在第一种情况下，基于激光雷达的特工不断穿越具有120公里轨迹的城市尺度环境，并遇到了不同类型的3D几何形状（开放街，住宅区，商业建筑）。我们表明，BioSlam可以逐步更新代理商的位置识别能力，并优于最先进的增量方法，即生成重播24％。在第二种情况下，基于激光镜的代理商在4.5公里的轨迹上反复穿越校园规模区域。 Bioslam可以保证在不同外观下的最先进方法上优于15％的地方识别精度。据我们所知，BioSlam是第一个具有记忆力增强的终身大满贯系统，可以帮助长期导航任务中的逐步识别。

translated by 谷歌翻译

HTML版本

AutoMerge: A Framework for Map Assembling and Smoothing in City-scale Environments

Peng Yin , Haowen Lai , Shiqi Zhao , Ruijie Fu , Ivan Cisneros , Ruohai Ge , Ji Zhang , Howie Choset , Sebastian Scherer

分类：机器人 | 计算机视觉

2022-07-14

我们提出Automerge，这是一种LIDAR数据处理框架，用于将大量地图段组装到完整的地图中。传统的大规模地图合并方法对于错误的数据关联是脆弱的，并且主要仅限于离线工作。 Automerge利用多观点的融合和自适应环路闭合检测来进行准确的数据关联，并且它使用增量合并来从随机顺序给出的单个轨迹段组装大图，没有初始估计。此外，在组装段后，自动制度可以执行良好的匹配和姿势图片优化，以在全球范围内平滑合并的地图。我们展示了城市规模合并（120公里）和校园规模重复合并（4.5公里x 8）的汽车。该实验表明，自动化（i）在段检索中超过了第二和第三最佳方法的14％和24％的召回，（ii）在120 km大尺度地图组件（III）中实现了可比较的3D映射精度，IT对于暂时的重新审视是强大的。据我们所知，Automerge是第一种映射方法，它可以在无GPS的帮助下合并数百公里的单个细分市场。

translated by 谷歌翻译

SphereVLAD++: Attention-based and Signal-enhanced Viewpoint Invariant Descriptor

Shiqi Zhao , Peng Yin , Ge Yi , Sebastian Scherer

分类：计算机视觉 | 机器人

2022-07-06

基于激光雷达的本地化方法是用于大规模导航任务的基本模块，例如最后一英里交付和自动驾驶，并且本地化鲁棒性高度依赖于观点和3D功能提取。我们以前的工作提供了一个观点不变的描述符来处理观点差异；但是，全局描述符在无监督聚类中的信号噪声比率低，从而降低了可区分的特征提取能力。我们开发了SphereVlad ++，这是这项工作中一种引起注意的观点不变的位置识别方法。 SphereVlad ++在每个唯一区域的球形视角上投射点云，并通过全局3D几何分布捕获本地特征及其依赖关系之间的上下文连接。作为回报，全局描述符中的群集元素以本地和全球几何形式为条件，并支持SphereVlad的原始视点不变属性。在实验中，我们评估了SphereVlad ++在匹兹堡市的公共Kitti360数据集和自我生成的数据集上的本地化性能。实验结果表明，SphereVlad ++在小甚至完全逆转的视点差异下优于所有相对最新的3D位置识别方法，并显示0.69％和15.81％的成功检索率，比第二好的检索率更好。低计算要求和高时间效率也有助于其用于低成本机器人的应用。

translated by 谷歌翻译

Binary Single-dimensional Convolutional Neural Network for Seizure Prediction

Shiqi Zhao , Jie Yang , Yankun Xu , Mohamad Sawan

分类：机器学习

2022-06-08

如今，提出了几种深度学习方法来应对癫痫发作预测的挑战。但是，由于其大型硬件和相应的高功率消耗，这些方法仍然无法作为可植入或有效的可穿戴设备的一部分实现。他们通常需要复杂的功能提取过程，用于存储高精度参数的大存储器和复杂的算术计算，从而大大增加了所需的硬件资源。此外，可用的预测性能差，因为它们直接从图像识别应用程序中采用网络体系结构无法准确考虑EEG信号的特征。我们在本文中提出了一个适合二进制卷积神经网络（BSDCNN）的硬件友好网络，用于癫痫发作预测。 BSDCNN利用1D卷积内核来提高预测性能。除了第一层外，所有参数均已二进制以减少所需的计算和存储。在美国癫痫社会癫痫发作预测挑战（AES）数据集和CHB-MIT方面，曲线，灵敏度和虚假预测率的总面积达到0.915、89.26％，0.117/h和0.970，94.69％，0.095/h。所提出的体系结构的表现优于最新作品，同时提供了7.2和25.5倍的参数和计算大小。

translated by 谷歌翻译

ALITA: A Large-scale Incremental Dataset for Long-term Autonomy

Peng Yin , Shiqi Zhao , Ruohai Ge , Ivan Cisneros , Ruijie Fu , Ji Zhang , Howie Choset , Sebastian Scherer

分类：机器人

2022-05-22

对于长期自治，大多数位置识别方法主要在简化的方案或模拟数据集上进行评估，该数据集无法提供可靠的证据来评估当前同时定位和映射的准备就绪（SLAM）。在本文中，我们提出了一个长期的位置识别数据集，用于在大规模动态环境下用于移动定位。该数据集包括一个校园规模的轨道和城市规模的轨道：1）校园轨道重点关注长期财产，我们在10个轨迹上记录Lidar设备和一个全向相机，并且每个轨迹在变体下重复记录8次照明条件。 2）城市轨道聚焦大型物业，我们将激光雷达设备安装在车辆上，并穿过120公里种类在城市环境中。每个轨迹都提供了两个轨道的地面真实位置，这是从全球位置系统中获得的，具有额外的基于ICP的点云的细化。为了简化评估程序，我们还为Python-API提供了一组地点识别指标，以快速加载我们的数据集并根据不同方法评估识别性能。该数据集的目标是寻找具有高位置识别精度和鲁棒性的方法，并提供长期自治的真正机器人系统。可以从https://github.com/metaslam/alita访问数据集和提供的工具。

translated by 谷歌翻译

Multi-Spatio-temporal Fusion Graph Recurrent Network for Traffic forecasting

Wei Zhao , Shiqi Zhang , Bing Zhou , Bei Wang

分类：机器学习 | 人工智能

2022-05-03

交通预测对于新时代智能城市的交通建设至关重要。但是，流量数据的复杂空间和时间依赖性使流量预测极具挑战性。大多数现有的流量预测方法都依赖于预定义的邻接矩阵来对时空依赖性建模。但是，道路交通状态是高度实时的，因此邻接矩阵应随着时间的推移而动态变化。本文介绍了一个新的多空间融合图复发网络（MSTFGRN），以解决上述问题。该网络提出了一种数据驱动的加权邻接矩阵生成方法，以补偿预定义的邻接矩阵未反映的实时空间依赖性。它还通过在不同矩的平行时空关系上执行新的双向时空融合操作来有效地学习隐藏的时空依赖性。最后，通过将全局注意机制集成到时空融合模块中，同时捕获了全局时空依赖性。对四个大型现实世界流量数据集进行的广泛试验表明，与替代基线相比，我们的方法实现了最先进的性能。

translated by 谷歌翻译

PanGu-Bot: Efficient Generative Dialogue Pre-training from Pre-trained Language Model

Fei Mi , Yitong Li , Yulong Zeng , Jingyan Zhou , Yasheng Wang , Chuanfei Xu , Lifeng Shang , Xin Jiang , Shiqi Zhao , Qun Liu

分类：自然语言处理

2022-03-31

在本文中，我们介绍了基于大型预训练的语言模型（PLM）pangu-alpha（Zeng等，2021）的中国预训练的开放域对话生成模型。与其他对大量对话数据进行培训的预训练的对话模型不同，我们旨在通过继承PLM的有价值的语言能力和知识来构建强大的对话模型，并以相对较少的数据和计算成本构建强大的对话模型。为此，我们训练大型PLM Pangu-Alpha的Pangu-bot，该机器人已被证明在各种中国自然语言任务上表现出色。我们研究了pangu-bot产生的响应的不同方面，包括响应质量，知识和安全性。我们表明，Pangu-Bot优于最先进的中国对话系统（CDIALGPT（Wang等，2020），Eva（Zhou等，2021），EVA2.0（Gu等，2022）） W.R.T.以上三个方面。我们还证明，可以轻松地部署pangu-bot，以在没有进一步训练的情况下产生情感反应。在整个经验分析中，我们还指出，Pangu-bot响应质量，知识正确性和安全性仍然远非完美，进一步的探索对于建立可靠且智能的对话系统是必不可少的。我们的型号和代码将在https://github.com/huawei-noah/pretretaining-language-model/tree/master/master/pangu-bot上提供。

translated by 谷歌翻译