本文提出了一种以完全分布式方式工作的协同环境学习算法。多机器人系统比单个机器人更有效,但它涉及以下挑战:1)使用多个机器人在线分布式学习环境地图; 2)基于学习地图的安全和有效的探索路径的产生; 3)对机器人数量的维持能力。为此,我们将整个过程划分为环境学习和路径规划的两个阶段。在每个阶段应用分布式算法并通过相邻机器人之间的通信组合。环境学习算法使用分布式高斯过程,路径规划算法使用分布式蒙特卡罗树搜索。因此,我们构建一个可扩展系统,而无需对机器人数量的约束。仿真结果证明了所提出的系统的性能和可扩展性。此外,基于实际数据集的仿真验证了我们算法在更现实的方案中的实用程序。
translated by 谷歌翻译
在许多环境监测方案中,采样机器人需要同时探索环境和利用有限时间利用感兴趣的特征。我们介绍了一个名为Pareto Monte Carlo树搜索的多目标信息规划方法,该方法允许机器人处理潜在的竞争目标,例如勘探与剥削。该方法基于环境状态的知识(估计)为机器人产生了优化的决策解决方案,从而更好地适应环境动态。我们在关键树节点选择步骤提供算法分析,并显示选择子最优节点的次数是对数界限的,并且搜索结果以多项式率收敛到最佳选择。
translated by 谷歌翻译
信息性规划试图指导机器人的一系列动作,以收集最大信息的数据以映射大环境或学习动态系统。信息规划中的现有工作主要侧重于提出新规划者,并将其应用于各种机器人应用,如环境监测,自主勘探和系统识别。信息规划人员优化了概率模型给出的目标,例如,高斯过程回归。在实践中,该模型可以很容易受到无处不在的传感异常值的影响,导致误导目标。直接的解决方案是使用搁板的异常值检测器过滤出传感数据流中的异常值。但是,信息性样本也根据定义稀缺,因此它们可能被错误地筛选出来。在本文中,我们提出了一种方法来使机器人能够重新访问除了优化信息规划目标之外对异常值进行采样的位置。通过这样做,机器人可以在异常值附近收集更多样本,并更新异常值检测器以减少误报的数量。这是通过在蒙特卡罗树搜索的帕累托变体上设计一个新目标来实现的。我们证明所提出的框架可以实现比仅应用异常值探测器更好的性能。
translated by 谷歌翻译
嘈杂的传感,不完美的控制和环境变化是许多现实世界机器人任务的定义特征。部分可观察到的马尔可夫决策过程(POMDP)提供了一个原则上的数学框架,用于建模和解决不确定性下的机器人决策和控制任务。在过去的十年中,它看到了许多成功的应用程序,涵盖了本地化和导航,搜索和跟踪,自动驾驶,多机器人系统,操纵和人类机器人交互。这项调查旨在弥合POMDP模型的开发与算法之间的差距,以及针对另一端的不同机器人决策任务的应用。它分析了这些任务的特征,并将它们与POMDP框架的数学和算法属性联系起来,以进行有效的建模和解决方案。对于从业者来说,调查提供了一些关键任务特征,以决定何时以及如何成功地将POMDP应用于机器人任务。对于POMDP算法设计师,该调查为将POMDP应用于机器人系统的独特挑战提供了新的见解,并指出了有希望的新方向进行进一步研究。
translated by 谷歌翻译
多机器人自适应抽样问题旨在为机器人团队找到轨迹,以有效地对机器人的给定耐力预算中的感兴趣现象进行采样。在本文中,我们使用分散的多代理增强学习来提出一种可靠,可扩展的方法,用于准静态环境过程的合作自适应采样(MARLAS)。鉴于该领域的先验采样,该提议的方法学习了一个机器人团队的分散政策,以在固定预算范围内采样高实现区域。多机器人自适应采样问题要求机器人彼此协调,以避免重叠的采样轨迹。因此,我们编码机器人之间的邻居位置和间歇性通信在学习过程中的估计值。我们评估了Marlas对多个性能指标的评估,发现它的表现优于其他基线多机器人采样技术。我们进一步证明了与机器人团队的大小和所采样区域的大小相对于通信失败和可伸缩性的鲁棒性。实验评估既是对真实数据的模拟,又在演示环境设置的实际机器人实验中进行的。
translated by 谷歌翻译
This paper proposes a new 3D gas distribution mapping technique based on the local message passing of Gaussian belief propagation that is capable of resolving in real time, concentration estimates in 3D space whilst accounting for the obstacle information within the scenario, the first of its kind in the literature. The gas mapping problem is formulated as a 3D factor graph of Gaussian potentials, the connections of which are conditioned on local occupancy values. The Gaussian belief propagation framework is introduced as the solver and a new hybrid message scheduler is introduced to increase the rate of convergence. The factor graph problem is then redesigned as a dynamically expanding inference task, coupling the information of consecutive gas measurements with local spatial structure obtained by the robot. The proposed algorithm is compared to the state of the art methods in 2D and 3D simulations and is found to resolve distribution maps orders of magnitude quicker than typical direct solvers. The proposed framework is then deployed for the first time onboard a ground robot in a 3D mapping and exploration task. The system is shown to be able to resolve multiple sensor inputs and output high resolution 3D gas distribution maps in a GPS denied cluttered scenario in real time. This online inference of complicated plume structures provides a new layer of contextual information over its 2D counterparts and enables autonomous systems to take advantage of real time estimates to inform potential next best sampling locations.
translated by 谷歌翻译
在本文中,我们在不确定的沟通和对抗性攻击者的影响下解决了多机器人信息路径计划(MIPP)任务。目的是创建一个多机器人系统,尽管存在损坏的机器人共享恶意信息,但仍可以学习并统一对未知环境的知识。我们使用高斯工艺(GP)来对未知环境进行建模,并使用相互信息的指标来定义信息。我们MIPP任务的目标是最大化团队收集的信息量,同时最大程度地提高弹性弹性的可能性。不幸的是,这些目标是矛盾的,尤其是在探索需要机器人之间断开连接的大环境时。结果,我们强加了一个概率的通信约束,该概率可以使机器人间歇性地满足和弹性地共享信息,然后在所有其他时间内采取行动以最大程度地提高收集的信息。为了解决我们的问题,我们选择具有最高弹性概率的会议位置,并使用顺序贪婪算法来优化机器人探索的路径。最后,我们通过比较应用弹性和非弹性MIPP算法的良好行为机器人的学习能力来展示结果的有效性。
translated by 谷歌翻译
移动机器人的精确位置信息对于导航和任务处理至关重要,尤其是对于多机器人系统(MRS),可以从该领域进行协作和收集有价值的数据。但是,在无法访问GPS信号(例如在环境控制,室内或地下环境中)的机器人发现很难单独使用其传感器找到。结果,机器人共享其本地信息以改善其本地化估计,使整个MRS团队受益。已经尝试使用无线电信号强度指标(RSSI)作为计算轴承信息的来源进行了几次尝试模拟基于多机器人的定位。我们还利用了通过系统中多个机器人的通信生成的无线网络,并旨在在动态环境中具有很高准确性和效率的定位代理,以共享信息融合以完善本地化估计。该估计器结构减少了一个测量相关性的来源,同时适当地纳入了其他相关性。本文提出了一个分散的多机器人协同定位系统(MRSL),以实现密集和动态的环境。每当从邻居那里收到新信息时,机器人都会更新其位置估计。当系统感觉到该地区其他机器人的存在时,它会交换位置估计并将接收到的数据合并以提高其本地化精度。我们的方法使用基于贝叶斯规则的集成,该集成已证明在计算上是有效的,适用于异步机器人通信。我们已经使用数量不同的机器人进行了广泛的仿真实验,以分析算法。 MRSL与RSSI的本地化准确性优于文献中的其他算法,对未来发展有很大的希望。
translated by 谷歌翻译
主动位置估计(APE)是使用一个或多个传感平台本地化一个或多个目标的任务。 APE是搜索和拯救任务,野生动物监测,源期限估计和协作移动机器人的关键任务。 APE的成功取决于传感平台的合作水平,他们的数量,他们的自由度和收集的信息的质量。 APE控制法通过满足纯粹剥削或纯粹探索性标准,可以实现主动感测。前者最大限度地减少了位置估计的不确定性;虽然后者驱动了更接近其任务完成的平台。在本文中,我们定义了系统地分类的主要元素,并批判地讨论该域中的最新状态。我们还提出了一个参考框架作为对截图相关的解决方案的形式主义。总体而言,本调查探讨了主要挑战,并设想了本地化任务的自主感知系统领域的主要研究方向。促进用于搜索和跟踪应用的强大主动感测方法的开发也有益。
translated by 谷歌翻译
具有多模式传感(AIPPMS)的自适应信息路径计划(AIPPMS)考虑了配备多个传感器的代理商的问题,每个传感器具有不同的感应精度和能量成本。代理商的目标是探索环境并在未知的,部分可观察到的环境中受到其资源约束的信息。先前的工作集中在不太一般的适应性信息路径计划(AIPP)问题上,该问题仅考虑了代理人运动对收到的观察结果的影响。 AIPPMS问题通过要求代理的原因共同出现感应和移动的影响,同时平衡资源约束与信息目标,从而增加了额外的复杂性。我们将AIPPMS问题作为一种信念马尔可夫决策过程,并具有高斯流程信念,并使用在线计划中使用顺序的贝叶斯优化方法来解决它。我们的方法始终优于以前的AIPPMS解决方案,这几乎将几乎每个实验中获得的平均奖励增加了一倍,同时还将根平方的错误在环境信念中减少了50%。我们完全开放我们的实施方式,以帮助进一步开发和比较。
translated by 谷歌翻译
本文主要研究范围传感机器人在置信度富的地图(CRM)中的定位和映射,这是一种持续信仰的密集环境表示,然后扩展到信息理论探索以减少姿势不确定性。大多数关于主动同时定位和映射(SLAM)和探索的作品始终假设已知的机器人姿势或利用不准确的信息指标来近似姿势不确定性,从而导致不知名的环境中的勘探性能和效率不平衡。这激发了我们以可测量的姿势不确定性扩展富含信心的互信息(CRMI)。具体而言,我们为CRMS提出了一种基于Rao-Blackwellized粒子过滤器的定位和映射方案(RBPF-CLAM),然后我们开发了一种新的封闭形式的加权方法来提高本地化精度而不扫描匹配。我们通过更准确的近似值进一步计算了使用加权颗粒的不确定的CRMI(UCRMI)。仿真和实验评估显示了在非结构化和密闭场景中提出的方法的定位准确性和探索性能。
translated by 谷歌翻译
在本文中,我们为具有异质传感器的机器人团队提供了在线自适应计划策略,以使用学习的模型进行决策模型从潜在空间领域进行采样。当前的机器人抽样方法试图收集有关可观察到的空间场的信息。但是,许多应用程序,例如环境监测和精确农业,都涉及不直接观察或衡量昂贵的现象,称为潜在现象。在我们的方法中,我们试图通过使用具有异质传感器的机器人团队有效地采样可观察到的空间场来实时推理潜在现象,在这种空间场中,每个机器人都有一个独特的传感器来测量不同可观察的场。信息增益是使用从可观察到的空间场映射到潜在现象的学习模型来估计的。该模型捕获了关系中的不确定性,以允许信息理论措施。此外,我们明确考虑可观察到的空间场之间的相关性,从而捕获了观察结果并非独立的传感器类型之间的关系。我们表明,可以学习这些相关性,并研究学习相关模型对我们采样方法性能的影响。通过我们的定性和定量结果,我们说明了经验学习的相关性提高了团队的整体抽样效率。我们使用在魁北克的Lac Hertel上收集的传感器测量数据集模拟我们的方法,我们可以公开使用。
translated by 谷歌翻译
在本文中,我们设计了一个基于信息的多机器人来源,以寻求算法,其中一组移动传感器仅使用基于局部范围的测量值就本地化并移动靠近单个源。在算法中,移动传感器执行源标识/本地化以估计源位置;同时,他们移至新位置,以最大程度地提高有关传感器测量中包含的源的Fisher信息。在这样做的过程中,它们改善了源位置估计,并更靠近源。与传统的攀登算法相比,我们的算法在收敛速度方面具有优越性,在测量模型和信息指标的选择中是灵活的,并且对测量模型误差非常强大。此外,我们提供了算法的完全分布式版本,每个传感器都决定自己的动作,并且仅通过稀疏的通信网络与邻居共享信息。我们进行密集的仿真实验,以测试带有光传感器的小型地面车辆上的大规模系统和物理实验的算法,这表明在寻求光源方面取得了成功。
translated by 谷歌翻译
本文为一组移动机器人提供了一种算法,可以同时学习域上的空间字段,并在空间上分发自己以最佳覆盖。从以前的方法通过集中式高斯过程估算空间场的方法,这项工作利用了覆盖范围问题的空间结构,并提出了一种分散的策略,其中样本通过通过Voronoi分区的边界来建立通信在本地汇总。我们提出了一种算法,每个机器人都通过其自身测量值和Voronoi邻居提供的局部高斯流程运行局部高斯过程,该过程仅在提供足够新颖的信息时才将其纳入单个机器人的高斯过程中。在模拟中评估算法的性能,并与集中式方法进行比较。
translated by 谷歌翻译
主动同时定位和映射(SLAM)是规划和控制机器人运动以构建周围环境中最准确,最完整的模型的问题。自从三十多年前出现了积极感知的第一项基础工作以来,该领域在不同科学社区中受到了越来越多的关注。这带来了许多不同的方法和表述,并回顾了当前趋势,对于新的和经验丰富的研究人员来说都是非常有价值的。在这项工作中,我们在主动大满贯中调查了最先进的工作,并深入研究了仍然需要注意的公开挑战以满足现代应用程序的需求。为了实现现实世界的部署。在提供了历史观点之后,我们提出了一个统一的问题制定并审查经典解决方案方案,该方案将问题分解为三个阶段,以识别,选择和执行潜在的导航措施。然后,我们分析替代方法,包括基于深入强化学习的信念空间规划和现代技术,以及审查有关多机器人协调的相关工作。该手稿以讨论新的研究方向的讨论,解决可再现的研究,主动的空间感知和实际应用,以及其他主题。
translated by 谷歌翻译
本文介绍了一种可以在非通信和局部可观察条件下应用的新型混合多机器人运动计划。策划员是无模型的,可以实现多机器人状态和观察信息的端到端映射到最终平滑和连续的轨迹。规划师是前端和后端分离的架构。前端协作航点搜索模块的设计基于具有分散执行图的集中培训下的多代理软演员批评算法。后端轨迹优化模块的设计基于具有安全区域约束的最小快照方法。该模块可以输出最终动态可行和可执行的轨迹。最后,多组实验结果验证了拟议的运动计划员的有效性。
translated by 谷歌翻译
在移动机器人学中,区域勘探和覆盖率是关键能力。在大多数可用研究中,共同的假设是全球性,远程通信和集中合作。本文提出了一种新的基于群的覆盖控制算法,可以放松这些假设。该算法组合了两个元素:Swarm规则和前沿搜索算法。受到大量简单代理(例如,教育鱼,植绒鸟类,蜂拥昆虫)的自然系统的启发,第一元素使用三个简单的规则来以分布式方式维持群体形成。第二元素提供了选择有希望区域以使用涉及代理的相对位置的成本函数的最小化来探索(和覆盖)的装置。我们在不同环境中测试了我们的方法对异质和同质移动机器人的性能。我们衡量覆盖性能和允许本集团维持沟通的覆盖性能和群体形成统计数据。通过一系列比较实验,我们展示了拟议的策略在最近提出的地图覆盖方法和传统的人工潜在领域基于细胞覆盖,转变和安全路径的百分比,同时保持允许短程的形成沟通。
translated by 谷歌翻译
This article presents a novel review of Active SLAM (A-SLAM) research conducted in the last decade. We discuss the formulation, application, and methodology applied in A-SLAM for trajectory generation and control action selection using information theory based approaches. Our extensive qualitative and quantitative analysis highlights the approaches, scenarios, configurations, types of robots, sensor types, dataset usage, and path planning approaches of A-SLAM research. We conclude by presenting the limitations and proposing future research possibilities. We believe that this survey will be helpful to researchers in understanding the various methods and techniques applied to A-SLAM formulation.
translated by 谷歌翻译
近年来,研究人员委托机器人和无人驾驶汽车(UAV)团队委托进行准确的在线野火覆盖范围和跟踪。迄今为止,大多数先前的工作都集中在此类多机器人系统的协调和控制上,但尚未赋予这些无人机团队对火的轨道(即位置和传播动态)进行推理的能力,以提供性能保证时间范围。在空中野火监测的问题上,我们提出了一个预测框架,该框架使多UAV团队的合作能够与概率性能保证一起进行协作现场覆盖和火灾跟踪。我们的方法使无人机能够推断出潜在的火灾传播动态,以在安全至关重要的条件下进行时间扩展的协调。我们得出了一组新颖的,分析的时间和跟踪纠纷界限,以使无人机团队根据特定于案例的估计状态分发有限的资源并覆盖整个火灾区域,并提供概率性能保证。我们的结果不仅限于空中野火监测案例研究,而且通常适用于搜索和救援,目标跟踪和边境巡逻等问题。我们在模拟中评估了我们的方法,并在物理多机器人测试台上提供了建议的框架,以说明真实的机器人动态和限制。我们的定量评估验证了我们的方法的性能,分别比基于最新的模型和强化学习基准分别累积了7.5倍和9.0倍的跟踪误差。
translated by 谷歌翻译
自适应信息采样方法能够有效选择移动机器人的航点,可以获得可以获得物理过程的精确感测和映射,例如辐射或场强。本文分析了勘探和利用在环境过程的这种信息化空间采样中的作用。我们使用高斯过程来预测和估计利用置信度的预测,从而在勘探和剥削方面确定每个点的信息。具体地,我们使用高斯过程回归模型来对环境的Wi-Fi信号强度进行采样。对于信息功能的不同变体,我们广泛地分析和评估了通过单个机器人和多机器人设置中的两个不同初始轨迹的信息映射的有效性和效率。结果在基于采样目标选择适当的信息功能方面提供了有意义的见解。
translated by 谷歌翻译