在本文中,我们在不确定的沟通和对抗性攻击者的影响下解决了多机器人信息路径计划(MIPP)任务。目的是创建一个多机器人系统,尽管存在损坏的机器人共享恶意信息,但仍可以学习并统一对未知环境的知识。我们使用高斯工艺(GP)来对未知环境进行建模,并使用相互信息的指标来定义信息。我们MIPP任务的目标是最大化团队收集的信息量,同时最大程度地提高弹性弹性的可能性。不幸的是,这些目标是矛盾的,尤其是在探索需要机器人之间断开连接的大环境时。结果,我们强加了一个概率的通信约束,该概率可以使机器人间歇性地满足和弹性地共享信息,然后在所有其他时间内采取行动以最大程度地提高收集的信息。为了解决我们的问题,我们选择具有最高弹性概率的会议位置,并使用顺序贪婪算法来优化机器人探索的路径。最后,我们通过比较应用弹性和非弹性MIPP算法的良好行为机器人的学习能力来展示结果的有效性。
translated by 谷歌翻译
本文提出了一种以完全分布式方式工作的协同环境学习算法。多机器人系统比单个机器人更有效,但它涉及以下挑战:1)使用多个机器人在线分布式学习环境地图; 2)基于学习地图的安全和有效的探索路径的产生; 3)对机器人数量的维持能力。为此,我们将整个过程划分为环境学习和路径规划的两个阶段。在每个阶段应用分布式算法并通过相邻机器人之间的通信组合。环境学习算法使用分布式高斯过程,路径规划算法使用分布式蒙特卡罗树搜索。因此,我们构建一个可扩展系统,而无需对机器人数量的约束。仿真结果证明了所提出的系统的性能和可扩展性。此外,基于实际数据集的仿真验证了我们算法在更现实的方案中的实用程序。
translated by 谷歌翻译
主动位置估计(APE)是使用一个或多个传感平台本地化一个或多个目标的任务。 APE是搜索和拯救任务,野生动物监测,源期限估计和协作移动机器人的关键任务。 APE的成功取决于传感平台的合作水平,他们的数量,他们的自由度和收集的信息的质量。 APE控制法通过满足纯粹剥削或纯粹探索性标准,可以实现主动感测。前者最大限度地减少了位置估计的不确定性;虽然后者驱动了更接近其任务完成的平台。在本文中,我们定义了系统地分类的主要元素,并批判地讨论该域中的最新状态。我们还提出了一个参考框架作为对截图相关的解决方案的形式主义。总体而言,本调查探讨了主要挑战,并设想了本地化任务的自主感知系统领域的主要研究方向。促进用于搜索和跟踪应用的强大主动感测方法的开发也有益。
translated by 谷歌翻译
本文考虑了安全协调一个配备传感器的机器人团队的问题,以减少有关动态过程的不确定性,而该过程将使目标消除信息增益和能源成本。优化这种权衡是可取的,但是在机器人轨迹集中导致非占主酮目标函数。因此,基于协调下降的普通多机器人计划者失去了其性能保证。此外,处理非单调性的方法在受到机器人间碰撞避免约束时会失去其性能保证。由于需要保留性能保证和安全保证,这项工作提出了一种分布式计划者的层次结构方法,该方法使用本地搜索,并根据控制屏障功能提供了基于控制屏障功能的当地搜索和分散的控制器,以确保安全并鼓励及时到达传感位置。通过大量的模拟,硬件测试和硬件实验,我们证明了所提出的方法比基于坐标下降的算法在感应和能源成本之间取得更好的权衡。
translated by 谷歌翻译
信息性测量是获取有关未知状态信息的最有效方法。我们给出了一般目的动态编程算法的第一原理推导,通过顺序地最大化可能的测量结果的熵来返回一系列信息测量。该算法可以由自主代理或机器人使用,以确定最佳测量的位置,规划对应于信息序列的最佳信息序列的路径。该算法适用于具有连续或离散的状态和控制,以及随机或确定性的代理动态;包括马尔可夫决策过程。最近的近似动态规划和强化学习的结果,包括卷展栏和蒙特卡罗树搜索等在线近似,允许代理或机器人实时解决测量任务。由此产生的近最佳溶液包括非近视路径和测量序列,其通常可以优于超过,有时基本上使用的贪婪启发式,例如最大化每个测量结果的熵。这是针对全球搜索问题的说明,其中发现使用扩展本地搜索的在线规划来减少搜索中的测量数。
translated by 谷歌翻译
多路径定向问题询问机器人团队的路径最大化收集的总奖励,同时满足路径长度上的预算约束。这个问题模拟了许多多机器人路由任务,例如探索未知的环境和环境监控信息。在本文中,我们专注于如何使机器人团队在对抗环境中运行时对故障的强大。我们介绍了强大的多路径定向事问题(RMOP),在那里我们寻求最糟糕的案例保证,反对能够在大多数$ \ Alpha $机器人处攻击的对手。我们考虑两个问题的两个版本:RMOP离线和RMOP在线。在离线版本中,当机器人执行其计划时,没有通信或重新扫描,我们的主要贡献是一种具有界限近似保证的一般近似方案,其取决于$ \ alpha $和单个机器人导向的近似因子。特别是,我们表明该算法在成本函数是模块化时产生(i)恒因子近似; (ii)在成本函数是子模具时,$ \ log $因子近似; (iii)当成本函数是子模块时的恒因子近似,但是允许机器人通过有界金额超过其路径预算。在在线版本中,RMOP被建模为双人顺序游戏,并基于蒙特卡罗树搜索(MCT),以后退地平线方式自适应解决。除了理论分析之外,我们还对海洋监测和隧道信息收集应用进行仿真研究,以证明我们的方法的功效。
translated by 谷歌翻译
主动同时定位和映射(SLAM)是规划和控制机器人运动以构建周围环境中最准确,最完整的模型的问题。自从三十多年前出现了积极感知的第一项基础工作以来,该领域在不同科学社区中受到了越来越多的关注。这带来了许多不同的方法和表述,并回顾了当前趋势,对于新的和经验丰富的研究人员来说都是非常有价值的。在这项工作中,我们在主动大满贯中调查了最先进的工作,并深入研究了仍然需要注意的公开挑战以满足现代应用程序的需求。为了实现现实世界的部署。在提供了历史观点之后,我们提出了一个统一的问题制定并审查经典解决方案方案,该方案将问题分解为三个阶段,以识别,选择和执行潜在的导航措施。然后,我们分析替代方法,包括基于深入强化学习的信念空间规划和现代技术,以及审查有关多机器人协调的相关工作。该手稿以讨论新的研究方向的讨论,解决可再现的研究,主动的空间感知和实际应用,以及其他主题。
translated by 谷歌翻译
信息性规划试图指导机器人的一系列动作,以收集最大信息的数据以映射大环境或学习动态系统。信息规划中的现有工作主要侧重于提出新规划者,并将其应用于各种机器人应用,如环境监测,自主勘探和系统识别。信息规划人员优化了概率模型给出的目标,例如,高斯过程回归。在实践中,该模型可以很容易受到无处不在的传感异常值的影响,导致误导目标。直接的解决方案是使用搁板的异常值检测器过滤出传感数据流中的异常值。但是,信息性样本也根据定义稀缺,因此它们可能被错误地筛选出来。在本文中,我们提出了一种方法来使机器人能够重新访问除了优化信息规划目标之外对异常值进行采样的位置。通过这样做,机器人可以在异常值附近收集更多样本,并更新异常值检测器以减少误报的数量。这是通过在蒙特卡罗树搜索的帕累托变体上设计一个新目标来实现的。我们证明所提出的框架可以实现比仅应用异常值探测器更好的性能。
translated by 谷歌翻译
本文在具有部分未知语义的环境中解决了多机器人规划问题。假设环境具有已知的几何结构(例如,墙壁),并且由具有不确定位置和类的静态标记的地标占用。这种建模方法引发了语义SLAM算法生成的不确定语义地图。我们的目标是为配备有嘈杂感知系统的机器人设计控制策略,以便他们可以完成全局时间逻辑规范捕获的协同任务。为了指定考虑环境和感知不确定性的任务,我们采用了线性时间逻辑(LTL)的片段,称为CO-Safe LTL,定义了基于感知的原子谓性建模概率满意度要求。基于感知的LTL规划问题产生了通过新型采样的算法解决的最佳控制问题,它产生了在线更新的开环控制策略,以适应连续学习的语义地图。我们提供广泛的实验,以证明拟议的规划架构的效率。
translated by 谷歌翻译
在本文中,我们制定和解决间歇部署问题,从而产生了夫妇\ emph {当异质机器人应该感知环境过程的策略,其中一支部署的团队应该在环境中感知。作为一种动机,假设不必要的多机器人团队,例如无人驾驶飞行器监测牧场在精确农业背景下监控牧场的慢慢发展。在这种情况下,作为缓慢不断发展的过程,持久部署或监视是必要的间歇部署策略是必要的。与此同时,在部署一旦部署的地方的问题必须解决,因为过程观察产生了确定有效未来部署和监测决策的有用反馈。在这种情况下,我们将环境进程建模为作为一种时空高斯过程,以互信作为衡量我们对环境理解的标准。为了使传感资源有效,我们展示了如何使用Matroid约束来强加多样化的均匀和异构的约束。此外,为了反映现实世界应用的成本敏感性质,我们申请预算为部署的异构机器人团队的成本。为了解决所产生的问题,我们利用子模具优化和麦芽瘤的理论,并提出了一种贪婪算法,借助次级最优性。最后,蒙特卡罗模拟证明了所提出的方法的正确性。
translated by 谷歌翻译
共识算法通过使多个机器人能够收敛到仅使用本地通信的全局变量的一致估计来构成许多分布式算法的基础。但是,标准共识协议可以轻松地由非合作团队成员误入歧途。因此,对于设计弹性分布式算法是必要的,对共识的弹性形式的研究是必要的。 W-MSR共识是一种这样的有弹性共识算法,它允许仅具有通信图的本地知识,而没有用于共享数据的先验模型。但是,给定通信图满足严格的图形连接要求的验证使W-MSR在实践中难以使用。在本文中,我们显示了机器人文献中常用的通信图结构,即基于Voronoi Tessellation构建的通信图,自动产生足够连接的图以拒绝单个非合作团队成员。此外,我们展示了如何增强该图,以拒绝两个非合作团队成员,并为修改进一步的弹性提供路线图。这项贡献将允许在已经依赖基于Voronoi的通信(例如分布式覆盖范围和探索算法)的算法中轻松应用弹性共识。
translated by 谷歌翻译
本文解决了积极计划的问题,以在GNSS受限的场景中测量不确定性下实现多机器人系统(MRS)的合作定位。具体而言,我们解决了准确预测配备基于范围的测量设备的两个机器人之间未来连接的概率的问题。由于配备的传感器范围有限,由于机器人相互移动,网络连接拓扑中的边缘将被创建或破坏。因此,鉴于状态估计不完善和嘈杂的驱动,准确地预测边缘的未来存在是一项具有挑战性的任务。自适应功率序列扩展(或APSE)算法是根据当前估计和控制候选者开发的。这种算法在正态分布中应用了二次阳性形式的功率序列扩展公式。有限端近似是为了实现计算障碍。提出了进一步的分析,以表明通过自适应选择功率序列的求和度,可以从理论上将有限端近似中的截断误差降低到所需的阈值。几种足够的条件被严格得出作为选择原则。最后,相对于单个和多机器人案例,广泛的仿真结果和比较验证了正式计算的,因此将来拓扑的更准确的概率可以帮助改善在不确定性下积极计划的性能。
translated by 谷歌翻译
在许多环境监测方案中,采样机器人需要同时探索环境和利用有限时间利用感兴趣的特征。我们介绍了一个名为Pareto Monte Carlo树搜索的多目标信息规划方法,该方法允许机器人处理潜在的竞争目标,例如勘探与剥削。该方法基于环境状态的知识(估计)为机器人产生了优化的决策解决方案,从而更好地适应环境动态。我们在关键树节点选择步骤提供算法分析,并显示选择子最优节点的次数是对数界限的,并且搜索结果以多项式率收敛到最佳选择。
translated by 谷歌翻译
机器人对未知环境的探索从根本上是一个不确定性下决策的问题,在这种情况下,机器人必须考虑传感器测量,本地化,动作执行以及许多其他因素的不确定性。对于大规模勘探应用,自治系统必须克服依次确定哪些环境区域的挑战,可以探索哪些区域,同时安全地评估与障碍和危险地形相关的风险。在这项工作中,我们提出了一个风险意识的元级决策框架,以平衡与本地和全球勘探相关的权衡。元级决策是基于经典的等级覆盖计划者,通过在本地和全球政策之间进行切换,其总体目标是选择最有可能在随机环境中最大化奖励的政策。我们使用有关环境历史,穿术风险和动力学约束的信息,以推理成功执行本地和全球政策之间的策略执行的可能性。我们已经在模拟和各种大规模现实世界硬件测试中验证了解决方案。我们的结果表明,通过平衡本地和全球探索,我们可以更有效地显着探索大规模的环境。
translated by 谷歌翻译
嘈杂的传感,不完美的控制和环境变化是许多现实世界机器人任务的定义特征。部分可观察到的马尔可夫决策过程(POMDP)提供了一个原则上的数学框架,用于建模和解决不确定性下的机器人决策和控制任务。在过去的十年中,它看到了许多成功的应用程序,涵盖了本地化和导航,搜索和跟踪,自动驾驶,多机器人系统,操纵和人类机器人交互。这项调查旨在弥合POMDP模型的开发与算法之间的差距,以及针对另一端的不同机器人决策任务的应用。它分析了这些任务的特征,并将它们与POMDP框架的数学和算法属性联系起来,以进行有效的建模和解决方案。对于从业者来说,调查提供了一些关键任务特征,以决定何时以及如何成功地将POMDP应用于机器人任务。对于POMDP算法设计师,该调查为将POMDP应用于机器人系统的独特挑战提供了新的见解,并指出了有希望的新方向进行进一步研究。
translated by 谷歌翻译
本文为多代理系统开发了一个随机编程框架,在该系统中,任务分解,分配和调度问题同时被优化。该框架可以应用于具有分布式子任务的异质移动机器人团队。例子包括大流行机器人服务协调,探索和救援以及具有异质车辆的交付系统。由于其固有的灵活性和鲁棒性,多代理系统被应用于越来越多的现实问题,涉及异质任务和不确定信息。大多数以前的作品都采用一种将任务分解为角色的独特方法,以后可以将任务分配给代理。对于角色可以变化并且存在多个分解结构的复杂任务,此假设无效。同时,尚不清楚如何在多代理系统设置下系统地量化和优化任务要求和代理能力中的不确定性。提出了复杂任务的表示形式:代理功能表示为随机分布的向量,任务要求通过可推广的二进制函数验证。在目标函数中选择有风险的条件值(CVAR)作为制定强大计划的度量。描述了一种有效的算法来解决该模型,并在两个不同的实践案例中评估了整个框架:在大流行期间的捕获量和机器人服务协调(例如,Covid-19)。结果表明,该框架是可扩展的,可扩展到示例案例的140个代理和40个任务,并提供了低成本计划,以确保成功的概率很高。
translated by 谷歌翻译
在本文中,我们设计了一个基于信息的多机器人来源,以寻求算法,其中一组移动传感器仅使用基于局部范围的测量值就本地化并移动靠近单个源。在算法中,移动传感器执行源标识/本地化以估计源位置;同时,他们移至新位置,以最大程度地提高有关传感器测量中包含的源的Fisher信息。在这样做的过程中,它们改善了源位置估计,并更靠近源。与传统的攀登算法相比,我们的算法在收敛速度方面具有优越性,在测量模型和信息指标的选择中是灵活的,并且对测量模型误差非常强大。此外,我们提供了算法的完全分布式版本,每个传感器都决定自己的动作,并且仅通过稀疏的通信网络与邻居共享信息。我们进行密集的仿真实验,以测试带有光传感器的小型地面车辆上的大规模系统和物理实验的算法,这表明在寻求光源方面取得了成功。
translated by 谷歌翻译
近年来,研究人员委托机器人和无人驾驶汽车(UAV)团队委托进行准确的在线野火覆盖范围和跟踪。迄今为止,大多数先前的工作都集中在此类多机器人系统的协调和控制上,但尚未赋予这些无人机团队对火的轨道(即位置和传播动态)进行推理的能力,以提供性能保证时间范围。在空中野火监测的问题上,我们提出了一个预测框架,该框架使多UAV团队的合作能够与概率性能保证一起进行协作现场覆盖和火灾跟踪。我们的方法使无人机能够推断出潜在的火灾传播动态,以在安全至关重要的条件下进行时间扩展的协调。我们得出了一组新颖的,分析的时间和跟踪纠纷界限,以使无人机团队根据特定于案例的估计状态分发有限的资源并覆盖整个火灾区域,并提供概率性能保证。我们的结果不仅限于空中野火监测案例研究,而且通常适用于搜索和救援,目标跟踪和边境巡逻等问题。我们在模拟中评估了我们的方法,并在物理多机器人测试台上提供了建议的框架,以说明真实的机器人动态和限制。我们的定量评估验证了我们的方法的性能,分别比基于最新的模型和强化学习基准分别累积了7.5倍和9.0倍的跟踪误差。
translated by 谷歌翻译
在本文中,我们为具有异质传感器的机器人团队提供了在线自适应计划策略,以使用学习的模型进行决策模型从潜在空间领域进行采样。当前的机器人抽样方法试图收集有关可观察到的空间场的信息。但是,许多应用程序,例如环境监测和精确农业,都涉及不直接观察或衡量昂贵的现象,称为潜在现象。在我们的方法中,我们试图通过使用具有异质传感器的机器人团队有效地采样可观察到的空间场来实时推理潜在现象,在这种空间场中,每个机器人都有一个独特的传感器来测量不同可观察的场。信息增益是使用从可观察到的空间场映射到潜在现象的学习模型来估计的。该模型捕获了关系中的不确定性,以允许信息理论措施。此外,我们明确考虑可观察到的空间场之间的相关性,从而捕获了观察结果并非独立的传感器类型之间的关系。我们表明,可以学习这些相关性,并研究学习相关模型对我们采样方法性能的影响。通过我们的定性和定量结果,我们说明了经验学习的相关性提高了团队的整体抽样效率。我们使用在魁北克的Lac Hertel上收集的传感器测量数据集模拟我们的方法,我们可以公开使用。
translated by 谷歌翻译
具有多模式传感(AIPPMS)的自适应信息路径计划(AIPPMS)考虑了配备多个传感器的代理商的问题,每个传感器具有不同的感应精度和能量成本。代理商的目标是探索环境并在未知的,部分可观察到的环境中受到其资源约束的信息。先前的工作集中在不太一般的适应性信息路径计划(AIPP)问题上,该问题仅考虑了代理人运动对收到的观察结果的影响。 AIPPMS问题通过要求代理的原因共同出现感应和移动的影响,同时平衡资源约束与信息目标,从而增加了额外的复杂性。我们将AIPPMS问题作为一种信念马尔可夫决策过程,并具有高斯流程信念,并使用在线计划中使用顺序的贝叶斯优化方法来解决它。我们的方法始终优于以前的AIPPMS解决方案,这几乎将几乎每个实验中获得的平均奖励增加了一倍,同时还将根平方的错误在环境信念中减少了50%。我们完全开放我们的实施方式,以帮助进一步开发和比较。
translated by 谷歌翻译