集体感知是群体机器人技术中的基本问题,在该机器人技术中,群体必须就环境的连贯代表达成共识。集体感知的一个重要变体将其视为最佳决策过程,在该过程中,群体必须从一组替代方案中确定最有可能的代表。过去对这种变体的工作主要集中在表征不同的算法如何在群体必须决定最频繁的环境特征的情况下如何导航速度-VS-Accuracy折衷。至关重要的是,过去在最佳决策中的工作使机器人传感器是完美的(无噪声和故障),从而限制了这些算法的现实适用性。在本文中,我们从第一个原理中得出了一个最佳的,概率的框架,用于配备有缺陷的传感器的简约群机器人。然后,我们在群体共同决定某个环境特征的频率的情况下验证了我们的方法。我们研究了有关几个感兴趣的参数的决策过程的速度和准确性。即使存在严重的感觉噪声,我们的方法也可以提供及时,准确的频率估计。
translated by 谷歌翻译
自组织的聚合是群体机器人技术的一种精心研究的行为,因为它是开发更先进的组级响应的前提。在本文中,我们研究了分散算法的设计,用于在不同的目标位点上自我聚集的一群异质机器人。先前的研究表明,包括作为群体的一部分,许多知情的机器人可以将聚合过程的动态引导到可用聚合位点之间群体的理想分布。我们使用简化的方法复制了先前研究的结果:我们删除了与机器人的通信协议相关的约束,并简化了调节概率控制器状态之间过渡的控制机制。结果表明,可以使用我们的简化方法来复制以先前,更复杂的控制器获得的性能,该方法在物理机器人的便携性和灵活性方面具有明显的优势。也就是说,与复杂控制器相比,我们简化的方法可以在更大的操作条件下产生自组织的聚合响应。
translated by 谷歌翻译
我们考虑一个设置机器人团队的任务是跟踪以下属性的多个目标:接近目标可以实现更准确的目标位置估计,同时也增加了传感器故障的风险。因此,要解决跟踪质量最大化和风险最小化之间的权衡至关重要。在我们以前的工作中,开发了一个集中式控制器来规划所有机器人的动作 - 但是,这不是可扩展的方法。在这里,我们提出了一个分散且具有风险的多目标跟踪框架,在该框架中,每个机器人都计划其运动交易的跟踪准确性最大化和厌恶风险,同时仅依靠其与邻居交流的信息和信息。我们使用控制屏障函数来保证整个跟踪过程中的网络连接。广泛的数值实验表明,我们的系统可以达到与集中式同行相似的跟踪准确性和风险意识。
translated by 谷歌翻译
多机器人决策是多个机器人协调操作的过程。在本文中,尽管机器人有限的车载资源和其任务的资源要求复杂性,但我们的目标是可扩展可靠的多机器人决策。我们介绍了第一种使机器人可以选择其他机器人协调的算法,从而平衡了集中式与分散协调的权衡。特别是,集中化有利于全球近乎最佳的决策,但付出了增加的船上资源要求;而权力下放有利于最小的资源要求,但以全球次优的成本。因此,所有机器人都可以负担我们的算法,无论其资源如何。我们受到自治的未来的激励,涉及多个机器人协调行动以完成资源需求任务,例如目标跟踪和区域覆盖。为了提供封闭形式的特征,我们专注于涉及单调和“双重”下函数的最大化问题。为了捕获权力下放的成本,我们介绍了在非邻居(COIN)中的信息集中概念。我们在图像覆盖的模拟场景中验证我们的算法。
translated by 谷歌翻译
在本文中,我们设计了一个基于信息的多机器人来源,以寻求算法,其中一组移动传感器仅使用基于局部范围的测量值就本地化并移动靠近单个源。在算法中,移动传感器执行源标识/本地化以估计源位置;同时,他们移至新位置,以最大程度地提高有关传感器测量中包含的源的Fisher信息。在这样做的过程中,它们改善了源位置估计,并更靠近源。与传统的攀登算法相比,我们的算法在收敛速度方面具有优越性,在测量模型和信息指标的选择中是灵活的,并且对测量模型误差非常强大。此外,我们提供了算法的完全分布式版本,每个传感器都决定自己的动作,并且仅通过稀疏的通信网络与邻居共享信息。我们进行密集的仿真实验,以测试带有光传感器的小型地面车辆上的大规模系统和物理实验的算法,这表明在寻求光源方面取得了成功。
translated by 谷歌翻译
自动机器人群的主要任务之一是共同决定最佳可用选项。实现需要在现实世界环境中可能不会总是可用的代理商之间的高质量沟通。在本文中,我们介绍了沟通受限的集体决策问题,其中环境的某些领域限制了代理人通过降低成功率或阻止沟通渠道进行沟通的能力。我们提出了一种分散的算法,用于绘制机器人群的环境特征,并在不知道通信环境的情况下改善沟通有限环境中的集体决策。我们的结果表明,让集体意识到通信环境可以在存在沟通限制的情况下提高收敛速度,而不会牺牲准确性的速度至少3倍。
translated by 谷歌翻译
在产生复杂结构(例如化学元件和分子)的粒子相互作用中可以广泛看到自组织的新兴模式。受这些互动的启发,这项工作提出了一种新颖的随机方法,该方法使一群异质机器人以完全分散的方式创建新兴的模式,并且仅依靠本地信息。我们的方法包括将群构型建模为动态吉布斯随机场(GRF),并在受到化学规则启发的邻域系统上的设置约束,这些规则决定了粒子之间的结合极性。使用GRF模型,我们确定每个机器人的速度,从而导致导致图案或形状创建的行为。模拟实验显示了该方法在产生多种模式中的多功能性,并且使用一组物理机器人的实验显示了潜在应用中的可行性。
translated by 谷歌翻译
近年来我们目睹了巨大进展的动机,本文提出了对协作同时定位和映射(C-SLAM)主题的科学文献的调查,也称为多机器人猛击。随着地平线上的自动驾驶车队和工业应用中的多机器人系统的兴起,我们相信合作猛击将很快成为未来机器人应用的基石。在本调查中,我们介绍了C-Slam的基本概念,并呈现了彻底的文献综述。我们还概述了C-Slam在鲁棒性,通信和资源管理方面的主要挑战和限制。我们通过探索该地区目前的趋势和有前途的研究途径得出结论。
translated by 谷歌翻译
We propose a decentralized control algorithm for a minimalistic robotic swarm with limited capabilities such that the desired global behavior emerges. We consider the problem of searching for and encapsulating various targets present in the environment while avoiding collisions with both static and dynamic obstacles. The novelty of this work is the guaranteed generation of desired complex swarm behavior with constrained individual robots which have no memory, no localization, and no knowledge of the exact relative locations of their neighbors. Moreover, we analyze how the emergent behavior changes with different parameters of the task, noise in the sensor reading, and asynchronous execution.
translated by 谷歌翻译
In this paper, we present a solution to a design problem of control strategies for multi-agent cooperative transport. Although existing learning-based methods assume that the number of agents is the same as that in the training environment, the number might differ in reality considering that the robots' batteries may completely discharge, or additional robots may be introduced to reduce the time required to complete a task. Therefore, it is crucial that the learned strategy be applicable to scenarios wherein the number of agents differs from that in the training environment. In this paper, we propose a novel multi-agent reinforcement learning framework of event-triggered communication and consensus-based control for distributed cooperative transport. The proposed policy model estimates the resultant force and torque in a consensus manner using the estimates of the resultant force and torque with the neighborhood agents. Moreover, it computes the control and communication inputs to determine when to communicate with the neighboring agents under local observations and estimates of the resultant force and torque. Therefore, the proposed framework can balance the control performance and communication savings in scenarios wherein the number of agents differs from that in the training environment. We confirm the effectiveness of our approach by using a maximum of eight and six robots in the simulations and experiments, respectively.
translated by 谷歌翻译
In collective decision-making, designing algorithms that use only local information to effect swarm-level behaviour is a non-trivial problem. We used machine learning techniques to teach swarm members to map their local perceptions of the environment to an optimal action. A curriculum inspired by Machine Education approaches was designed to facilitate this learning process and teach the members the skills required for optimal performance in the collective perception problem. We extended upon previous approaches by creating a curriculum that taught agents resilience to malicious influence. The experimental results show that well-designed rules-based algorithms can produce effective agents. When performing opinion fusion, we implemented decentralised resilience by having agents dynamically weight received opinion. We found a non-significant difference between constant and dynamic weights, suggesting that momentum-based opinion fusion is perhaps already a resilience mechanism.
translated by 谷歌翻译
本文为一组移动机器人提供了一种算法,可以同时学习域上的空间字段,并在空间上分发自己以最佳覆盖。从以前的方法通过集中式高斯过程估算空间场的方法,这项工作利用了覆盖范围问题的空间结构,并提出了一种分散的策略,其中样本通过通过Voronoi分区的边界来建立通信在本地汇总。我们提出了一种算法,每个机器人都通过其自身测量值和Voronoi邻居提供的局部高斯流程运行局部高斯过程,该过程仅在提供足够新颖的信息时才将其纳入单个机器人的高斯过程中。在模拟中评估算法的性能,并与集中式方法进行比较。
translated by 谷歌翻译
本文解决了使用异质多机器人系统进行合作目标跟踪的问题,该系统在该系统上通过动态通信网络进行通信,而异质性则是在机器人中安装的不同类型的传感器和预测算法方面。该问题被投入到分布式学习框架中,在该框架中,机器人被认为是通过动态通信网络连接的“代理”。他们的预测算法被认为是“专家”,对目标轨迹的看法预测。在本文中,提出了一种新颖的分散分布式专家辅助学习(D2EAL)算法,提出了通过使每个机器人通过其信息共享来改善目标轨迹的外观预测,并运行加权信息,从而改善了整体跟踪性能。融合过程结合了基于预测损失度量的在线学习权重。对D2EAL进行了理论分析,该分析涉及对累积预测损失的最坏情况界限的分析以及权重分析。仿真研究表明,在涉及专家预测中涉及大动态偏见或漂移的不利场景中,D2EAL优于众所周知的基于协方差的估计/预测融合方法,无论是在预测性能和可伸缩性方面。
translated by 谷歌翻译
在各种任务和场景中使用多机器人系统的使用越来越兴趣。这种系统的主要吸引力是它们的灵活性,鲁棒性和可扩展性。系统模块化是一个经常被忽视但有希望的功能,它为利用代理专业化提供了可能性,同时还可以实现系统级别的升级。但是,改变代理的能力可以改变最大化系统性能所需的勘探探索示例平衡。在这里,我们研究了群异质性对其探索探索平衡的影响,同时跟踪在对多个移动目标框架的合作多机器人观察下跟踪多个快速移动的回避目标。为此,我们使用分散的搜索和跟踪策略,并具有可调节水平的探索和剥削水平。通过间接调整平衡,我们首先确认这两个关键的竞争动作之间存在最佳平衡。接下来,通过用更快的速度替换较慢的移动剂,我们表明该系统表现出了性能的改进,而无需对原始策略进行任何修改。此外,由于更快的代理商进行了额外的剥削量,我们证明,可以通过降低代理的连接水平来进一步改善异质系统的性能,从而有利于探索性动作的行为。此外,在研究蜂群剂的密度的影响时,我们表明,加快代理的添加可以抵消代理数量的减少,同时保持跟踪性能的水平。最后,我们探索使用差异化策略来利用群体的异质性质的挑战。
translated by 谷歌翻译
在多机器人系统中,任务对单个机器人的适当分配是非常重要的组成部分。集中式基础架构的可用性可以保证任务的最佳分配。但是,在许多重要的情况下,例如搜索和救援,探索,灾难管理,战场等,以分散的方式将动态任务直接分配给机器人。机器人之间的有效交流在任何这样的分散环境中都起着至关重要的作用。现有的关于分布式多机器人任务分配(MRTA)的作品假设网络可用或使用幼稚的通信范例。相反,在大多数情况下,网络基础架构是不稳定的或不可用的,并且临时网络是唯一的度假胜地。在同步传输(ST)的无线通信协议(ST)的最新发展显示,比在临时网络(例如无线传感器网络(WSN)/物联网(IOT)应用程序中的传统异步传输协议(IOT)应用程序中比传统的基于异步传输的协议更有效。当前的工作是将ST用于MRTA的第一项工作。具体而言,我们提出了一种有效调整基于ST的多对多交互的算法,并将信息交换最小化以达成任务分配的共识。我们通过广泛的基于基于模拟的研究在不同的环境下进行了基于模拟的延迟和能源效率来展示拟议算法的功效。
translated by 谷歌翻译
主动位置估计(APE)是使用一个或多个传感平台本地化一个或多个目标的任务。 APE是搜索和拯救任务,野生动物监测,源期限估计和协作移动机器人的关键任务。 APE的成功取决于传感平台的合作水平,他们的数量,他们的自由度和收集的信息的质量。 APE控制法通过满足纯粹剥削或纯粹探索性标准,可以实现主动感测。前者最大限度地减少了位置估计的不确定性;虽然后者驱动了更接近其任务完成的平台。在本文中,我们定义了系统地分类的主要元素,并批判地讨论该域中的最新状态。我们还提出了一个参考框架作为对截图相关的解决方案的形式主义。总体而言,本调查探讨了主要挑战,并设想了本地化任务的自主感知系统领域的主要研究方向。促进用于搜索和跟踪应用的强大主动感测方法的开发也有益。
translated by 谷歌翻译
分散的多机器人目标跟踪的问题要求共同选择动作,例如运动原语,以使机器人通过本地通信最大化目标跟踪性能。实施实施的一个主要挑战是使目标跟踪方法可扩展到大规模的问题实例。在这项工作中,我们提出了通用学习体系结构,以通过分散的通信进行大规模的协作目标跟踪。特别是,我们的学习体系结构利用图形神经网络(GNN)捕获机器人的本地互动,并学习机器人的分散决策。我们通过模仿专家解决方案来训练学习模型,并实施仅涉及本地观察和沟通的分散行动选择的最终模型。我们在使用大型机器人网络的主动目标跟踪方案中演示了基于GNN的学习方法的性能。仿真结果表明,我们的方法几乎与专家算法的跟踪性能相匹配,但最多可以使用多达100个机器人运行多个订单。此外,它的表现略高于分散的贪婪算法,但运行速度更快(尤其是20多个机器人)。结果还显示了我们在以前看不见的情况下的方法的概括能力,例如,较大的环境和较大的机器人网络。
translated by 谷歌翻译
本文介绍了适用于各种实用多机器人应用的分布式算法。在这种多机器人应用中,使命的用户定义目标可以作为一般优化问题投射,而无需每个不同机器人的子任务的明确指南。由于环境未知,未知的机器人动态,传感器非线性等,优化成本函数的分析形式不可用。因此,标准梯度 - 下降样算法不适用于这些问题。为了解决这个问题,我们介绍了一种新的算法,仔细设计每个机器人的子变速功能,优化可以实现整个团队目标。在该转换时,我们提出了一种基于基于认知的自适应优化(CAO)算法的分布式方法,其能够近似每个机器人成本函数的演变并充分优化其决策变量(机器人动作)。后者可以通过在线学习来实现影响特派团目标的特定特定特征。总体而言,低复杂性算法可以简单地结合任何类型的操作约束,是容错的,并且可以适当地解决时变的成本函数。这种方法的基石是它与块坐标血管下降算法相同的收敛特征。该算法在多种方案下的三个异构模拟设置中评估,针对通用和特定于问题的算法。源代码可在\ url {https://github.com/athakapo/a-distributed-plug-lobot-applications}中获得。
translated by 谷歌翻译
共识算法通过使多个机器人能够收敛到仅使用本地通信的全局变量的一致估计来构成许多分布式算法的基础。但是,标准共识协议可以轻松地由非合作团队成员误入歧途。因此,对于设计弹性分布式算法是必要的,对共识的弹性形式的研究是必要的。 W-MSR共识是一种这样的有弹性共识算法,它允许仅具有通信图的本地知识,而没有用于共享数据的先验模型。但是,给定通信图满足严格的图形连接要求的验证使W-MSR在实践中难以使用。在本文中,我们显示了机器人文献中常用的通信图结构,即基于Voronoi Tessellation构建的通信图,自动产生足够连接的图以拒绝单个非合作团队成员。此外,我们展示了如何增强该图,以拒绝两个非合作团队成员,并为修改进一步的弹性提供路线图。这项贡献将允许在已经依赖基于Voronoi的通信(例如分布式覆盖范围和探索算法)的算法中轻松应用弹性共识。
translated by 谷歌翻译
我们在执行姿势图优化(PGO)的机器人团队中提供了一份新颖的合作框架,该团队解决了解决多机器人SLAM的两个重要挑战:i)通过在不使用地图的情况下通过活动的Rendezvous实现信息交换“按需”的两个重要挑战机器人的位置和ii)拒绝偏远的测量。我们的主要洞察力是利用机器人之间的通信信道中存在的相对位置数据来提高PGO的基地精度。我们开发一种用于将信道状态信息(CSI)与多机器人PGO集成的算法和实验框架;它是分布式的,适用于低灯或无特色环境,传统传感器经常失败。我们对实际机器人提供了广泛的实验结果,并观察了使用活跃的Rendezvous导致在地面真理姿势错误的64%减少中,使用CSI观察援助异常拒绝将地面真理造成错误减少32%。这些结果表明,将通信作为新颖的Slam传感器集成的可能性。
translated by 谷歌翻译