群机器人执行觅食任务的适用性受其紧凑的尺寸和成本的启发。需要相当大量的能量来执行这些任务,特别是如果任务是连续和/或重复的。现实世界的情况,其中机器人在保持活力(生存能力)时连续执行任务,并最大限度地提高生产(性能)需要能量意识。本文提出了一种能够有意识的分布式任务分配算法来解决连续任务(例如,无限觅食),用于合作机器人以实现高效的任务。当食物返回收集箱时,我们将效率视为机器人在勘探和收集期间消耗的能量的函数。最后,所提出的节能算法最小化了充电站的总传输时间和在充电时消耗的时间消耗,最大化机器人的寿命,以执行最大的任务,以提高协作机器人的整体效率。我们对典型的贪婪基准战略(将最近的收藏箱分配给可用机器人的最近的收集箱并最大充电)效率和性能在各种方案中的效率和性能。拟议的方法显着提高了基线方法的性能和效率。
translated by 谷歌翻译
多个代理的分布式任务分配引发了基本和新的控制理论和机器人问题。新的挑战是开发分布式算法,它动态地将任务分配给多个代理,而不是依赖于先前的分配信息。这项工作提出了一种基于消息到期的验证方法的多机器人任务管理的分布式方法。我们的方法通过使用基于距离和时间戳的测量来处理分布式多机器人系统中的断开引起的冲突,以验证每个机器人的任务分配。机器人模拟器平台中的仿真实验已经验证了所提出的方法的有效性。
translated by 谷歌翻译
我们为仓库环境中的移动机器人提供基于新颖的强化学习(RL)任务分配和分散的导航算法。我们的方法是针对各种机器人执行各种接送和交付任务的场景而设计的。我们考虑了联合分散任务分配和导航的问题,并提出了解决该问题的两层方法。在更高级别,我们通过根据马尔可夫决策过程制定任务并选择适当的奖励来最大程度地减少总旅行延迟(TTD)来解决任务分配。在较低级别,我们使用基于ORCA的分散导航方案,使每个机器人能够独立执行这些任务,并避免与其他机器人和动态障碍物发生碰撞。我们通过定义较高级别的奖励作为低级导航算法的反馈来结合这些下层和上层。我们在复杂的仓库布局中进行了广泛的评估,并具有大量代理商,并根据近视拾取距离距离最小化和基于遗憾的任务选择,突出了对最先进算法的好处。我们观察到任务完成时间的改善高达14%,并且在计算机器人的无碰撞轨迹方面提高了40%。
translated by 谷歌翻译
本文考虑了安全协调一个配备传感器的机器人团队的问题,以减少有关动态过程的不确定性,而该过程将使目标消除信息增益和能源成本。优化这种权衡是可取的,但是在机器人轨迹集中导致非占主酮目标函数。因此,基于协调下降的普通多机器人计划者失去了其性能保证。此外,处理非单调性的方法在受到机器人间碰撞避免约束时会失去其性能保证。由于需要保留性能保证和安全保证,这项工作提出了一种分布式计划者的层次结构方法,该方法使用本地搜索,并根据控制屏障功能提供了基于控制屏障功能的当地搜索和分散的控制器,以确保安全并鼓励及时到达传感位置。通过大量的模拟,硬件测试和硬件实验,我们证明了所提出的方法比基于坐标下降的算法在感应和能源成本之间取得更好的权衡。
translated by 谷歌翻译
在多机器人系统中,任务对单个机器人的适当分配是非常重要的组成部分。集中式基础架构的可用性可以保证任务的最佳分配。但是,在许多重要的情况下,例如搜索和救援,探索,灾难管理,战场等,以分散的方式将动态任务直接分配给机器人。机器人之间的有效交流在任何这样的分散环境中都起着至关重要的作用。现有的关于分布式多机器人任务分配(MRTA)的作品假设网络可用或使用幼稚的通信范例。相反,在大多数情况下,网络基础架构是不稳定的或不可用的,并且临时网络是唯一的度假胜地。在同步传输(ST)的无线通信协议(ST)的最新发展显示,比在临时网络(例如无线传感器网络(WSN)/物联网(IOT)应用程序中的传统异步传输协议(IOT)应用程序中比传统的基于异步传输的协议更有效。当前的工作是将ST用于MRTA的第一项工作。具体而言,我们提出了一种有效调整基于ST的多对多交互的算法,并将信息交换最小化以达成任务分配的共识。我们通过广泛的基于基于模拟的研究在不同的环境下进行了基于模拟的延迟和能源效率来展示拟议算法的功效。
translated by 谷歌翻译
在移动机器人学中,区域勘探和覆盖率是关键能力。在大多数可用研究中,共同的假设是全球性,远程通信和集中合作。本文提出了一种新的基于群的覆盖控制算法,可以放松这些假设。该算法组合了两个元素:Swarm规则和前沿搜索算法。受到大量简单代理(例如,教育鱼,植绒鸟类,蜂拥昆虫)的自然系统的启发,第一元素使用三个简单的规则来以分布式方式维持群体形成。第二元素提供了选择有希望区域以使用涉及代理的相对位置的成本函数的最小化来探索(和覆盖)的装置。我们在不同环境中测试了我们的方法对异质和同质移动机器人的性能。我们衡量覆盖性能和允许本集团维持沟通的覆盖性能和群体形成统计数据。通过一系列比较实验,我们展示了拟议的策略在最近提出的地图覆盖方法和传统的人工潜在领域基于细胞覆盖,转变和安全路径的百分比,同时保持允许短程的形成沟通。
translated by 谷歌翻译
我们提出了一种基于新颖的增强学习算法,用于仓库环境中的多机器人任务分配问题。我们将其作为马尔可夫的决策过程提出,并通过一种新颖的深度多代理强化学习方法(称为RTAW)解决了启发性的政策体系结构。因此,我们提出的策略网络使用独立于机器人/任务数量的全局嵌入。我们利用近端政策优化算法进行培训,并使用精心设计的奖励来获得融合的政策。融合的政策确保了不同机器人之间的合作,以最大程度地减少总旅行延迟(TTD),这最终改善了Makepan的大型任务列表。在我们的广泛实验中,我们将RTAW算法的性能与最先进的方法进行了比较,例如近视皮卡最小化(Greedy)和基于遗憾的基于不同导航方案的基线。在TTD中,我们在TTD中显示了最高14%(25-1000秒)的情况,这些方案具有数百或数千个任务,用于不同挑战性的仓库布局和任务生成方案。我们还通过在模拟中显示高达$ 1000 $的机器人的性能来证明我们的方法的可扩展性。
translated by 谷歌翻译
We consider task allocation for multi-object transport using a multi-robot system, in which each robot selects one object among multiple objects with different and unknown weights. The existing centralized methods assume the number of robots and tasks to be fixed, which is inapplicable to scenarios that differ from the learning environment. Meanwhile, the existing distributed methods limit the minimum number of robots and tasks to a constant value, making them applicable to various numbers of robots and tasks. However, they cannot transport an object whose weight exceeds the load capacity of robots observing the object. To make it applicable to various numbers of robots and objects with different and unknown weights, we propose a framework using multi-agent reinforcement learning for task allocation. First, we introduce a structured policy model consisting of 1) predesigned dynamic task priorities with global communication and 2) a neural network-based distributed policy model that determines the timing for coordination. The distributed policy builds consensus on the high-priority object under local observations and selects cooperative or independent actions. Then, the policy is optimized by multi-agent reinforcement learning through trial and error. This structured policy of local learning and global communication makes our framework applicable to various numbers of robots and objects with different and unknown weights, as demonstrated by numerical simulations.
translated by 谷歌翻译
尽管使用多个无人机(UAV)具有快速自主探索的巨大潜力,但它的关注程度很少。在本文中,我们提出了赛车手,这是一种使用分散无人机的舰队的快速协作探索方法。为了有效派遣无人机,使用了基于在线HGRID空间分解的成对交互。它可确保仅使用异步和有限的通信同时探索不同的区域。此外,我们优化了未知空间的覆盖路径,并通过电容的车辆路由问题(CVRP)配方平衡分区到每个UAV的工作负载。鉴于任务分配,每个无人机都会不断更新覆盖路径,并逐步提取关键信息以支持探索计划。分层规划师可以找到探索路径,完善本地观点并生成序列的最小时间轨迹,以敏捷,安全地探索未知空间。对所提出的方法进行了广泛的评估,显示出较高的勘探效率,可伸缩性和对有限交流的鲁棒性。此外,我们第一次与现实世界中的多个无人机进行了完全分散的协作探索。我们将作为开源软件包发布实施。
translated by 谷歌翻译
在本文中,我们为全向机器人提供了一种积极的视觉血液。目标是生成允许这样的机器人同时定向机器人的控制命令并将未知环境映射到最大化的信息量和消耗尽可能低的信息。利用机器人的独立翻译和旋转控制,我们引入了一种用于活动V-SLAM的多层方法。顶层决定提供信息丰富的目标位置,并为它们产生高度信息的路径。第二个和第三层积极地重新计划并执行路径,利用连续更新的地图和本地特征信息。此外,我们介绍了两个实用程序配方,以解释视野和机器人位置的障碍物。通过严格的模拟,真正的机器人实验和与最先进的方法的比较,我们证明我们的方法通过较小的整体地图熵实现了类似的覆盖结果。这是可以获得的,同时保持横向距离比其他方法短至39%,而不增加车轮的总旋转量。代码和实现详细信息作为开源提供。
translated by 谷歌翻译
在异构机器人网络上进行计算负载共享是一个有希望的方法,可以将机器人能力和效率作为极端环境中的团队提高。然而,在这种环境中,通信链路可以是间歇性的,并且与云或因特网的连接可能是不存在的。在本文中,我们介绍了用于多机器人系统的通信感知,计算任务调度问题,并提出了整数线性程序(ILP),该程序(ILP)优化了异构机器人网络中的计算任务分配,占网络机器人的计算能力对于可用(和可能的时变)通信链接。我们考虑调度由依赖关系图建模的一组相互依赖的必需任务和可选任务。我们为共享世界,分布式系统提供了一项备份的调度架构。我们验证了ILP制定和不同计算平台中的分布式实现,并在模拟场景中,偏向于月球或行星探索方案。我们的研究结果表明,与没有计算负载共享的类似系统相比,所提出的实施方式可以优化提高时间表以允许三倍增加所执行的奖励任务的数量(例如,科学测量)。
translated by 谷歌翻译
本文提出了一种新颖的方法,用于在具有复杂拓扑结构的地下领域的搜索和救援行动中自动合作。作为CTU-Cras-Norlab团队的一部分,拟议的系统在DARPA SubT决赛的虚拟轨道中排名第二。与专门为虚拟轨道开发的获奖解决方案相反,该建议的解决方案也被证明是在现实世界竞争极为严峻和狭窄的环境中飞行的机上实体无人机的强大系统。提出的方法可以使无缝模拟转移的无人机团队完全自主和分散的部署,并证明了其优于不同环境可飞行空间的移动UGV团队的优势。该论文的主要贡献存在于映射和导航管道中。映射方法采用新颖的地图表示形式 - 用于有效的风险意识长距离计划,面向覆盖范围和压缩的拓扑范围的LTVMAP领域,以允许在低频道通信下进行多机器人合作。这些表示形式与新的方法一起在导航中使用,以在一般的3D环境中可见性受限的知情搜索,而对环境结构没有任何假设,同时将深度探索与传感器覆盖的剥削保持平衡。所提出的解决方案还包括一条视觉感知管道,用于在没有专用GPU的情况下在5 Hz处进行四个RGB流中感兴趣的对象的板上检测和定位。除了参与DARPA SubT外,在定性和定量评估的各种环境中,在不同的环境中进行了广泛的实验验证,UAV系统的性能得到了支持。
translated by 谷歌翻译
这项研究提出了一种分布式算法,该算法通过自动决策,平滑的羊群和分布良好的捕获来使代理的自适应分组捕获多个目标。代理商根据环境信息做出自己的决定。提出了一种改进的人工潜在方法,以使代理能够平稳自然地改变形成以适应环境。拟议的策略确保了群体的协调发展在群体上陷入多个目标的现象。我们使用仿真实验和设计指标来验证提出方法的性能,以分析这些模拟和物理实验。
translated by 谷歌翻译
使用团队或机器人联盟的任务分配是机器人技术,计算机科学,运营研究和人工智能中最重要的问题之一。在最近的工作中,研究集中在处理复杂的目标和可行性限制之间,这是多机器人任务分配问题的其他变化。在这些方向上有许多重要的研究进展的例子。我们提出了任务分配问题的一般表述,该问题概括了几个经过充分研究的版本。我们的表述包括机器人,任务和其操作周围环境的状态。我们描述问题如何根据可行性约束,目标函数和动态变化信息的水平而变化。此外,我们讨论了有关该问题的现有解决方案方法,包括基于优化的方法和基于市场的方法。
translated by 谷歌翻译
如果我们给机器人将对象从其当前位置移至未知环境中的另一个位置的任务,则机器人必须探索地图,确定所有类型的障碍物,然后确定完成任务的最佳途径。我们提出了一个数学模型,以找到一个最佳的路径计划,以避免与所有静态和移动障碍物发生冲突,并具有最小的完成时间和最小距离。在此模型中,不考虑障碍物和机器人周围的边界框,因此机器人可以在不与它们相撞的情况下非常接近障碍物移动。我们考虑了两种类型的障碍:确定性,其中包括所有静态障碍,例如不移动的墙壁以及所有动作具有固定模式和非确定性的移动障碍,其中包括所有障碍物,其运动都可以在任何方向上发生任何方向发生概率分布随时。我们还考虑了机器人的加速和减速,以改善避免碰撞的速度。
translated by 谷歌翻译
本文介绍了一种可以在非通信和局部可观察条件下应用的新型混合多机器人运动计划。策划员是无模型的,可以实现多机器人状态和观察信息的端到端映射到最终平滑和连续的轨迹。规划师是前端和后端分离的架构。前端协作航点搜索模块的设计基于具有分散执行图的集中培训下的多代理软演员批评算法。后端轨迹优化模块的设计基于具有安全区域约束的最小快照方法。该模块可以输出最终动态可行和可执行的轨迹。最后,多组实验结果验证了拟议的运动计划员的有效性。
translated by 谷歌翻译
主动位置估计(APE)是使用一个或多个传感平台本地化一个或多个目标的任务。 APE是搜索和拯救任务,野生动物监测,源期限估计和协作移动机器人的关键任务。 APE的成功取决于传感平台的合作水平,他们的数量,他们的自由度和收集的信息的质量。 APE控制法通过满足纯粹剥削或纯粹探索性标准,可以实现主动感测。前者最大限度地减少了位置估计的不确定性;虽然后者驱动了更接近其任务完成的平台。在本文中,我们定义了系统地分类的主要元素,并批判地讨论该域中的最新状态。我们还提出了一个参考框架作为对截图相关的解决方案的形式主义。总体而言,本调查探讨了主要挑战,并设想了本地化任务的自主感知系统领域的主要研究方向。促进用于搜索和跟踪应用的强大主动感测方法的开发也有益。
translated by 谷歌翻译
对于多机器人系统的安全有效运行,通信连接是可取的。尽管最近的文献中已经探讨了用于连接性维持的分散算法,但这些作品中的大多数并没有说明机器人运动和感知不确定性。这些不确定性是实际机器人固有的,并导致机器人偏离其所需位置,这可能会导致连通性丧失。在本文中,我们提出了一种分散的连接维护算法,该算法会计机器人运动和感知不确定性(DCMU)。我们首先为多机器人系统提出了一个新颖的加权图定义,该定义说明了上述不确定性以及现实的连接性约束,例如视线连接性和避免碰撞。接下来,我们设计了一个基于分散梯度的控制器,用于连接维护,在该控制器中,我们得出了计算控件所需的加权图边缘权重的梯度。最后,我们执行多个模拟,以验证机器人运动下的DCMU算法的连接性维持性能并感知不确定性,并与以前的工作相比显示出改进。
translated by 谷歌翻译
In this paper, we present a solution to a design problem of control strategies for multi-agent cooperative transport. Although existing learning-based methods assume that the number of agents is the same as that in the training environment, the number might differ in reality considering that the robots' batteries may completely discharge, or additional robots may be introduced to reduce the time required to complete a task. Therefore, it is crucial that the learned strategy be applicable to scenarios wherein the number of agents differs from that in the training environment. In this paper, we propose a novel multi-agent reinforcement learning framework of event-triggered communication and consensus-based control for distributed cooperative transport. The proposed policy model estimates the resultant force and torque in a consensus manner using the estimates of the resultant force and torque with the neighborhood agents. Moreover, it computes the control and communication inputs to determine when to communicate with the neighboring agents under local observations and estimates of the resultant force and torque. Therefore, the proposed framework can balance the control performance and communication savings in scenarios wherein the number of agents differs from that in the training environment. We confirm the effectiveness of our approach by using a maximum of eight and six robots in the simulations and experiments, respectively.
translated by 谷歌翻译
多机器人和多代理系统通过系统的局部行为集成在组中表现出集体(Swarm)智能。分享有关任务和环境知识的代理商可以提高个人和任务水平的绩效。但是,这很难实现,部分原因是缺乏用于在代理之间转移一部分知识(行为)的通用框架。本文提出了一个新的知识表示框架和一种称为KT-BT:通过行为树的知识转移的转移策略。 KT-BT框架遵循通过在线行为树框架进行查询反应加速机制,在该框架中,代理对未知条件进行广播查询,并使用条件性能控制子流量以适当的知识做出响应。我们嵌入了一种称为StringBT的新型语法结构,该结构编码知识,从而实现行为共享。从理论上讲,我们研究了KT-BT框架的特性,与异质系统相比,整个小组的高知识同质性具有高度知识的性质,而没有能力共享知识。我们在模拟的多机器人搜索和救援问题中广泛验证了我们的框架。结果表明,在各种情况下,成功传递知识转移并提高了群体绩效。我们进一步研究了机会和沟通范围对一组代理商中群体绩效,知识传播和功能异质性的影响,并提供有趣的见解。
translated by 谷歌翻译