群机器人执行觅食任务的适用性受其紧凑的尺寸和成本的启发。需要相当大量的能量来执行这些任务,特别是如果任务是连续和/或重复的。现实世界的情况,其中机器人在保持活力(生存能力)时连续执行任务,并最大限度地提高生产(性能)需要能量意识。本文提出了一种能够有意识的分布式任务分配算法来解决连续任务(例如,无限觅食),用于合作机器人以实现高效的任务。当食物返回收集箱时,我们将效率视为机器人在勘探和收集期间消耗的能量的函数。最后,所提出的节能算法最小化了充电站的总传输时间和在充电时消耗的时间消耗,最大化机器人的寿命,以执行最大的任务,以提高协作机器人的整体效率。我们对典型的贪婪基准战略(将最近的收藏箱分配给可用机器人的最近的收集箱并最大充电)效率和性能在各种方案中的效率和性能。拟议的方法显着提高了基线方法的性能和效率。
translated by 谷歌翻译
多个代理的分布式任务分配引发了基本和新的控制理论和机器人问题。新的挑战是开发分布式算法,它动态地将任务分配给多个代理,而不是依赖于先前的分配信息。这项工作提出了一种基于消息到期的验证方法的多机器人任务管理的分布式方法。我们的方法通过使用基于距离和时间戳的测量来处理分布式多机器人系统中的断开引起的冲突,以验证每个机器人的任务分配。机器人模拟器平台中的仿真实验已经验证了所提出的方法的有效性。
translated by 谷歌翻译
在异构机器人网络上进行计算负载共享是一个有希望的方法,可以将机器人能力和效率作为极端环境中的团队提高。然而,在这种环境中,通信链路可以是间歇性的,并且与云或因特网的连接可能是不存在的。在本文中,我们介绍了用于多机器人系统的通信感知,计算任务调度问题,并提出了整数线性程序(ILP),该程序(ILP)优化了异构机器人网络中的计算任务分配,占网络机器人的计算能力对于可用(和可能的时变)通信链接。我们考虑调度由依赖关系图建模的一组相互依赖的必需任务和可选任务。我们为共享世界,分布式系统提供了一项备份的调度架构。我们验证了ILP制定和不同计算平台中的分布式实现,并在模拟场景中,偏向于月球或行星探索方案。我们的研究结果表明,与没有计算负载共享的类似系统相比,所提出的实施方式可以优化提高时间表以允许三倍增加所执行的奖励任务的数量(例如,科学测量)。
translated by 谷歌翻译
我们为仓库环境中的移动机器人提供基于新颖的强化学习(RL)任务分配和分散的导航算法。我们的方法是针对各种机器人执行各种接送和交付任务的场景而设计的。我们考虑了联合分散任务分配和导航的问题,并提出了解决该问题的两层方法。在更高级别,我们通过根据马尔可夫决策过程制定任务并选择适当的奖励来最大程度地减少总旅行延迟(TTD)来解决任务分配。在较低级别,我们使用基于ORCA的分散导航方案,使每个机器人能够独立执行这些任务,并避免与其他机器人和动态障碍物发生碰撞。我们通过定义较高级别的奖励作为低级导航算法的反馈来结合这些下层和上层。我们在复杂的仓库布局中进行了广泛的评估,并具有大量代理商,并根据近视拾取距离距离最小化和基于遗憾的任务选择,突出了对最先进算法的好处。我们观察到任务完成时间的改善高达14%,并且在计算机器人的无碰撞轨迹方面提高了40%。
translated by 谷歌翻译
We consider task allocation for multi-object transport using a multi-robot system, in which each robot selects one object among multiple objects with different and unknown weights. The existing centralized methods assume the number of robots and tasks to be fixed, which is inapplicable to scenarios that differ from the learning environment. Meanwhile, the existing distributed methods limit the minimum number of robots and tasks to a constant value, making them applicable to various numbers of robots and tasks. However, they cannot transport an object whose weight exceeds the load capacity of robots observing the object. To make it applicable to various numbers of robots and objects with different and unknown weights, we propose a framework using multi-agent reinforcement learning for task allocation. First, we introduce a structured policy model consisting of 1) predesigned dynamic task priorities with global communication and 2) a neural network-based distributed policy model that determines the timing for coordination. The distributed policy builds consensus on the high-priority object under local observations and selects cooperative or independent actions. Then, the policy is optimized by multi-agent reinforcement learning through trial and error. This structured policy of local learning and global communication makes our framework applicable to various numbers of robots and objects with different and unknown weights, as demonstrated by numerical simulations.
translated by 谷歌翻译
在本文中,我们为全向机器人提供了一种积极的视觉血液。目标是生成允许这样的机器人同时定向机器人的控制命令并将未知环境映射到最大化的信息量和消耗尽可能低的信息。利用机器人的独立翻译和旋转控制,我们引入了一种用于活动V-SLAM的多层方法。顶层决定提供信息丰富的目标位置,并为它们产生高度信息的路径。第二个和第三层积极地重新计划并执行路径,利用连续更新的地图和本地特征信息。此外,我们介绍了两个实用程序配方,以解释视野和机器人位置的障碍物。通过严格的模拟,真正的机器人实验和与最先进的方法的比较,我们证明我们的方法通过较小的整体地图熵实现了类似的覆盖结果。这是可以获得的,同时保持横向距离比其他方法短至39%,而不增加车轮的总旋转量。代码和实现详细信息作为开源提供。
translated by 谷歌翻译
本文考虑了安全协调一个配备传感器的机器人团队的问题,以减少有关动态过程的不确定性,而该过程将使目标消除信息增益和能源成本。优化这种权衡是可取的,但是在机器人轨迹集中导致非占主酮目标函数。因此,基于协调下降的普通多机器人计划者失去了其性能保证。此外,处理非单调性的方法在受到机器人间碰撞避免约束时会失去其性能保证。由于需要保留性能保证和安全保证,这项工作提出了一种分布式计划者的层次结构方法,该方法使用本地搜索,并根据控制屏障功能提供了基于控制屏障功能的当地搜索和分散的控制器,以确保安全并鼓励及时到达传感位置。通过大量的模拟,硬件测试和硬件实验,我们证明了所提出的方法比基于坐标下降的算法在感应和能源成本之间取得更好的权衡。
translated by 谷歌翻译
我们提出了一种基于新颖的增强学习算法,用于仓库环境中的多机器人任务分配问题。我们将其作为马尔可夫的决策过程提出,并通过一种新颖的深度多代理强化学习方法(称为RTAW)解决了启发性的政策体系结构。因此,我们提出的策略网络使用独立于机器人/任务数量的全局嵌入。我们利用近端政策优化算法进行培训,并使用精心设计的奖励来获得融合的政策。融合的政策确保了不同机器人之间的合作,以最大程度地减少总旅行延迟(TTD),这最终改善了Makepan的大型任务列表。在我们的广泛实验中,我们将RTAW算法的性能与最先进的方法进行了比较,例如近视皮卡最小化(Greedy)和基于遗憾的基于不同导航方案的基线。在TTD中,我们在TTD中显示了最高14%(25-1000秒)的情况,这些方案具有数百或数千个任务,用于不同挑战性的仓库布局和任务生成方案。我们还通过在模拟中显示高达$ 1000 $的机器人的性能来证明我们的方法的可扩展性。
translated by 谷歌翻译
在多机器人系统中,任务对单个机器人的适当分配是非常重要的组成部分。集中式基础架构的可用性可以保证任务的最佳分配。但是,在许多重要的情况下,例如搜索和救援,探索,灾难管理,战场等,以分散的方式将动态任务直接分配给机器人。机器人之间的有效交流在任何这样的分散环境中都起着至关重要的作用。现有的关于分布式多机器人任务分配(MRTA)的作品假设网络可用或使用幼稚的通信范例。相反,在大多数情况下,网络基础架构是不稳定的或不可用的,并且临时网络是唯一的度假胜地。在同步传输(ST)的无线通信协议(ST)的最新发展显示,比在临时网络(例如无线传感器网络(WSN)/物联网(IOT)应用程序中的传统异步传输协议(IOT)应用程序中比传统的基于异步传输的协议更有效。当前的工作是将ST用于MRTA的第一项工作。具体而言,我们提出了一种有效调整基于ST的多对多交互的算法,并将信息交换最小化以达成任务分配的共识。我们通过广泛的基于基于模拟的研究在不同的环境下进行了基于模拟的延迟和能源效率来展示拟议算法的功效。
translated by 谷歌翻译
在移动机器人学中,区域勘探和覆盖率是关键能力。在大多数可用研究中,共同的假设是全球性,远程通信和集中合作。本文提出了一种新的基于群的覆盖控制算法,可以放松这些假设。该算法组合了两个元素:Swarm规则和前沿搜索算法。受到大量简单代理(例如,教育鱼,植绒鸟类,蜂拥昆虫)的自然系统的启发,第一元素使用三个简单的规则来以分布式方式维持群体形成。第二元素提供了选择有希望区域以使用涉及代理的相对位置的成本函数的最小化来探索(和覆盖)的装置。我们在不同环境中测试了我们的方法对异质和同质移动机器人的性能。我们衡量覆盖性能和允许本集团维持沟通的覆盖性能和群体形成统计数据。通过一系列比较实验,我们展示了拟议的策略在最近提出的地图覆盖方法和传统的人工潜在领域基于细胞覆盖,转变和安全路径的百分比,同时保持允许短程的形成沟通。
translated by 谷歌翻译
本文提出了一种新颖的方法,用于在具有复杂拓扑结构的地下领域的搜索和救援行动中自动合作。作为CTU-Cras-Norlab团队的一部分,拟议的系统在DARPA SubT决赛的虚拟轨道中排名第二。与专门为虚拟轨道开发的获奖解决方案相反,该建议的解决方案也被证明是在现实世界竞争极为严峻和狭窄的环境中飞行的机上实体无人机的强大系统。提出的方法可以使无缝模拟转移的无人机团队完全自主和分散的部署,并证明了其优于不同环境可飞行空间的移动UGV团队的优势。该论文的主要贡献存在于映射和导航管道中。映射方法采用新颖的地图表示形式 - 用于有效的风险意识长距离计划,面向覆盖范围和压缩的拓扑范围的LTVMAP领域,以允许在低频道通信下进行多机器人合作。这些表示形式与新的方法一起在导航中使用,以在一般的3D环境中可见性受限的知情搜索,而对环境结构没有任何假设,同时将深度探索与传感器覆盖的剥削保持平衡。所提出的解决方案还包括一条视觉感知管道,用于在没有专用GPU的情况下在5 Hz处进行四个RGB流中感兴趣的对象的板上检测和定位。除了参与DARPA SubT外,在定性和定量评估的各种环境中,在不同的环境中进行了广泛的实验验证,UAV系统的性能得到了支持。
translated by 谷歌翻译
尽管使用多个无人机(UAV)具有快速自主探索的巨大潜力,但它的关注程度很少。在本文中,我们提出了赛车手,这是一种使用分散无人机的舰队的快速协作探索方法。为了有效派遣无人机,使用了基于在线HGRID空间分解的成对交互。它可确保仅使用异步和有限的通信同时探索不同的区域。此外,我们优化了未知空间的覆盖路径,并通过电容的车辆路由问题(CVRP)配方平衡分区到每个UAV的工作负载。鉴于任务分配,每个无人机都会不断更新覆盖路径,并逐步提取关键信息以支持探索计划。分层规划师可以找到探索路径,完善本地观点并生成序列的最小时间轨迹,以敏捷,安全地探索未知空间。对所提出的方法进行了广泛的评估,显示出较高的勘探效率,可伸缩性和对有限交流的鲁棒性。此外,我们第一次与现实世界中的多个无人机进行了完全分散的协作探索。我们将作为开源软件包发布实施。
translated by 谷歌翻译
使用团队或机器人联盟的任务分配是机器人技术,计算机科学,运营研究和人工智能中最重要的问题之一。在最近的工作中,研究集中在处理复杂的目标和可行性限制之间,这是多机器人任务分配问题的其他变化。在这些方向上有许多重要的研究进展的例子。我们提出了任务分配问题的一般表述,该问题概括了几个经过充分研究的版本。我们的表述包括机器人,任务和其操作周围环境的状态。我们描述问题如何根据可行性约束,目标函数和动态变化信息的水平而变化。此外,我们讨论了有关该问题的现有解决方案方法,包括基于优化的方法和基于市场的方法。
translated by 谷歌翻译
Smart City applications, such as traffic monitoring and disaster response, often use swarms of intelligent and cooperative drones to efficiently collect sensor data over different areas of interest and time spans. However, when the required sensing becomes spatio-temporally large and varying, a collective arrangement of sensing tasks to a large number of battery-restricted and distributed drones is challenging. To address this problem, we introduce a scalable and energy-aware model for planning and coordination of spatio-temporal sensing. The coordination model is built upon a decentralized multi-agent collective learning algorithm (EPOS) to ensure scalability, resilience, and flexibility that existing approaches lack of. Experimental results illustrate the outstanding performance of the proposed method compared to state-of-the-art methods. Analytical results contribute a deeper understanding of how coordinated mobility of drones influences sensing performance. This novel coordination solution is applied to traffic monitoring using real-world data to demonstrate a $46.45\%$ more accurate and $2.88\%$ more efficient detection of vehicles as the number of drones become a scarce resource.
translated by 谷歌翻译
主动位置估计(APE)是使用一个或多个传感平台本地化一个或多个目标的任务。 APE是搜索和拯救任务,野生动物监测,源期限估计和协作移动机器人的关键任务。 APE的成功取决于传感平台的合作水平,他们的数量,他们的自由度和收集的信息的质量。 APE控制法通过满足纯粹剥削或纯粹探索性标准,可以实现主动感测。前者最大限度地减少了位置估计的不确定性;虽然后者驱动了更接近其任务完成的平台。在本文中,我们定义了系统地分类的主要元素,并批判地讨论该域中的最新状态。我们还提出了一个参考框架作为对截图相关的解决方案的形式主义。总体而言,本调查探讨了主要挑战,并设想了本地化任务的自主感知系统领域的主要研究方向。促进用于搜索和跟踪应用的强大主动感测方法的开发也有益。
translated by 谷歌翻译
在机器人学中,数据采集通常扮演未知环境探索的关键部分。例如,存储有关探索地形的地形或环境中的自然危险的信息可以通知机器人的决策过程。因此,对这些数据安全地存储这些数据至关重要,并使其能够快速提供给机器人系统的运营商。在分散的系统中,如一群机器人,这需要几个挑战。要解决它们,我们提出了rass,一个分散的风险感知群体存储和路由机制,它专门依赖于邻居之间的本地信息共享,以建立存储和路由健身。我们通过基于物理模拟器的彻底实验测试我们的系统,并使用物理实验测试其现实世界的适用性。我们获得了令人信服的可靠性,路由速度和群体存储容量结果。
translated by 谷歌翻译
Path planning in the multi-robot system refers to calculating a set of actions for each robot, which will move each robot to its goal without conflicting with other robots. Lately, the research topic has received significant attention for its extensive applications, such as airport ground, drone swarms, and automatic warehouses. Despite these available research results, most of the existing investigations are concerned with the cases of robots with a fixed movement speed without considering uncertainty. Therefore, in this work, we study the problem of path-planning in the multi-robot automatic warehouse context, which considers the time-varying and uncertain robots' movement speed. Specifically, the path-planning module searches a path with as few conflicts as possible for a single agent by calculating traffic cost based on customarily distributed conflict probability and combining it with the classic A* algorithm. However, this probability-based method cannot eliminate all conflicts, and speed's uncertainty will constantly cause new conflicts. As a supplement, we propose the other two modules. The conflict detection and re-planning module chooses objects requiring re-planning paths from the agents involved in different types of conflicts periodically by our designed rules. Also, at each step, the scheduling module fills up the agent's preserved queue and decides who has a higher priority when the same element is assigned to two agents simultaneously. Finally, we compare the proposed algorithm with other algorithms from academia and industry, and the results show that the proposed method is validated as the best performance.
translated by 谷歌翻译
在带有电动车队的乘车系统中,充电是一个复杂的决策过程。大多数电动汽车(EV)出租车服务要求驾驶员做出利己主义决定,从而导致分散的临时充电策略。车辆之间通常缺乏或不共享移动性系统的当前状态,因此无法做出最佳的决定。大多数现有方法都不将时间,位置和持续时间结合到全面的控制算法中,也不适合实时操作。因此,我们提出了一种实时预测性充电方法,用于使用一个名为“闲置时间开发(ITX)”的单个操作员进行乘车服务,该方法预测了车辆闲置并利用这些时期来收获能量的时期。它依靠图形卷积网络和线性分配算法来设计最佳的车辆和充电站配对,以最大程度地提高利用的空闲时间。我们通过对纽约市现实世界数据集的广泛模拟研究评估了我们的方法。结果表明,就货币奖励功能而言,ITX的表现优于所有基线方法至少提高5%(相当于6,000个车辆操作的$ 70,000),该奖励奖励功能的建模旨在复制现实世界中乘车系统的盈利能力。此外,与基线方法相比,ITX可以将延迟至少减少4.68%,并且通常通过促进顾客在整个车队中更好地传播乘客的舒适度。我们的结果还表明,ITX使车辆能够在白天收获能量,稳定电池水平,并增加需求意外激增的弹性。最后,与表现最佳的基线策略相比,峰值负载减少了17.39%,这使网格操作员受益,并为更可持续的电网使用铺平了道路。
translated by 谷歌翻译
在多机器人合作(MRC)系统中部署移动边缘计算(MEC)部署是在能耗和实现延迟方面完成任务的有效方法。然而,需要共同考虑计算和通信资源以充分利用MEC技术所带来的优势。在本文中,研究了多个机器人协作完成时间关键任务的情况,其中智能主机器人(MR)充当边缘服务器,以向多个从机器人(SRS)提供服务,并且SRS负责环境传感和数据收集。为了节省能源并延长系统的函数时间,提出了两种方案,分别优化计算和通信资源。在第一种方案中,SRS的能量消耗最小化和平衡,同时保证在时间约束下完成任务。在第二种方案中,不仅可以消耗能耗,而且认为SRS的剩余能量被认为是增强系统的鲁棒性。通过分析和数值模拟,我们证明即使第一策略可以保证对总SRS能耗的最小化,MRC系统的函数时间比第一个策略更长。
translated by 谷歌翻译
本文介绍了适用于各种实用多机器人应用的分布式算法。在这种多机器人应用中,使命的用户定义目标可以作为一般优化问题投射,而无需每个不同机器人的子任务的明确指南。由于环境未知,未知的机器人动态,传感器非线性等,优化成本函数的分析形式不可用。因此,标准梯度 - 下降样算法不适用于这些问题。为了解决这个问题,我们介绍了一种新的算法,仔细设计每个机器人的子变速功能,优化可以实现整个团队目标。在该转换时,我们提出了一种基于基于认知的自适应优化(CAO)算法的分布式方法,其能够近似每个机器人成本函数的演变并充分优化其决策变量(机器人动作)。后者可以通过在线学习来实现影响特派团目标的特定特定特征。总体而言,低复杂性算法可以简单地结合任何类型的操作约束,是容错的,并且可以适当地解决时变的成本函数。这种方法的基石是它与块坐标血管下降算法相同的收敛特征。该算法在多种方案下的三个异构模拟设置中评估,针对通用和特定于问题的算法。源代码可在\ url {https://github.com/athakapo/a-distributed-plug-lobot-applications}中获得。
translated by 谷歌翻译