本文为多代理系统开发了一个随机编程框架,在该系统中,任务分解,分配和调度问题同时被优化。该框架可以应用于具有分布式子任务的异质移动机器人团队。例子包括大流行机器人服务协调,探索和救援以及具有异质车辆的交付系统。由于其固有的灵活性和鲁棒性,多代理系统被应用于越来越多的现实问题,涉及异质任务和不确定信息。大多数以前的作品都采用一种将任务分解为角色的独特方法,以后可以将任务分配给代理。对于角色可以变化并且存在多个分解结构的复杂任务,此假设无效。同时,尚不清楚如何在多代理系统设置下系统地量化和优化任务要求和代理能力中的不确定性。提出了复杂任务的表示形式:代理功能表示为随机分布的向量,任务要求通过可推广的二进制函数验证。在目标函数中选择有风险的条件值(CVAR)作为制定强大计划的度量。描述了一种有效的算法来解决该模型,并在两个不同的实践案例中评估了整个框架:在大流行期间的捕获量和机器人服务协调(例如,Covid-19)。结果表明,该框架是可扩展的,可扩展到示例案例的140个代理和40个任务,并提供了低成本计划,以确保成功的概率很高。
translated by 谷歌翻译
This paper presents a learning framework to estimate an agent capability and task requirement model for multi-agent task allocation. With a set of team configurations and the corresponding task performances as the training data, linear task constraints can be learned to be embedded in many existing optimization-based task allocation frameworks. Comprehensive computational evaluations are conducted to test the scalability and prediction accuracy of the learning framework with a limited number of team configurations and performance pairs. A ROS and Gazebo-based simulation environment is developed to validate the proposed requirements learning and task allocation framework in practical multi-agent exploration and manipulation tasks. Results show that the learning process for scenarios with 40 tasks and 6 types of agents uses around 12 seconds, ending up with prediction errors in the range of 0.5-2%.
translated by 谷歌翻译
疏散计划是灾难管理的关键部分,其目标是将人员搬迁到安全和减少伤亡。每个疏散计划都有两个基本组件:路由和调度。但是,这两个组件与目标的联合优化,例如最大程度地减少平均疏散时间或疏散完成时间,这是一个计算问题上的问题。为了解决它,我们提出了MIP-LNS,这是一种可扩展的优化方法,将启发式搜索与数学优化结合在一起,并可以优化各种目标函数。我们使用来自德克萨斯州休斯敦的哈里斯县的现实世界道路网络和人口数据,并应用MIP-LNS来查找该地区的疏散路线和时间表。我们表明,在给定的时间限制内,我们提出的方法在平均疏散时间,疏散完成时间和解决方案的最佳保证方面找到了比现有方法更好的解决方案。我们在研究区域进行基于代理的疏散模拟,以证明解决方案的功效和鲁棒性。我们表明,即使撤离人员在一定程度上偏离了建议的时间表,我们的规定疏散计划仍然有效。我们还研究了疏散计划如何受到道路故障的影响。我们的结果表明,MIP-LN可以使用有关道路估计截止日期的信息,以成功,方便地撤离更多人,以提出更好的疏散计划。
translated by 谷歌翻译
复杂的多目标任务需要在多个相互连接的级别(例如联盟形成,调度和运动计划)上协调异质机器人。动态变化(例如传感器和执行器故障,通信损失和意外延迟)加剧了这一挑战。我们将动态迭代任务分配图搜索(D-ITAGS)介绍到\ textit {同时}地址在涉及异构团队的动态设置中,地址为联盟组建,调度和运动计划。 D-Itag通过两个关键特征实现弹性:i)交错执行,ii)有针对性的维修。 \ textIt {交错执行}可以在每一层进行有效搜索解决方案,同时避免与其他层不兼容。 \ textIt {目标修复}识别并修复了现有解决方案的一部分,该解决方案在保存其余部分的同时受到给定破坏的影响。除了算法贡献外,我们还提供理论上的见解,以了解这些设置中时间和资源最优性之间固有的权衡,并在计划次级临时性上得出有意义的界限。我们的实验表明,在动态设置中,i)d-itag的速度明显比从头开始的重新计算要快得多,而溶液质量几乎没有损失,ii)理论次优界在实践中始终保持。
translated by 谷歌翻译
在以并发方式解决团队范围的任务时,多机构系统可能非常有效。但是,如果没有正确的同步,则很难保证合并行为的正确性,例如遵循子任务的特定顺序或同时进行协作。这项工作解决了在复杂的全球任务下,将最低时间的任务计划问题称为线性时间逻辑(LTL)公式。这些任务包括独立本地动作和直接子团队合作的时间和空间要求。提出的解决方案是一种随时随地的算法,结合了对任务分解的基础任务自动机的部分顺序分析,以及用于任务分配的分支和绑定(BNB)搜索方法。提供最小的完成时间的合理性,完整性和最佳性分析。还表明,在搜索范围内持续在时间预算之内,可以迅速达成可行且近乎最佳的解决方案。此外,为了处理在线执行期间任务持续时间和代理失败的波动,提出了适应算法来同步执行状态并动态地重新分配未完成的子任务以保持正确性和最佳性。两种算法通过数值模拟和硬件实验在大规模系统上进行了严格的验证,该算法对几个强基地进行了验证。
translated by 谷歌翻译
我们为多机器人任务计划和分配问题提出了一种新的公式,该公式结合了(a)任务之间的优先关系; (b)任务的协调,允许多个机器人提高效率; (c)通过形成机器人联盟的任务合作,而单独的机器人不能执行。在我们的公式中,任务图指定任务和任务之间的关系。我们在任务图的节点和边缘上定义了一组奖励函数。这些功能对机器人联盟规模对任务绩效的影响进行建模,并结合一个任务的性能对依赖任务的影响。最佳解决此问题是NP-HARD。但是,使用任务图公式使我们能够利用最小成本的网络流量方法有效地获得近似解决方案。此外,我们还探索了一种混合整数编程方法,该方法为问题的小实例提供了最佳的解决方案,但计算上很昂贵。我们还开发了一种贪婪的启发式算法作为基准。我们的建模和解决方案方法导致任务计划,即使在与许多代理商的大型任务中,也利用任务优先关系的关系以及机器人的协调和合作来实现高级任务绩效。
translated by 谷歌翻译
我们研究了合作航空航天车辆路线应用程序的资源分配问题,其中多个无人驾驶汽车(UAV)电池容量有限和多个无人接地车辆(UGV),这也可以充当移动充电站,需要共同实现诸如持续监视一组要点之类的任务。由于无人机的电池能力有限,他们有时必须偏离任务才能与UGV进行集合并得到充电。每个UGV一次可以一次提供有限数量的无人机。与确定性多机器人计划的先前工作相反,我们考虑了无人机能源消耗的随机性所带来的挑战。我们有兴趣找到无人机的最佳充电时间表,从而最大程度地减少了旅行成本,并且在计划范围内没有任何无人机在计划范围内取消收费的可能性大于用户定义的公差。我们将此问题({风险意识召集集合问题(RRRP))}作为整数线性程序(ILP),其中匹配的约束捕获资源可用性约束,而背包约束捕获了成功概率约束。我们提出了一种求解RRRP的双晶格近似算法。在一个持续监测任务的背景下,我们证明了我们的制定和算法的有效性。
translated by 谷歌翻译
在异构机器人网络上进行计算负载共享是一个有希望的方法,可以将机器人能力和效率作为极端环境中的团队提高。然而,在这种环境中,通信链路可以是间歇性的,并且与云或因特网的连接可能是不存在的。在本文中,我们介绍了用于多机器人系统的通信感知,计算任务调度问题,并提出了整数线性程序(ILP),该程序(ILP)优化了异构机器人网络中的计算任务分配,占网络机器人的计算能力对于可用(和可能的时变)通信链接。我们考虑调度由依赖关系图建模的一组相互依赖的必需任务和可选任务。我们为共享世界,分布式系统提供了一项备份的调度架构。我们验证了ILP制定和不同计算平台中的分布式实现,并在模拟场景中,偏向于月球或行星探索方案。我们的研究结果表明,与没有计算负载共享的类似系统相比,所提出的实施方式可以优化提高时间表以允许三倍增加所执行的奖励任务的数量(例如,科学测量)。
translated by 谷歌翻译
在过去的几十年中,经典的车辆路由问题(VRP),即为车辆分配一组订单并规划他们的路线已经被密集研究。仅作为车辆的订单分配和他们的路线已经是一个NP完整的问题,因此在实践中的应用通常无法考虑在现实世界应用中应用的约束和限制,所谓的富VRP所谓的富VRP(RVRP)并且仅限于单一方面。在这项工作中,我们融入了主要的相关真实限制和要求。我们提出了一种两级策略和时间线窗口和暂停时间的时间线算法,并将遗传算法(GA)和蚁群优化(ACO)单独应用于问题以找到最佳解决方案。我们对四种不同问题实例的评估,针对四个最先进的算法表明,我们的方法在合理的时间内处理所有给定的约束。
translated by 谷歌翻译
使用团队或机器人联盟的任务分配是机器人技术,计算机科学,运营研究和人工智能中最重要的问题之一。在最近的工作中,研究集中在处理复杂的目标和可行性限制之间,这是多机器人任务分配问题的其他变化。在这些方向上有许多重要的研究进展的例子。我们提出了任务分配问题的一般表述,该问题概括了几个经过充分研究的版本。我们的表述包括机器人,任务和其操作周围环境的状态。我们描述问题如何根据可行性约束,目标函数和动态变化信息的水平而变化。此外,我们讨论了有关该问题的现有解决方案方法,包括基于优化的方法和基于市场的方法。
translated by 谷歌翻译
In many domains such as transportation and logistics, search and rescue, or cooperative surveillance, tasks are pending to be allocated with the consideration of possible execution uncertainties. Existing task coordination algorithms either ignore the stochastic process or suffer from the computational intensity. Taking advantage of the weakly coupled feature of the problem and the opportunity for coordination in advance, we propose a decentralized auction-based coordination strategy using a newly formulated score function which is generated by forming the problem into task-constrained Markov decision processes (MDPs). The proposed method guarantees convergence and at least 50% optimality in the premise of a submodular reward function. Furthermore, for the implementation on large-scale applications, an approximate variant of the proposed method, namely Deep Auction, is also suggested with the use of neural networks, which is evasive of the troublesome for constructing MDPs. Inspired by the well-known actor-critic architecture, two Transformers are used to map observations to action probabilities and cumulative rewards respectively. Finally, we demonstrate the performance of the two proposed approaches in the context of drone deliveries, where the stochastic planning for the drone league is cast into a stochastic price-collecting Vehicle Routing Problem (VRP) with time windows. Simulation results are compared with state-of-the-art methods in terms of solution quality, planning efficiency and scalability.
translated by 谷歌翻译
线覆盖范围的问题是找到有效的路由,以通过一个或多个资源约束的机器人覆盖线性特征。线性具有模型环境,例如道路网络,电力线以及石油和天然气管道。我们为机器人定义了两种旅行模式:维修和陷入困境。机器人服务功能如果它执行特定于任务的操作,例如拍摄图像,则它可以遍历该功能;否则,它是无人机的。穿越环境会产生成本(例如旅行时间)和对资源的需求(例如电池寿命)。维修和无人机的成本和需求功能可能具有不同的成本和需求功能,我们进一步允许它们取决于方向。我们将环境建模为图形,并提供整数线性程序。由于问题是NP-HARD,因此我们开发了一种快速有效的启发式算法,即合并 - 默认混合物(MEM)。该算法的建设性属性使得为大图求解了多depot版本。我们进一步扩展了MEM算法,以处理转弯成本和非语言限制。我们在50个道路网络的数据集上对算法进行基准测试,并在道路网络上使用空中机器人进行了实验中的算法。
translated by 谷歌翻译
组合优化是运营研究和计算机科学领域的一个公认领域。直到最近,它的方法一直集中在孤立地解决问题实例,而忽略了它们通常源于实践中的相关数据分布。但是,近年来,人们对使用机器学习,尤其是图形神经网络(GNN)的兴趣激增,作为组合任务的关键构件,直接作为求解器或通过增强确切的求解器。GNN的电感偏差有效地编码了组合和关系输入,因为它们对排列和对输入稀疏性的意识的不变性。本文介绍了对这个新兴领域的最新主要进步的概念回顾,旨在优化和机器学习研究人员。
translated by 谷歌翻译
主动位置估计(APE)是使用一个或多个传感平台本地化一个或多个目标的任务。 APE是搜索和拯救任务,野生动物监测,源期限估计和协作移动机器人的关键任务。 APE的成功取决于传感平台的合作水平,他们的数量,他们的自由度和收集的信息的质量。 APE控制法通过满足纯粹剥削或纯粹探索性标准,可以实现主动感测。前者最大限度地减少了位置估计的不确定性;虽然后者驱动了更接近其任务完成的平台。在本文中,我们定义了系统地分类的主要元素,并批判地讨论该域中的最新状态。我们还提出了一个参考框架作为对截图相关的解决方案的形式主义。总体而言,本调查探讨了主要挑战,并设想了本地化任务的自主感知系统领域的主要研究方向。促进用于搜索和跟踪应用的强大主动感测方法的开发也有益。
translated by 谷歌翻译
在本文中,我们介绍了有关典型乘车共享系统中决策优化问题的强化学习方法的全面,深入的调查。涵盖了有关乘车匹配,车辆重新定位,乘车,路由和动态定价主题的论文。在过去的几年中,大多数文献都出现了,并且要继续解决一些核心挑战:模型复杂性,代理协调和多个杠杆的联合优化。因此,我们还引入了流行的数据集和开放式仿真环境,以促进进一步的研发。随后,我们讨论了有关该重要领域的强化学习研究的许多挑战和机会。
translated by 谷歌翻译
传统的多代理路径规划者通常在优化单个物镜的同时计算路径的集合,例如路径长度。然而,许多应用可能需要多个目标,例如在规划期间同时优化的燃料消耗和完井时间,并且这些标准可能无法容易地进行比较,有时彼此竞争。天真地应用现有的多目标搜索算法,例如多目标A *(MoA *),以多代理路径查找可能被证明是效率低,作为可能的解决方案的空间的大小,即帕累托最优集合,可以用代理的数量(搜索空间的维度)指数增长。本文介绍了一种名为基于多目标冲突的搜索(Mo-CBS)的方法,该方法通过利用基于冲突的搜索(CBS),是单目标多代理的公知算法来绕过这种所谓的维度诅咒路径发现,以及多目标优化文献的优势原则。我们还开发了MO-CBS的几种变体,以进一步提高其性能。我们证明了MO-CBS及其变体能够计算整个帕累托最优集合。数值结果表明,Mo-CBS优于MoA *以及妈妈*,最近开发的最先进的多目标多功能策划员。
translated by 谷歌翻译
我们介绍了多模式的汽车和乘车共享问题(MMCRP),其中使用一台汽车来涵盖一组乘车请求,同时将发现的请求分配给其他运输方式(MOT)。汽车的路线由一次或多个旅行组成。每次旅行都必须具有特定但不明的驱动程序,以仓库开始,然后以(可能不同的)仓库结束。即使两个骑行没有相同的起源和/或目的地,也允许在用户之间共享骑行。用户始终可以根据各个首选项列表使用其他运输方式。该问题可以作为车辆调度问题提出。为了解决该问题,构建了一个辅助图,在该图中,每次旅行在仓库中的启动和结尾,并覆盖可能的乘车共享,以时空图中的形式建模为弧。我们提出了一种基于列生成的两层分解算法,其中主问题可确保最多只能涵盖每个请求,并且定价问题通过在时间 - 时间中解决一种最短路径问题来生成新的有希望的路线空间网络。报告了基于现实实例的计算实验。基准实例基于奥地利维也纳的人口,空间和经济数据。我们通过在合理时间内基于列生成的方法来解决大型实例,并进一步研究了各种精确和启发式定价方案。
translated by 谷歌翻译
未来的互联网涉及几种新兴技术,例如5G和5G网络,车辆网络,无人机(UAV)网络和物联网(IOT)。此外,未来的互联网变得异质并分散了许多相关网络实体。每个实体可能需要做出本地决定,以在动态和不确定的网络环境下改善网络性能。最近使用标准学习算法,例如单药强化学习(RL)或深入强化学习(DRL),以使每个网络实体作为代理人通过与未知环境进行互动来自适应地学习最佳决策策略。但是,这种算法未能对网络实体之间的合作或竞争进行建模,而只是将其他实体视为可能导致非平稳性问题的环境的一部分。多机构增强学习(MARL)允许每个网络实体不仅观察环境,还可以观察其他实体的政策来学习其最佳政策。结果,MAL可以显着提高网络实体的学习效率,并且最近已用于解决新兴网络中的各种问题。在本文中,我们因此回顾了MAL在新兴网络中的应用。特别是,我们提供了MARL的教程,以及对MARL在下一代互联网中的应用进行全面调查。特别是,我们首先介绍单代机Agent RL和MARL。然后,我们回顾了MAL在未来互联网中解决新兴问题的许多应用程序。这些问题包括网络访问,传输电源控制,计算卸载,内容缓存,数据包路由,无人机网络的轨迹设计以及网络安全问题。
translated by 谷歌翻译
本文考虑了安全协调一个配备传感器的机器人团队的问题,以减少有关动态过程的不确定性,而该过程将使目标消除信息增益和能源成本。优化这种权衡是可取的,但是在机器人轨迹集中导致非占主酮目标函数。因此,基于协调下降的普通多机器人计划者失去了其性能保证。此外,处理非单调性的方法在受到机器人间碰撞避免约束时会失去其性能保证。由于需要保留性能保证和安全保证,这项工作提出了一种分布式计划者的层次结构方法,该方法使用本地搜索,并根据控制屏障功能提供了基于控制屏障功能的当地搜索和分散的控制器,以确保安全并鼓励及时到达传感位置。通过大量的模拟,硬件测试和硬件实验,我们证明了所提出的方法比基于坐标下降的算法在感应和能源成本之间取得更好的权衡。
translated by 谷歌翻译
嘈杂的传感,不完美的控制和环境变化是许多现实世界机器人任务的定义特征。部分可观察到的马尔可夫决策过程(POMDP)提供了一个原则上的数学框架,用于建模和解决不确定性下的机器人决策和控制任务。在过去的十年中,它看到了许多成功的应用程序,涵盖了本地化和导航,搜索和跟踪,自动驾驶,多机器人系统,操纵和人类机器人交互。这项调查旨在弥合POMDP模型的开发与算法之间的差距,以及针对另一端的不同机器人决策任务的应用。它分析了这些任务的特征,并将它们与POMDP框架的数学和算法属性联系起来,以进行有效的建模和解决方案。对于从业者来说,调查提供了一些关键任务特征,以决定何时以及如何成功地将POMDP应用于机器人任务。对于POMDP算法设计师,该调查为将POMDP应用于机器人系统的独特挑战提供了新的见解,并指出了有希望的新方向进行进一步研究。
translated by 谷歌翻译