This paper proposes Distributed Model Predictive Covariance Steering (DMPCS), a novel method for safe multi-robot control under uncertainty. The scope of our approach is to blend covariance steering theory, distributed optimization and model predictive control (MPC) into a single methodology that is safe, scalable and decentralized. Initially, we pose a problem formulation that uses the Wasserstein distance to steer the state distributions of a multi-robot team to desired targets, and probabilistic constraints to ensure safety. We then transform this problem into a finite-dimensional optimization one by utilizing a disturbance feedback policy parametrization for covariance steering and a tractable approximation of the safety constraints. To solve the latter problem, we derive a decentralized consensus-based algorithm using the Alternating Direction Method of Multipliers (ADMM). This method is then extended to a receding horizon form, which yields the proposed DMPCS algorithm. Simulation experiments on large-scale problems with up to hundreds of robots successfully demonstrate the effectiveness and scalability of DMPCS. Its superior capability in achieving safety is also highlighted through a comparison against a standard stochastic MPC approach. A video with all simulation experiments is available in https://youtu.be/Hks-0BRozxA.
translated by 谷歌翻译
在这项工作中,我们提出了一种新型的安全且可扩展的分散解决方案,以在存在随机干扰的情况下进行多代理控制。使用随机控制屏障功能在数学上编码安全性,并通过求解二次程序来计算安全控制。通过增强每个代理的优化变量,复制变量,为其邻居增强,可以实现权力下放。这使我们能够将集中式多代理优化问题解脱出来。但是,为了确保安全,邻近的代理商必须就“我们俩安全的安全”达成共识,这产生了共识。为了实现安全共识解决方案,我们结合了一种基于ADMM的方法。具体而言,我们提出了一个合并的CADMM-OSQP隐式神经网络层,该网络层解决了局部二次程序的迷你批次以及总体共识问题,作为单个优化问题。该层在每个时间步骤中都嵌入了Deep FBSDES网络体系结构中,以促进端到端可区分,安全和分散的随机最佳控制。在模拟中的几个具有挑战性的多机器人任务中,证明了所提出的方法的功效。通过对避免碰撞限制指定的安全要求强加要求,可以在整个培训过程中确保所有代理的安全操作。与集中式方法相比,我们还可以在计算和内存节省方面表现出卓越的可伸缩性。
translated by 谷歌翻译
由于围绕机器人的未来轨迹的不确定性,安全导航是多机器人系统中的一个基本挑战,这些轨迹彼此相互障碍。在这项工作中,我们提出了一种原则性的数据驱动方法,每个机器人都反复解决一个有限的地平线优化问题,但要避免碰撞限制,后者被表达为代理商和代理之间距离的分布稳健的条件价值风险(CVAR)多面体障碍物几何形状。具体而言,需要CVAR约束来保留所有与从执行过程中收集的预测误差样本构成的经验分布的所有分布。该方法的一般性使我们能够在分布式和去中心化设置中普遍强加的假设下出现的预测错误鲁棒性。我们通过利用凸面和Minmax二元性结果来得出这类约束的有限尺寸近似值。在凉亭平台中实现的多人导航设置中说明了所提出的方法的有效性。
translated by 谷歌翻译
机器人等系统的安全操作要求它们计划和执行受安全约束的轨迹。当这些系统受到动态的不确定性的影响时,确保不违反限制是具有挑战性的。本文提出了基于受约束差分动态规划(DDP)的附加不确定性和非线性安全约束的安全轨迹,安全轨迹优化和控制方法。在其运动中的机器人的安全性被制定为机会限制了用户所选择的约束满足的概率。通过约束收紧将机会约束转换为DDP制剂中的确定性。为了避免在约束期间的过保守,从受约束的DDP导出的反馈策略的线性控制增益用于预测中的闭环不确定性传播的近似。所提出的算法在三种不同的机器人动态上进行了经验评估,模拟中具有高达12度的自由度。使用物理硬件实现对方法的计算可行性和适用性进行了说明。
translated by 谷歌翻译
在本文中,我们为多机器人系统提供了一种分散和无通信的碰撞避免方法,该系统考虑了机器人定位和感测不确定性。该方法依赖于计算每个机器人的不确定感知安全区域,以在高斯分布的不确定性的假设下在环境中导航的其他机器人和环境中的静态障碍物。特别地,在每次步骤中,我们为每个机器人构建一个机器人约束的缓冲不确定性感知的voronoI细胞(B-UAVC)给出指定的碰撞概率阈值。通过将每个机器人的运动约束在其对应的B-UAVC内,即机器人和障碍物之间的碰撞概率仍然可以实现概率碰撞避免。所提出的方法是分散的,无通信,可扩展,具有机器人的数量和机器人本地化和感测不确定性的强大。我们将方法应用于单积分器,双积分器,差动驱动机器人和具有一般非线性动力学的机器人。对地面车辆,四轮车和异质机器人团队进行广泛的模拟和实验,以分析和验证所提出的方法。
translated by 谷歌翻译
机器人间通信使多机器人系统能够有效地协调和执行复杂的任务。因此,维持机器人之间的通信网络的连接对于许多多机器人系统是必不可少的。在本文中,我们提出了一种用于多机器人系统的连接维护的轨迹策划局。我们首先定义加权无向图形以表示系统的连接。与以前的连接维护不同,我们明确地解释了机器人运动和传感不确定性,同时制定图形边缘权重。这些不确定性导致不确定的机器人位置,该位置直接影响系统的连接性。接下来,使用基于乘法器(ADMM)框架的分布式交替方向方法,使用轨迹规划器维持加权未向图的代数连接以上的指定的下限。在这里,我们得出了ADMM优化步骤中所需的Hessian矩阵的近似,以减少计算负荷。最后,提出了仿真结果以统计验证我们的轨迹策划者的连接维护。
translated by 谷歌翻译
本文考虑了安全协调一个配备传感器的机器人团队的问题,以减少有关动态过程的不确定性,而该过程将使目标消除信息增益和能源成本。优化这种权衡是可取的,但是在机器人轨迹集中导致非占主酮目标函数。因此,基于协调下降的普通多机器人计划者失去了其性能保证。此外,处理非单调性的方法在受到机器人间碰撞避免约束时会失去其性能保证。由于需要保留性能保证和安全保证,这项工作提出了一种分布式计划者的层次结构方法,该方法使用本地搜索,并根据控制屏障功能提供了基于控制屏障功能的当地搜索和分散的控制器,以确保安全并鼓励及时到达传感位置。通过大量的模拟,硬件测试和硬件实验,我们证明了所提出的方法比基于坐标下降的算法在感应和能源成本之间取得更好的权衡。
translated by 谷歌翻译
Motion planning is challenging for autonomous systems in multi-obstacle environments due to nonconvex collision avoidance constraints. Directly applying numerical solvers to these nonconvex formulations fails to exploit the constraint structures, resulting in excessive computation time. In this paper, we present an accelerated collision-free motion planner, namely regularized dual alternating direction method of multipliers (RDADMM or RDA for short), for the model predictive control (MPC) based motion planning problem. The proposed RDA addresses nonconvex motion planning via solving a smooth biconvex reformulation via duality and allows the collision avoidance constraints to be computed in parallel for each obstacle to reduce computation time significantly. We validate the performance of the RDA planner through path-tracking experiments with car-like robots in simulation and real world setting. Experimental results show that the proposed methods can generate smooth collision-free trajectories with less computation time compared with other benchmarks and perform robustly in cluttered environments.
translated by 谷歌翻译
在本文中,我们基于非线性模型预测控制(NMPC)方法提出了一种分散的控制方法,该方法采用屏障证书在具有静态和/或动态障碍的未知环境中安全导航的多个非独立轮式移动机器人。该方法将学习的屏障功能(LBF)纳入NMPC设计中,以确保安全机器人导航,即防止机器人与其他机器人和障碍物的碰撞。我们将我们提出的控制方法称为NMPC-LBF。由于每个机器人都没有关于障碍物和其他机器人的先验知识,因此我们使用每个机器人实时运行的深神经网络(DEEPNN),仅从机器人的刺激镜头和探针测量中学习屏障功能(BF)。深文经过训练,可以学习分离安全和不安全地区的BF。在不同情况下,我们对模拟和实际Turtlebot3汉堡机器人实施了建议的方法。实施结果显示了NMPC-LBF方法在确保机器人安全导航方面的有效性。
translated by 谷歌翻译
In this work, we propose a collision-free source seeking control framework for unicycle robots traversing an unknown cluttered environment. In this framework, the obstacle avoidance is guided by the control barrier functions (CBF) embedded in quadratic programming and the source seeking control relies solely on the use of on-board sensors that measure signal strength of the source. To tackle the mixed relative degree of the CBF, we proposed three different CBF, namely the zeroing control barrier functions (ZCBF), exponential control barrier functions (ECBF), and reciprocal control barrier functions (RCBF) that can directly be integrated with our recent gradient-ascent source-seeking control law. We provide rigorous analysis of the three different methods and show the efficacy of the approaches in simulations using Matlab, as well as, using a realistic dynamic environment with moving obstacles in Gazebo/ROS.
translated by 谷歌翻译
对于多机器人系统的安全有效运行,通信连接是可取的。尽管最近的文献中已经探讨了用于连接性维持的分散算法,但这些作品中的大多数并没有说明机器人运动和感知不确定性。这些不确定性是实际机器人固有的,并导致机器人偏离其所需位置,这可能会导致连通性丧失。在本文中,我们提出了一种分散的连接维护算法,该算法会计机器人运动和感知不确定性(DCMU)。我们首先为多机器人系统提出了一个新颖的加权图定义,该定义说明了上述不确定性以及现实的连接性约束,例如视线连接性和避免碰撞。接下来,我们设计了一个基于分散梯度的控制器,用于连接维护,在该控制器中,我们得出了计算控件所需的加权图边缘权重的梯度。最后,我们执行多个模拟,以验证机器人运动下的DCMU算法的连接性维持性能并感知不确定性,并与以前的工作相比显示出改进。
translated by 谷歌翻译
我们提出了一个模型预测控制(MPC),以避免自治药物和动态障碍之间的碰撞。避免碰撞的限制是通过在代表代理和障碍物的凸组之间执行正距离的,并使用Lagrange二重性进行了谨慎地对其进行重新校正。这种方法即使对于多面体来说也可以平稳避免碰撞限制,否则需要混合组合或非平滑限制。我们考虑了不确定障碍位置的三种广泛使用的描述:1)具有多重支持的任意分布,2)高斯分布和3)任意分布,并以已知的前两个矩。对于每种情况,我们都会获得避免碰撞限制的确定性重新制定。拟议的MPC公式优化了反馈政策,以减少满足碰撞避免限制的保守主义。使用卡拉中交通交叉点的模拟对所提出的方法进行了验证。
translated by 谷歌翻译
共享工作空间中无线轨迹的生成对于大多数多机器人应用程序至关重要。但是,许多基于模型预测控制(MPC)的广泛使用的方法缺乏基础优化的可行性的理论保证。此外,当以分布式的方式应用无中央协调员时,僵局通常会无限期地互相阻挡。尽管存在诸如引入随机扰动之类的启发式方法,但没有进行深入的分析来验证这些措施。为此,我们提出了一种系统的方法,称为Infinite-Horizo​​n模型预测性控制,并通过死锁解决。 MPC用警告范围对拟议的修改后的Voronoi进行了配方,作为凸优化。基于此公式,对僵局的状况进行了正式分析,并证明与力平衡相似。提出了一个检测分辨率方案,该方案可以在甚至在发生之前有效地在网上检测到僵局,并且一旦检测到,便利用自适应分辨率方案来解决僵局,并在绩效上进行理论保证。此外,所提出的计划算法可确保在输入和模型约束下每个时间步骤的基础优化的递归可行性,对于所有机器人都是并发的,并且只需要本地通信。全面的模拟和实验研究是通过大规模多机器人系统进行的。与其他最先进的方法相比,尤其是在拥挤和高速场景中,成功率的显着提高了成功率。
translated by 谷歌翻译
在本文中,我们研究了加强学习问题的安全政策的学习。这是,我们的目标是控制我们不知道过渡概率的马尔可夫决策过程(MDP),但我们通过经验访问样品轨迹。我们将安全性定义为在操作时间内具有高概率的期望安全集中的代理。因此,我们考虑受限制的MDP,其中限制是概率。由于没有直接的方式来优化关于加强学习框架中的概率约束的政策,因此我们提出了对问题的遍历松弛。拟议的放松的优点是三倍。 (i)安全保障在集界任务的情况下保持,并且它们保持在一个给定的时间范围内,以继续进行任务。 (ii)如果政策的参数化足够丰富,则约束优化问题尽管其非凸起具有任意小的二元间隙。 (iii)可以使用标准策略梯度结果和随机近似工具容易地计算与安全学习问题相关的拉格朗日的梯度。利用这些优势,我们建立了原始双算法能够找到安全和最佳的政策。我们在连续域中的导航任务中测试所提出的方法。数值结果表明,我们的算法能够将策略动态调整到环境和所需的安全水平。
translated by 谷歌翻译
过去半年来,从控制和强化学习社区的真实机器人部署的安全学习方法的贡献数量急剧上升。本文提供了一种简洁的但整体审查,对利用机器学习实现的最新进展,以实现在不确定因素下的安全决策,重点是统一控制理论和加固学习研究中使用的语言和框架。我们的评论包括:基于学习的控制方法,通过学习不确定的动态,加强学习方法,鼓励安全或坚固性的加固学习方法,以及可以正式证明学习控制政策安全的方法。随着基于数据和学习的机器人控制方法继续获得牵引力,研究人员必须了解何时以及如何最好地利用它们在安全势在必行的现实情景中,例如在靠近人类的情况下操作时。我们突出了一些开放的挑战,即将在未来几年推动机器人学习领域,并强调需要逼真的物理基准的基准,以便于控制和加固学习方法之间的公平比较。
translated by 谷歌翻译
本文开发了一个分布式可区分的动态游戏(DDDG)框架,该框架可以从演示中学习多机器人协调。我们将多机器人协调表示为动态游戏,其中机器人的行为由其自身的动态和目标决定,这也取决于他人的行为。因此,可以通过调整每个机器人的客观和动力学来调整协调。提出的DDDG使每个机器人能够以分布式方式自动调整其单个动力学和目标,从而最大程度地减少其轨迹和演示之间的不匹配。此过程需要前向通道的新分布式设计,在该设计中,所有机器人都协作寻求NASH均衡行为,以及一个向后通行,在该阶段通过通信图传播梯度。我们在仿真中测试了DDDG,并给定不同任务配置的四个小组。结果证明了DDDG从演示中学习多机器人协调的能力
translated by 谷歌翻译
在粗糙的地形上的动态运动需要准确的脚部放置,避免碰撞以及系统的动态不足的计划。在存在不完美且常常不完整的感知信息的情况下,可靠地优化此类动作和互动是具有挑战性的。我们提出了一个完整的感知,计划和控制管道,可以实时优化机器人所有自由度的动作。为了减轻地形所带来的数值挑战,凸出不平等约束的顺序被提取为立足性可行性的局部近似值,并嵌入到在线模型预测控制器中。每个高程映射预先计算了步骤性分类,平面分割和签名的距离场,以最大程度地减少优化过程中的计算工作。多次射击,实时迭代和基于滤波器的线路搜索的组合用于可靠地以高速率解决该法式问题。我们在模拟中的间隙,斜率和踏上石头的情况下验证了所提出的方法,并在Anymal四倍的平台上进行实验,从而实现了最新的动态攀登。
translated by 谷歌翻译
We propose a path planning methodology for a mobile robot navigating through an obstacle-filled environment to generate a reference path that is traceable with moderate sensing efforts. The desired reference path is characterized as the shortest path in an obstacle-filled Gaussian belief manifold equipped with a novel information-geometric distance function. The distance function we introduce is shown to be an asymmetric quasi-pseudometric and can be interpreted as the minimum information gain required to steer the Gaussian belief. An RRT*-based numerical solution algorithm is presented to solve the formulated shortest-path problem. To gain insight into the asymptotic optimality of the proposed algorithm, we show that the considered path length function is continuous with respect to the topology of total variation. Simulation results demonstrate that the proposed method is effective in various robot navigation scenarios to reduce sensing costs, such as the required frequency of sensor measurements and the number of sensors that must be operated simultaneously.
translated by 谷歌翻译
我们研究了由测量和过程噪声引起的不确定性的动态系统的规划问题。测量噪声导致系统状态可观察性有限,并且过程噪声在给定控制的结果中导致不确定性。问题是找到一个控制器,保证系统在有限时间内达到所需的目标状态,同时避免障碍物,至少需要一些所需的概率。由于噪音,此问题不承认一般的精确算法或闭合性解决方案。我们的主要贡献是一种新颖的规划方案,采用卡尔曼滤波作为状态估计器,以获得动态系统的有限状态抽象,我们将作为马尔可夫决策过程(MDP)正式化。通过延长概率间隔的MDP,我们可以增强模型对近似过渡概率的数值不精确的鲁棒性。对于这种所谓的间隔MDP(IMDP),我们采用最先进的验证技术来有效地计算最大化目标状态概率的计划。我们展示了抽象的正确性,并提供了几种优化,旨在平衡计划的质量和方法的可扩展性。我们展示我们的方法能够处理具有6维状态的系统,该系统导致具有数万个状态和数百万个过渡的IMDP。
translated by 谷歌翻译
我们为非全面移动机器人设计了MPC方法,并在分析上表明,随着时间的变化,线性化的系统可以在跟踪任务中的来源周围产生渐近稳定性。为了避免障碍物,我们提出了速度空间中的约束,该约束根据当前状态明确耦合两个控件输入。
translated by 谷歌翻译