这项研究提出了一种分布式算法,该算法通过自动决策,平滑的羊群和分布良好的捕获来使代理的自适应分组捕获多个目标。代理商根据环境信息做出自己的决定。提出了一种改进的人工潜在方法,以使代理能够平稳自然地改变形成以适应环境。拟议的策略确保了群体的协调发展在群体上陷入多个目标的现象。我们使用仿真实验和设计指标来验证提出方法的性能,以分析这些模拟和物理实验。
translated by 谷歌翻译
在移动机器人学中,区域勘探和覆盖率是关键能力。在大多数可用研究中,共同的假设是全球性,远程通信和集中合作。本文提出了一种新的基于群的覆盖控制算法,可以放松这些假设。该算法组合了两个元素:Swarm规则和前沿搜索算法。受到大量简单代理(例如,教育鱼,植绒鸟类,蜂拥昆虫)的自然系统的启发,第一元素使用三个简单的规则来以分布式方式维持群体形成。第二元素提供了选择有希望区域以使用涉及代理的相对位置的成本函数的最小化来探索(和覆盖)的装置。我们在不同环境中测试了我们的方法对异质和同质移动机器人的性能。我们衡量覆盖性能和允许本集团维持沟通的覆盖性能和群体形成统计数据。通过一系列比较实验,我们展示了拟议的策略在最近提出的地图覆盖方法和传统的人工潜在领域基于细胞覆盖,转变和安全路径的百分比,同时保持允许短程的形成沟通。
translated by 谷歌翻译
在过去的几十年中,对生物启发的智能及其对机器人技术的应用非常关注。本文对生物启发的智能进行了全面的调查,重点是神经动力学方法,尤其是对自主机器人系统的路径计划和控制。首先,引入了以生物启发的分流模型及其变体(添加剂模型和门控偶极模型),并详细介绍其主要特征。然后,回顾了实时路径计划和各种机器人系统控制的两个主要神经动力学应用。一个以神经动力学模型为特征的生物启发的神经网络框架,用于移动机器人,清洁机器人和水下机器人。生物启发的神经网络已在无碰撞导航和合作中广泛使用,没有任何学习程序,全球成本功能以及动态环境的先验知识。此外,还进一步讨论了针对各种机器人系统的生物启发的后台控制器,这些控制器能够在发生较大的初始跟踪误差时消除速度跳跃。最后,本文讨论了当前的挑战和未来的研究方向。
translated by 谷歌翻译
无人机(无人驾驶飞机)动态包围是一个具有巨大潜力的新兴领域。研究人员通常会从生物系统中获得灵感,要么是从宏观世界(如鱼类学校或鸟类羊群)或类似基因调节网络等微世界的灵感。但是,大多数群体控制算法都取决于集中控制,全球信息获取或相邻代理之间的通信。在这项工作中,我们提出了一种纯粹基于视觉的分布式群体控制方法,而没有任何直接通信,例如,群体的代理无人机可以生成一个陷入的模式,以完全基于其安装的全向视觉传感器包围无人机的逃脱目标。还设计了描述每种无人机行为模型的有限状态机器,以便一群无人机可以集体地搜索和捕获目标。我们在各种模拟和现实实验中验证了所提出方法的有效性和效率。
translated by 谷歌翻译
热方程驱动区域覆盖范围(HEDAC)是由潜在场的梯度引导的最先进的多机颈运动控制。特此实施有限元方法以获得Helmholtz部分微分方程的解决方案,该方程对测量运动控制的潜在字段进行了建模。这使我们能够调查任意形状的领域,并以优雅而健壮的方式包括Hedac的基本想法。对于简单的运动运动运动,通过将试剂运动用电位的梯度引导,可以成功处理障碍和边界避免限制。但是,包括其他约束,例如固定障碍物和移动障碍物的最小间隙距离以及最小的路径曲率半径,都需要控制算法的进一步交替。我们通过基于无碰撞逃生路线操纵的直接优化问题制定了一种相对简单但可靠的方法来处理这些约束的方法。这种方法提供了保证的避免碰撞机制,同时由于优化问题分配而在计算上是便宜的。在三个现实的测量场景模拟中评估了所提出的运动控制,显示了测量的有效性和控制算法的鲁棒性。此外,突出了由于定义不当的测量场景而引起的潜在操纵困难,我们提供了有关如何超越它们的指南。结果是有希望的,并表明了对自主测量和潜在的其他HEDAC利用的拟议受限的多代理运动控制的现实适用性。
translated by 谷歌翻译
为多个机器人制定安全,稳定和高效的避免障碍政策是具有挑战性的。大多数现有研究要么使用集中控制,要么需要与其他机器人进行通信。在本文中,我们提出了一种基于对数地图的新型对数深度强化学习方法,以避免复杂且无通信的多机器人方案。特别是,我们的方法将激光信息转换为对数图。为了提高训练速度和概括性能,我们的政策将在两个专门设计的多机器人方案中进行培训。与其他方法相比,对数图可以更准确地表示障碍,并提高避免障碍的成功率。我们最终在各种模拟和现实情况下评估了我们的方法。结果表明,我们的方法为复杂的多机器人场景和行人场景中的机器人提供了一种更稳定,更有效的导航解决方案。视频可在https://youtu.be/r0esuxe6mze上找到。
translated by 谷歌翻译
尽管数十年的努力,但在真正的情景中的机器人导航具有波动性,不确定性,复杂性和歧义(vuca短暂),仍然是一个具有挑战性的话题。受到中枢神经系统(CNS)的启发,我们提出了一个在Vuca环境中的自主导航的分层多专家学习框架。通过考虑目标位置,路径成本和安全水平的启发式探索机制,上层执行同时映射探索和路线规划,以避免陷入盲巷,类似于CNS中的大脑。使用本地自适应模型融合多种差异策略,下层追求碰撞 - 避免和直接策略之间的平衡,作为CNS中的小脑。我们在多个平台上进行仿真和实际实验,包括腿部和轮式机器人。实验结果表明我们的算法在任务成就,时间效率和安全性方面优于现有方法。
translated by 谷歌翻译
形成控制问题是群体智能领域中最关心的主题之一,通常通过常规数学方法来解决。然而,在本文中,我们提出了一种元疗法方法,该方法利用了一种自然的共同进化策略来解决一群导弹的形成控制问题。导弹群是由具有异质参考目标的二阶系统建模的,并将指数误差函数作为目标函数,以使群体融合到满足某些形成要求的最佳平衡状态。为了关注本地最佳和不稳定进化的问题,我们纳入了一种新颖的基于模型的政策约束和人口适应策略,从而大大减轻了绩效退化。通过在网络通信领域中应用Molloy reed标准,我们开发了一种自适应拓扑方法,该方法可以通过理论和实验验证节点失败及其有效性下的连通性及其有效性。实验结果有助于提议的形成控制方法的有效性。更重要的是,我们表明将通用形成控制问题视为马尔可夫决策过程(MDP)并通过迭代学习解决它是可行的。
translated by 谷歌翻译
This paper presents trajectory planning for three-dimensional autonomous multi-UAV volume coverage and visual inspection based on the Heat Equation Driven Area Coverage (HEDAC) algorithm. The method designs a potential field to achieve the target density and generate trajectories using potential gradients to direct UAVs to regions of a higher potential. Collisions are prevented by implementing a distance field and correcting the agent's directional vector if the distance threshold is reached. The method is successfully tested for volume coverage and visual inspection of complex structures such as wind turbines and a bridge. For visual inspection, the algorithm is supplemented with camera direction control. A field containing the nearest distance from any point in the domain to the structure is designed and this field's gradient provides the camera orientation throughout the trajectory. The bridge inspection test case is compared with a state-of-the-art method where the HEDAC algorithm allowed more surface area to be inspected under the same conditions. The limitations of the HEDAC method are analyzed, focusing on computational efficiency and adequacy of spatial coverage to approximate the surface coverage. The proposed methodology offers flexibility in various setup parameters and is applicable to real-world inspection tasks.
translated by 谷歌翻译
机器人群系统现在对许多具有挑战性的应用越来越吸引人。任何机器人的主要任务是到达目的地,同时保持与其他机器人和障碍物的安全分离。在许多情况下,机器人需要在狭窄的走廊内移动,穿过窗户或门框。为了引导所有机器人在杂乱的环境中移动,在本文中仔细设计了没有障碍物的曲线虚拟管。管内部没有障碍物,即管内的区域可以被视为安全区。然后,提出了一种具有三个精细控制术语的分布式群控制器:线路接近项,机器人避免期限和管保持术语。正式分析和证据表明,可以在有限时间内解决曲线虚拟管通过问题。为方便起见,提出了一种具有近似控制性能的修改式控制器。最后,通过数值模拟和实验验证了所提出的方法的有效性。为了展示所提出的方法的优点,我们的方法和控制屏障功能方法之间的比较也在计算速度方面呈现。
translated by 谷歌翻译
无人管理的水下车辆(UUV)的运动计划和跟踪控制技术对于高效且强大的UUV导航至关重要,这对于水下救援,设施维护,海洋资源探索,水上娱乐等至关重要。控制范围一直在全球范围内迅速增长,通常将其分类为以下主题:多UUV系统的任务分配,UUV路径计划和UUV轨迹跟踪。本文提供了对传统和智能技术的全面审查,用于运动计划和跟踪UUV的控制。介绍了文献中这些各种方法的益处和缺点的分析。此外,为将来的研究提供了UV运动计划和跟踪控制的挑战和前景。
translated by 谷歌翻译
当代机器人主义者的主要目标之一是使智能移动机器人能够在共享的人类机器人环境中平稳运行。为此目标服务的最基本必要的功能之一是在这种“社会”背景下有效的导航。结果,最近的一般社会导航的研究激增,尤其是如何处理社会导航代理之间的冲突。这些贡献介绍了各种模型,算法和评估指标,但是由于该研究领域本质上是跨学科的,因此许多相关论文是不可比较的,并且没有共同的标准词汇。这项调查的主要目标是通过引入这种通用语言,使用它来调查现有工作并突出开放问题来弥合这一差距。它首先定义社会导航的冲突,并提供其组成部分的详细分类学。然后,这项调查将现有工作映射到了本分类法中,同时使用其框架讨论论文。最后,本文提出了一些未来的研究方向和开放问题,这些方向目前正在社会导航的边界,以帮助集中于正在进行的和未来的研究。
translated by 谷歌翻译
大多数避免障碍算法仅在特定环境中有效,并且对某些新环境的适应性较低。在本文中,我们提出了一种轨迹学习(TL)的避免算法,该算法可以从一般障碍避免算法产生的轨迹中学习隐式避免机制,并实现更好的适应性。具体而言,我们定义了一个通用数据结构来描述避免障碍机制。基于这种结构,我们将学习障碍算法的学习转换为有关方向选择的多类分类问题。然后,我们设计一个人工神经网络(ANN),以通过监督学习来拟合多类分类功能,并最终获得产生观察到的轨迹的障碍物避免机制。我们的算法可以获得类似于轨迹中所示的障碍机制,并且适合看不见的环境。自动学习机制简化了应用程序中障碍算法的修改和调试。仿真结果表明,所提出的算法可以从轨迹学习避免障碍策略并获得更好的适应性。
translated by 谷歌翻译
近年来,移动机器人的安全问题引起了人们的关注。在本文中,我们提出了一种智能的物理攻击,通过从外部观察中学习障碍 - 避免机制,将移动机器人置于预设位置。我们作品的显着新颖性在于揭示具有智能和高级设计的基于物理攻击的可能性,可以带来真正的威胁,而没有对系统动态或对内部系统的访问的先验知识。传统网络空间安全中的对策无法处理这种攻击。练习,拟议的攻击的基石是积极探索受害者机器人与环境的复杂相互作用的特征,并学习对其行为的有限观察中表现出的障碍知识。然后,我们提出了最短的路径和手持攻击算法,以从巨大的运动空间中找到有效的攻击路径,从而在路径长度和活动期间分别以低成本实现了驾驶到陷阱目标。证明了算法的收敛性,并进一步得出了攻击性能范围。广泛的模拟和现实生活实验说明了拟议攻击的有效性,招呼未来对机器人系统的物理威胁和防御的研究。
translated by 谷歌翻译
深度强化学习在基于激光的碰撞避免有效的情况下取得了巨大的成功,因为激光器可以感觉到准确的深度信息而无需太多冗余数据,这可以在算法从模拟环境迁移到现实世界时保持算法的稳健性。但是,高成本激光设备不仅很难为大型机器人部署,而且还表现出对复杂障碍的鲁棒性,包括不规则的障碍,例如桌子,桌子,椅子和架子,以及复杂的地面和特殊材料。在本文中,我们提出了一个新型的基于单眼相机的复杂障碍避免框架。特别是,我们创新地将捕获的RGB图像转换为伪激光测量,以进行有效的深度强化学习。与在一定高度捕获的传统激光测量相比,仅包含距离附近障碍的一维距离信息,我们提议的伪激光测量融合了捕获的RGB图像的深度和语义信息,这使我们的方法有效地有效障碍。我们还设计了一个功能提取引导模块,以加重输入伪激光测量,并且代理对当前状态具有更合理的关注,这有利于提高障碍避免政策的准确性和效率。
translated by 谷歌翻译
本文介绍了设计,开发,并通过IISC-TCS团队为穆罕默德·本·扎耶德国际机器人挑战赛2020年挑战1的目标的挑战1硬件 - 软件系统的测试是抓住从移动和机动悬挂球UAV和POP气球锚定到地面,使用合适的操纵器。解决这一挑战的重要任务包括具有高效抓取和突破机制的硬件系统的设计和开发,考虑到体积和有效载荷的限制,使用适用于室外环境的可视信息的准确目标拦截算法和开发动态多功能机空中系统的软件架构,执行复杂的动态任务。在本文中,设计了具有末端执行器的单个自由度机械手设计用于抓取和突发,并且开发了鲁棒算法以拦截在不确定的环境中的目标。基于追求参与和人工潜在功能的概念提出了基于视觉的指导和跟踪法。本工作中提供的软件架构提出了一种操作管理系统(OMS)架构,其在多个无人机之间协同分配静态和动态任务,以执行任何给定的任务。这项工作的一个重要方面是所有开发的系统都设计用于完全自主模式。在这项工作中还包括对凉亭环境和现场实验结果中完全挑战的模拟的详细描述。所提出的硬件软件系统对反UAV系统特别有用,也可以修改以满足其他几种应用。
translated by 谷歌翻译
In this paper a global reactive motion planning framework for robotic manipulators in complex dynamic environments is presented. In particular, the circular field predictions (CFP) planner from Becker et al. (2021) is extended to ensure obstacle avoidance of the whole structure of a robotic manipulator. Towards this end, a motion planning framework is developed that leverages global information about promising avoidance directions from arbitrary configuration space motion planners, resulting in improved global trajectories while reactively avoiding dynamic obstacles and decreasing the required computational power. The resulting motion planning framework is tested in multiple simulations with complex and dynamic obstacles and demonstrates great potential compared to existing motion planning approaches.
translated by 谷歌翻译
模拟虚拟人群的轨迹是计算机图形中通常遇到的任务。最近的一些作品应用了强化学习方法来使虚拟代理动画,但是在基本模拟设置方面,它们通常会做出不同的设计选择。这些选择中的每一个都有合理的使用依据,因此并不明显其真正的影响是什么,以及它们如何影响结果。在这项工作中,我们从对学习绩效的影响以及根据能源效率测得的模拟的质量分析了其中一些任意选择。我们对奖励函数设计的性质进行理论分析,并经验评估使用某些观察和动作空间对各种情况的影响,并将奖励函数和能量使用作为指标。我们表明,直接使用相邻代理的信息作为观察,通常优于更广泛使用的射线播放。同样,与具有绝对观察结果的自动对照相比,使用具有以自我为中心的观察的非体力学对照倾向于产生更有效的行为。这些选择中的每一个都对结果产生重大且潜在的非平凡影响,因此研究人员应该注意选择和报告他们的工作。
translated by 谷歌翻译
多机器人系统(MRS)是一组协调的机器人,旨在相互合作并完成给定的任务。由于操作环境中的不确定性,该系统可能会遇到紧急情况,例如未观察到的障碍物,移动车辆和极端天气。蜂群等动物群体会引发集体紧急反应行为,例如绕过障碍和避免掠食者,类似于肌肉条件的反射,该反射组织局部肌肉以避免在第一反应中避免危害,而不会延迟通过大脑的危害。受此启发,我们开发了一种类似的集体反射机制,以使多机器人系统应对紧急情况。在这项研究中,基于动物集体行为分析和多代理增强学习(MARL),开发了一种由生物启发的紧急反应机制(MARL)开发的集体条件反射(CCR)。该算法使用物理模型来确定机器人是否经历了紧急情况。然后,通过相应的启发式奖励增强了涉及紧急情况的机器人的奖励,该奖励评估紧急情况和后果并决定当地机器人的参与。 CCR在三个典型的紧急情况下进行了验证:\ textit {湍流,强风和隐藏障碍物}。仿真结果表明,与基线方法相比,CCR以更快的反应速度和更安全的轨迹调整来提高机器人团队的紧急反应能力。
translated by 谷歌翻译
如今,合作多代理系统用于学习如何在大规模动态环境中实现目标。然而,在这些环境中的学习是具有挑战性的:从搜索空间大小对学习时间的影响,代理商之间的低效合作。此外,增强学习算法可能遭受这种环境的长时间的收敛。本文介绍了通信框架。在拟议的沟通框架中,代理商学会有效地合作,同时通过引入新的状态计算方法,状态空间的大小将大大下降。此外,提出了一种知识传输算法以共享不同代理商之间的获得经验,并制定有效的知识融合机制,以融合利用来自其他团队成员所收到的知识的代理商自己的经验。最后,提供了模拟结果以指示所提出的方法在复杂学习任务中的功效。我们已经评估了我们对牧羊化问题的方法,结果表明,通过利用知识转移机制,学习过程加速了,通过基于状态抽象概念产生类似国家的状态空间的大小均下降。
translated by 谷歌翻译