本文介绍了一个混合运动规划策略,将深度生成网络与传统运动规划方法相结合。现有的规划方法如* *和混合动力A *被广泛用于路径规划任务,因为它们即使在复杂的环境中确定可行的路径也是如此;但是,它们对效率有局限性。为了克服这些限制,介绍了一种基于神经网络的路径规划算法,即神经混合A *。本文使用条件变形Autiachoder(CVAE)提出通过利用CVAE在给定停车环境的信息的情况下学习有关规划空间信息的能力来指导搜索算法。基于在示威中学到的可行轨迹的分布,利用了非均匀的扩展策略。该方法有效地学习给定状态的表示,并显示了算法性能方面的改进。
translated by 谷歌翻译
迅速探索随机树(RRT)已申请自动停车,因为迅速解决高维运动规划,易于反映约束。然而,规划时间通过延伸狭窄的停车点而无需碰撞而增加。为了减少规划时间,提出了目标树算法,用了向后停车路径的集合(目标树)代替RRT中的停车目标。然而,它由圆形和直线路径组成,并且由于曲率不连续性,自主车辆无法准确停放。此外,规划时间在复杂的环境中增加;障碍物可以阻挡向后路径。因此,本文介绍了复杂停车环境的连续曲率目标树算法。首先,目标树包括薄帘路径,以解决这种曲率不连续性。其次,为了进一步减少计划时间,定义了成本函数以构建考虑障碍物的目标树。与最佳变型RRT集成并搜索到达后向路径中的最短路径,所提出的算法在采样时间增加时获得近最佳路径。实验结果在真实环境中表明车辆更加准确地停放,并且连续曲率路径比与其他基于样品的算法所获得的那些获得更高的成功率。
translated by 谷歌翻译
我们提出了一种使用条件生成对抗网络(CGANS)在机器人关节空间和潜在空间之间转换的新方法,以进行无碰撞路径计划,该方法仅捕获以障碍物图来捕获关节空间的无碰撞区域。操纵机器人臂时,很方便地生成多个合理的轨迹进行进一步选择。此外,出于安全原因,有必要生成轨迹,以避免与机器人本身或周围环境发生碰撞。在提出的方法中,可以通过将开始和目标状态与此生成的潜在空间中的任意线段连接起来和目标状态来产生各种轨迹。我们的方法提供了此无碰撞潜在空间,此后,任何使用任何优化条件的计划者都可以使用任何计划器来生成最合适的路径。我们通过模拟和实际的UR5E 6-DOF机器人臂成功验证了这种方法。我们确认可以根据优化条件的选择生成不同的轨迹。
translated by 谷歌翻译
We present a unified probabilistic model that learns a representative set of discrete vehicle actions and predicts the probability of each action given a particular scenario. Our model also enables us to estimate the distribution over continuous trajectories conditioned on a scenario, representing what each discrete action would look like if executed in that scenario. While our primary objective is to learn representative action sets, these capabilities combine to produce accurate multimodal trajectory predictions as a byproduct. Although our learned action representations closely resemble semantically meaningful categories (e.g., "go straight", "turn left", etc.), our method is entirely self-supervised and does not utilize any manually generated labels or categories. Our method builds upon recent advances in variational inference and deep unsupervised clustering, resulting in full distribution estimates based on deterministic model evaluations.
translated by 谷歌翻译
基于采样的路径规划算法通常实现均匀的采样方法来搜索状态空间。然而,统一的采样可能导致许多情况下不必要的探索,例如具有几个死角的环境。我们以前的工作建议使用有希望的区域来指导采样过程来解决问题。然而,预测的有希望区域通常是断开连接,这意味着它们无法连接到开始和目标状态,导致缺乏概率完整性。这项工作侧重于提高预测有前途地区的连通性。我们所提出的方法在x和y方向上回归边缘的连接概率。此外,它可以计算丢失中有希望的边缘的重量,以引导神经网络更加关注有前景区域的连通性。我们进行一系列仿真实验,结果表明,有前途地区的连接性显着提高。此外,我们分析了连接基于采样的路径规划算法的影响,并得出结论,连接在维护算法性能方面发挥着重要作用。
translated by 谷歌翻译
本文介绍了一个混合在线的部分可观察到的马尔可夫决策过程(POMDP)计划系统,该系统在存在环境中其他代理商引入的多模式不确定性的情况下解决了自主导航的问题。作为一个特别的例子,我们考虑了密集的行人和障碍物中的自主航行问题。该问题的流行方法首先使用完整的计划者(例如,混合A*)生成一条路径,具有对不确定性的临时假设,然后使用基于在线树的POMDP求解器来解决问题的不确定性,并控制问题的有限方面(即沿着路径的速度)。我们提出了一种更有能力和响应的实时方法,使POMDP规划师能够控制更多的自由度(例如,速度和标题),以实现更灵活,更有效的解决方案。这种修改大大扩展了POMDP规划师必须推荐的国家空间区域,从而大大提高了在实时控制提供的有限计算预算中找到有效的推出政策的重要性。我们的关键见解是使用多Query运动计划技术(例如,概率路线图或快速行进方法)作为先验,以快速生成在有限的地平线搜索中POMDP规划树可能达到的每个状态的高效推出政策。我们提出的方法产生的轨迹比以前的方法更安全,更有效,即使在较长的计划范围内密集拥挤的动态环境中。
translated by 谷歌翻译
本文介绍了一种多模式运动计划(MMP)算法,该算法结合了三维(3-D)路径计划和DWA障碍避免算法。该算法旨在计划复杂的非结构化场景中超越障碍物的机器人的路径和运动。提出了一种新颖的A-Star算法来结合非结构化场景的特征,并将其切换为贪婪的最佳优先策略算法的策略。同时,路径计划的算法与DWA算法集成在一起,因此机器人可以在沿着全球计划的路径运动过程中执行局部动态障碍。此外,当提议的全球路径计划算法与局部障碍算法结合使用时,机器人可以在避免障碍物和克服障碍物后纠正道路。具有几个复杂环境的工厂中的仿真实验验证了算法的可行性和鲁棒性。该算法可以迅速为超越障碍物的机器人生成合理的3D路径,并在考虑场景和运动障碍物的特征的前提下进行可靠的当地障碍。
translated by 谷歌翻译
在本文中,提出了一种基于静态障碍的环境中实验室规模3D龙门起重机的基于抽样的轨迹计划算法,并呈现了龙门起重机系统速度和加速度的范围。重点是针对差异化系统开发快速运动计划算法,在该系统中可以存储和重复使用中间结果以进行进一步的任务,例如重新植入。所提出的方法基于知情的最佳迅速探索随机树算法(知情RRT*),该算法用于构建轨迹树,这些树在开始和/或目标状态变化时重新使用。与最先进的方法相反,拟议的运动计划算法包含了线性二次最低时间(LQTM)本地计划者。因此,在提出的算法中直接考虑了动态特性,例如时间最优性和轨迹的平滑度。此外,通过集成分支和结合方法以在轨迹树上执行修剪过程,提出的算法可以消除树中没有促成更好解决方案的点中的点。这有助于抑制记忆消耗并降低运动(RE)计划期间的计算复杂性。 3D龙门起重机的经过验证的数学模型的仿真结果显示了所提出的方法的可行性。
translated by 谷歌翻译
我们提出了一种新颖的场景表示,其编码达到距离 - 沿着可行轨迹的场景中的任何位置之间的距离。我们证明,该环境现场表示可以直接指导2D迷宫或3D室内场景中代理的动态行为。我们的环境领域是一种连续表示,通过使用离散采样的培训数据通过神经隐式功能学习。我们展示其在2D迷宫中的代理导航应用,3D室内环境中的人为轨迹预测。为了为人类生产物理似品和自然的轨迹,我们还学习了一种生成模型,该模型预测了人类通常出现的区域,并强制执行要在这些区域内定义的环境场。广泛的实验表明,所提出的方法可以有效准确地产生可行和合理的轨迹。
translated by 谷歌翻译
科学界能够为实践问题提供一套新的解决方案,这些解决方案由于神经网络体系结构的进步而在效率和计算速度方面显着改善了现代技术的性能。考虑到机器人路径计划中神经网络的利用,我们介绍了最新作品。我们的调查显示了考虑不同输入,输出和环境的问题的不同公式之间的对比,以及不同的神经网络架构如何为所有提出的问题提供解决方案。
translated by 谷歌翻译
由于NN模型的强大学习能力及其固有的高平行性,基于神经网络(NN)的方法已成为机器人运动计划的有吸引力的方法。尽管目前朝这个方向发展,但以直接和同时的方式对重要的顺序和空间信息的有效捕获和处理仍然相对较小。为了克服挑战并释放神经网络对运动计划任务的潜力,在本文中,我们提出了STP-NET,这是一个端到端的学习框架,可以充分提取并利用重要的时空信息来形成有效的神经信息运动计划者。通过将机器人的移动解释为视频剪辑,机器人运动计划被转换为视频预测任务,STP-NET可以在空间和时间上有效的方式执行。 STP-NET在不同的和看不见的环境之间进行了经验评估,表明,凭借近100%的准确性(又称成功率),STP-NET在计划速度和路径成本方面表现出非常有希望的性能。与现有的基于NN的运动计划者相比,STP-NET在2D随机森林,2D迷宫和3D随机森林环境中至少达到5倍,2.6倍和1.8倍的速度,速度较低。此外,STP-NET可以快速,同时计算多机手运动计划任务中的多个近乎最佳路径
translated by 谷歌翻译
当前独立于域的经典计划者需要问题域和实例作为输入的符号模型,从而导致知识采集瓶颈。同时,尽管深度学习在许多领域都取得了重大成功,但知识是在与符号系统(例如计划者)不兼容的亚符号表示中编码的。我们提出了Latplan,这是一种无监督的建筑,结合了深度学习和经典计划。只有一组未标记的图像对,显示了环境中允许的过渡子集(训练输入),Latplan学习了环境的完整命题PDDL动作模型。稍后,当给出代表初始状态和目标状态(计划输入)的一对图像时,Latplan在符号潜在空间中找到了目标状态的计划,并返回可视化的计划执行。我们使用6个计划域的基于图像的版本来评估LATPLAN:8个插头,15个式嘴,Blockworld,Sokoban和两个LightsOut的变体。
translated by 谷歌翻译
基于采样的运动计划算法广泛用于机器人,因为它们在高维空间中非常有效。 However, the success rate and quality of the solutions are determined by an adequate selection of their parameters such as the distance between states, the local planner, and the sampling distribution.对于具有大配置空间或动态限制的机器人,选择这些参数是一个具有挑战性的任务。本文提出了一种通过调整采样方法来提高对基于最流行的采样的算法,快速探索随机树(RRT)的性能的方法。该想法是用自定义分布(C-PDF)替换均匀概率密度函数(U-PDF)从类似任务中的先前成功查询中获取。通过一些示例,我们的方法构建了一种自定义分布,允许RRT成长为承诺将导致解决方案的国家。我们在几种自主驾驶任务中测试了我们的方法,例如停车演习,障碍物间隙和狭窄的通道场景。结果表明,所提出的方法在成功率,树密度和计算时间方面优于原始的RRT和几种改进版本。另外,所提出的方法需要相对较小的示例,与需要大量示例的当前深度学习技术不同。
translated by 谷歌翻译
Despite recent progress on trajectory planning of multiple robots and path planning of a single tethered robot, planning of multiple tethered robots to reach their individual targets without entanglements remains a challenging problem. In this paper, we present a complete approach to address this problem. Firstly, we propose a multi-robot tether-aware representation of homotopy, using which we can efficiently evaluate the feasibility and safety of a potential path in terms of (1) the cable length required to reach a target following the path, and (2) the risk of entanglements with the cables of other robots. Then, the proposed representation is applied in a decentralized and online planning framework that includes a graph-based kinodynamic trajectory finder and an optimization-based trajectory refinement, to generate entanglement-free, collision-free and dynamically feasible trajectories. The efficiency of the proposed homotopy representation is compared against existing single and multiple tethered robot planning approaches. Simulations with up to 8 UAVs show the effectiveness of the approach in entanglement prevention and its real-time capabilities. Flight experiments using 3 tethered UAVs verify the practicality of the presented approach.
translated by 谷歌翻译
在本研究中,我们提出了一种模拟绘图/研磨轨迹的局部和全局特征的方法,通过分层变分自动化器(VAES)。通过将两个单独训练的VAE模型组合在分层结构中,可以为本地和全局特征产生高再现性的轨迹。分层生成网络使得能够生成具有相对较少量的训练数据的高阶轨迹。模拟和实验结果表明了该方法的泛化性能。此外,我们确认可以通过改变学习模型的组合来生成过去从未学到过的新轨迹。
translated by 谷歌翻译
为了解决复杂环境中的自主导航问题,本文新呈现了一种有效的运动规划方法。考虑到大规模,部分未知的复杂环境的挑战,精心设计了三层运动规划框架,包括全局路径规划,本地路径优化和时间最佳速度规划。与现有方法相比,这项工作的新颖性是双重的:1)提出了一种新的动作原语的启发式引导剪枝策略,并完全集成到基于国家格子的全球路径规划器中,以进一步提高图表搜索的计算效率,以及2)提出了一种新的软限制局部路径优化方法,其中充分利用底层优化问题的稀疏带系统结构以有效解决问题。我们在各种复杂的模拟场景中验证了我们方法的安全,平滑,灵活性和效率,并挑战真实世界的任务。结果表明,与最近的近期B型zier曲线的状态空间采样方法相比,全球规划阶段,计算效率提高了66.21%,而机器人的运动效率提高了22.87%。我们命名拟议的运动计划框架E $ \ mathrm {^ 3} $拖把,其中3号不仅意味着我们的方法是三层框架,而且还意味着所提出的方法是三个阶段有效。
translated by 谷歌翻译
强化学习(RL)是一种强大的数据驱动控制方法,在很大程度上探讨了自动驾驶任务。然而,传统的RL方法通过与环境的试验和错误相互作用来学习控制策略,因此可能导致诸如在现实世界交通中测试时的灾难性后果。离线RL最近被揭示为有希望的框架,了解从先前收集的静态数据集的有效政策,而无需积极的交互,尤其吸引自动驾驶应用。尽管有希望,现有的离线RL算法,如批处理的深度Q-Learning(BCQ)通常导致相当保守的政策,具有有限的勘探效率。为了解决这些问题,本文通过在扰动模型中采用学习参数噪声方案来提高增强的BCQ算法来增加观察到的动作的分集。此外,还包含基于Lyapunov的安全增强策略,以限制安全区域内的可勘探状态空间。高速公路和停车交通方案的实验结果表明,我们的方法优于传统的RL方法,以及最先进的离线RL算法。
translated by 谷歌翻译
该论文提出了一种新颖的基于学习的抽样策略,可确保在偏见和大约统一条件下对自由空间的无排斥采样,从而利用多元核密度。利用给定自治系统的过去状态的历史数据可以估算该域的非参数概率描述,这反过来又描述了可​​能找到运动计划问题的可行解决方案的自由空间。然后使用内核密度估计器,带宽和内核的调整参数来改变自由空间的描述,以使得没有采样状态可以落在最初定义的空间之外。在两个现实生活中的案例研究中证明了该方法:自主表面容器(2D)和一个自主无人机(3D)。解决了两个计划问题,表明所提出的近似统一抽样方案能够保证对所考虑工作空间的无排斥采样。此外,使用Monte Carlo模拟在统计上验证了所提出的方法的计划效率。
translated by 谷歌翻译
在本文中,我们为非结构化的户外环境提供了一个完整的自主导航管道。这项工作的主要贡献位于路径规划模块上,我们分为两个主要类别:全局路径规划(GPP)和本地路径规划(LPP)。对于环境表示,而不是复杂和重型网格图,GPP层使用直接从OpenStreetMaps(OSM)获得的道路网络信息。在LPP层中,我们使用新颖的天真谷路(NVP)方法来生成局部路径,避免实时障碍物。这种方法使用LIDAR传感器使用本地环境的天真表示。此外,它使用了一个天真的优化,用于利用成本图中的“谷”区域的概念。我们在研究平台蓝色实验上实验展示了该系统的稳健性,在阿利坎特大学科学园区自主驾驶超过20公里,在12.33公顷地区。
translated by 谷歌翻译
Designing a local planner to control tractor-trailer vehicles in forward and backward maneuvering is a challenging control problem in the research community of autonomous driving systems. Considering a critical situation in the stability of tractor-trailer systems, a practical and novel approach is presented to design a non-linear MPC(NMPC) local planner for tractor-trailer autonomous vehicles in both forward and backward maneuvering. The tractor velocity and steering angle are considered to be control variables. The proposed NMPC local planner is designed to handle jackknife situations, avoiding multiple static obstacles, and path following in both forward and backward maneuvering. The challenges mentioned above are converted into a constrained problem that can be handled simultaneously by the proposed NMPC local planner. The direct multiple shooting approach is used to convert the optimal control problem(OCP) into a non-linear programming problem(NLP) that IPOPT solvers can solve in CasADi. The controller performance is evaluated through different backup and forward maneuvering scenarios in the Gazebo simulation environment in real-time. It achieves asymptotic stability in avoiding static obstacles and accurate tracking performance while respecting path constraints. Finally, the proposed NMPC local planner is integrated with an open-source autonomous driving software stack called AutowareAi.
translated by 谷歌翻译