In cooperative Multi-Agent Planning (MAP), a set of goals has to be achieved by a set of agents. Independently of whether they perform a pre-assignment of goals to agents or they directly search for a solution without any goal assignment, most previous works did not focus on a fair distribution/achievement of goals by agents. This paper adapts well-known fairness schemes to MAP, and introduces two novel approaches to generate cost-aware fair plans. The first one solves an optimization problem to pre-assign goals to agents, and then solves a centralized MAP task using that assignment. The second one consists of a planning-based compilation that allows solving the joint problem of goal assignment and planning while taking into account the given fairness scheme. Empirical results in several standard MAP benchmarks show that these approaches outperform different baselines. They also show that there is no need to sacrifice much plan cost to generate fair plans.
translated by 谷歌翻译
分层任务网络(HTN)形式主义用于将任务分解为staks表示各种计划问题。已经提出了许多技术来解决此类等级计划问题。一种特定的技术是将层次计划问题编码为经典条款规划问题。该技术的一个优点是直接受益于Strips Planners的不断改进。但是,仍然几乎没有有效和表现力的编码。在本文中,我们提出了一个新的HTN,以编码带有并发计划的编码。我们通过实验表明,这对层次IPC基准测试的编码优于先前的方法。
translated by 谷歌翻译
大多数古典规划者使用接地作为预处理步骤,基本上减少了命题逻辑的规划。然而,接地涉及使用具体对象组合实例化所有动作规则,并导致基于SAT / QBF的规划仪的大编码。当动作有许多参数时,这种严重成本成为主要的瓶颈,例如IPC 2018竞争中的有机合成问题。我们提供了一个紧凑的QBF编码,它是对数的对数,并通过使用对象组合的通用量化完全避免接地。我们表明我们可以解决一些有机综合问题,该问题不能通过任何SAT / QBF基于基于统一策略者处理的有机合成问题。
translated by 谷歌翻译
移动机器人的推理和计划是一个具有挑战性的问题,随着世界的发展,机器人的目标可能会改变。解决这个问题的一种技术是目标推理,代理人不仅原因是其行动的原因,而且还要实现哪些目标。尽管已经对单个代理的目标推理进行了广泛的研究,但分布式,多代理目标推理带来了其他挑战,尤其是在分布式环境中。在这种情况下,必须进行某种形式的协调以实现合作行为。先前的目标推理方法与其他代理商共享代理商的世界模型,这已经实现了基本的合作。但是,代理商的目标及其意图通常没有共享。在本文中,我们提出了一种解决此限制的方法。扩展了现有的目标推理框架,我们建议通过承诺在多个代理之间实现合作行为,在这种情况下,代理商可能会保证某些事实在将来的某个时候将是正确的。分享这些诺言使其他代理人不仅可以考虑世界的当前状态,而且还可以在决定下一步追求哪个目标时其他代理商的意图。我们描述了如何将承诺纳入目标生命周期,这是一种常用的目标改进机制。然后,我们通过将PDDL计划的定时初始文字(TIL)连接到计划特定目标时如何使用承诺。最后,我们在简化的物流方案中评估了我们的原型实现。
translated by 谷歌翻译
本文介绍了广义计划(GP)问题及其解决方案的新颖代表,作为C ++程序。我们的C ++表示允许正式证明广义计划的终止,并指定其渐近复杂性W.R.T.世界对象的数量。表征C ++广义计划的复杂性,可以应用组合搜索,该搜索以复杂性顺序列举了可能的GP解决方案的空间。实验结果表明,我们称之为BFGP ++的实施,我们的实施优于先前的GP作为启发式搜索方法,用于计算以编译器式程序为代表的通用计划。最后但并非最不重要的一点是,在经典计划实例上执行C ++程序是一个无确定性的无基接地过程,因此我们的C ++表示允许我们自动在数千个对象的大型测试实例上自动验证计算的解决方案,其中有数千个对象,其中现成的古典规划人员会陷入预处理或搜索中。
translated by 谷歌翻译
有关行动成本的信息对于现实世界中的AI规划应用程序至关重要。最近的方法不仅依靠声明性的行动模型,还使用了在计划阶段应用的黑框外部动作成本估算器,通常是从数据中学到的。但是,这些可能在计算上很昂贵,并产生不确定的值。在本文中,我们建议对确定性计划的概括,并允许在多个估计器之间选择动作成本,以平衡计算时间与有限估计不确定性。这使问题表示能力更丰富,并且相应地更现实。重要的是,它允许计划者限制计划的准确性,从而提高可靠性,同时减少不必要的计算负担,这对于扩展到大问题至关重要。我们介绍了一种搜索算法,概括了$ a^*$,该算法解决了此类计划问题和其他算法扩展。除了理论保证外,与替代方案相比,广泛的实验还显示出大量的运行时节省节省。
translated by 谷歌翻译
域特异性启发式方法是有效解决组合问题的必不可少的技术。当前将特定于域的启发式方法与答案集编程(ASP)集成的方法在处理基于部分分配的非单调指定的启发式方法时,这是不令人满意的。例如,在挑选尚未放入垃圾箱中的物品时,这种启发式方法经常发生。因此,我们介绍了ASP中域特异性启发式方法声明性规范的新颖语法和语义。我们的方法支持启发式陈述,依赖于解决过程中所维持的部分任务,这是不可能的。我们在Alpha中提供了一种实现,该实现使Alpha成为第一个支持声明指定的域特定启发式方法的懒惰的ASP系统。使用两个实际的示例域来证明我们的提议的好处。此外,我们使用我们的方法用A*实施知情},该搜索首次在ASP中解决。 A*应用于两个进一步的搜索问题。实验证实,结合懒惰的ASP解决方案和我们的新型启发式方法对于解决工业大小的问题至关重要。
translated by 谷歌翻译
该项目提出了一种自动生成视频游戏动态描述的动作模型的方法,以及与计划代理的集成,以执行和监控计划。规划者使用这些动作模型来获得许多不同视频游戏中的代理的审议行为,并与反应模块组合,解决确定性和无确定级别。实验结果验证了该方法的方法,并证明了知识工程师的努力在这种复杂域的定义中可以大大减少。此外,域名的基准已经制定,这可能对国际规划社会评估国际规划竞赛中的规划者感兴趣。
translated by 谷歌翻译
分层任务网络(HTN)计划者使用具有额外域知识的分解过程生成计划,以指导搜索计划任务。尽管域专家会开发HTN描述,但他们可能会反复描述相同的先决条件或很少使用或可能被分解的方法。通过利用三阶段的编译器设计,我们可以轻松地支持更多的语言描述和预处理优化,这些优化可以极大地提高此类域中的运行时效率。在本文中,我们使用HTN IPC 2020中使用的高血压HTN计划者评估了这种优化。
translated by 谷歌翻译
在多代理路径查找(MAPF)问题中,一组在图表上移动的代理必须达到其自身各自的目的地,而无需间间冲突。在实用的MAPF应用中,如自动仓库导航,偶尔有数百个或更多代理商,MAPF必须在终身基础上迭代地解决。这种情景排除了离线计算密集型最佳方法的简单调整;因此,可扩展的子最优算法用于此类设置。理想的可扩展算法适用于可预测计算时间的迭代方案和输出合理的解决方案。对于上述目的,在本研究中,提出了一种具有回溯(PIBT)的优先级继承的新型算法以迭代地解决MAPF。 PIBT依赖于适应性优先级方案,专注于多个代理的相邻运动;因此它可以应用于若干域。我们证明,无论其数量如何,当环境是图形时,所有代理都保证在有限的时间内达到目的地,使得所有相邻节点属于一个简单的周期(例如,双绞线)。实验结果涵盖了各种场景,包括真正的机器人演示,揭示了所提出的方法的好处。即使用数百种代理商,PIBT也会立即产生可接受的解决方案,可以解决其他事实上MAPF方法的大型情况。此外,PIBT在运行时和解决方案质量的自动化仓库中的传送包中的迭代方案上占据了现有方法。
translated by 谷歌翻译
机器人中的任务和运动规划问题通常将符号规划与连续状态和动作变量相处的运动优化相结合,从而满足满足在任务变量上强加的逻辑约束的轨迹。符号规划可以用任务变量的数量呈指数级级,因此最近的工作诸如PDDLSTREAM的工作侧重于乐观规划,以逐步增长的对象和事实,直到找到可行的轨迹。然而,这种设置以宽度第一的方式被彻底地且均匀地扩展,无论手头的问题的几何结构如何,这使得具有大量物体的长时间地理推理,这令人难以耗时。为了解决这个问题,我们提出了一个几何通知的符号规划员,以最佳的方式扩展了一组对象和事实,优先由从现有搜索计算中学到的基于神经网络的基于神经网络的分数。我们在各种问题上评估我们的方法,并展示了在大型或困难情景中规划的提高能力。我们还在几个块堆叠操作任务中将算法应用于7DOF机器人手臂。
translated by 谷歌翻译
完全可观察到的非确定性(FONT)计划通过具有非确定性效果的行动模型不确定性。现有的FONS计划算法是有效的,并采用了广泛的技术。但是,大多数现有算法对于处理非确定性和任务规模并不强大。在本文中,我们开发了一种新颖的迭代深度优先搜索算法,该算法解决了精心的计划任务并产生了强大的循环策略。我们的算法是针对精心计划的明确设计的,更直接地解决了Fond Planning的非确定性方面,并且还利用了启发式功能的好处,以使算法在迭代搜索过程中更有效。我们将提出的算法与著名的Food Planners进行了比较,并表明它在考虑不同的指标的几种不同类型的FOND领域中具有良好的性能。
translated by 谷歌翻译
引入了模型对帐问题(MRP),以解决可解释的AI计划中的问题。 MRP的解决方案是对人与计划代理(机器人)模型之间差异的解释。解决MRP的大多数方法都认为,需要提供解释的机器人知道人类模型。在几种情况下,这个假设并不总是现实的(例如,人可能会决定更新她的模型,并且机器人不知道更新)。在本文中,我们提出了一种基于对话的方法,用于计算MRP的解释,即(i)机器人不知道人类模型; (ii)人类和机器人共享计划域的谓词及其交换是关于行动描述和流利的价值; (iii)双方之间的沟通是完美的; (iv)各方是真实的。 MRP解决方案是通过对话框计算的,该对话框定义为机器人和人之间的一系列交换序列。在每回合中,机器人向人类发送了一个潜在的解释,称为提案,她对提案的评估回答称为回应。我们开发了用于计算机器人和人类响应的算法,并将这些算法实现在将命令式手段与使用Clingo的多拍功能的答案集编程相结合的系统中。
translated by 谷歌翻译
在现实世界应用中,推理不完整的知识,传感,时间概念和数字约束的能力至关重要。尽管几个AI计划者能够处理其中一些要求,但它们主要限于特定类型的约束问题。本文提出了一种新的计划方法,该方法将临时计划构建结合在时间计划框架中,提供考虑数字约束和不完整知识的解决方案。我们建议对计划域定义语言(PDDL)进行较小的扩展,以模型(i)不完整,(ii)通过未知命题进行操作的知识传感动作,以及(iii)非确定性感应效应的可能结果。我们还引入了一组新的计划域来评估我们的求解器,该求解器在各种问题上表现出良好的性能。
translated by 谷歌翻译
在机器人域中,学习和计划因连续的状态空间,连续的动作空间和较长的任务范围而变得复杂。在这项工作中,我们通过神经符号关系过渡模型(NSRTS)解决了这些挑战,这是一种具有数据效率学习的新型模型,与强大的机器人计划方法兼容,并且可以推广到对象上。NSRT具有符号和神经成分,实现了双重计划方案,其中外循环中的符号AI规划指导内部循环中的神经模型的连续计划。四个机器人计划域中的实验表明,仅在数十或数百个培训情节之后就可以学习NSRT,然后用于快速规划的新任务,这些任务需要高达60个动作,并且涉及比培训期间看到的更多物体。视频:https://tinyurl.com/chitnis-nsrts
translated by 谷歌翻译
3D场景图(3DSG)是新兴的描述;统一符号,拓扑和度量场景表示。但是,典型的3DSG即使在小环境中包含数百个对象和符号。完整图上的任务计划是不切实际的。我们构建任务法,这是第一个大规模的机器人任务计划基准3DSGS。尽管大多数基准在该领域的基准努力都集中在基于愿景的计划上,但我们系统地研究了符号计划,以使计划绩效与视觉表示学习相结合。我们观察到,在现有方法中,基于经典和学习的计划者都不能在完整的3DSG上实时计划。实现实时计划需要(a)稀疏3DSG进行可拖动计划的进展,以及(b)设计更好利用3DSG层次结构的计划者。针对前一个目标,我们提出了磨砂膏,这是一种由任务条件的3DSG稀疏方法。使经典计划者能够匹配,在某些情况下可以超过最新的学习计划者。我们提出寻求后一个目标,这是一种使学习计划者能够利用3DSG结构的程序,从而减少了当前最佳方法所需的重型查询数量的数量级。我们将开放所有代码和基线,以刺激机器人任务计划,学习和3DSGS的交叉点进行进一步的研究。
translated by 谷歌翻译
大型语言模型(LLM)的最新进展已改变了自然语言处理(NLP)的领域。从GPT-3到Palm,每种新的大型语言模型都在推动自然语言任务的最新表现。除了自然语言的能力外,人们还对理解这种模型(接受大量数据,具有推理能力的培训)也引起了重大兴趣。因此,人们有兴趣为各种推理任务开发基准,并且在此类基准测试中测试LLM的初步结果似乎主要是积极的。但是,目前的基准相对简单,这些基准的性能不能用作支持的证据,很多时候是古怪的,对LLMS的推理能力提出了主张。截至目前,这些基准仅代表了一组非常有限的简单推理任务集,如果我们要衡量此类基于LLM的系统的真实限制,我们需要研究更复杂的推理问题。通过这种动机,我们提出了一个可扩展的评估框架,以测试LLM在人类智能的中心方面的能力,这是关于行动和变化的推理。我们提供的多个测试案例比任何先前建立的推理基准都更重要,并且每个测试案例都评估了有关行动和变化的推理的某些方面。对GPT-3(Davinci)基本版本的初步评估结果,在这些基准测试中显示了Subpar的性能。
translated by 谷歌翻译
本文为多代理系统开发了一个随机编程框架,在该系统中,任务分解,分配和调度问题同时被优化。该框架可以应用于具有分布式子任务的异质移动机器人团队。例子包括大流行机器人服务协调,探索和救援以及具有异质车辆的交付系统。由于其固有的灵活性和鲁棒性,多代理系统被应用于越来越多的现实问题,涉及异质任务和不确定信息。大多数以前的作品都采用一种将任务分解为角色的独特方法,以后可以将任务分配给代理。对于角色可以变化并且存在多个分解结构的复杂任务,此假设无效。同时,尚不清楚如何在多代理系统设置下系统地量化和优化任务要求和代理能力中的不确定性。提出了复杂任务的表示形式:代理功能表示为随机分布的向量,任务要求通过可推广的二进制函数验证。在目标函数中选择有风险的条件值(CVAR)作为制定强大计划的度量。描述了一种有效的算法来解决该模型,并在两个不同的实践案例中评估了整个框架:在大流行期间的捕获量和机器人服务协调(例如,Covid-19)。结果表明,该框架是可扩展的,可扩展到示例案例的140个代理和40个任务,并提供了低成本计划,以确保成功的概率很高。
translated by 谷歌翻译
在环境抽象中进行高级搜索来指导低水平决策,这是一种有效的方法,是解决连续状态和行动空间中的长途任务的有效方法。最近的工作表明,可以以符号操作员和神经采样器的形式学习使这种二聚体计划的动作抽象,并且鉴于实现已知目标的符号谓词和演示。在这项工作中,我们表明,在动作往往会导致大量谓词发生变化的环境中,现有的方法不足。为了解决这个问题,我们建议学习具有忽略效果的操作员。激发我们方法的关键思想是,对谓词的每一个观察到的变化进行建模是不必要的。唯一需要建模的更改是高级搜索以实现指定目标所需的更改。在实验上,我们表明我们的方法能够学习具有忽略六个混合机器人域效果的操作员,这些企业能够解决一个代理,以解决具有不同初始状态,目标和对象数量的新任务变化,比几个基线要高得多。
translated by 谷歌翻译
我们概述了在其知识表示和声明问题解决的应用中的视角下的时间逻辑编程。这些程序是将通常规则与时间模态运算符组合的结果,如线性时间时间逻辑(LTL)。我们专注于最近的非单调形式主义的结果​​称为时间平衡逻辑(电话),该逻辑(电话)为LTL的全语法定义,但是基于平衡逻辑执行模型选择标准,答案集编程的众所周知的逻辑表征(ASP )。我们获得了稳定模型语义的适当延伸,以进行任意时间公式的一般情况。我们记得电话和单调基础的基本定义,这里的时间逻辑 - 和那里(THT),并研究无限和有限迹线之间的差异。我们还提供其他有用的结果,例如将转换成其他形式主义,如量化的平衡逻辑或二阶LTL,以及用于基于自动机计算的时间稳定模型的一些技术。在第二部分中,我们专注于实际方面,定义称为较近ASP的时间逻辑程序的句法片段,并解释如何在求解器Telingo的构建中被利用。
translated by 谷歌翻译