本文是Berkel和Lyon在2019年发表的“Cut-free Calculi and RelationalSemantics for Temporal STIT logics”一文的附录。它提供了基本STIT逻辑Ldm(相对于无反射,时间Kripke STIT帧)的完整性证明以及给出了逻辑Xstit的代理公理的独立性的推导。
translated by 谷歌翻译
复杂的环境提供结构化但可变的感官输入。为了从这些环境中获取信息,生物体必须发展正确预测未知刺激的后果的能力,并对这些预测采取行动。我们提出了神经网络的进化路径,将无机构从反应行为引导到简单的主动行为,从简单的主动行为到基于感应的行为。通过体外和实验室实验,我们定义了网络中必需的最小条件,其中生物体的定时依赖性可塑性来自反应性的顶部反应行为。我们的结果支持小进化系统的存在和四个必要条件,允许体现神经网络从最初的反应策略发展预测和归纳能力。我们将这些条件扩展到更一般的结构。
translated by 谷歌翻译
有限的前瞻已经在完整的信息游戏中研究了几十年。我们通过两个同时的偏差点开始了一个新的方向:概括到不完全信息游戏和游戏理论方法。我们研究一个人在面对一个前瞻的对手时应该如何行动我们根据他们的前瞻深度,根据他们是否也有不完整的信息,并根据他们如何破坏来研究这个问题。我们描述了为任何一个参与者找到纳什均衡或最优承诺策略的硬度,表明在某些变化中,问题可以在多项式时间内解决,而在其他情况下,它是PPAD-硬或NP-硬。我们继续设计用于计算最佳承诺策略的算法 - 用于当对手按照固定规则或者对抗方式有利地打破关系时。然后,我们通过实验研究有限前瞻的影响。有限的前瞻玩家如果知道游戏树中节点的预期值以获得某种平衡,则通常会获得游戏的价值 - 但我们证明这一般是不够的。最后,我们研究噪声对这些估计和不同前瞻深度的影响。这将发现一个不完整的信息游戏先行病理。
translated by 谷歌翻译
AGM的信念修订是信仰变更运作研究的主要范例之一。在这种情况下,信念基础(优先基础)已被大量用于指定代理人的信念状态 - 是否代表代理人的“显性信念”或作为其信念状态的计算模型。而迭代的类AGM操作的连接和它们的编码是动态的之前已经研究过认知逻辑,很少有人认为迭代信念修正理论中的已知假设可以通过信念基础和动态认知逻辑中的对应物来表征。这项工作研究优先图如何与偏好关系的句法表征深深地联系在一起。优先基础,可用于改变信仰变量的运算符,着重于着名的迭代信念变化假设。我们在动态上下文中提供了信念变更操作符的句法表示,以及关于使用优先级图上的变换表示迭代的信念修订操作的可能性的新的否定结果。
translated by 谷歌翻译
基于时间轴的规划是最初在空间任务规划和调度的背景下开发的一种方法,其中问题域是由许多独立但相互作用的组件建模的组件,其随时间推移,时间线由一组时间约束控制。这种方法不同于基于动作的常见PDDL规划语言。基于时间轴的系统已成功部署在许多太空任务和其他领域。然而,尽管取得了这种实际成功,但缺乏对范式的全面理论理解。本论文填补了这一空白,首次详细介绍了基于时间轴的规划方法的形态计算属性。特别是,我们表明形式主义的一个特别受限制的变体已经足够表达,可以紧凑地捕捉基于行为的时间规划问题。然后,找到基于时间轴的计划问题的解决方案计划证明是EXPSPACE完成的。然后,我们研究了具有不确定性的基于时间线的规划问题,其中包括其行为不受规划系统控制的外部组件。我们根据灵活的计划确定了最先进方法中的一些问题,提出了基于时间线的游戏,这是一个解决这些问题的更为一般理论的问题解决方案。我们展示了这种游戏的制胜策略可以在双倍指数时间内找到。然后,我们从逻辑的角度研究形式主义的表现力,表明(大多数)基于时间轴的计划问题可以通过带有过去的TPTL + P的有限TPTL捕获,与后者不同,它保留了EXPSPACE可满足性问题。引入逻辑并通过扩展最近的用于LTL的一次通过树形表格方法来解决它的可满足性问题。
translated by 谷歌翻译
本技术报告记录了计算智能游戏(CIG)2018年Hanabi比赛的获胜者。我们介绍了重新确定IS-MCTS,信息集蒙特卡罗树搜索(IS-MCTS)\ cite {IS-MCTS}的新扩展,它可以防止隐藏信息泄漏到IS-MCTS中可能发生的对手模型中,特别是在Hanabi中重新确定IS-MCTS得分在Hanabi中的分数高于2-4名参与者,而不是之前发表的作品。考虑到每次移动40ms的竞争时间限制,我们使用学习的评估函数来估计叶节点值并避免在MCTS期间的完全模拟。对于混合赛道比赛,其中其他球员的身份未知,使用简单的贝叶斯对手模型,该模型随着每场比赛的进行而更新。
translated by 谷歌翻译
贝叶斯优化算法(BOA)是使用贝叶斯网络作为概率图形模型(PGM)的分布算法估计(EDA)。给定解决方案样本确定最优贝叶斯网络结构是NP难问题。此步骤应在BOA的每次迭代中完成,从而导致非常耗时的过程。出于这个原因,mostimplementations使用贪婪的估计算法,如K2。然而,我们在本文中表明,PGM结构的显着变化不会发生,并且在进化结束时可能特别稀疏。因此,提出了BOA的统计学研究,以表征PGM调整模式,该模式可用作减少进化过程中PGM更新频率的指南。这是通过提出一种新的基于BOA的优化方法(FBOA)来实现的,该方法的PGM不会在每次更新时更新。这种新方法避免了标准BOA中常见的计算负担。结果比较了两种算法在一个NG风景优化问题上的性能,使用了坚固性和预期运行时间相关的枚举实例。实验表明,FBA具有竞争力,同时显着节省了计算时间。
translated by 谷歌翻译
在这里,我们确定了分布式约束优化(DCOPs)中的一种隐私问题,尽管它在应用领域具有重要性和影响:分离约束优化(DCOPs),但在文献中尚未涉及:隐私存在的隐私。科学只有在明确定义度量和假设的情况下才开始。分布式约束优化的领域出现在多智能体系统社区和约束规划的交叉点上。对于多智能体社区,约束优化问题是表达交易和分布式机器人中出现的许多问题的一种优雅方式。对于理论约束规划社区,DCOP是其主要研究对象的自然延伸,即约束满足问题。因此,对DCOP框架的理解已经根据两个社区的需求进行了改进,但有时没有正式拼写新的假设,因此难以比较技术。在这里,我们指导了在这一领域构建概念的努力。
translated by 谷歌翻译
我们对从英国生物银行的3822个心脏4D MRI中提取的图像衍生形状和运动特征进行无监督分析。首先,使用先前基于深度学习模型发布的特征提取方法,从每个案例中提取9个表征心脏形状和运动的特征值。其次,执行特征选择以移除高度相关的特征对。第三,使用高斯混合模型对所选特征进行聚类。经过分析,我们确定了两个可能对应两种病理类别的小聚类。使用训练的分类模型和维数减少工具进行进一步的确认以支持该发现。此外,我们检查其他大型集群之间的差异,并将我们的衡量标准与事实真相进行比较。
translated by 谷歌翻译
在现实世界的场景中,用于连续控制的强化学习的观测数据通常是有噪声的,并且其中一部分可能在时间上动态地丢失,这违反了当前开发的许多当前方法的假设。我们使用基于模型的方法在部分可观察马尔可夫决策过程(POMDP)的框架内解决了该问题,其中使用新提出的具有局部近似的替代损失函数从不完整和噪声观察来估计过渡模型,而政策和价值函数是在信仰归责的帮助下学到了。在后一个目的中,构建了一个生成模型,并将其无缝地融入到POMDP的信念更新过程中,即使在显着的不完整性和噪声下也能实现抢占。所提出方法的有效性在一组基准任务上得到验证,表明我们的方法在各种具有挑战性的情景下优于多种比较方法。
translated by 谷歌翻译