智能论文笔记

Sensory attenuation develops as a result of sensorimotor experience

Hayato Idei , Wataru Ohata , Yuichi Yamashita , Tetsuya Ogata , Jun Tani

分类：人工智能 | 机器学习 | 机器人

2021-11-04

大脑减轻了对自我产生的遗产的反应（例如，我们不能自我痒痒）。这种现象是这种现象，称为感官衰减，天生，还是通过学习获得的？为了探讨后一种可能性，我们创建了由感官（Proprioceptive和Extleceptive），协会和行政区域组成的神经网络模型。由网络控制的模拟机器人学会了以获得具有自我产生或外部产生的脱敏反馈的电动机图案。我们发现，机器人首先在学习早期阶段的自我产生和外部产生的条件下的感觉和关联区域中的响应增加，但随后，它逐渐衰减在仅用于自我产生的条件的感觉区域中的反应。机器人自发地获得了通过切换执行区域的神经状态的条件来切换（衰减或放大）响应的容量。这表明通过学习自动组织网络内部感官信息流的主动控制。我们还发现，调制感官信息流程的天然改变诱导类似于精神分裂症和自闭症谱系疾病的一些特征。本研究提供了一种关于神经机制潜在的感知现象和精神病疾病的新颖性观点。

translated by 谷歌翻译

Active Inference in Robotics and Artificial Agents: Survey and Challenges

Pablo Lanillos , Cristian Meo , Corrado Pezzato , Ajith Anil Meera , Mohamed Baioumy , Wataru Ohata , Alexander Tschantz , Beren Millidge , Martijn Wisse , Christopher L. Buckley

分类：机器人 | 人工智能 | 机器学习

2021-12-03

有效推论是一种数学框架，它起源于计算神经科学，作为大脑如何实现动作，感知和学习的理论。最近，已被证明是在不确定性下存在国家估算和控制问题的有希望的方法，以及一般的机器人和人工代理人的目标驱动行为的基础。在这里，我们审查了最先进的理论和对国家估计，控制，规划和学习的积极推断的实现;描述当前的成就，特别关注机器人。我们展示了相关实验，以适应，泛化和稳健性而言说明其潜力。此外，我们将这种方法与其他框架联系起来，并讨论其预期的利益和挑战：使用变分贝叶斯推理具有功能生物合理性的统一框架。

translated by 谷歌翻译

The free-energy principle: a unified brain theory?

分类：

Despite the wealth of empirical data in neuroscience, there are relatively few global theories about how the brain works. A recently proposed free-energy principle for adaptive systems tries to provide a unified account of action, perception and learning. Although this principle has been portrayed as a unified brain theory 1 , its capacity to unify different perspectives on brain function has yet to be established. This Review attempts to place some key theories within the free-energy framework, in the hope of identifying common themes. I first review the free-energy principle and then deconstruct several global brain theories to show how they all speak to the same underlying idea. The free-energy principleThe free-energy principle (BOX 1) says that any selforganizing system that is at equilibrium with its environment must minimize its free energy 2 . The principle is essentially a mathematical formulation of how adaptive systems (that is, biological agents, like animals or brains) resist a natural tendency to disorder [3][4][5][6] . What follows is a non-mathematical treatment of the motivation and implications of the principle. We will see that although the motivation is quite straightforward, the implications are complicated and diverse. This diversity allows the principle to account for many aspects of brain structure and function and lends it the potential to unify different perspectives on how the brain works. In subsequent sections, I discuss how the principle can be applied to neuronal systems as viewed from these perspectives. This Review starts in a rather abstract and technical way but then tries to unpack the basic idea in more familiar terms.Motivation: resisting a tendency to disorder. The defining characteristic of biological systems is that they maintain their states and form in the face of a constantly changing environment [3][4][5][6] . From the point of view of the brain, the environment includes both the external and the internal milieu. This maintenance of order is seen at many levels and distinguishes biological from other self-organizing systems; indeed, the physiology of biological systems can be reduced almost entirely to their homeostasis 7 . More precisely, the repertoire of physiological and sensory states in which an organism can be is limited, and these states define the organism's phenotype. Mathematically, this means that the probability of these (interoceptive and exteroceptive) sensory states must have low entropy; in other words, there is a high probability that a system will be in any of a small number of states, and a low probability that it will be in the remaining states. Entropy is also the average self information or 'surprise' 8 (more formally, it is the negative log-probability of an outcome). Here, 'a fish out of water' would be in a surprising state (both emotionally and mathematically). A fish that frequently forsook water would have high entropy. Note that both surprise and entropy depend on the agen

translated by 谷歌翻译

Predictive Coding: a Theoretical and Experimental Review

Beren Millidge , Anil Seth , Christopher L Buckley

分类：人工智能 | 神经与进化计算

2021-07-27

预测性编码提供了对皮质功能的潜在统一说明 - 假设大脑的核心功能是最小化有关世界生成模型的预测错误。该理论与贝叶斯大脑框架密切相关，在过去的二十年中，在理论和认知神经科学领域都产生了重大影响。基于经验测试的预测编码的改进和扩展的理论和数学模型，以及评估其在大脑中实施的潜在生物学合理性以及该理论所做的具体神经生理学和心理学预测。尽管存在这种持久的知名度，但仍未对预测编码理论，尤其是该领域的最新发展进行全面回顾。在这里，我们提供了核心数学结构和预测编码的逻辑的全面综述，从而补充了文献中最新的教程。我们还回顾了该框架中的各种经典和最新工作，从可以实施预测性编码的神经生物学现实的微电路到预测性编码和广泛使用的错误算法的重新传播之间的紧密关系，以及对近距离的调查。预测性编码和现代机器学习技术之间的关系。

translated by 谷歌翻译

A Whole Brain Probabilistic Generative Model: Toward Realizing Cognitive Architectures for Developmental Robots

Tadahiro Taniguchi , Hiroshi Yamakawa , Takayuki Nagai , Kenji Doya , Masamichi Sakagami , Masahiro Suzuki , Tomoaki Nakamura , Akira Taniguchi

分类：人工智能

2021-03-15

建立一种人类综合人工认知系统，即人工综合情报（AGI），是人工智能（AI）领域的圣杯。此外，实现人工系统实现认知发展的计算模型将是脑和认知科学的优秀参考。本文介绍了一种通过集成元素认知模块来开发认知架构的方法，以实现整个模块的训练。这种方法是基于两个想法：（1）脑激发AI，学习人类脑建筑以构建人类级智能，（2）概率的生成模型（PGM）基础的认知系统，为发展机器人开发认知系统通过整合PGM。发展框架称为全大脑PGM（WB-PGM），其根本地不同于现有的认知架构，因为它可以通过基于感官电机信息的系统不断学习。在这项研究中，我们描述了WB-PGM的基本原理，基于PGM的元素认知模块的当前状态，与人类大脑的关系，对认知模块的整合的方法，以及未来的挑战。我们的研究结果可以作为大脑研究的参考。随着PGMS描述变量之间的明确信息关系，本说明书提供了从计算科学到脑科学的可解释指导。通过提供此类信息，神经科学的研究人员可以向AI和机器人提供的研究人员提供反馈，以及目前模型缺乏对大脑的影响。此外，它可以促进神经认知科学的研究人员以及AI和机器人的合作。

translated by 谷歌翻译

The Free Energy Principle for Perception and Action: A Deep Learning Perspective

Pietro Mazzaglia , Tim Verbelen , Ozan Çatal , Bart Dhoedt

分类：机器学习 | 人工智能

2022-07-13

自由能原理及其必然的积极推论构成了一种生物启发的理论，该理论假设生物学作用保留在一个受限制的世界首选状态中，即它们最小化自由能。根据这一原则，生物学家学习了世界的生成模型和未来的计划行动，该模型将使代理保持稳态状态，以满足其偏好。该框架使自己在计算机中实现，因为它理解了使其计算负担得起的重要方面，例如变异推断和摊销计划。在这项工作中，我们研究了深度学习的工具，以设计和实现基于主动推断的人造代理，对自由能原理进行深入学习的呈现，调查工作与机器学习和主动推理领域相关，以及讨论实施过程中涉及的设计选择。该手稿探究了积极推理框架的新观点，将其理论方面扎根于更务实的事务中，为活跃推理的新手提供了实用指南，并为深度学习从业人员的起点提供了研究，以调查自由能源原则的实施。

translated by 谷歌翻译

Towards autonomous artificial agents with an active self: modeling sense of control in situated action

Sebastian Kahl , Sebastian Wiese , Nele Russwinkel , Stefan Kopp

分类：人工智能

2021-12-10

在本文中，我们在人工代理中介绍了活跃的自我的计算建模叙述。特别是，我们专注于代理人如何配备控制意识以及它在自主位于行动中的方式以及反过来，影响行动控制。我们认为这需要铺设一个体现的认知模型，将自下而上的过程（传感器学习和对控制的细粒度适应）与自上而下的过程（战略选择和决策的认知过程）。我们基于预测处理和自由能量最小化的原理提出了这种概念计算架构。使用此常规模型，我们描述了控制层次结构的级别的控制感以及如何支持在不可预测的环境中的动作控制。我们在模型的实施以及模拟任务场景中的第一评估，其中自主代理必须应对不可预测的情况并经历相应的控制感。我们探讨了不同的型号参数设置，导致不同方式结合低电平和高级动作控制。结果表明，在低/高级动作控制需求的情况下适当加权信息的重要性，并且他们证明了控制的感觉如何促进这一点。

translated by 谷歌翻译

Hippocampal formation-inspired probabilistic generative model

Akira Taniguchi , Ayako Fukawa , Hiroshi Yamakawa

分类：人工智能 | 神经与进化计算

2021-03-12

我们解决了弥合海马形成（HPF）神经科学知识与机器人和人工智能的工程知识之间差距的具有挑战性的。同时定位和映射（SLAM）已经在机器人学中实现为空间认知的基本功能。在这项研究中，我们的目标是调查Slam功能如何对应于HPF。为此，提出了一种基于文献综述的假设，并且呈现了其验证的方向，而不执行任何新的模拟。我们调查了HPF模型和各种计算的模型，包括脑激发的血液，空间概念形成和深度生成模型。此外，我们讨论了神经科学中HPF的结果与机器人中的SLAM之间的关系。由此，使用用于构建脑参考架构的方法来构建海马形成启动的概率产生模型（PGM）。我们基于传统SLAM模型的修改提出了一种HPF-PGM作为计算模型，该模型设计成与HPF的解剖结构和功能高度一致。通过参考大脑，我们建议将Enocentric / Allocentric信息集成从Entorlinal Cortex集成到海马以及使用离散事件队列的使用。

translated by 谷歌翻译

Backprop-Free Reinforcement Learning with Active Neural Generative Coding

Alexander Ororbia , Ankur Mali

分类：机器学习

2021-07-10

在人类中，感知意识促进了来自感官输入的快速识别和提取信息。这种意识在很大程度上取决于人类代理人如何与环境相互作用。在这项工作中，我们提出了主动神经生成编码，用于学习动作驱动的生成模型的计算框架，而不会在动态环境中反正出错误（Backprop）。具体而言，我们开发了一种智能代理，即使具有稀疏奖励，也可以从规划的认知理论中汲取灵感。我们展示了我们框架与深度Q学习竞争力的几个简单的控制问题。我们的代理的强劲表现提供了有希望的证据，即神经推断和学习的无背方法可以推动目标定向行为。

translated by 谷歌翻译

The Neural Coding Framework for Learning Generative Models

Alexander Ororbia , Daniel Kifer

分类：机器学习 | 人工智能 | 神经与进化计算

2020-12-07

神经生成模型可用于学习从数据的复杂概率分布，从它们中进行采样，并产生概率密度估计。我们提出了一种用于开发由大脑预测处理理论启发的神经生成模型的计算框架。根据预测加工理论，大脑中的神经元形成一个层次结构，其中一个级别的神经元形成关于来自另一个层次的感觉输入的期望。这些神经元根据其期望与观察到的信号之间的差异更新其本地模型。以类似的方式，我们的生成模型中的人造神经元预测了邻近的神经元的作用，并根据预测匹配现实的程度来调整它们的参数。在这项工作中，我们表明，在我们的框架内学到的神经生成模型在练习中跨越多个基准数据集和度量来表现良好，并且保持竞争或显着优于具有类似功能的其他生成模型（例如变形自动编码器）。

translated by 谷歌翻译

A Computational Architecture for Machine Consciousness and Artificial Superintelligence: Updating Working Memory Iteratively

Jared Edward Reser

分类：自然语言处理 | 计算机视觉

2022-03-29

这篇理论文章研究了如何在计算机中构建类似人类的工作记忆和思维过程。应该有两个工作记忆存储，一个类似于关联皮层中的持续点火，另一个类似于大脑皮层中的突触增强。这些商店必须通过环境刺激或内部处理产生的新表示不断更新。它们应该连续更新，并以一种迭代的方式进行更新，这意味着在下一个状态下，应始终保留一组共同工作中的某些项目。因此，工作记忆中的一组概念将随着时间的推移逐渐发展。这使每个状态都是对先前状态的修订版，并导致连续的状态与它们所包含的一系列表示形式重叠和融合。随着添加新表示形式并减去旧表示形式，在这些更改过程中，有些保持活跃几秒钟。这种持续活动，类似于人工复发性神经网络中使用的活动，用于在整个全球工作区中传播激活能量，以搜索下一个关联更新。结果是能够朝着解决方案或目标前进的联想连接的中间状态链。迭代更新在这里概念化为信息处理策略，一种思想流的计算和神经生理决定因素以及用于设计和编程人工智能的算法。

translated by 谷歌翻译

From internal models toward metacognitive AI

Mitsuo Kawato , Aurelio Cortese

分类：人工智能

2021-09-27

在20世纪80年代和20世纪90年代的生物控制论中发表的几篇论文中，Kawato及其同事提出了计算模型，说明在小脑中如何获得内部模型。这些模型后来通过猴子和涉及人类的神经影像学实验支持神经生理学实验。这些早期研究影响了神经科学从基本，感官电机控制到更高的认知功能。与内部模型相关的最令人困惑的谜团之一是了解使动物能够在很少的试验中学习大型问题的神经机制。意识和元认知 - 监测自己思想的能力可能是解决这个谜的一部分。基于对过去20年来的文学审查，在这里，我们提出了一个计算神经科学模型的元动态。该模型包括并行和分层，生成逆模型对的模块化分层加强学习架构。在前额cortex中，一种称为“认知现实监测网络”（CRMN）（CRMN）的分布式执行网络（CRMN）在感知和行动中协调了生成逆模型对的意识参与。基于生成和逆模型的计算之间的不匹配，以及奖励预测误差，CRMN计算在感知，动作和加强学习中的选择和学习对的“责任信号”。高责任信号被赋予最佳捕获外部世界的对，这是在运动中称职（小错配），并且能够加强学习（小奖励预测误差）。 CRMN选择具有更高责任信号作为元记高对象的对，并且意识由所有对责任信号的熵决定。

translated by 谷歌翻译

Shared perception is different from individual perception: a new look on context dependency

Carlo Mazzola , Francesco Rea , Alessandra Sciutti

分类：机器人

2022-07-14

人类的感知基于无意识的推论，其中感觉输入与先前的信息集成在一起。这种现象被称为上下文依赖性，有助于面对外部世界的不确定性，并在先前的经验上构建了预测。另一方面，人类的感知过程固有地是由社会互动塑造的。但是，上下文依赖性的机制如何影响到迄今为止未知。如果使用以前的经验 - 先验 - 在单个环境中是有益的，那么它可能代表了其他代理商可能没有相同先验的社会场景中的问题，从而在共享环境上造成了感知的错误。本研究解决了这个问题。我们研究了与人形机器人ICUB的互动环境中的上下文依赖性，该机器人是刺激示威者。参与者在两个条件下重现了机器人所示的长度：一个具有社交性的ICUB，另一个与ICUB充当机械臂。机器人的不同行为显着影响了感知的先验使用。此外，社会机器人通过提高准确性并减少参与者的总体感知错误，从而对感知性能产生积极影响。最后，观察到的现象是按照贝叶斯的方法加深和探索共同感知的新概念进行了建模的。

translated by 谷歌翻译

Inference of Affordances and Active Motor Control in Simulated Agents

Fedor Scholz , Christian Gumbsch , Sebastian Otte , Martin V. Butz

分类：人工智能

2022-02-23

灵活的目标指导行为是人类生活的一个基本方面。基于自由能最小化原理，主动推断理论从计算神经科学的角度正式产生了这种行为。基于该理论，我们介绍了一个输出型，时间预测的，模块化的人工神经网络体系结构，该建筑处理感觉运动信息，渗透到世界上与行为相关的方面，并引起高度灵活的，目标定向的行为。我们表明，我们的建筑经过端对端训练，以最大程度地减少自由能的近似值，它会发展出可以将其解释为负担能力地图的潜在状态。也就是说，新兴的潜在状态表明哪种行动导致哪些效果取决于局部环境。结合主动推断，我们表明可以调用灵活的目标指导行为，并结合新兴的负担能力图。结果，我们的模拟代理会在连续的空间中灵活地转向，避免与障碍物发生碰撞，并且更喜欢高确定性地导致目标的途径。此外，我们表明，学识渊博的代理非常适合跨环境的零拍概括：在训练少数固定环境中的代理商在具有障碍和其他影响其行为的固定环境中，它在程序生成的环境中表现出色，其中包含不同量的环境不同位置的各种尺寸的障碍和地形。

translated by 谷歌翻译

BrainCog: A Spiking Neural Network based Brain-inspired Cognitive Intelligence Engine for Brain-inspired AI and Brain Simulation

Yi Zeng , Dongcheng Zhao , Feifei Zhao , Guobin Shen , Yiting Dong , Enmeng Lu , Qian Zhang , Yinqian Sun , Qian Liang , Yuxuan Zhao

分类：神经与进化计算

2022-07-18

尖峰神经网络（SNN）引起了脑启发的人工智能和计算神经科学的广泛关注。它们可用于在多个尺度上模拟大脑中的生物信息处理。更重要的是，SNN是适当的抽象水平，可以将大脑和认知的灵感带入人工智能。在本文中，我们介绍了脑启发的认知智力引擎（Braincog），用于创建脑启发的AI和脑模拟模型。 Braincog将不同类型的尖峰神经元模型，学习规则，大脑区域等作为平台提供的重要模块。基于这些易于使用的模块，BrainCog支持各种受脑启发的认知功能，包括感知和学习，决策，知识表示和推理，运动控制和社会认知。这些受脑启发的AI模型已在各种受监督，无监督和强化学习任务上有效验证，并且可以用来使AI模型具有多种受脑启发的认知功能。为了进行大脑模拟，Braincog实现了决策，工作记忆，神经回路的结构模拟以及小鼠大脑，猕猴大脑和人脑的整个大脑结构模拟的功能模拟。一个名为BORN的AI引擎是基于Braincog开发的，它演示了如何将Braincog的组件集成并用于构建AI模型和应用。为了使科学追求解码生物智能的性质并创建AI，Braincog旨在提供必要且易于使用的构件，并提供基础设施支持，以开发基于脑部的尖峰神经网络AI，并模拟认知大脑在多个尺度上。可以在https://github.com/braincog-x上找到Braincog的在线存储库。

translated by 谷歌翻译

Generalized Reinforcement Learning: Experience Particles, Action Operator, Reinforcement Field, Memory Association, and Decision Concepts

Po-Hsiang Chiu , Manfred Huber

分类：机器学习 | 人工智能

2022-08-09

学习涉及时变和不断发展的系统动态的控制政策通常对主流强化学习算法构成了巨大的挑战。在大多数标准方法中，通常认为动作是一组刚性的，固定的选择，这些选择以预定义的方式顺序应用于状态空间。因此，在不诉诸于重大学习过程的情况下，学识渊博的政策缺乏适应动作集和动作的“行为”结果的能力。此外，标准行动表示和动作引起的状态过渡机制固有地限制了如何将强化学习应用于复杂的现实世界应用中，这主要是由于所得大的状态空间的棘手性以及缺乏概括的学术知识对国家空间未知部分的政策。本文提出了一个贝叶斯味的广义增强学习框架，首先建立参数动作模型的概念，以更好地应对不确定性和流体动作行为，然后将增强领域的概念作为物理启发的结构引入通过“极化体验颗粒颗粒建立） “维持在学习代理的工作记忆中。这些粒子有效地编码了以自组织方式随时间演变的动态学习体验。在强化领域之上，我们将进一步概括策略学习过程，以通过将过去的记忆视为具有隐式图结构来结合高级决策概念，在该结构中，过去的内存实例（或粒子）与决策之间的相似性相互联系。定义，因此，可以应用“关联记忆”原则来增强学习代理的世界模型。

translated by 谷歌翻译

Active Predicting Coding: Brain-Inspired Reinforcement Learning for Sparse Reward Robotic Control Problems

Alexander Ororbia , Ankur Mali

分类：机器人 | 机器学习 | 神经与进化计算

2022-09-19

在本文中，我们通过神经生成编码的神经认知计算框架（NGC）提出了一种无反向传播的方法，以机器人控制（NGC），设计了一种完全由强大的预测性编码/处理电路构建的代理，体现计划的原则。具体而言，我们制作了一种自适应剂系统，我们称之为主动预测性编码（ACTPC），该系统可以平衡内部生成的认知信号（旨在鼓励智能探索）与内部生成的仪器信号（旨在鼓励寻求目标行为）最终学习如何使用现实的机器人模拟器（即超现实的机器人套件）来控制各种模拟机器人系统以及复杂的机器人臂，以解决块提升任务并可能选择问题。值得注意的是，我们的实验结果表明，我们提出的ACTPC代理在面对稀疏（外部）奖励信号方面表现良好，并且具有竞争力或竞争性或胜过几种强大的基于反向Prop的RL方法。

translated by 谷歌翻译

Constraints on the design of neuromorphic circuits set by the properties of neural population codes

Stefano Panzeri , Ella Janotte , Alejandro Pequeño-Zurro , Jacopo Bonato , Chiara Bartolozzi

分类：神经与进化计算

2022-12-08

In the brain, information is encoded, transmitted and used to inform behaviour at the level of timing of action potentials distributed over population of neurons. To implement neural-like systems in silico, to emulate neural function, and to interface successfully with the brain, neuromorphic circuits need to encode information in a way compatible to that used by populations of neuron in the brain. To facilitate the cross-talk between neuromorphic engineering and neuroscience, in this Review we first critically examine and summarize emerging recent findings about how population of neurons encode and transmit information. We examine the effects on encoding and readout of information for different features of neural population activity, namely the sparseness of neural representations, the heterogeneity of neural properties, the correlations among neurons, and the time scales (from short to long) at which neurons encode information and maintain it consistently over time. Finally, we critically elaborate on how these facts constrain the design of information coding in neuromorphic circuits. We focus primarily on the implications for designing neuromorphic circuits that communicate with the brain, as in this case it is essential that artificial and biological neurons use compatible neural codes. However, we also discuss implications for the design of neuromorphic systems for implementation or emulation of neural computation.

translated by 谷歌翻译

The brain as a probabilistic transducer: an evolutionarily plausible network architecture for knowledge representation, computation, and behavior

Joseph Y. Halpern , Arnon Lotem

分类：人工智能

2021-12-26

我们为大脑和行为提供了一般的理论框架，这些框架是进化的和计算方式。我们抽象模型中的大脑是一个节点和边缘网络。虽然它与标准神经网络模型有一些相似之处，但随着我们所示，存在一些显着差异。我们网络中的节点和边缘都具有权重和激活级别。它们充当使用一组相对简单的规则来确定激活级别和权重的概率传感器，以通过输入，生成输出，并相互影响。我们表明这些简单的规则能够实现允许网络代表越来越复杂的知识的学习过程，并同时充当促进规划，决策和行为执行的计算设备。通过指定网络的先天（遗传）组件，我们展示了进化如何以初始的自适应规则和目标赋予网络，然后通过学习来丰富。我们展示了网络的开发结构（这决定了大脑可以做些什么以及如何良好）受影响数据输入分布的机制和确定学习参数的机制之间的共同进化协调的批判性影响（在程序中使用按节点和边缘运行）。最后，我们考虑了模型如何占了学习领域的各种调查结果，如何解决思想和行为的一些挑战性问题，例如与设定目标和自我控制相关的问题，以及它如何帮助理解一些认知障碍。

translated by 谷歌翻译

Active Inference Tree Search in Large POMDPs

Domenico Maisto , Francesco Gregoretti , Karl Friston , Giovanni Pezzulo

分类：人工智能

2021-03-25

有效计划的能力对于生物体和人造系统都是至关重要的。在认知神经科学和人工智能（AI）中广泛研究了基于模型的计划和假期，但是从不同的角度来看，以及难以调和的考虑（生物现实主义与可伸缩性）的不同意见（生物现实主义与可伸缩性）。在这里，我们介绍了一种新颖的方法来计划大型POMDP（Active Tree search（ACT）），该方法结合了神经科学中领先的计划理论的规范性特征和生物学现实主义（主动推论）和树木搜索方法的可扩展性AI。这种统一对两种方法都是有益的。一方面，使用树搜索可以使生物学接地的第一原理，主动推断的方法可应用于大规模问题。另一方面，主动推理为探索 - 开发困境提供了一种原则性的解决方案，该解决方案通常在树搜索方法中以启发性解决。我们的模拟表明，ACT成功地浏览了对基于抽样的方法，需要自适应探索的问题以及大型POMDP问题“ RockSample”的二进制树，其中ACT近似于最新的POMDP解决方案。此外，我们说明了如何使用ACT来模拟人类和其他解决大型计划问题的人类和其他动物的神经生理反应（例如，在海马和前额叶皮层）。这些数值分析表明，主动树搜索是神经科学和AI计划理论的原则性实现，既具有生物现实主义和可扩展性。

translated by 谷歌翻译