在过去的工作中,我们开发了一个基于Conway的生活游戏的共生实体(Model-S)演变的计算模型。在本文中,我们研究了三个趋势,即生物学家在共生的演变中观察到。 (1)管理:如果一个合作伙伴能够控制共生关系,则该控制可以减少冲突;因此,进化选择有利于有经理的辛酸人。 (2)共同主义:虽然共生的合作伙伴往往具有相互冲突的需求,但进化选择有利于伴侣之间的合作。 (3)相互作用:共生中的合作伙伴中的反复互动趋于促进进化选择引起的越来越容易。我们向Model-S添加了仪器,允许我们进行详细的测量,以了解在模拟中可以观察到三种趋势。当我们通过它的儿童人数来衡量一个合作伙伴的健身时,我们发现Fitter Symbiotes的管理,相互主义和互动比不那么贴合的共生体。这些结果证实了生物学家本质上观察到的趋势。 Model-S允许生物学家以不具有生物体的方式研究这些进化趋势和共生的其他特征。
translated by 谷歌翻译
本文介绍了一种全自动的机械照明方法,以实现一般视频游戏水平的生成。使用受约束的MAP-ELITE算法和GVG-AI框架,该系统生成了最简单的基于图块的级别,该级别包含特定的游戏机制集并满足可玩性约束。我们将这种方法应用于GVG-AI的$ 4 $不同游戏的机械空间:Zelda,Solarfox,Plants和eartortals。
translated by 谷歌翻译
为了协助游戏开发人员制作游戏NPC,我们展示了EvolvingBehavior,这是一种新颖的工具,用于基因编程,以在不真实的引擎4中发展行为树4.在初步评估中,我们将演变的行为与我们的研究人员设计的手工制作的树木和随机的树木进行了比较 - 在3D生存游戏中种植的树木。我们发现,在这种情况下,EvolvingBehavior能够产生行为,以实现设计师的目标。最后,我们讨论了共同创造游戏AI设计工具的探索的含义和未来途径,以及行为树进化的挑战和困难。
translated by 谷歌翻译
Monte Carlo Tree Search (MCTS) is a recently proposed search method that combines the precision of tree search with the generality of random sampling. It has received considerable interest due to its spectacular success in the difficult problem of computer Go, but has also proved beneficial in a range of other domains. This paper is a survey of the literature to date, intended to provide a snapshot of the state of the art after the first five years of MCTS research. We outline the core algorithm's derivation, impart some structure on the many variations and enhancements that have been proposed, and summarise the results from the key game and non-game domains to which MCTS methods have been applied. A number of open research questions indicate that the field is ripe for future work.
translated by 谷歌翻译
我们提出,生命的连续性及其演变来自称为合身生存的互动群体过程。该过程取代了达尔文人的个人斗争和适合生存理论,这是进化的主要机制。在这里,我们提出,自然过程与计算机自动编码功能相关。自动编码是一种机器学习技术,用于提取输入数据基本特征的紧凑表示。通过自动编码降低维度性,建立一个代码,该代码能够基于解码相关数据的各种应用程序。我们确定以下几点:(1)我们通过其物种相互作用代码定义一个物种,该物种由该物种与其外部环境和内部环境的基本核心相互作用组成;核心相互作用由包括分子细胞 - 生物在内的多尺度网络编码。 (2)通过可持续变化的物种相互作用代码进行进化;这些变化的代码既反映和构建物种环境。物种的生存是通过我们称为自然自动编码的内容来计算的:输入相互作用的阵列会产生物种代码,该代码通过解码为持续生态系统相互作用的网络而生存。 DNA只是天然自动编码的一个元素。 (3)自然自动编码和人工自动编码过程明确定义了相似性和差异。天然自动编码的生存为进化机理提供了新的启示,并解释了为什么可居住的生物圈需要多样化的拟合组相互作用。
translated by 谷歌翻译
Alphazero,Leela Chess Zero和Stockfish Nnue革新了计算机国际象棋。本书对此类引擎的技术内部工作进行了完整的介绍。该书分为四个主要章节 - 不包括第1章(简介)和第6章(结论):第2章引入神经网络,涵盖了所有用于构建深层网络的基本构建块,例如Alphazero使用的网络。内容包括感知器,后传播和梯度下降,分类,回归,多层感知器,矢量化技术,卷积网络,挤压网络,挤压和激发网络,完全连接的网络,批处理归一化和横向归一化和跨性线性单位,残留层,剩余层,过度效果和底漆。第3章介绍了用于国际象棋发动机以及Alphazero使用的经典搜索技术。内容包括minimax,alpha-beta搜索和蒙特卡洛树搜索。第4章展示了现代国际象棋发动机的设计。除了开创性的Alphago,Alphago Zero和Alphazero我们涵盖Leela Chess Zero,Fat Fritz,Fat Fritz 2以及有效更新的神经网络(NNUE)以及MAIA。第5章是关于实施微型α。 Shexapawn是国际象棋的简约版本,被用作为此的示例。 Minimax搜索可以解决六ap峰,并产生了监督学习的培训位置。然后,作为比较,实施了类似Alphazero的训练回路,其中通过自我游戏进行训练与强化学习结合在一起。最后,比较了类似α的培训和监督培训。
translated by 谷歌翻译
自然系统的多样性和质量一直是研究人造生活的社区的难题和灵感。现在广泛承认,使这些特性的适应机制在很大程度上受其居住环境的影响。面临环境变异性的生物具有在不同时间尺度上运行的两种替代适应机制:\ textit {可塑性},这是表型在不同环境中生存的能力,以及\ textit {EvolDobility},能够通过突变适应。尽管在环境变异性下至关重要,但两种机制都与假设在稳定环境中不必要的健身成本相关。在这项工作中,我们研究了可塑性和可变性进化模型中环境动力学与适应性之间的相互作用。我们尝试以不同类型的环境为特征,其特征是存在壁ni和确定适应性景观的气候功能。我们从经验上表明,环境动力学对可塑性和可变性的影响有所不同,并且即使在稳定的环境中,各种生态壁ches的存在也支持适应性。我们对选择机制进行消融研究,以分离基于健身的选择和利基限制竞争的作用。从我们的最低模型中获得的结果使我们能够在生物和人工系统的开放性研究中提出有前途的研究方向。
translated by 谷歌翻译
我们将仔细研究道德,并尝试以可能成为工具的抽象属性的形式提取见解。我们想将道德与游戏联系起来,谈论道德的表现,将好奇心引入竞争和协调良好的伦理学之间的相互作用,并提供可能统一实体汇总的可能发展的看法。所有这些都是由计算复杂性造成的长阴影,这对游戏来说是负面的。该分析是寻找建模方面的第一步,这些方面可能在AI伦理中用于将现代AI系统整合到人类社会中。
translated by 谷歌翻译
蒙特卡洛树搜索(MCT)是设计游戏机器人或解决顺序决策问题的强大方法。该方法依赖于平衡探索和开发的智能树搜索。MCT以模拟的形式进行随机抽样,并存储动作的统计数据,以在每个随后的迭代中做出更有教育的选择。然而,该方法已成为组合游戏的最新技术,但是,在更复杂的游戏(例如那些具有较高的分支因素或实时系列的游戏)以及各种实用领域(例如,运输,日程安排或安全性)有效的MCT应用程序通常需要其与问题有关的修改或与其他技术集成。这种特定领域的修改和混合方法是本调查的主要重点。最后一项主要的MCT调查已于2012年发布。自发布以来出现的贡献特别感兴趣。
translated by 谷歌翻译
离散基因监管网络(GRNS)在鲁棒性和模块化的研究中起着至关重要的作用。评估GRNS稳健性的常见方法是测量它们调节一组扰动基因激活图案回到其未受干扰的形式的能力。通常,通过收集通过基因激活模式的预定分布产生的随机样品来获得扰动。这种采样方法引入了随机性,否定动态。这种动态施加在已经复杂的健身景观之上。因此,在使用采样的情况下,重要的是要理解哪种效果来自健身景观的结构,并且从施加的动力学产生。健身功能的随机性也会导致重现性和实验后分析中的困难。通过考虑基因活性模式的完全分布,我们制定确定性分布适应性评估,以避免适应性评估中的随机性。这种健身评估有助于重复性。其确定性允许我们在健身上确定理论界,从而确定算法是否达到了全局最优。它使我们能够将问题域与嘈杂的健身评估的影响区分开来,从而解决〜\ CiteT {espinosa2010Specialization}问题领域的行为中的两个剩余异常。我们还揭示了解决方案GRNS的一些属性,使它们具有稳健和模块化,导致对问题域的性质更深入了解。我们通过讨论潜在的方向来模拟和理解较大,更复杂的域中的模块化的出现,这是产生更有用的模块化解决方案的关键,并理解生物系统中的模块化的难以。
translated by 谷歌翻译
Multi-agent artificial intelligence research promises a path to develop intelligent technologies that are more human-like and more human-compatible than those produced by "solipsistic" approaches, which do not consider interactions between agents. Melting Pot is a research tool developed to facilitate work on multi-agent artificial intelligence, and provides an evaluation protocol that measures generalization to novel social partners in a set of canonical test scenarios. Each scenario pairs a physical environment (a "substrate") with a reference set of co-players (a "background population"), to create a social situation with substantial interdependence between the individuals involved. For instance, some scenarios were inspired by institutional-economics-based accounts of natural resource management and public-good-provision dilemmas. Others were inspired by considerations from evolutionary biology, game theory, and artificial life. Melting Pot aims to cover a maximally diverse set of interdependencies and incentives. It includes the commonly-studied extreme cases of perfectly-competitive (zero-sum) motivations and perfectly-cooperative (shared-reward) motivations, but does not stop with them. As in real-life, a clear majority of scenarios in Melting Pot have mixed incentives. They are neither purely competitive nor purely cooperative and thus demand successful agents be able to navigate the resulting ambiguity. Here we describe Melting Pot 2.0, which revises and expands on Melting Pot. We also introduce support for scenarios with asymmetric roles, and explain how to integrate them into the evaluation protocol. This report also contains: (1) details of all substrates and scenarios; (2) a complete description of all baseline algorithms and results. Our intention is for it to serve as a reference for researchers using Melting Pot 2.0.
translated by 谷歌翻译
克里斯·兰顿(Chris Langton)所阐明的人工生命研究的目标是“通过将生活与我们的生活定位在更大的生活中,为理论生物学做出贡献.1)。人工进化系统中对开放式进化的研究和追求证明了这一目标。但是,开放式进化研究受到两个基本问题的阻碍。在人工进化系统中复制开放式的斗争,以及我们只有一个系统(遗传进化)来汲取灵感的事实。在这里,我们认为,文化进化不仅应视为开放式进化系统的另一个现实世界的例子,而且文化进化中看到的独特品质为我们提供了一个新的观点,我们可以从中评估,我们可以评估,我们可以评估,这是我们可以评估的基本属性。并询问有关开放式进化系统的新问题,尤其是关于发展的开放性和从边界到无限进化的过渡。在这里,我们提供了文化作为进化系统的概述,强调了人类文化进化为开放式进化系统的有趣案例,并在(进化)开放式进化的框架下将文化进化化。我们继续提供一组新问题,一旦我们考虑了开放式演变框架内的文化演变,并引入了新见解,我们可能会因为询问这些信息而获得有关进化的开放性的新见解。问题。
translated by 谷歌翻译
人工智能,当与游戏进行合并时,使研究和推进领域的理想结构。多种代理游戏对每个代理具有多个控件,同时增加搜索复杂性的同时生成大量数据。因此,我们需要高级搜索方法来查找解决方案并创建人工智能代理。在本文中,我们提出了我们的小说进化蒙特卡罗树搜索(FEMCTS)代理商,借用从进化的Algorthims(EA)和Monte Carlo树搜索(MCT)的想法来玩Pommerman的比赛。它优于滚动地平线进化算法(Rhea)在高可观察性环境中显着,几乎和MCTS用于大多数游戏种子,在某些情况下表现优于它。
translated by 谷歌翻译
自动适应玩家的游戏内容打开新的游戏开发门。在本文中,我们提出了一种使用人物代理和经验指标的架构,这使得能够在进行针对特定玩家人物的程序生成的水平。使用我们的游戏“Grave Rave”,我们证明了这种方法成功地适应了三个不同的三种不同体验指标的基于法则的角色代理。此外,该适应性被证明是特定的,这意味着水平是人的意识,而不仅仅是关于所选度量的一般优化。
translated by 谷歌翻译
哈纳比(Hanabi)是一款合作游戏,它带来了将其他玩家建模到最前沿的问题。在这个游戏中,协调的一组玩家可以利用预先建立的公约发挥出色的效果,但是在临时环境中进行比赛需要代理商适应其伴侣的策略,而没有以前的协调。在这种情况下评估代理需要各种各样的潜在伙伴人群,但是到目前为止,尚未以系统的方式考虑代理的行为多样性。本文提出了质量多样性算法作为有前途的算法类别,以生成多种人群为此目的,并使用MAP-ELITE生成一系列不同的Hanabi代理。我们还假设,在培训期间,代理商可以从多样化的人群中受益,并实施一个简单的“元策略”,以适应代理人的感知行为利基市场。我们表明,即使可以正确推断其伴侣的行为利基市场,即使培训其伴侣的行为利基市场,这种元策略也可以比通才策略更好地工作,但是在实践中,伴侣的行为取决于并干扰了元代理自己的行为,这表明是一条途径对于未来的研究,可以在游戏过程中表征另一个代理商的行为。
translated by 谷歌翻译
在生存的背景下,可以单独繁殖在我们的机器中产生智力吗?在这项工作中,自我复制是在现代学习环境中出现智能行为的一种机制。通过纯粹专注于生存,在进行自然选择的同时,进化的生物被证明会产生有意义的,复杂和聪明的行为,从而在没有任何奖励或目标概念的情况下向挑战性问题展示了创造性的解决方案。Atari和机器人学习环境是根据自然选择重新定义的,在这些实验过程中自我复制生物中出现的行为进行了详细描述。
translated by 谷歌翻译
生物系统对形态损害非常强大,但人工系统(机器人)目前却不是。在本文中,我们介绍了一个基于神经细胞自动机的系统,其中运动机器人的进化,然后赋予能够通过基于梯度的训练从损害中再生其形态。因此,我们的方法结合了进化的好处,可以发现各种不同的机器人形态,以及通过可区别的更新规则对鲁棒性的监督培训的效率。所得的神经细胞自动机能够生长能够恢复超过80 \%功能的虚拟机器人,即使经过严重的形态损害。
translated by 谷歌翻译
4月20日至22日,在马德里(西班牙)举行的EVO* 2022会议上提交了末期摘要。这些论文介绍了正在进行的研究和初步结果,这些结果研究了对不同问题的不同方法(主要是进化计算)的应用,其中大多数是现实世界中的方法。
translated by 谷歌翻译
基因调节网络是负责确定蛋白质和肽生产水平的生物生物体相互作用的网络。蛋白质是细胞工厂的工人,其生产定义了细胞及其开发的目标。已经进行了各种尝试来建模此类网络,以更好地了解这些生物系统,并利用了解它们的灵感来解决计算问题。在这项工作中,提出了一个针对基因调节网络的生物学上更现实的模型,该模型结合了细胞自动机和人工化学,以模拟称为转录因子和基因调节位点的调节蛋白之间的相互作用。这项工作的结果表明,复杂的动力学接近自然界中可以观察到的东西。在这里,对系统的初始状态对产生的动力学的影响进行了分析,这表明可以将这种可转化的模型针对产生所需的蛋白质动力学。
translated by 谷歌翻译
本文介绍了一种“混合自我注意整洁”方法,以改善高维输入中增强拓扑(整洁)算法的原始神经发展。虽然整洁的算法显示出在不同具有挑战性的任务中的显着结果,但由于输入表示是高维度,但它无法创建一个良好的调谐网络。我们的研究通过使用自我关注作为间接编码方法来解决此限制,以选择输入的最重要部分。此外,我们在混合方法的帮助下提高了整体性能,以发展最终网络权重。主要结论是混合自我关注整洁可以消除原始整洁的限制。结果表明,与进化算法相比,我们的模型可以在ATARI游戏中获得与原始像素输入的可比分数,其中参数数量较少。
translated by 谷歌翻译