贝叶斯的行为模型在一系列心理物理任务中提供了计算级别解释。一个基本的实验范式是生产或再现任务,其中指示受试者生成再现先前感测的刺激幅度或实现目标响应的动作。因此,这种类型的任务将自己与其他心理物理任务区分开来,因为响应是连续性,并且努力在增加响应幅度下起着重要作用。基于贝叶斯决策理论,我们提出了一种推理方法来恢复感知的不确定性,响应变异性和潜在的人为反应的成本函数。至关重要,成本函数参数化,使得明确地包括努力。我们介绍了采用MCMC采样的混合推断方法,利用适当的提案分布和利用摊销推断与近似于最佳响应分布模式的神经网络的内部环路。我们展示了如何利用该模型来避免实验设计的不明确性,并且可以通过对实验数据的合成和应用验证来恢复参数。我们的方法将使行为科学家能够在生产和再生任务中执行决策参数的贝叶斯推断。
translated by 谷歌翻译
We present the GPry algorithm for fast Bayesian inference of general (non-Gaussian) posteriors with a moderate number of parameters. GPry does not need any pre-training, special hardware such as GPUs, and is intended as a drop-in replacement for traditional Monte Carlo methods for Bayesian inference. Our algorithm is based on generating a Gaussian Process surrogate model of the log-posterior, aided by a Support Vector Machine classifier that excludes extreme or non-finite values. An active learning scheme allows us to reduce the number of required posterior evaluations by two orders of magnitude compared to traditional Monte Carlo inference. Our algorithm allows for parallel evaluations of the posterior at optimal locations, further reducing wall-clock times. We significantly improve performance using properties of the posterior in our active learning scheme and for the definition of the GP prior. In particular we account for the expected dynamical range of the posterior in different dimensionalities. We test our model against a number of synthetic and cosmological examples. GPry outperforms traditional Monte Carlo methods when the evaluation time of the likelihood (or the calculation of theoretical observables) is of the order of seconds; for evaluation times of over a minute it can perform inference in days that would take months using traditional methods. GPry is distributed as an open source Python package (pip install gpry) and can also be found at https://github.com/jonaselgammal/GPry.
translated by 谷歌翻译
贝叶斯脑假设假设大脑根据贝叶斯定理进行准确地运行统计分布。突触前囊泡释放神经递质的随机性失效可以让大脑从网络参数的后部分布中样本,被解释为认知不确定性。尚未显示出先前随机故障可能允许网络从观察到的分布中采样,也称为炼肠或残留不确定性。两个分布的采样使概率推断,高效搜索和创造性或生成问题解决。我们证明,在基于人口码的神经活动的解释下,可以用单独的突触衰竭来表示和对两种类型的分布进行分布。我们首先通过突触故障和横向抑制来定义生物学限制的神经网络和采样方案。在该框架内,我们派生基于辍学的认知不确定性,然后从突触功效证明了允许网络从任意,由接收层表示的分布来释放概率的分析映射。其次,我们的结果导致了本地学习规则,突触将适应其发布概率。我们的结果表明,在生物学限制的网络中,仅使用本地学习的突触失败率,与变分的贝叶斯推断相关的完整贝叶斯推断。
translated by 谷歌翻译
语言是协调问题的强大解决方案:他们提供了稳定的,有关我们所说的单词如何对应于我们头脑中的信仰和意图的共同期望。然而,在变量和非静止社会环境中的语言使用需要语言表征来灵活:旧词在飞行中获取新的临时或合作伙伴特定含义。在本文中,我们介绍了柴(通过推理的连续分层适应),一个分层贝叶斯的协调理论和会议组织,旨在在这两个基本观察之间调和长期张力。我们认为,沟通的中央计算问题不仅仅是传输,如在经典配方中,而是在多个时间尺度上持续学习和适应。合作伙伴特定的共同点迅速出现在数型互动中的社会推论中,而社群范围内的社会公约是稳定的前锋,这些前锋已经抽象出与多个合作伙伴的互动。我们展示了新的实证数据,展示了我们的模型为多个现象提供了对先前账户挑战的计算基础:(1)与同一合作伙伴的重复互动的更有效的参考表达的融合(2)将合作伙伴特定的共同基础转移到陌生人,并(3)交际范围的影响最终会形成。
translated by 谷歌翻译
在本文中,我们在人工代理中介绍了活跃的自我的计算建模叙述。特别是,我们专注于代理人如何配备控制意识以及它在自主位于行动中的方式以及反过来,影响行动控制。我们认为这需要铺设一个体现的认知模型,将自下而上的过程(传感器学习和对控制的细粒度适应)与自上而下的过程(战略选择和决策的认知过程)。我们基于预测处理和自由能量最小化的原理提出了这种概念计算架构。使用此常规模型,我们描述了控制层次结构的级别的控制感以及如何支持在不可预测的环境中的动作控制。我们在模型的实施以及模拟任务场景中的第一评估,其中自主代理必须应对不可预测的情况并经历相应的控制感。我们探讨了不同的型号参数设置,导致不同方式结合低电平和高级动作控制。结果表明,在低/高级动作控制需求的情况下适当加权信息的重要性,并且他们证明了控制的感觉如何促进这一点。
translated by 谷歌翻译
神经密度估计值证明在各种研究领域进行高效的仿真贝叶斯推理方面具有显着强大。特别是,Bayesflow框架使用两步方法来实现在仿真程序隐式地定义似然函数的设置中的摊销参数估计。但是当模拟是现实差的差异时,这种推断是多么忠实?在本文中,我们概念化了基于模拟的推论中出现的模型误操作的类型,并系统地研究了这些误操作下的Bayesflow框架的性能。我们提出了一个增强优化目标,它对潜伏数据空间上的概率结构施加了概率结构,并利用了最大平均差异(MMD)来检测推理期间的可能灾难性的误操作,破坏了所获得的结果的有效性。我们验证了许多人工和现实的误操作的检测标准,从玩具共轭模型到复杂的决策和疾病爆发动态的复杂模型应用于实际数据。此外,我们表明后部推理误差随着真实数据生成分布与潜在摘要空间中的典型模拟集之间的常数而增加。因此,我们展示了MMD的双重实用性作为检测模型误操作的方法和作为验证摊销贝叶斯推理的忠实性的代理。
translated by 谷歌翻译
在心理实验期间,使用选择反应时间数据观察人类决策行为。该数据的漂移扩散模型由维纳(Wiener)的第一邮箱时间(WFPT)分布组成,并通过认知参数描述:漂移速率,边界分离和起点。这些估计的参数是神经科学家的感兴趣,因为它们可以映射到决策过程的特征(例如速度,谨慎和偏见),并且与大脑活动有关。观察到的RT模式还反映了从神经动力学介导的试验到试验的认知过程的可变性。我们调整了基于SINCNET的浅神经网络体系结构,以使用每项实验试验中的EEG信号符合漂移扩散模型。该模型由SINCNET层,深度空间卷积层和两个单独的FC层组成,可预测每个试验的漂移速率和边界。 SINCNET层参数化了内核,以直接学习应用于脑电图数据以预测漂移和边界参数的带通滤波器的低和高截止频率。在训练过程中,通过最大程度地降低给定试验RT的WFPT分布的负模可能性函数来更新模型参数。我们为执行两项强制选择任务的每个参与者开发了单独的决策SINCNET模型。我们的结果表明,与训练和测试数据集中的中位数估计相比,漂移和边界的单试估计在预测RT方面的性能更好,这表明我们的模型可以成功地使用EEG特征来估计有意义的单试扩散模型参数。此外,浅层SINCNET体系结构确定了与证据积累和谨慎相关的信息处理的时间窗口以及反映每个参与者中这些过程的EEG频段。
translated by 谷歌翻译
流行病学中的数学模型是一种不可或缺的工具,可以确定传染病的动态和重要特征。除了他们的科学价值之外,这些模型通常用于在正在进行的爆发期间提供政治决策和干预措施。然而,通过将复杂模型连接到真实数据来可靠地推断正在进行的爆发的动态仍然很难,并且需要费力的手动参数拟合或昂贵的优化方法,这些方法必须从划痕中重复给定模型的每个应用。在这项工作中,我们用专门的神经网络的流行病学建模的新组合来解决这个问题。我们的方法需要两个计算阶段:在初始训练阶段中,描述该流行病的数学模型被用作神经网络的教练,该主管是关于全球可能疾病动态的全球知识。在随后的推理阶段,训练有素的神经网络处理实际爆发的观察到的数据,并且揭示了模型的参数,以便实际地再现观察到的动态并可可靠地预测未来的进展。通过其灵活的框架,我们的仿真方法适用于各种流行病学模型。此外,由于我们的方法是完全贝叶斯的,它旨在纳入所有可用的关于合理参数值的先前知识,并返回这些参数上的完整关节后部分布。我们的方法在德国的早期Covid-19爆发阶段的应用表明,我们能够获得可靠的概率估计对重要疾病特征,例如生成时间,未检测到的感染部分,症状发作前的传播可能性,以及报告延迟非常适中的现实观测。
translated by 谷歌翻译
Taking advice from others requires confidence in their competence. This is important for interaction with peers, but also for collaboration with social robots and artificial agents. Nonetheless, we do not always have access to information about others' competence or performance. In these uncertain environments, do our prior beliefs about the nature and the competence of our interacting partners modulate our willingness to rely on their judgments? In a joint perceptual decision making task, participants made perceptual judgments and observed the simulated estimates of either a human participant, a social humanoid robot or a computer. Then they could modify their estimates based on this feedback. Results show participants' belief about the nature of their partner biased their compliance with its judgments: participants were more influenced by the social robot than human and computer partners. This difference emerged strongly at the very beginning of the task and decreased with repeated exposure to empirical feedback on the partner's responses, disclosing the role of prior beliefs in social influence under uncertainty. Furthermore, the results of our functional task suggest an important difference between human-human and human-robot interaction in the absence of overt socially relevant signal from the partner: the former is modulated by social normative mechanisms, whereas the latter is guided by purely informational mechanisms linked to the perceived competence of the partner.
translated by 谷歌翻译
Mathematical models of cognition are often memoryless and ignore potential fluctuations of their parameters. However, human cognition is inherently dynamic, regardless of the reference time scale. Thus, we propose to augment mechanistic cognitive models with a temporal dimension and estimate the resulting dynamics from a superstatistics perspective. In its simplest form, such a model entails a hierarchy between a low-level observation model and a high-level transition model. The observation model describes the local behavior of a system, and the transition model specifies how the parameters of the observation model evolve over time. To overcome the estimation challenges resulting from the complexity of superstatistical models, we develop and validate a simulation-based deep learning method for Bayesian inference, which can recover both time-varying and time-invariant parameters. We first benchmark our method against two existing frameworks capable of estimating time-varying parameters. We then apply our method to fit a dynamic version of the diffusion decision model to long time series of human response times data. Our results show that the deep learning approach is very efficient in capturing the temporal dynamics of the model. Furthermore, we show that the erroneous assumption of static or homogeneous parameters will hide important temporal information.
translated by 谷歌翻译
人类不断受到他人的行为和观点的影响。至关重要的是,人类之间的社会影响是由互惠构成的:我们更多地遵循一直在考虑我们意见的人的建议。在当前的工作中,我们研究了与社会类人机器人互动时相互影响的影响是否可以出现。在一项联合任务中,人类参与者和人形机器人进行了感知估计,然后在观察伴侣的判断后可以公开修改它们。结果表明,赋予机器人表达和调节其对人类判断的易感水平的能力代表了双刃剑。一方面,当机器人遵循他们的建议时,参与者对机器人的能力失去了信心。另一方面,参与者不愿透露他们对易感机器人缺乏信心,这表明出现了支持人类机器人合作的社会影响力的相互机制。
translated by 谷歌翻译
基于采样的推理技术是现代宇宙学数据分析的核心;然而,这些方法与维度不良,通常需要近似或顽固的可能性。在本文中,我们描述了截短的边际神经比率估计(TMNRE)(即所谓的基于模拟的推断的新方法)自然避免了这些问题,提高了$(i)$效率,$(ii)$可扩展性和$ (iii)推断后的后续后续的可信度。使用宇宙微波背景(CMB)的测量,我们表明TMNRE可以使用比传统马尔可夫链蒙特卡罗(MCMC)方法更少模拟器呼叫的数量级来实现融合的后海后。值得注意的是,所需数量的样本有效地独立于滋扰参数的数量。此外,称为\ MEMPH {本地摊销}的属性允许对基于采样的方法无法访问的严格统计一致性检查的性能。 TMNRE承诺成为宇宙学数据分析的强大工具,特别是在扩展宇宙学的背景下,其中传统的基于采样的推理方法所需的时间级数融合可以大大超过$ \ Lambda $ CDM等简单宇宙学模型的时间。为了执行这些计算,我们使用开源代码\ texttt {swyft}来使用TMNRE的实现。
translated by 谷歌翻译
在2015年和2019年之间,地平线的成员2020年资助的创新培训网络名为“Amva4newphysics”,研究了高能量物理问题的先进多变量分析方法和统计学习工具的定制和应用,并开发了完全新的。其中许多方法已成功地用于提高Cern大型Hadron撞机的地图集和CMS实验所执行的数据分析的敏感性;其他几个人,仍然在测试阶段,承诺进一步提高基本物理参数测量的精确度以及新现象的搜索范围。在本文中,在研究和开发的那些中,最相关的新工具以及对其性能的评估。
translated by 谷歌翻译
人类的感知基于无意识的推论,其中感觉输入与先前的信息集成在一起。这种现象被称为上下文依赖性,有助于面对外部世界的不确定性,并在先前的经验上构建了预测。另一方面,人类的感知过程固有地是由社会互动塑造的。但是,上下文依赖性的机制如何影响到迄今为止未知。如果使用以前的经验 - 先验 - 在单个环境中是有益的,那么它可能代表了其他代理商可能没有相同先验的社会场景中的问题,从而在共享环境上造成了感知的错误。本研究解决了这个问题。我们研究了与人形机器人ICUB的互动环境中的上下文依赖性,该机器人是刺激示威者。参与者在两个条件下重现了机器人所示的长度:一个具有社交性的ICUB,另一个与ICUB充当机械臂。机器人的不同行为显着影响了感知的先验使用。此外,社会机器人通过提高准确性并减少参与者的总体感知错误,从而对感知性能产生积极影响。最后,观察到的现象是按照贝叶斯的方法加深和探索共同感知的新概念进行了建模的。
translated by 谷歌翻译
这本数字本书包含在物理模拟的背景下与深度学习相关的一切实际和全面的一切。尽可能多,所有主题都带有Jupyter笔记本的形式的动手代码示例,以便快速入门。除了标准的受监督学习的数据中,我们将看看物理丢失约束,更紧密耦合的学习算法,具有可微分的模拟,以及加强学习和不确定性建模。我们生活在令人兴奋的时期:这些方法具有从根本上改变计算机模拟可以实现的巨大潜力。
translated by 谷歌翻译
项目反应理论(IRT)是一个无处不在的模型,可以根据他们对问题的回答理解人类行为和态度。大型现代数据集为捕捉人类行为的更多细微差别提供了机会,从而有可能改善心理测量模型,从而改善科学理解和公共政策。但是,尽管较大的数据集允许采用更灵活的方法,但许多用于拟合IRT模型的当代算法也可能具有禁止现实世界应用的巨大计算需求。为了解决这种瓶颈,我们引入了IRT的变异贝叶斯推理算法,并表明它在不牺牲准确性的情况下快速可扩展。将此方法应用于认知科学和教育的五个大规模项目响应数据集中,比替代推理算法更高的对数可能性和更高的准确性。然后,使用这种新的推论方法,我们将IRT概括为具有表现力的贝叶斯响应模型,利用深度学习的最新进展来捕获具有神经网络的非线性项目特征曲线(ICC)。使用TIMSS的特定级数学测试,我们显示我们的非线性IRT模型可以捕获有趣的不对称ICC。该算法实现是开源的,易于使用。
translated by 谷歌翻译
现代深度学习方法构成了令人难以置信的强大工具,以解决无数的挑战问题。然而,由于深度学习方法作为黑匣子运作,因此与其预测相关的不确定性往往是挑战量化。贝叶斯统计数据提供了一种形式主义来理解和量化与深度神经网络预测相关的不确定性。本教程概述了相关文献和完整的工具集,用于设计,实施,列车,使用和评估贝叶斯神经网络,即使用贝叶斯方法培训的随机人工神经网络。
translated by 谷歌翻译
概率模型告知越来越广泛的商业和政策决策最终是人们的。最近的算法,计算和软件框架开发进步促进了贝叶斯概率模型的扩散,其通过其联合分布而不是点估计来表征未观察的参数。虽然他们可以授权决策者探索复杂的查询并在理论上执行什么样式的调理,因此需要适当的可视化和交互式工具来最大化用户的理解和理性决策在不确定性下。在本文中,提出了一种对贝叶斯模型的定量评估的协议,并引入实现该协议的软件框架,以支持评估实践中的标准化,并促进再现性。我们说明了对用户学习的评估和分析工作流程,探讨了制作Boxpots和假设结果情节互动可以增加理解或合理性,并在未来寻求进行类似研究的研究人员的设计指导方针得出。
translated by 谷歌翻译
贝叶斯分析中的先验者通常编码信息域知识,这些知识可用于使推理过程更有效。但是,有时,先验可能是给定数据集的参数值的代表性的,这可能导致参数空间探索效率低下,甚至是错误的推论,尤其是对于嵌套采样(NS)算法。在这种情况下,仅仅在某些应用中扩大了先验可能是不合适的或不可能的。因此,我们以前对该问题的解决方案(称为后验电源(PR))在保持产品固定的同时重新定义了先前和可能性,以使后验推断和证据估计保持不变,但是NS过程的效率显着提高。 PR在其最实用的形式中提高了某些功率beta的提高,该beta是作为一个辅助变量引入的,必须根据具体情况确定,通常是通过根据某些预定的“退火时间表”降低beta的统一性来确定的。 '直到产生的推论会收敛到一致的解决方案。在这里,我们提出了一种非常简单但功能强大的替代贝叶斯方法,其中beta被视为从数据与问题的原始参数一起从数据推断出来的超参数,然后边缘化以获得最终推断。我们通过数值示例表明,这种贝叶斯PR(BPR)方法为使用NS的贝叶斯推断中未代表性的先验问题提供了一种非常健壮,自我适应和计算有效的“手持”解决方案。此外,与原始PR方法不同,我们表明,即使对于代表性的PRIORS,BPR也相对于标准嵌套采样而具有可忽略的计算间接费用,这表明它应在所有NS分析中用作默认值。
translated by 谷歌翻译
我们提出了一种小型任务,可以衡量人们如何基于观察单个(实验1)或几个(实验2)对象对之间的因果相互作用来概括物体的因果动力。我们提出了一种计算建模框架,可以在我们的任务环境中综合人类的泛化模式,并阐明人们如何有效地浏览可能的因果函数和类别的组成空间。我们的建模框架结合了使用代理和收件人对象的特征和关系的因果函数发生器,以及贝叶斯非参数推断过程,以控制基于相似性的概念。我们的模型具有自然的“资源合理的”变体,可以在描述参与者时优于一个天真的贝叶斯账户,特别是在我们的行为实验中再现透明阶效应和因果不对称。我们认为,该建模框架为真实世界因果概念提供了计算上的合理机制。
translated by 谷歌翻译