在许多科学应用中,恢复成对相互作用,即在输出上的连接效应与其边际效应的总和不同的输入特征对。我们将这个问题的解决方案概念化为两个阶段的过程:首先,我们使用灵活的混合神经网络模拟特征和输出之间的关系;第二,我们检测训练模型的特征交互。对于第二步,我们提出了一种简单直观的交互测量(IM),它对第一步中使用的机器学习模型没有特定的要求,只是它定义了从输入到输出的映射。在特殊情况下,它会减少输入 - 输出映射的平均Hessian。重要的是,我们的methodupper将交互恢复错误与学习模型的错误联系起来,这确保了我们可以通过训练更准确的模型来改善恢复的交互。我们提供模拟和现实世界数据的分析,它们证明了我们的方法与可用替代品相比的好处,并在理论上分析了它的性质以及与其他方法的关系。
translated by 谷歌翻译
定居宿主的细菌群体在宿主健康中起着重要作用,包括作为向其他宿主传播的宿主以及从中出现侵入性菌株,从而强调了解殖民群体的获得和清除的重要性。对殖民化动力学的研究基于对连续样品是否代表单个群体或不同的定植事件的评估。估算采集和清除率的共同点是使用固定的遗传距离阈值。然而,这种方法通常不足以解释潜在的主体内发展人口的多样性,连续测量之间的时间间隔以及估计的获取和清除率的不确定性。在这里,我们总结了最近提交的工作\ cite {jarvenpaa2018named},并提出了一个贝叶斯模型,它提供了两个菌株是否应该被认为是相同的概率,允许确定细菌清除和从基因组样本中获取时间。我们使用种群遗传模拟明确地模拟宿主内变异,并且通过使用近似贝叶斯计算(ABC)和马尔可夫链蒙特卡罗(MCMC)的组合来组合来自多个数据源的信息来完成推断。我们使用该方法分析一组耐甲氧西林金黄色葡萄球菌(MRSA)分离株。
translated by 谷歌翻译
无可能性推理引擎(ELFI)是一个Python软件库,用于执行无可用推理(LFI)。 ELFI提供了一种方便的语法,用于将LFI中的组件(例如先验,模拟器,摘要或距离)安排到称为ELFI图的网络中。这些组件可以用各种语言实现。独立的ELFI图可以与任何可用的推理方法一起使用而无需修改。在ELFI中实现的中心方法是无可能性推理的贝叶斯优化(BOLFI),最近已经证明通过代理建模距离可以将无可能性推断加速到几个数量级。 ELFI还具有内置的输出数据存储支持,可用于重用和分析,并支持从多个核到群集环境的计算并行化。 ELFI旨在实现可扩展性,并提供扩展其功能的接口。这使得向ELFI添加新的推理方法变得简单并且自动与内置功能兼容。
translated by 谷歌翻译
近似贝叶斯计算(ABC)是贝叶斯推理的一种方法,当可能性不可用时,但是可以从模型中进行模拟。然而,许多ABC算法需要大量的模拟,这可能是昂贵的。为了降低计算成本,已经提出了贝叶斯优化(BO)和诸如高斯过程的模拟模型。贝叶斯优化使人们可以智能地决定在哪里评估模型下一个,但是常见的BO策略不是为了估计后验分布而设计的。我们的论文解决了文献中的这一差距。我们建议计算ABC后验密度的不确定性,这是因为缺乏模拟来准确估计这个数量,并且定义了测量这种不确定性的aloss函数。然后,我们建议选择下一个评估位置,以尽量减少预期的损失。实验表明,与普通BO策略相比,所提出的方法通常产生最准确的近似。
translated by 谷歌翻译
自主系统和人工智能在我们生活中不断增长的影响力和决策能力迫使我们考虑这些系统中嵌入的价值。但道德应该如何在这些系统中实施?在这项研究中,解决方案在哲学概念化中被视为形成人工智能伦理实践实施模型的框架。为了获得概念化的第一步,需要确定在该领域使用的主要概念。针对人工智能和道德规范中使用的关键词进行了基于关键词的系统映射研究(SMS),以帮助识别,挑战和比较当前人工智能伦理话语中使用的主要概念。在1062篇论文中,在83篇学术论文中,SMS发现了37个重新发生的关键词。 Wensuggest认为,关注寻找关键词是指导和提供AI伦理领域未来研究方向的第一步。
translated by 谷歌翻译
Bayesian matrix factorization (BMF) is a powerful tool for producing low-rank representations of matrices and for predicting missing values and providing confidence intervals. Scaling up the posterior inference for massive-scale matrices is challenging and requires distributing both data and computation over many workers, making communication the main computational bottleneck. Embarrassingly parallel inference would remove the communication needed, by using completely independent computations on different data subsets, but it suffers from the inherent unidentifiability of BMF solutions. We introduce a hierarchical decomposition of the joint posterior distribution, which couples the subset inferences, allowing for embarrassingly parallel computations in a sequence of at most three stages. Using an efficient approximate implementation, we show improvements empirically on both real and simulated data. Our distributed approach is able to achieve a speed-up of almost an order of magnitude over the full posterior, with a negligible effect on predictive accuracy. Our method outperforms state-of-the-art embarrassingly parallel MCMC methods in accuracy, and achieves results competitive to other available distributed and parallel implementations of BMF.
translated by 谷歌翻译