因果发现是学习给定观察数据的变量之间的因果关系,对于许多应用程序很重要。现有的因果发现方法假设数据足够,在许多现实世界数据集中可能并非如此。结果,在有限的数据下,许多现有的因果发现方法可能会失败。在这项工作中,我们提出了贝叶斯的频繁独立性测试,以在数据不足下提高基于约束的因果发现方法的性能:1)我们首先引入了一种贝叶斯方法来估计互信息(MI),我们提出了一个可靠的方法基于MI的独立测试; 2)其次,我们考虑了假设可能性的贝叶斯估计,并将其纳入定义明确的统计检验中,从而进行了基于统计测试的强大独立性检验。我们将提出的独立测试应用于基于约束的因果发现方法,并评估样品不足的基准数据集上的性能。实验在SOTA方法的准确性和效率方面表现出显着的性能提高。
translated by 谷歌翻译
State-of-the-art causal discovery methods usually assume that the observational data is complete. However, the missing data problem is pervasive in many practical scenarios such as clinical trials, economics, and biology. One straightforward way to address the missing data problem is first to impute the data using off-the-shelf imputation methods and then apply existing causal discovery methods. However, such a two-step method may suffer from suboptimality, as the imputation algorithm may introduce bias for modeling the underlying data distribution. In this paper, we develop a general method, which we call MissDAG, to perform causal discovery from data with incomplete observations. Focusing mainly on the assumptions of ignorable missingness and the identifiable additive noise models (ANMs), MissDAG maximizes the expected likelihood of the visible part of observations under the expectation-maximization (EM) framework. In the E-step, in cases where computing the posterior distributions of parameters in closed-form is not feasible, Monte Carlo EM is leveraged to approximate the likelihood. In the M-step, MissDAG leverages the density transformation to model the noise distributions with simpler and specific formulations by virtue of the ANMs and uses a likelihood-based causal discovery algorithm with directed acyclic graph constraint. We demonstrate the flexibility of MissDAG for incorporating various causal discovery algorithms and its efficacy through extensive simulations and real data experiments.
translated by 谷歌翻译
检测条件独立性在几个统计和机器学习任务中起着关键作用,尤其是在因果发现算法中。在这项研究中,我们介绍了LCIT(基于潜在的条件独立性检验) - 一种基于表示学习的有条件独立性测试的新型非参数方法。我们的主要贡献涉及提出一个生成框架,在该框架中测试X和Y之间的独立性,我们首先学会推断目标变量X和Y的潜在表示,该代表不包含有关条件变量Z的信息。潜在变量是然后研究了任何剩余的显着依赖性,可以使用常规的部分相关测试进行。经验评估表明,在不同的评估指标下,LCIT始终超过几个最先进的基线,并且能够很好地适应非线性和高维度的各种合成和真实数据集的集合。
translated by 谷歌翻译
We present a new algorithm for Bayesian network structure learning, called Max-Min Hill-Climbing (MMHC). The algorithm combines ideas from local learning, constraint-based, and search-and-score techniques in a principled and effective way. It first reconstructs the skeleton of a Bayesian network and then performs a Bayesian-scoring greedy hill-climbing search to orient the edges. In our extensive empirical evaluation MMHC outperforms on average and in terms of various metrics several prototypical and state-of-the-art algorithms, namely the PC, Sparse Candidate, Three Phase Dependency Analysis, Optimal Reinsertion, Greedy Equivalence Search, and Greedy Search. These are the first empirical results simultaneously comparing most of the major Bayesian network algorithms against each other. MMHC offers certain theoretical advantages, specifically over the Sparse Candidate algorithm, corroborated by our experiments. MMHC and detailed results of our study are publicly available at http://www.dsl-lab.org/supplements/mmhc paper/mmhc index.html.
translated by 谷歌翻译
在非参数环境中,因果结构通常仅在马尔可夫等效性上可识别,并且出于因果推断的目的,学习马尔可夫等效类(MEC)的图形表示很有用。在本文中,我们重新审视了贪婪的等效搜索(GES)算法,该算法被广泛引用为一种基于分数的算法,用于学习基本因果结构的MEC。我们观察到,为了使GES算法在非参数设置中保持一致,不必设计评估图的评分度量。取而代之的是,足以插入有条件依赖度量的一致估计器来指导搜索。因此,我们提出了GES算法的重塑,该算法比基于标准分数的版本更灵活,并且很容易将自己带到非参数设置,并具有条件依赖性的一般度量。此外,我们提出了一种神经条件依赖性(NCD)度量,该措施利用深神经网络的表达能力以非参数方式表征条件独立性。我们根据标准假设建立了重新构架GES算法的最佳性,并使用我们的NCD估计器来决定条件独立性的一致性。这些结果共同证明了拟议的方法。实验结果证明了我们方法在因果发现中的有效性,以及使用我们的NCD度量而不是基于内核的措施的优势。
translated by 谷歌翻译
本地到全球学习方法在贝叶斯网络(BN)结构学习中起着重要作用。现有的本地到全局学习算法首先通过在数据集中学习每个变量的MB(马尔可夫毯子)或PC(家长和儿童)来构建DAG(Markov毯子)或PC(父母和儿童),然后在骨架中定向边缘。然而,现有的MB或PC学习方法通​​常是昂贵的昂贵昂贵,特别是具有大型BN,导致局部到全局学习算法效率低下。为了解决问题,在本文中,我们使用特征选择开发了一个有效的本地到全局学习方法。具体地,我们首先分析众所周知的最小冗余和最大相关性(MRMR)特征选择方法的基本原理,用于学习变量的PC集。基于分析,我们提出了一种高效的F2SL(基于特征选择的结构学习)方法,以局部 - 全局BN结构学习。 F2SL方法首先采用MRMR方法来学习DAG骨架,然后在骨架中的边缘。采用独立测试或进行定向边缘的分数函数,我们将F2SL方法实例化为两个新算法,F2SL-C(使用独立测试)和F2SL-S(使用得分函数)。与最先进的本地到全局BN学习算法相比,实验验证了本文中所提出的算法比比较算法更有效,提供竞争性结构学习质量。
translated by 谷歌翻译
在学习从观察数据中学习贝叶斯网络的图形结构是描述和帮助了解复杂应用程序中的数据生成过程的关键,而任务由于其计算复杂性而构成了相当大的挑战。代表贝叶斯网络模型的定向非循环图(DAG)通常不会从观察数据识别,并且存在各种方法来估计其等价类。在某些假设下,流行的PC算法可以通过测试条件独立(CI)一致地始终恢复正确的等价类,从边际独立关系开始,逐步扩展调节集。这里,我们提出了一种通过利用协方差与精密矩阵之间的反向关系来执行PC算法内的CI测试的新颖方案。值得注意的是,精密矩阵的元素与高斯数据的部分相关性。然后,我们的算法利用对协方差和精密矩阵的块矩阵逆转,同时对互补(或双)调节集的部分相关性进行测试。因此,双PC算法的多个CI测试首先考虑边缘和全阶CI关系并逐步地移动到中心顺序。仿真研究表明,双PC算法在运行时和恢复底层网络结构方面都优于经典PC算法。
translated by 谷歌翻译
重度抑郁症(MDD)需要研究患者的大脑功能连通性改变,可以通过静止状态功能磁共振成像(RS-FMRI)数据发现。我们考虑确定单个MDD患者大脑功能连通性改变的问题。这是特别困难的,因为在fMRI扫描期间收集的数据量过于限制,无法为个人分析提供足够的信息。此外,RS-FMRI数据通常具有不完整,稀疏性,可变性,高维度和高噪声的特征。为了解决这些问题,我们提出了一个多任务高斯贝叶斯网络(MTGBN)框架,该框架能够识别MDD患者的个体疾病诱导的改变。我们假设这种疾病引起的改变显示了与该工具相似的程度,以学习从观察到了解系统如何共同从相关任务结构构造的网络结构。首先,我们将每类观察中的每个患者视为一项任务,然后通过从共享编码先验知识的默认协方差矩阵的所有任务中学习该数据类的高斯贝叶斯网络(GBN)。此设置可以帮助我们从有限的数据中学习更多信息。接下来,我们得出了完整的似然函数的封闭式公式,并使用蒙特卡洛期望 - 最大化(MCEM)算法有效地搜索大约最佳的贝叶斯网络结构。最后,我们通过模拟和现实世界的RS-FMRI数据评估方法的性能。
translated by 谷歌翻译
Causal structure learning from observational data remains a non-trivial task due to various factors such as finite sampling, unobserved confounding factors, and measurement errors. Constraint-based and score-based methods tend to suffer from high computational complexity due to the combinatorial nature of estimating the directed acyclic graph (DAG). Motivated by the `Cause-Effect Pair' NIPS 2013 Workshop on Causality Challenge, in this paper, we take a different approach and generate a probability distribution over all possible graphs informed by the cause-effect pair features proposed in response to the workshop challenge. The goal of the paper is to propose new methods based on this probabilistic information and compare their performance with traditional and state-of-the-art approaches. Our experiments, on both synthetic and real datasets, show that our proposed methods not only have statistically similar or better performances than some traditional approaches but also are computationally faster.
translated by 谷歌翻译
因果推断对于跨业务参与,医疗和政策制定等领域的数据驱动决策至关重要。然而,关于因果发现的研究已经与推理方法分开发展,从而阻止了两个领域方法的直接组合。在这项工作中,我们开发了深层端到端因果推理(DECI),这是一种基于流动的非线性添加噪声模型,该模型具有观察数据,并且可以执行因果发现和推理,包括有条件的平均治疗效果(CATE) )估计。我们提供了理论上的保证,即DECI可以根据标准因果发现假设恢复地面真实因果图。受应用影响的激励,我们将该模型扩展到具有缺失值的异质,混合型数据,从而允许连续和离散的治疗决策。我们的结果表明,与因果发现的相关基线相比,DECI的竞争性能和(c)在合成数据集和因果机器学习基准测试基准的一千多个实验中,跨数据类型和缺失水平进行了估计。
translated by 谷歌翻译
Using a Bayesian network to analyze the causal relationship between nodes is a hot spot. The existing network learning algorithms are mainly constraint-based and score-based network generation methods. The constraint-based method is mainly the application of conditional independence (CI) tests, but the inaccuracy of CI tests in the case of high dimensionality and small samples has always been a problem for the constraint-based method. The score-based method uses the scoring function and search strategy to find the optimal candidate network structure, but the search space increases too much with the increase of the number of nodes, and the learning efficiency is very low. This paper presents a new hybrid algorithm, MCME (multiple compound memory erasing). This method retains the advantages of the first two methods, solves the shortcomings of the above CI tests, and makes innovations in the scoring function in the direction discrimination stage. A large number of experiments show that MCME has better or similar performance than some existing algorithms.
translated by 谷歌翻译
考虑基于AI和ML的决策对这些新兴技术的安全和可接受的使用的决策的社会和道德后果至关重要。公平,特别是保证ML决定不会导致对个人或少数群体的歧视。使用因果关系,可以更好地实现和衡量可靠的公平/歧视,从而更好地实现了敏感属性(例如性别,种族,宗教等)之间的因果关系,仅仅是仅仅是关联,例如性别,种族,宗教等(例如,雇用工作,贷款授予等) )。然而,对因果关系解决公平性的最大障碍是因果模型的不可用(通常表示为因果图)。文献中现有的因果关系方法并不能解决此问题,并假设可获得因果模型。在本文中,我们没有做出这样的假设,并且我们回顾了从可观察数据中发现因果关系的主要算法。这项研究的重点是因果发现及其对公平性的影响。特别是,我们展示了不同的因果发现方法如何导致不同的因果模型,最重要的是,即使因果模型之间的轻微差异如何对公平/歧视结论产生重大影响。通过使用合成和标准公平基准数据集的经验分析来巩固这些结果。这项研究的主要目标是强调因果关系使用因果关系适当解决公平性的因果发现步骤的重要性。
translated by 谷歌翻译
我们研究了全球优化因果关系变量的因果关系变量的问题,在该目标变量中可以进行干预措施。这个问题在许多科学领域都引起,包括生物学,运营研究和医疗保健。我们提出了因果熵优化(CEO),该框架概括了因果贝叶斯优化(CBO),以说明所有不确定性来源,包括由因果图结构引起的。首席执行官在因果效应的替代模型中以及用于通过信息理论采集函数选择干预措施的机制中纳入了因果结构的不确定性。所得算法自动交易结构学习和因果效应优化,同时自然考虑观察噪声。对于各种合成和现实世界的结构性因果模型,与CBO相比,CEO可以更快地与全局最佳达到融合,同时还可以学习图形。此外,我们的结构学习和因果优化的联合方法在顺序的结构学习优先方法上改善了。
translated by 谷歌翻译
Bayesian causal structure learning aims to learn a posterior distribution over directed acyclic graphs (DAGs), and the mechanisms that define the relationship between parent and child variables. By taking a Bayesian approach, it is possible to reason about the uncertainty of the causal model. The notion of modelling the uncertainty over models is particularly crucial for causal structure learning since the model could be unidentifiable when given only a finite amount of observational data. In this paper, we introduce a novel method to jointly learn the structure and mechanisms of the causal model using Variational Bayes, which we call Variational Bayes-DAG-GFlowNet (VBG). We extend the method of Bayesian causal structure learning using GFlowNets to learn not only the posterior distribution over the structure, but also the parameters of a linear-Gaussian model. Our results on simulated data suggest that VBG is competitive against several baselines in modelling the posterior over DAGs and mechanisms, while offering several advantages over existing methods, including the guarantee to sample acyclic graphs, and the flexibility to generalize to non-linear causal mechanisms.
translated by 谷歌翻译
有条件的独立性(CI)测试是因果推理中许多方法来模型测试和结构学习的方法。大多数现有的CI测试用于分类和序数数据,将样品通过条件变量分类,在每个层中进行简单的独立性测试,然后结合结果。不幸的是,随着条件变量的增加,该方法的统计能力迅速降低。在这里,我们提出了一个简单的统一CI测试,以实现序数和分类数据,该测试在高维度中保持合理的校准和功率。我们表明,我们的测试在密集的有向图形模型的模型测试和结构学习中优于现有基线,同时与稀疏模型相当。我们的方法对于因果模型测试可能具有吸引力,因为它易于实现,可以与非参数或参数概率模型一起使用,具有对称属性,并且具有合理的计算要求。
translated by 谷歌翻译
在贝叶斯网络(BNS)中,边缘方向对于因果推理和推理至关重要。然而,马尔可夫等价类考虑因素意味着它并不总是可以建立边缘方向,这就是许多BN结构学习算法不能从纯粹观察数据定向所有边缘的原因。此外,潜在的混乱会导致假阳性边缘。已经提出了相对较少的方法来解决这些问题。在这项工作中,我们介绍了从涉及观察数据集的离散数据和一个或多个介入数据集的离散数据的结构学习的混合MFGS-BS(Meance规则和快速贪婪等价搜索)算法。该算法假设存在潜在变量的因果不足,并产生部分祖先图形(PAG)。结构学习依赖于混合方法和新的贝叶斯评分范式,用于计算添加到学习图表的每个定向边缘的后验概率。基于众所周知的网络的实验结果高达109个变量和10K样本大小表明,MFGS-BS相对于最先进的结构提高了结构学习准确性,并且它是计算效率的。
translated by 谷歌翻译
在许多学科中,在大量解释变量中推断反应变量的直接因果父母的问题具有很高的实际意义。但是,建立的方法通常至少会随着解释变量的数量而呈指数级扩展,难以扩展到非线性关系,并且很难扩展到周期性数据。受{\ em Debiased}机器学习方法的启发,我们研究了一种单Vs.-the-Rest特征选择方法,以发现响应的直接因果父母。我们提出了一种用于纯观测数据的算法,同时还提供理论保证,包括可能在周期存在下的部分非线性关系的情况。由于它仅需要对每个变量进行一个估计,因此我们的方法甚至适用于大图。与既定方法相比,我们证明了显着改善。
translated by 谷歌翻译
结构方程模型(SEM)是一种有效的框架,其原因是通过定向非循环图(DAG)表示的因果关系。最近的进步使得能够从观察数据中实现了DAG的最大似然点估计。然而,在实际场景中,可以不能准确地捕获在推断下面的底层图中的不确定性,其中真正的DAG是不可识别的并且/或观察到的数据集是有限的。我们提出了贝叶斯因果发现网(BCD网),一个变分推理框架,用于估算表征线性高斯SEM的DAG的分布。由于图形的离散和组合性质,开发一个完整的贝叶斯后面是挑战。我们通过表达变分别家庭分析可扩展VI的可扩展VI的关键设计选择,例如1)表达性变分别家庭,2)连续弛豫,使低方差随机优化和3)在潜在变量上具有合适的前置。我们提供了一系列关于实际和合成数据的实验,显示BCD网在低数据制度中的标准因果发现度量上的最大似然方法,例如结构汉明距离。
translated by 谷歌翻译
由于数据有限和非识别性,观察性和介入数据的因果发现是具有挑战性的:在估计基本结构因果模型(SCM)时引入不确定性的因素。基于这两个因素引起的不确定性选择实验(干预措施)可以加快SCM的识别。来自有限数据的因果发现实验设计中的现有方法要么依赖于SCM的线性假设,要么仅选择干预目标。这项工作将贝叶斯因果发现的最新进展纳入了贝叶斯最佳实验设计框架中,从而使大型非线性SCM的积极因果发现同时选择了介入目标和值。我们证明了对线性和非线性SCM的合成图(ERDOS-R \'enyi,breetr cable)以及在\ emph {intiLico}单细胞基因调节网络数据集的\ emph {inyeare scms的性能。
translated by 谷歌翻译
本文提出了一种新的因果发现方法,即结构不可知的建模(SAM)。SAM利用条件独立性和分布不对称性,旨在从观察数据中找到潜在的因果结构。该方法基于不同玩家之间的游戏,该游戏将每个变量分布有条件地作为神经网估算,而对手则旨在区分生成的数据与原始数据。结合分布估计,稀疏性和无环限制的学习标准用于通过随机梯度下降来实施图形结构和参数的优化。SAM在合成和真实数据上进行了实验验证。
translated by 谷歌翻译