智能论文笔记

Differentiable and Transportable Structure Learning

Jeroen Berrevoets , Nabeel Seedat , Fergus Imrie , Mihaela van der Schaar

分类：机器学习 | (统计)机器学习

2022-06-13

我们对无监督的结构学习感兴趣，特别关注有向的无环图形（DAG）模型。推断这些结构所需的计算通常在变量量中是超指定性的，因为推理需要扫描组合较大的潜在结构空间。也就是说，直到最近允许使用可区分的度量标准搜索此空间，大幅度缩短了搜索时间。尽管该技术（名为Notears）被广泛认为是在DAG-DISCOVERY中的开创性工作，但它承认了一个重要的属性，有利于可怜性：可运输性。在我们的论文中，我们介绍了D型结构，该结构通过新颖的结构和损失功能在发现的结构中恢复可运输性，同时保持完全可区分。由于D型结构仍然可区分，因此可以像以前使用Notears一样轻松地采用我们的方法。在我们的实验中，我们根据边缘准确性和结构锤距离验证了D结构。

translated by 谷歌翻译

A Causal Research Pipeline and Tutorial for Psychologists and Social Scientists

Matthew J. Vowels

分类： (统计)机器学习

2022-06-10

因果关系是理解世界的科学努力的基本组成部分。不幸的是，在心理学和社会科学中，因果关系仍然是禁忌。由于越来越多的建议采用因果方法进行研究的重要性，我们重新制定了心理学研究方法的典型方法，以使不可避免的因果理论与其余的研究渠道协调。我们提出了一个新的过程，该过程始于从因果发现和机器学习的融合中纳入技术的发展，验证和透明的理论形式规范。然后，我们提出将完全指定的理论模型的复杂性降低到与给定目标假设相关的基本子模型中的方法。从这里，我们确定利息量是否可以从数据中估算出来，如果是的，则建议使用半参数机器学习方法来估计因果关系。总体目标是介绍新的研究管道，该管道可以（a）促进与测试因果理论的愿望兼容的科学询问（b）鼓励我们的理论透明代表作为明确的数学对象，（c）将我们的统计模型绑定到我们的统计模型中该理论的特定属性，因此减少了理论到模型间隙通常引起的规范不足问题，以及（d）产生因果关系和可重复性的结果和估计。通过具有现实世界数据的教学示例来证明该过程，我们以摘要和讨论来结论。

translated by 谷歌翻译

Differentiable Invariant Causal Discovery

Yu Wang , An Zhang , Xiang Wang , Xiangnan He , Tat-Seng Chua

分类：机器学习

2022-05-31

从观察数据中学习因果结构是机器学习的基本挑战。但是，大多数常用的可区分因果发现方法是不可识别的，这将此问题变成了容易发生数据偏差的连续优化任务。在许多现实生活中，数据是从不同环境中收集的，在不同的环境中，功能关系在整个环境中保持一致，而添加噪声的分布可能会有所不同。本文提出了可区分的因果发现（DICD），利用基于可区分框架的多环境信息，以避免学习虚假边缘和错误的因果方向。具体而言，DICD旨在在消除环境依赖性相关性的同时发现环境不变的因果关系。我们进一步制定了强制执行目标结构方程模型的约束，以在整个环境中保持最佳状态。在温和条件下提供了足够的环境，提供了针对拟议DICD的可识别性的理论保证。关于合成和现实世界数据集的广泛实验验证了DICD优于最先进的因果发现方法，而SHD中最高36％。我们的代码将是开源的。

translated by 谷歌翻译

Navigating causal deep learning

Jeroen Berrevoets , Krzysztof Kacprzyk , Zhaozhi Qian , Mihaela van der Schaar

分类：机器学习

2022-12-01

Causal deep learning (CDL) is a new and important research area in the larger field of machine learning. With CDL, researchers aim to structure and encode causal knowledge in the extremely flexible representation space of deep learning models. Doing so will lead to more informed, robust, and general predictions and inference -- which is important! However, CDL is still in its infancy. For example, it is not clear how we ought to compare different methods as they are so different in their output, the way they encode causal knowledge, or even how they represent this knowledge. This is a living paper that categorises methods in causal deep learning beyond Pearl's ladder of causation. We refine the rungs in Pearl's ladder, while also adding a separate dimension that categorises the parametric assumptions of both input and representation, arriving at the map of causal deep learning. Our map covers machine learning disciplines such as supervised learning, reinforcement learning, generative modelling and beyond. Our paradigm is a tool which helps researchers to: find benchmarks, compare methods, and most importantly: identify research gaps. With this work we aim to structure the avalanche of papers being published on causal deep learning. While papers on the topic are being published daily, our map remains fixed. We open-source our map for others to use as they see fit: perhaps to offer guidance in a related works section, or to better highlight the contribution of their paper.

translated by 谷歌翻译

Deep End-to-end Causal Inference

Tomas Geffner , Javier Antoran , Adam Foster , Wenbo Gong , Chao Ma , Emre Kiciman , Amit Sharma , Angus Lamb , Martin Kukla , Nick Pawlowski

分类： (统计)机器学习 | 机器学习

2022-02-04

因果推断对于跨业务参与，医疗和政策制定等领域的数据驱动决策至关重要。然而，关于因果发现的研究已经与推理方法分开发展，从而阻止了两个领域方法的直接组合。在这项工作中，我们开发了深层端到端因果推理（DECI），这是一种基于流动的非线性添加噪声模型，该模型具有观察数据，并且可以执行因果发现和推理，包括有条件的平均治疗效果（CATE））估计。我们提供了理论上的保证，即DECI可以根据标准因果发现假设恢复地面真实因果图。受应用影响的激励，我们将该模型扩展到具有缺失值的异质，混合型数据，从而允许连续和离散的治疗决策。我们的结果表明，与因果发现的相关基线相比，DECI的竞争性能和（c）在合成数据集和因果机器学习基准测试基准的一千多个实验中，跨数据类型和缺失水平进行了估计。

translated by 谷歌翻译

Causal Feature Selection via Orthogonal Search

Ashkan Soleymani , Anant Raj , Stefan Bauer , Bernhard Schölkopf , Michel Besserve

分类： (统计)机器学习 | 机器学习

2020-07-06

在许多学科中，在大量解释变量中推断反应变量的直接因果父母的问题具有很高的实际意义。但是，建立的方法通常至少会随着解释变量的数量而呈指数级扩展，难以扩展到非线性关系，并且很难扩展到周期性数据。受{\ em Debiased}机器学习方法的启发，我们研究了一种单Vs.-the-Rest特征选择方法，以发现响应的直接因果父母。我们提出了一种用于纯观测数据的算法，同时还提供理论保证，包括可能在周期存在下的部分非线性关系的情况。由于它仅需要对每个变量进行一个估计，因此我们的方法甚至适用于大图。与既定方法相比，我们证明了显着改善。

translated by 谷歌翻译

Causal Structure Learning: a Combinatorial Perspective

Chandler Squires , Caroline Uhler

分类：机器学习

2022-06-02

In this review, we discuss approaches for learning causal structure from data, also called causal discovery. In particular, we focus on approaches for learning directed acyclic graphs (DAGs) and various generalizations which allow for some variables to be unobserved in the available data. We devote special attention to two fundamental combinatorial aspects of causal structure learning. First, we discuss the structure of the search space over causal graphs. Second, we discuss the structure of equivalence classes over causal graphs, i.e., sets of graphs which represent what can be learned from observational data alone, and how these equivalence classes can be refined by adding interventional data.

translated by 谷歌翻译

Masked Gradient-Based Causal Structure Learning

Ignavier Ng , Shengyu Zhu , Zhuangyan Fang , Haoyang Li , Zhitang Chen , Jun Wang

分类：机器学习 | (统计)机器学习

2019-10-18

本文研究了从观察数据学习因果关系的问题。我们用二进制图邻接矩阵参数化的形式重整结构方程模型（SEM），并显示，如果原始SEM是可识别的，则可以识别二进制邻接矩阵到真实因果图的超图在温和的条件下。然后，我们利用所述重新设计的SEM来开发一种因果结构学习方法，可以通过利用对非循环性和Gumbel-Softmax方法的平滑表征来实现基于梯度的优化来有效地接受训练，以近似于二进制邻接矩阵。发现获得的条目通常在零或一个附近，并且可以容易地阈值以识别边缘。我们对合成和实时数据集进行实验，以验证所提出的方法的有效性，并表明它容易包括不同的平滑模型功能，并在考虑大多数数据集中实现了大大提高的性能。

translated by 谷歌翻译

The max-min hill-climbing Bayesian network structure learning algorithm

分类：

We present a new algorithm for Bayesian network structure learning, called Max-Min Hill-Climbing (MMHC). The algorithm combines ideas from local learning, constraint-based, and search-and-score techniques in a principled and effective way. It first reconstructs the skeleton of a Bayesian network and then performs a Bayesian-scoring greedy hill-climbing search to orient the edges. In our extensive empirical evaluation MMHC outperforms on average and in terms of various metrics several prototypical and state-of-the-art algorithms, namely the PC, Sparse Candidate, Three Phase Dependency Analysis, Optimal Reinsertion, Greedy Equivalence Search, and Greedy Search. These are the first empirical results simultaneously comparing most of the major Bayesian network algorithms against each other. MMHC offers certain theoretical advantages, specifically over the Sparse Candidate algorithm, corroborated by our experiments. MMHC and detailed results of our study are publicly available at http://www.dsl-lab.org/supplements/mmhc paper/mmhc index.html.

translated by 谷歌翻译

Beware of the Simulated DAG! Causal Discovery Benchmarks May Be Easy To Game

Alexander G. Reisach , Christof Seiler , Sebastian Weichwald

分类： (统计)机器学习 | 机器学习

2021-02-26

模拟DAG模型可能表现出属性，也许无意中，使其结构识别和意外地影响结构学习算法。在这里，我们表明边缘方差往往沿着仿制性添加添加剂噪声模型的因果顺序增加。我们将Varsortable介绍为衡量衡量边际差异和因果顺序的秩序之间的协议。对于通常采样的图形和模型参数，我们表明，一些连续结构学习算法的显着性能可以通过高的Varsortable解释，并通过简单的基线方法匹配。然而，这种性能可能不会转移到真实世界的数据，其中VARS使性可能是中等或取决于测量尺度的选择。在标准化数据上，相同的算法无法识别地面真理DAG或其Markov等价类。虽然标准化在边缘方差中删除了模式，但我们表明，数据产生过程，其产生高VILS使性也留下了即使在标准化之后也可以利用不同的协方差模式。我们的调查结果挑战了独立绘制参数的通用基准的重要性。代码可在https://github.com/scriddie/varsortable获得。

translated by 谷歌翻译

Federated Causal Discovery

Erdun Gao , Junjia Chen , Li Shen , Tongliang Liu , Mingming Gong , Howard Bondell

分类：机器学习 | (统计)机器学习

2021-12-07

因果发现旨在从观察数据中学习因果图。迄今为止，大多数因果发现方法需要将数据存储在中央服务器中。但是，数据所有者逐渐拒绝分享他们的个性化数据以避免隐私泄漏，使这项任务通过切断第一步来更加麻烦。出现拼图：$ \ texit {如何从分散数据的原因关系推断出来自分散数据的因果关系？} $本文，具有数据的添加性噪声模型假设，我们参加了开发基于渐变的学习框架命名为DAG共享的渐变学习框架联邦因果发现（DS-FCD），可以在不直接触摸本地数据的情况下学习因果图，并自然地处理数据异质性。 DS-FCD受益于每个本地模型的两级结构。第一级别学习因果图并与服务器通信以获取来自其他客户端的模型信息，而第二级别近似于因果机制，并且从其自身的数据逐步更新以适应数据异质性。此外，DS-FCD通过利用平等的非循环性约束，将整体学习任务制定为连续优化问题，这可以通过梯度下降方法自然地解决。对合成和现实世界数据集的广泛实验验证了所提出的方法的功效。

translated by 谷歌翻译

From Causal Pairs to Causal Graphs

Rezaur Rashid , Jawad Chowdhury , Gabriel Terejanu

分类：机器学习 | 人工智能

2022-11-08

Causal structure learning from observational data remains a non-trivial task due to various factors such as finite sampling, unobserved confounding factors, and measurement errors. Constraint-based and score-based methods tend to suffer from high computational complexity due to the combinatorial nature of estimating the directed acyclic graph (DAG). Motivated by the `Cause-Effect Pair' NIPS 2013 Workshop on Causality Challenge, in this paper, we take a different approach and generate a probability distribution over all possible graphs informed by the cause-effect pair features proposed in response to the workshop challenge. The goal of the paper is to propose new methods based on this probabilistic information and compare their performance with traditional and state-of-the-art approaches. Our experiments, on both synthetic and real datasets, show that our proposed methods not only have statistically similar or better performances than some traditional approaches but also are computationally faster.

translated by 谷歌翻译

The Dual PC Algorithm for Structure Learning

Enrico Giudice , Jack Kuipers , Giusi Moffa

分类： (统计)机器学习 | 机器学习

2021-12-16

在学习从观察数据中学习贝叶斯网络的图形结构是描述和帮助了解复杂应用程序中的数据生成过程的关键，而任务由于其计算复杂性而构成了相当大的挑战。代表贝叶斯网络模型的定向非循环图（DAG）通常不会从观察数据识别，并且存在各种方法来估计其等价类。在某些假设下，流行的PC算法可以通过测试条件独立（CI）一致地始终恢复正确的等价类，从边际独立关系开始，逐步扩展调节集。这里，我们提出了一种通过利用协方差与精密矩阵之间的反向关系来执行PC算法内的CI测试的新颖方案。值得注意的是，精密矩阵的元素与高斯数据的部分相关性。然后，我们的算法利用对协方差和精密矩阵的块矩阵逆转，同时对互补（或双）调节集的部分相关性进行测试。因此，双PC算法的多个CI测试首先考虑边缘和全阶CI关系并逐步地移动到中心顺序。仿真研究表明，双PC算法在运行时和恢复底层网络结构方面都优于经典PC算法。

translated by 谷歌翻译

Efficient Sampling and Structure Learning of Bayesian Networks

Jack Kuipers , Polina Suter , Giusi Moffa

分类： (统计)机器学习 | 机器学习

2018-03-21

贝叶斯网络是概率的图形模型，广泛用于了解高维数据的依赖关系，甚至促进因果发现。学习作为定向的非循环图（DAG）编码的底层网络结构是高度具有挑战性的，主要是由于大量可能的网络与非狭窄性约束结合。努力专注于两个前面：基于约束的方法，该方法执行条件独立测试，以排除具有贪婪或MCMC方案的DAG空间的边缘和分数和搜索方法。在这里，我们以一种新的混合方法综合这两个领域，这降低了基于约束方法的MCMC方法的复杂性。 MCMC方案中的各个步骤仅需要简单的表查找，以便可以有效地获得非常长的链。此外，该方案包括迭代过程，以校正来自条件独立测试的错误。该算法对替代方案提供了显着卓越的性能，特别是因为也可以从后部分布采样DAG，从而实现全面的贝叶斯模型为大量较大的贝叶斯网络进行平均。

translated by 谷歌翻译

DAGs with NO TEARS: Continuous Optimization for Structure Learning

Xun Zheng , Bryon Aragam , Pradeep Ravikumar , Eric P. Xing

分类：

2018-03-04

Estimating the structure of directed acyclic graphs (DAGs, also known as Bayesian networks) is a challenging problem since the search space of DAGs is combinatorial and scales superexponentially with the number of nodes. Existing approaches rely on various local heuristics for enforcing the acyclicity constraint. In this paper, we introduce a fundamentally different strategy: We formulate the structure learning problem as a purely continuous optimization problem over real matrices that avoids this combinatorial constraint entirely. This is achieved by a novel characterization of acyclicity that is not only smooth but also exact. The resulting problem can be efficiently solved by standard numerical algorithms, which also makes implementation effortless. The proposed method outperforms existing ones, without imposing any structural assumptions on the graph such as bounded treewidth or in-degree. Code implementing the proposed algorithm is open-source and publicly available at https://github.com/xunzheng/notears.

translated by 谷歌翻译

Stochastic Causal Programming for Bounding Treatment Effects

Kirtan Padh , Jakob Zeitler , David Watson , Matt Kusner , Ricardo Silva , Niki Kilbertus

分类： (统计)机器学习 | 机器学习

2022-02-22

因果效应估计对于自然和社会科学中的许多任务很重要。但是，如果没有做出强大的，通常无法测试的假设，就无法从观察数据中识别效果。我们考虑了部分识别问题的算法，当未衡量的混淆使鉴定不可能鉴定时，多变量，连续处理的界限治疗效果。我们考虑一个框架，即可观察的证据与基于规范标准在因果模型中编码的约束的含义相匹配。这纯粹是基于生成模型来概括经典方法。将因果关系施放为在受约束优化问题中的目标函数，我们将灵活的学习算法与蒙特卡洛方法相结合，以随机因果节目的名义实施解决方案家族。特别是，我们提出了可以通过因果或观察到的数据模型而没有可能性功能的参数功能的这种约束优化问题的方式，从而降低了任务的计算和统计复杂性。

translated by 谷歌翻译

XAI Establishes a Common Ground Between Machine Learning and Causality

Matej Zečević , Devendra Singh Dhami , Constantin A. Rothkopf , Kristian Kersting

分类：机器学习

2021-10-05

最近的一些作品关于机器学习与因果关系之间的联系。在一个反向思考过程中，从因果模型中的心理模型的基础开始，我们加强了这些初始作品，结果表明XAI实质上要求机器学习学习与手头任务一致的因果关系。通过认识到人类的心理模型（HMM）如何自然地由Pearlian结构性因果模型（SCM）表示，我们通过构建线性SCM的示例度量空间来做出两个关键观察：首先，“真实”数据的概念 - 在SCM下是合理的，其次是，人类衍生的SCM的聚集可能指向“真实” SCM。在这些见解的含义中，我们以第三种观察结果认为，从HMM中得出的解释必须暗示在SCM框架中的解释性。在此直觉之后，我们使用这些首先建立的第一原则提出了原始推导，以揭示与给定SCM一致的人类可读解释方案，证明命名结构性因果解释（SCI）是合理的。进一步，我们从理论和经验上分析了这些SCI及其数学特性。我们证明，任何现有的图形诱导方法（GIM）实际上在科幻义中都是可以解释的。我们的第一个实验（E1）评估了这种基于GIM的SCI的质量。在（E2）中，我们观察到了我们对基于SCI学习的样本效率提高的猜想的证据。对于（e3），我们进行了一项研究（n = 22），并观察基于人类的SCI比GIM的SCI优势，从而证实了我们的初始假设。

translated by 谷歌翻译

Large-Scale Differentiable Causal Discovery of Factor Graphs

Romain Lopez , Jan-Christian Hütter , Jonathan K. Pritchard , Aviv Regev

分类： (统计)机器学习 | 机器学习

2022-06-15

因果推断的一个共同主题是学习观察到的变量（也称为因果发现）之间的因果关系。考虑到大量候选因果图和搜索空间的组合性质，这通常是一项艰巨的任务。也许出于这个原因，到目前为止，大多数研究都集中在相对较小的因果图上，并具有多达数百个节点。但是，诸如生物学之类的领域的最新进展使生成实验数据集，并进行了数千种干预措施，然后进行了数千个变量的丰富分析，从而增加了机会和迫切需要大量因果图模型。在这里，我们介绍了因子定向无环图（F-DAG）的概念，是将搜索空间限制为非线性低级别因果相互作用模型的一种方法。将这种新颖的结构假设与最近的进步相结合，弥合因果发现与连续优化之间的差距，我们在数千个变量上实现了因果发现。此外，作为统计噪声对此估计程序的影响的模型，我们根据随机图研究了F-DAG骨架的边缘扰动模型，并量化了此类扰动对F-DAG等级的影响。该理论分析表明，一组候选F-DAG比整个DAG空间小得多，因此在很难评估基础骨架的高维度中更统计学上的稳定性。我们提出了因子图（DCD-FG）的可区分因果发现，这是对高维介入数据的F-DAG约束因果发现的可扩展实现。 DCD-FG使用高斯非线性低级结构方程模型，并且在模拟中的最新方法以及最新的大型单细胞RNA测序数据集中，与最新方法相比显示出显着改善遗传干预措施。

translated by 谷歌翻译

Reframed GES with a Neural Conditional Dependence Measure

Xinwei Shen , Shengyu Zhu , Jiji Zhang , Shoubo Hu , Zhitang Chen

分类： (统计)机器学习 | 机器学习

2022-06-17

在非参数环境中，因果结构通常仅在马尔可夫等效性上可识别，并且出于因果推断的目的，学习马尔可夫等效类（MEC）的图形表示很有用。在本文中，我们重新审视了贪婪的等效搜索（GES）算法，该算法被广泛引用为一种基于分数的算法，用于学习基本因果结构的MEC。我们观察到，为了使GES算法在非参数设置中保持一致，不必设计评估图的评分度量。取而代之的是，足以插入有条件依赖度量的一致估计器来指导搜索。因此，我们提出了GES算法的重塑，该算法比基于标准分数的版本更灵活，并且很容易将自己带到非参数设置，并具有条件依赖性的一般度量。此外，我们提出了一种神经条件依赖性（NCD）度量，该措施利用深神经网络的表达能力以非参数方式表征条件独立性。我们根据标准假设建立了重新构架GES算法的最佳性，并使用我们的NCD估计器来决定条件独立性的一致性。这些结果共同证明了拟议的方法。实验结果证明了我们方法在因果发现中的有效性，以及使用我们的NCD度量而不是基于内核的措施的优势。

translated by 谷歌翻译

Truncated Matrix Power Iteration for Differentiable DAG Learning

Zhen Zhang , Ignavier Ng , Dong Gong , Yuhang Liu , Ehsan M Abbasnejad , Mingming Gong , Kun Zhang , Javen Qinfeng Shi

分类：机器学习 | 人工智能 | (统计)机器学习

2022-08-30

从观察数据中恢复基本的定向无环形结构（DAG），由于DAG受限的优化问题的组合性质，因此极具挑战性。最近，通过将DAG约束将DAG的限制定义为平滑的平等性，通常基于邻接矩阵上的多项式，将DAG学习作为连续优化问题。现有方法将非常小的系数放在高阶多项式术语上以进行稳定，因为它们认为由于数字爆炸而导致高阶项上的大系数有害。相反，我们发现，高阶术语上的大系数对DAG学习有益，当邻接矩阵的光谱辐射小时，高阶术语的较大系数可以比小尺寸近似于小的限制。同行。基于此，我们提出了一种具有有效截短的矩阵功率迭代的新型DAG学习方法，以近似于基于几何序列的DAG约束。从经验上讲，我们的DAG学习方法在各种环境中的表现优于先前的最新方法，在结构锤距离上通常以3倍或以上的倍数。

translated by 谷歌翻译