智能论文笔记

Clustering and Structural Robustness in Causal Diagrams

Santtu Tikka , Jouni Helske , Juha Karvanen

分类： (统计)机器学习 | 机器学习

2021-11-08

常用图是表示和可视化因果关系的。对于少量变量，这种方法提供了简洁和清晰的方案的视图。随着下属的变量数量增加，图形方法可能变得不切实际，并且表示的清晰度丢失。变量的聚类是减少因果图大小的自然方式，但如果任意实施，可能会错误地改变因果关系的基本属性。我们定义了一种特定类型的群集，称为Transit Cluster，保证在某些条件下保留因果效应的可识别性属性。我们提供了一种用于在给定图中查找所有传输群集的声音和完整的算法，并演示集群如何简化因果效应的识别。我们还研究了逆问题，其中一个人以群集的图形开始，寻找扩展图，其中因果效应的可识别性属性保持不变。我们表明这种结构稳健性与过境集群密切相关。

translated by 谷歌翻译

On the Representation of Causal Background Knowledge and its Applications in Causal Inference

Zhuangyan Fang , Ruiqi Zhao , Yue Liu , Yangbo He

分类：人工智能 | 机器学习 | (统计)机器学习

2022-07-10

在观察性研究中，经常遇到有关存在或缺乏因果边缘和路径的因果背景知识。由于背景知识而导致的马尔可夫等效dag的子类共享的指向边缘和链接可以由因果关系最大部分定向的无循环图（MPDAG）表示。在本文中，我们首先提供了因果MPDAG的声音和完整的图形表征，并提供了因果MPDAG的最小表示。然后，我们介绍了一种名为Direct Causal子句（DCC）的新颖表示，以统一形式表示所有类型的因果背景知识。使用DCC，我们研究因果背景知识的一致性和等效性，并表明任何因果背景知识集都可以等效地分解为因果MPDAG，以及最小的残留DCC。还提供了多项式时间算法，以检查一致性，等效性并找到分解的MPDAG和残留DCC。最后，有了因果背景知识，我们证明了一个足够且必要的条件来识别因果关系，并且出人意料地发现因果效应的可识别性仅取决于分解的MPDAG。我们还开发了局部IDA型算法，以估计无法识别效应的可能值。模拟表明因果背景知识可以显着提高因果影响的识别性。

translated by 谷歌翻译

Minimum Cost Intervention Design for Causal Effect Identification

Sina Akbari , Jalal Etesami , Negar Kiyavash

分类：机器学习 | 人工智能

2022-05-04

Pearl's Do Colculus是一种完整的公理方法，可以从观察数据中学习可识别的因果效应。如果无法识别这种效果，则有必要在系统中执行经常昂贵的干预措施以学习因果效应。在这项工作中，我们考虑了设计干预措施以最低成本来确定所需效果的问题。首先，我们证明了这个问题是NP-HARD，随后提出了一种可以找到最佳解或对数因子近似值的算法。这是通过在我们的问题和最小击球设置问题之间建立联系来完成的。此外，我们提出了几种多项式启发式算法来解决问题的计算复杂性。尽管这些算法可能会偶然发现亚最佳解决方案，但我们的模拟表明它们在随机图上产生了小的遗憾。

translated by 谷歌翻译

Foundations of Structural Causal Models with Cycles and Latent Variables

Stephan Bongers , Patrick Forré , Jonas Peters , Joris M. Mooij

分类：人工智能 | 机器学习

2016-11-18

也称为（非参数）结构方程模型（SEMS）的结构因果模型（SCM）被广泛用于因果建模目的。特别是，也称为递归SEM的无循环SCMS，形成了一个研究的SCM的良好的子类，概括了因果贝叶斯网络来允许潜在混淆。在本文中，我们调查了更多普通环境中的SCM，允许存在潜在混杂器和周期。我们展示在存在周期中，无循环SCM的许多方便的性质通常不会持有：它们并不总是有解决方案;它们并不总是诱导独特的观察，介入和反事实分布;边缘化并不总是存在，如果存在边缘模型并不总是尊重潜在的投影;他们并不总是满足马尔可夫财产;他们的图表并不总是与他们的因果语义一致。我们证明，对于SCM一般，这些属性中的每一个都在某些可加工条件下保持。我们的工作概括了SCM的结果，迄今为止仅针对某些特殊情况所知的周期。我们介绍了将循环循环设置扩展到循环设置的简单SCM的类，同时保留了许多方便的无环SCM的性能。用本文，我们的目标是为SCM提供统计因果建模的一般理论的基础。

translated by 谷歌翻译

Semiparametric Inference For Causal Effects In Graphical Models With Hidden Variables

Rohit Bhattacharya , Razieh Nabi , Ilya Shpitser

分类： (统计)机器学习 | 机器学习

2020-03-27

研究了与隐藏变量有关的非循环图（DAG）相关的因果模型中因果效应的识别理论。然而，由于估计它们输出的识别功能的复杂性，因此未耗尽相应的算法。在这项工作中，我们弥合了识别和估算涉及单一治疗和单一结果的人口水平因果效应之间的差距。我们派生了基于功能的估计，在大类隐藏变量DAG中表现出对所识别的效果的双重稳健性，其中治疗满足简单的图形标准;该类包括模型，产生调整和前门功能作为特殊情况。我们还提供必要的和充分条件，其中隐藏变量DAG的统计模型是非分子饱和的，并且意味着对观察到的数据分布没有平等约束。此外，我们推导了一类重要的隐藏变量DAG，这意味着观察到观察到的数据分布等同于完全观察到的DAG等同于（最高的相等约束）。在这些DAG类中，我们推出了实现兴趣目标的半导体效率界限的估计估计值，该估计是治疗满足我们的图形标准的感兴趣的目标。最后，我们提供了一种完整的识别算法，可直接产生基于权重的估计策略，以了解隐藏可变因果模型中的任何可识别效果。

translated by 谷歌翻译

Optimal structure identification with greedy search

分类：

In this paper we prove the so-called "Meek Conjecture". In particular, we show that if a DAG H is an independence map of another DAG G, then there exists a finite sequence of edge additions and covered edge reversals in G such that (1) after each edge modification H remains an independence map of G and ( 2) after all modifications G = H. As shown by Meek (1997), this result has an important consequence for Bayesian approaches to learning Bayesian networks from data: in the limit of large sample size, there exists a twophase greedy search algorithm that-when applied to a particular sparsely-connected search space-provably identifies a perfect map of the generative distribution if that perfect map is a DAG. We provide a new implementation of the search space, using equivalence classes as states, for which all operators used in the greedy search can be scored efficiently using local functions of the nodes in the domain. Finally, using both synthetic and real-world datasets, we demonstrate that the two-phase greedy approach leads to good solutions when learning with finite sample sizes.

translated by 谷歌翻译

Learning latent causal graphs via mixture oracles

Bohdan Kivva , Goutham Rajendran , Pradeep Ravikumar , Bryon Aragam

分类：机器学习 | 人工智能 | (统计)机器学习

2021-06-29

我们研究了在存在潜在变量存在下从数据重建因果图形模型的问题。感兴趣的主要问题是在潜在变量上恢复因果结构，同时允许一般，可能在变量之间的非线性依赖性。在许多实际问题中，原始观测之间的依赖性（例如，图像中的像素）的依赖性比某些高级潜在特征（例如概念或对象）之间的依赖性要小得多，这是感兴趣的设置。我们提供潜在表示和潜在潜在因果模型的条件可通过减少到混合甲骨文来识别。这些结果突出了学习混合模型的顺序的良好研究问题与观察到和解开的基础结构的问题之间的富裕问题之间的有趣连接。证明是建设性的，并导致几种算法用于明确重建全图形模型。我们讨论高效算法并提供说明实践中算法的实验。

translated by 谷歌翻译

Learning Bayesian Networks in the Presence of Structural Side Information

Ehsan Mokhtarian , Sina Akbari , Fateme Jamshidi , Jalal Etesami , Negar Kiyavash

分类：机器学习

2021-12-20

我们研究在有关系统的结构侧信息时学习一组变量的贝叶斯网络（BN）的问题。众所周知，学习一般BN的结构在计算上和统计上具有挑战性。然而，通常在许多应用中，关于底层结构的侧面信息可能会降低学习复杂性。在本文中，我们开发了一种基于递归约束的算法，其有效地将这些知识（即侧信息）纳入学习过程。特别地，我们研究了关于底层BN的两种类型的结构侧信息：（i）其集团数的上限是已知的，或者（ii）它是无菱形的。我们为学习算法提供理论保证，包括每个场景所需的最坏情况的测试数量。由于我们的工作，我们表明可以通过多项式复杂性学习有界树木宽度BNS。此外，我们评估了综合性和现实世界结构的算法的性能和可扩展性，并表明它们优于最先进的结构学习算法。

translated by 谷歌翻译

A Unified Experiment Design Approach for Cyclic and Acyclic Causal Models

Ehsan Mokhtarian , Saber Salehkaleybar , AmirEmad Ghassami , Negar Kiyavash

分类：机器学习 | 人工智能

2022-05-20

We study experiment design for unique identification of the causal graph of a system where the graph may contain cycles. The presence of cycles in the structure introduces major challenges for experiment design as, unlike acyclic graphs, learning the skeleton of causal graphs with cycles may not be possible from merely the observational distribution. Furthermore, intervening on a variable in such graphs does not necessarily lead to orienting all the edges incident to it. In this paper, we propose an experiment design approach that can learn both cyclic and acyclic graphs and hence, unifies the task of experiment design for both types of graphs. We provide a lower bound on the number of experiments required to guarantee the unique identification of the causal graph in the worst case, showing that the proposed approach is order-optimal in terms of the number of experiments up to an additive logarithmic term. Moreover, we extend our result to the setting where the size of each experiment is bounded by a constant. For this case, we show that our approach is optimal in terms of the size of the largest experiment required for uniquely identifying the causal graph in the worst case.

translated by 谷歌翻译

Finding Front-Door Adjustment Sets in Linear Time

Marcel Wienöbst , Benito van der Zander , Maciej Liśkiewicz

分类：人工智能 | 机器学习

2022-11-29

Front-door adjustment is a classic technique to estimate causal effects from a specified directed acyclic graph (DAG) and observed data. The advantage of this approach is that it uses observed mediators to identify causal effects, which is possible even in the presence of unobserved confounding. While the statistical properties of the front-door estimation are quite well understood, its algorithmic aspects remained unexplored for a long time. Recently, Jeong, Tian, and Barenboim [NeurIPS 2022] have presented the first polynomial-time algorithm for finding sets satisfying the front-door criterion in a given DAG, with an $O(n^3(n+m))$ run time, where $n$ denotes the number of variables and $m$ the number of edges of the graph. In our work, we give the first linear-time, i.e. $O(n+m)$, algorithm for this task, which thus reaches the asymptotically optimal time complexity, as the size of the input is $\Omega(n+m)$. We also provide an algorithm to enumerate all front-door adjustment sets in a given DAG with delay $O(n(n + m))$. These results improve the algorithms by Jeong et al. [2022] for the two tasks by a factor of $n^3$, respectively.

translated by 谷歌翻译

Inversion of Bayesian Networks

Jesse van Oostrum , Peter van Hintum , Nihat Ay

分类：机器学习 | 人工智能 | (统计)机器学习

2022-12-20

Variational autoencoders and Helmholtz machines use a recognition network (encoder) to approximate the posterior distribution of a generative model (decoder). In this paper we study the necessary and sufficient properties of a recognition network so that it can model the true posterior distribution exactly. These results are derived in the general context of probabilistic graphical modelling / Bayesian networks, for which the network represents a set of conditional independence statements. We derive both global conditions, in terms of d-separation, and local conditions for the recognition network to have the desired qualities. It turns out that for the local conditions the property perfectness (for every node, all parents are joined) plays an important role.

translated by 谷歌翻译

The d-separation criterion in Categorical Probability

Tobias Fritz , Andreas Klingler

分类： (统计)机器学习

2022-07-12

D分隔标准通过某些条件独立性检测到关节概率分布与定向无环图的兼容性。在这项工作中，我们通过引入因果模型的分类定义，D分隔的分类概念，并证明了D-Exaration Criterion的抽象版本，从而在分类概率理论的背景下研究了这个问题。这种方法有两个主要好处。首先，分类D分隔是基于拓扑连接的非常直观的标准。其次，我们的结果适用于度量理论概率（具有标准的鲍尔空间），因此提供了与局部和全球马尔可夫属性等效性具有因果关系兼容性的简洁证明。

translated by 谷歌翻译

Characterization of causal ancestral graphs for time series with latent confounders

Andreas Gerhardus

分类：人工智能 | 机器学习 | (统计)机器学习

2021-12-15

概括指向的最大祖先图形，我们介绍了一类图形模型，用于表示与未观察的变量的多变量时间序列的多变量时间序列的多变量的多种定样和定期分配时间步骤中的时间滞后特定因果关系和独立性。我们完全阐述了这些图表，并表明他们需要超出以前在文献中被考虑的那些的限制。这允许在没有强加的额外假设的情况下更强的因果推断。在指向部分祖先图的概括中，我们进一步介绍了新颖类型的图表的马尔可夫等同类的图形表示，并显示这些比当前最先进的因果发现算法学习的更具信息量。我们还通过增加观察时间步骤的数量来分析所获得的附加信息。

translated by 谷歌翻译

Representation of Context-Specific Causal Models with Observational and Interventional Data

Eliana Duarte , Liam Solus

分类： (统计)机器学习

2021-01-22

我们考虑代表代理模型的问题，该模型使用我们称之为CSTREES的阶段树模型的适当子类对离散数据编码离散数据的原因模型。我们表明，可以通过集合表达CSTREE编码的上下文专用信息。由于并非所有阶段树模型都承认此属性，CSTREES是一个子类，可提供特定于上下文的因果信息的透明，直观和紧凑的表示。我们证明了CSTREEES承认全球性马尔可夫属性，它产生了模型等价的图形标准，概括了Verma和珍珠的DAG模型。这些结果延伸到一般介入模型设置，使CSTREES第一族的上下文专用模型允许介入模型等价的特征。我们还为CSTREE的最大似然估计器提供了一种封闭式公式，并使用它来表示贝叶斯信息标准是该模型类的本地一致的分数函数。在模拟和实际数据上分析了CSTHEELE的性能，在那里我们看到与CSTREELE而不是一般上演树的建模不会导致预测精度的显着损失，同时提供了特定于上下文的因果信息的DAG表示。

translated by 谷歌翻译

Causal Discovery in Probabilistic Networks with an Identifiable Causal Effect

Sina Akbari , Fateme Jamshidi , Ehsan Mokhtarian , Matthew J. Vowels , Jalal Etesami , Negar Kiyavash

分类：机器学习

2022-08-09

因果鉴定是因果推理文献的核心，在该文献中提出了完整的算法来识别感兴趣的因果问题。这些算法的有效性取决于访问正确指定的因果结构的限制性假设。在这项工作中，我们研究了可获得因果结构概率模型的环境。具体而言，因果图中的边缘是分配的概率，例如，可能代表来自领域专家的信念程度。另外，关于边缘的不确定的可能反映了特定统计检验的置信度。在这种情况下自然出现的问题是：给定这样的概率图和感兴趣的特定因果效应，哪些具有最高合理性的子图是什么？我们表明回答这个问题减少了解决NP-HARD组合优化问题，我们称之为边缘ID问题。我们提出有效的算法来近似此问题，并评估我们针对现实世界网络和随机生成图的算法。

translated by 谷歌翻译

Counting Markov Equivalent Directed Acyclic Graphs Consistent with Background Knowledge

Vidya Sagar Sharma

分类：人工智能 | 机器学习

2022-06-14

Wien \ \'inst，Bannach和li \'Skiewicz（AAAI 2021）最近给出了一种用于计算马尔可夫等效类中定向无环形数量数量的多项式精确算法。在本文中，我们考虑了更一般的问题当某些边缘的方向也固定时，计算马尔可夫等效类中有向无环的数量的数量（例如，在部分可用的介入数据时会出现此设置）。从理论上讲，复杂性。相比之下，我们证明了问题在有趣的一类实例中仍然可以解决，它是通过确定``固定参数tractable''。特别是，我们的计数算法在时间范围内运行。多项式在图的大小中，其中多项式的程度\ emph {not}取决于提供的附加边数作为输入的数量。

translated by 谷歌翻译

Identifying Mixtures of Bayesian Network Distributions

Spencer L. Gordon , Bijan Mazaheri , Yuval Rabani , Leonard J. Schulman

分类：机器学习 | (统计)机器学习

2021-12-22

贝叶斯网络是一组$ N $随机变量的定向非循环图（DAG）（用顶点标识）;贝叶斯网络分布（BND）是RV的概率分布，即在图中是马尔可夫的。这种模型的有限混合物是在较大的图表上对这些变量的投影，其具有额外的“隐藏”（或“隐藏”（或“潜伏”）随机变量$ U $，范围在$ \ {1，\ ldots，k \ $，以及从$ U $到其他每个其他顶点的指示边。这种类型的模型是对因因果推理的基础，其中$ U $模型是一种混杂效果。一个非常特殊的案例一直是在理论文学中的长期兴趣：空图。这种分布只是$ k $产品分布的混合。考虑到k $产品分布的混合物的联合分布，以识别产物分布及其混合重量，这一直是长期的问题。我们的结果是：（1）我们改善了从$ \ exp（o（k ^ 2））$到$ \ exp（o（k \ log k）的$ k $产品分布的混合物的示例复杂性（和运行时））$。鉴于已知的$ \ exp（\ omega（k））$下限，这几乎可以最好。（2）我们为非空图表提供了第一算法。最大程度为$ \ delta $的图表的复杂性为$ \ exp（o（k（\ delta ^ 2 + \ log k）））$。（上述复杂性是近似和抑制辅助参数的依赖性。）

translated by 谷歌翻译

A Transformational Characterization of Unconditionally Equivalent Bayesian Networks

Alex Markham , Danai Deligeorgaki , Pratik Misra , Liam Solus

分类： (统计)机器学习 | 机器学习

2022-03-01

我们考虑将贝叶斯网络表征到无条件等效的问题，即，当定向无环形图（DAGS）具有相同的无条件$ d $分离式语句。每个无条件的等效类（UEC）均以一个无方向的图形为唯一表示，其集团结构编码了类的成员。通过这种结构，我们提供了无条件对等的变革性表征。也就是说，我们证明当一个DAG在同一UEC中，并且仅当一个可以通过有限的指定移动序列转换为另一个DAG。我们还将此特征扩展到代表UEC中Markov等效类（MEC）的基本图。UEC分配了MEC的空间，并且可以从边际独立性测试中估算。因此，无条件等价的表征在涉及搜索贝叶斯网络空间的方法中应用。

translated by 谷歌翻译

Verification and search algorithms for causal DAGs

Davin Choo , Kirankumar Shiragur , Arnab Bhattacharyya

分类：机器学习 | (统计)机器学习

2022-06-30

我们研究了与从介入数据中恢复因果图有关的两个问题：（i）$ \ textIt {verification} $，其中的任务是检查声称的因果图是否正确，并且（ii）$ \ textit {search} $，任务是恢复正确的因果图。对于这两者，我们都希望最大程度地减少执行的干预措施的数量。对于第一个问题，我们给出了一组最小尺寸的原子干预措施的表征，这些干预措施是必要且足以检查所要求的因果图的正确性。我们的表征使用$ \ textit {coving edges} $的概念，这使我们能够获得简单的证据，并且很容易理解早期结果。我们还将结果推广到有限尺寸干预措施和节点依赖性干预成本的设置。对于上述所有设置，我们提供了第一种已知的可验证算法，用于有效地计算（接近）一般图上的最佳验证集。对于第二个问题，我们给出了一种基于图形分离器的简单自适应算法，该算法会产生一个原子干预集，该集合在使用$ \ MATHCAL {O}（\ log n）$ times $ times所需的$所需干预措施时，该算法完全围绕任何必需图表。 \ textIt {verify} $（验证大小）$ n $顶点上的基础dag。相对于验证大小而言，此近似值是紧密的，因为$ \ textit {any} $搜索算法的最差情况是$ \ omega（\ log n）$的最差情况。使用有限的大小干预措施，每个大小$ \ leq k $，我们的算法给出了$ \ mathcal {o}（\ log n \ cdot \ log \ log \ log k）$ factor actialation。我们的结果是第一种已知的算法，该算法对一般未加权图和有界尺寸干预的验证尺寸提供了非平凡的近似保证。

translated by 谷歌翻译

Near-Optimal Multi-Perturbation Experimental Design for Causal Structure Learning

Scott Sussex , Andreas Krause , Caroline Uhler

分类：机器学习

2021-05-28

因果结构学习是许多领域的关键问题。通过对感兴趣系统进行实验来学习因果结构。我们解决了设计一批实验的主要原因，每个实验中同时干预多个变量。虽然可能比常用的单变干预措施更具信息丰富，但选择这种干预措施是更具挑战性的，这是由于复合干预措施的双指数组合搜索空间。在本文中，我们开发有效的算法，以优化量化预算限制批次实验的信息性的不同目标函数。通过建立这些目标的新型子模具性质，我们为我们的算法提供近似保证。我们的算法经验上优于随机干预和算法，只能选择单变化干预。

translated by 谷歌翻译