智能论文笔记

Finding Front-Door Adjustment Sets in Linear Time

Marcel Wienöbst , Benito van der Zander , Maciej Liśkiewicz

分类：人工智能 | 机器学习

2022-11-29

Front-door adjustment is a classic technique to estimate causal effects from a specified directed acyclic graph (DAG) and observed data. The advantage of this approach is that it uses observed mediators to identify causal effects, which is possible even in the presence of unobserved confounding. While the statistical properties of the front-door estimation are quite well understood, its algorithmic aspects remained unexplored for a long time. Recently, Jeong, Tian, and Barenboim [NeurIPS 2022] have presented the first polynomial-time algorithm for finding sets satisfying the front-door criterion in a given DAG, with an $O(n^3(n+m))$ run time, where $n$ denotes the number of variables and $m$ the number of edges of the graph. In our work, we give the first linear-time, i.e. $O(n+m)$, algorithm for this task, which thus reaches the asymptotically optimal time complexity, as the size of the input is $\Omega(n+m)$. We also provide an algorithm to enumerate all front-door adjustment sets in a given DAG with delay $O(n(n + m))$. These results improve the algorithms by Jeong et al. [2022] for the two tasks by a factor of $n^3$, respectively.

translated by 谷歌翻译

Clustering and Structural Robustness in Causal Diagrams

Santtu Tikka , Jouni Helske , Juha Karvanen

分类： (统计)机器学习 | 机器学习

2021-11-08

常用图是表示和可视化因果关系的。对于少量变量，这种方法提供了简洁和清晰的方案的视图。随着下属的变量数量增加，图形方法可能变得不切实际，并且表示的清晰度丢失。变量的聚类是减少因果图大小的自然方式，但如果任意实施，可能会错误地改变因果关系的基本属性。我们定义了一种特定类型的群集，称为Transit Cluster，保证在某些条件下保留因果效应的可识别性属性。我们提供了一种用于在给定图中查找所有传输群集的声音和完整的算法，并演示集群如何简化因果效应的识别。我们还研究了逆问题，其中一个人以群集的图形开始，寻找扩展图，其中因果效应的可识别性属性保持不变。我们表明这种结构稳健性与过境集群密切相关。

translated by 谷歌翻译

On the Representation of Causal Background Knowledge and its Applications in Causal Inference

Zhuangyan Fang , Ruiqi Zhao , Yue Liu , Yangbo He

分类：人工智能 | 机器学习 | (统计)机器学习

2022-07-10

在观察性研究中，经常遇到有关存在或缺乏因果边缘和路径的因果背景知识。由于背景知识而导致的马尔可夫等效dag的子类共享的指向边缘和链接可以由因果关系最大部分定向的无循环图（MPDAG）表示。在本文中，我们首先提供了因果MPDAG的声音和完整的图形表征，并提供了因果MPDAG的最小表示。然后，我们介绍了一种名为Direct Causal子句（DCC）的新颖表示，以统一形式表示所有类型的因果背景知识。使用DCC，我们研究因果背景知识的一致性和等效性，并表明任何因果背景知识集都可以等效地分解为因果MPDAG，以及最小的残留DCC。还提供了多项式时间算法，以检查一致性，等效性并找到分解的MPDAG和残留DCC。最后，有了因果背景知识，我们证明了一个足够且必要的条件来识别因果关系，并且出人意料地发现因果效应的可识别性仅取决于分解的MPDAG。我们还开发了局部IDA型算法，以估计无法识别效应的可能值。模拟表明因果背景知识可以显着提高因果影响的识别性。

translated by 谷歌翻译

Identifiability of Causal-based Fairness Notions: A State of the Art

Karima Makhlouf , Sami Zhioua , Catuscia Palamidessi

分类：机器学习

2022-03-11

机器学习算法通常会对少数族裔和代表性不足的子人群产生偏见的结果/预测。因此，公平是基于机器学习技术的大规模应用的重要要求。最常用的公平概念（例如统计平等，均衡的几率，预测奇偶等）是观察性的，并且依赖于变量之间的仅相关性。在统计异常（例如辛普森或伯克森的悖论）的情况下，这些概念无法识别偏差。基于因果关系的公平概念（例如反事实公平，无歧视歧视等）对此类异常免疫，因此更可靠地评估公平性。但是，基于因果关系的公平概念的问题是，它们是根据数量（例如因果，反事实和特定于路径特定效应）定义的，这些概念并非总是可衡量的。这被称为可识别性问题，是因果推理文献中大量工作的主题。本文是对机器学习公平性特别相关的主要可识别性结果的汇编。使用大量示例和因果图说明了结果。公平研究人员，从业人员和政策制定者正在考虑使用基于因果关系的公平概念，并说明主要可识别性结果，这本文特别感兴趣。

translated by 谷歌翻译

A note on efficient minimum cost adjustment sets in causal graphical models

Ezequiel Smucler , Andrea Rotnitzky

分类：机器学习 | (统计)机器学习

2022-01-06

我们研究了在个性化治疗规则下估算介入均值的调整集的选择。我们假设具有，可能是隐藏变量和由可观察变量组成的至少一个调整集的非参数因果图形模型。此外，我们假设可观察变量具有与它们相关的正成本。我们将可观察调整集的成本定义为包含它的变量成本的总和。我们认为，在此设置中，存在最小成本最佳的调整集，从而使其产生的非参数估计值与控制可观察到的可观察调整集中的最小渐近方差。我们的结果基于与原始因果图相关的特殊流量网络的构建。我们表明，可以通过计算网络上的最大流程，然后通过增强路径找到从源可到达的一组顶点来找到最低成本最佳调整集。 OptimalAdj Python包实现本文介绍的算法。

translated by 谷歌翻译

Data-Driven Causal Effect Estimation Based on Graphical Causal Modelling: A Survey

Debo Cheng , Jiuyong Li , Lin Liu , Jixue Liu , Thuc Duy Le

分类：人工智能 | 机器学习

2022-08-20

在科学研究和现实世界应用的许多领域中，非实验数据的因果效应的无偏估计对于理解数据的基础机制以及对有效响应或干预措施的决策至关重要。从不同角度对这个具有挑战性的问题进行了大量研究。对于数据中的因果效应估计，始终做出诸如马尔可夫财产，忠诚和因果关系之类的假设。在假设下，仍然需要一组协变量或基本因果图之类的全部知识。一个实用的挑战是，在许多应用程序中，没有这样的全部知识或只有某些部分知识。近年来，研究已经出现了基于图形因果模型的搜索策略，以从数据中发现有用的知识，以进行因果效应估计，并具有一些温和的假设，并在应对实际挑战方面表现出了诺言。在这项调查中，我们回顾了方法，并关注数据驱动方法所面临的挑战。我们讨论数据驱动方法的假设，优势和局限性。我们希望这篇综述将激励更多的研究人员根据图形因果建模设计更好的数据驱动方法，以解决因果效应估计的具有挑战性的问题。

translated by 谷歌翻译

On Testability of the Front-Door Model via Verma Constraints

Rohit Bhattacharya , Razieh Nabi

分类：机器学习

2022-03-01

尽管在治疗和结果之间存在未衡量的混杂因素，但前门标准可用于识别和计算因果关系。但是，关键假设 - （i）存在充分介导治疗对结果影响的变量（或一组变量）的存在，（ii）同时并不遭受类似的混淆问题的困扰 - outcome对 - 通常被认为是难以置信的。本文探讨了这些假设的可检验性。我们表明，在涉及辅助变量的轻度条件下，可以通过广义平等约束也可以测试前门模型中编码的假设（以及简单的扩展）。我们基于此观察结果提出了两个合适性测试，并评估我们对真实和合成数据的提议的疗效。我们还将理论和经验比较与仪器可变方法处理未衡量的混杂。

translated by 谷歌翻译

Learning Bayesian Networks in the Presence of Structural Side Information

Ehsan Mokhtarian , Sina Akbari , Fateme Jamshidi , Jalal Etesami , Negar Kiyavash

分类：机器学习

2021-12-20

我们研究在有关系统的结构侧信息时学习一组变量的贝叶斯网络（BN）的问题。众所周知，学习一般BN的结构在计算上和统计上具有挑战性。然而，通常在许多应用中，关于底层结构的侧面信息可能会降低学习复杂性。在本文中，我们开发了一种基于递归约束的算法，其有效地将这些知识（即侧信息）纳入学习过程。特别地，我们研究了关于底层BN的两种类型的结构侧信息：（i）其集团数的上限是已知的，或者（ii）它是无菱形的。我们为学习算法提供理论保证，包括每个场景所需的最坏情况的测试数量。由于我们的工作，我们表明可以通过多项式复杂性学习有界树木宽度BNS。此外，我们评估了综合性和现实世界结构的算法的性能和可扩展性，并表明它们优于最先进的结构学习算法。

translated by 谷歌翻译

Semiparametric Inference For Causal Effects In Graphical Models With Hidden Variables

Rohit Bhattacharya , Razieh Nabi , Ilya Shpitser

分类： (统计)机器学习 | 机器学习

2020-03-27

研究了与隐藏变量有关的非循环图（DAG）相关的因果模型中因果效应的识别理论。然而，由于估计它们输出的识别功能的复杂性，因此未耗尽相应的算法。在这项工作中，我们弥合了识别和估算涉及单一治疗和单一结果的人口水平因果效应之间的差距。我们派生了基于功能的估计，在大类隐藏变量DAG中表现出对所识别的效果的双重稳健性，其中治疗满足简单的图形标准;该类包括模型，产生调整和前门功能作为特殊情况。我们还提供必要的和充分条件，其中隐藏变量DAG的统计模型是非分子饱和的，并且意味着对观察到的数据分布没有平等约束。此外，我们推导了一类重要的隐藏变量DAG，这意味着观察到观察到的数据分布等同于完全观察到的DAG等同于（最高的相等约束）。在这些DAG类中，我们推出了实现兴趣目标的半导体效率界限的估计估计值，该估计是治疗满足我们的图形标准的感兴趣的目标。最后，我们提供了一种完整的识别算法，可直接产生基于权重的估计策略，以了解隐藏可变因果模型中的任何可识别效果。

translated by 谷歌翻译

Necessary and sufficient graphical conditions for optimal adjustment sets in causal graphical models with hidden variables

Jakob Runge

分类：机器学习

2021-02-20

解决了选择最佳后门调整集的问题，以解决隐藏和条件变量的图形模型中的因果效应。以前的工作已经定义了实现最小的渐近估计方差，并且在没有隐藏变量的情况下派生的最佳集。对于隐藏变量的情况，可以有设置在没有最佳集合的情况下，并且目前仅导出有限适用性的足够的图形最优标准。在本工作中，最优性的特征在于最大化某个调整信息，该信息允许导出用于存在最佳调整集的必要和足够的图形标准和构造它的定义和算法。此外，如果仅存在有效调整集并且具有比Perkovi {\'C}等所提出的调整集更高（或等于）调整信息，则最佳集是有效的。 [机器学习研究学报，18：1--62,2018]任何图表。结果转化为一类估计的渐近估计差异，其渐近方差遵循某种信息理论关系。数值实验表明，渐近结果也适用于相对较小的样本尺寸，并且最佳调整集或其最小化变体通常也会产生更好的方差，也超出该估计类。令人惊讶的是，在随机创建的设置中，超过90 \％满足最优性条件，指示在许多现实世界场景中也可以保持。代码可用作Python Package \ URL {https://github.com/jakobrunge/tigramite}的一部分。

translated by 谷歌翻译

Ancestral instrument method for causal inference without a causal graph

Debo Cheng , Jiuyong Li , Lin Liu , Jiji Zhang , Thuc duy Le , Jixue Liu

分类：人工智能

2022-01-11

不观察到的混淆是观测数据的因果效应估计的主要障碍。仪器变量（IVS）广泛用于存在潜在混淆时的因果效应估计。利用标准IV方法，当给定的IV有效时，可以获得无偏估计，但标准IV的有效性要求是严格和不可能的。已经提出了通过调节一组观察变量（称为条件IV的调节装置）来放松标准IV的要求。然而，用于查找条件IV的调节集的标准需要完整的因果结构知识或指向的非循环图（DAG），其代表观察到和未观察的变量的因果关系。这使得无法发现直接从数据设置的调节。在本文中，通过利用潜在变量的因果推断中的最大祖先图（MAGS），我们提出了一种新型的MAG中的IV，祖先IV，并开发了支持给定祖传的调节装置的数据驱动的发现iv在mag。基于该理论，我们在MAG和观测数据中开发了一种与祖先IV的非偏见因果效应估计的算法。与现有IV方法相比，对合成和实际数据集的广泛实验表明了算法的性能。

translated by 谷歌翻译

Generalizing experimental findings: identification beyond adjustments

Juha Karvanen

分类：机器学习

2022-06-14

我们旨在借助一些观察数据，将随机对照试验（RCT）的结果推广到目标人群。这是多个数据源的因果效应识别的问题。当RCT在与目标人群不同的情况下进行时，就会出现挑战。较早的研究集中在可以通过观察数据调整RCT的估计值以消除选择偏差和其他域特定差异的情况。我们考虑了无法通过调整来概括实验发现的示例，并表明可以通过应用DO-Calculus得出的其他识别策略仍然可以进行概括。这些示例的获得的识别功能包含新类型的陷阱变量。陷阱变量的值需要在估计中固定，并且值的选择可能会对估计值的偏见和准确性产生重大影响，这在模拟中也可以看到。提出的结果扩大了实验发现的概括是可行的设置范围

translated by 谷歌翻译

Counting Markov Equivalent Directed Acyclic Graphs Consistent with Background Knowledge

Vidya Sagar Sharma

分类：人工智能 | 机器学习

2022-06-14

Wien \ \'inst，Bannach和li \'Skiewicz（AAAI 2021）最近给出了一种用于计算马尔可夫等效类中定向无环形数量数量的多项式精确算法。在本文中，我们考虑了更一般的问题当某些边缘的方向也固定时，计算马尔可夫等效类中有向无环的数量的数量（例如，在部分可用的介入数据时会出现此设置）。从理论上讲，复杂性。相比之下，我们证明了问题在有趣的一类实例中仍然可以解决，它是通过确定``固定参数tractable''。特别是，我们的计数算法在时间范围内运行。多项式在图的大小中，其中多项式的程度\ emph {not}取决于提供的附加边数作为输入的数量。

translated by 谷歌翻译

A Unified Experiment Design Approach for Cyclic and Acyclic Causal Models

Ehsan Mokhtarian , Saber Salehkaleybar , AmirEmad Ghassami , Negar Kiyavash

分类：机器学习 | 人工智能

2022-05-20

We study experiment design for unique identification of the causal graph of a system where the graph may contain cycles. The presence of cycles in the structure introduces major challenges for experiment design as, unlike acyclic graphs, learning the skeleton of causal graphs with cycles may not be possible from merely the observational distribution. Furthermore, intervening on a variable in such graphs does not necessarily lead to orienting all the edges incident to it. In this paper, we propose an experiment design approach that can learn both cyclic and acyclic graphs and hence, unifies the task of experiment design for both types of graphs. We provide a lower bound on the number of experiments required to guarantee the unique identification of the causal graph in the worst case, showing that the proposed approach is order-optimal in terms of the number of experiments up to an additive logarithmic term. Moreover, we extend our result to the setting where the size of each experiment is bounded by a constant. For this case, we show that our approach is optimal in terms of the size of the largest experiment required for uniquely identifying the causal graph in the worst case.

translated by 谷歌翻译

Minimum Cost Intervention Design for Causal Effect Identification

Sina Akbari , Jalal Etesami , Negar Kiyavash

分类：机器学习 | 人工智能

2022-05-04

Pearl's Do Colculus是一种完整的公理方法，可以从观察数据中学习可识别的因果效应。如果无法识别这种效果，则有必要在系统中执行经常昂贵的干预措施以学习因果效应。在这项工作中，我们考虑了设计干预措施以最低成本来确定所需效果的问题。首先，我们证明了这个问题是NP-HARD，随后提出了一种可以找到最佳解或对数因子近似值的算法。这是通过在我们的问题和最小击球设置问题之间建立联系来完成的。此外，我们提出了几种多项式启发式算法来解决问题的计算复杂性。尽管这些算法可能会偶然发现亚最佳解决方案，但我们的模拟表明它们在随机图上产生了小的遗憾。

translated by 谷歌翻译

Identifying Mixtures of Bayesian Network Distributions

Spencer L. Gordon , Bijan Mazaheri , Yuval Rabani , Leonard J. Schulman

分类：机器学习 | (统计)机器学习

2021-12-22

贝叶斯网络是一组$ N $随机变量的定向非循环图（DAG）（用顶点标识）;贝叶斯网络分布（BND）是RV的概率分布，即在图中是马尔可夫的。这种模型的有限混合物是在较大的图表上对这些变量的投影，其具有额外的“隐藏”（或“隐藏”（或“潜伏”）随机变量$ U $，范围在$ \ {1，\ ldots，k \ $，以及从$ U $到其他每个其他顶点的指示边。这种类型的模型是对因因果推理的基础，其中$ U $模型是一种混杂效果。一个非常特殊的案例一直是在理论文学中的长期兴趣：空图。这种分布只是$ k $产品分布的混合。考虑到k $产品分布的混合物的联合分布，以识别产物分布及其混合重量，这一直是长期的问题。我们的结果是：（1）我们改善了从$ \ exp（o（k ^ 2））$到$ \ exp（o（k \ log k）的$ k $产品分布的混合物的示例复杂性（和运行时））$。鉴于已知的$ \ exp（\ omega（k））$下限，这几乎可以最好。（2）我们为非空图表提供了第一算法。最大程度为$ \ delta $的图表的复杂性为$ \ exp（o（k（\ delta ^ 2 + \ log k）））$。（上述复杂性是近似和抑制辅助参数的依赖性。）

translated by 谷歌翻译

Greedy Relaxations of the Sparsest Permutation Algorithm

Wai-Yin Lam , Bryan Andrews , Joseph Ramsey

分类：人工智能

2022-06-11

人们对利用置换推理来搜索定向的无环因果模型的方法越来越兴趣，包括Teysier和Kohler和Solus，Wang和Uhler的GSP的“订购搜索”。我们通过基于置换的操作Tuck扩展了后者的方法，并开发了一类算法，即掌握，这些算法在越来越弱的假设下比忠诚度更有效且方向保持一致。最放松的掌握形式优于模拟中许多最新的因果搜索算法，即使对于具有超过100个变量的密集图和图形，也可以有效，准确地搜索。

translated by 谷歌翻译

Counterfactual Fairness with Partially Known Causal Graph

Aoqi Zuo , Susan Wei , Tongliang Liu , Bo Han , Kun Zhang , Mingming Gong

分类：机器学习

2022-05-27

公平的机器学习旨在避免基于\ textit {敏感属性}（例如性别和种族）对个人或子人群的治疗。公平机器学习中的那些方法是基于因果推理确定的歧视和偏见的。尽管基于因果关系的公平学习吸引了越来越多的关注，但当前的方法假设真正的因果图是完全已知的。本文提出了一种一般方法，以实现反事实公平的概念时，当真实的因果图未知。为了能够选择导致反事实公平性的功能，我们得出了条件和算法，以识别\ textit上变量之间的祖先关系{部分定向的无循环图（pdag）}，具体来说，可以从一类可学到的dag中学到。观察数据与域知识相结合。有趣的是，我们发现可以实现反事实公平，就好像真正的因果图是完全知道的一样，当提供了特定的背景知识时：敏感属性在因果图中没有祖先。模拟和实际数据集的结果证明了我们方法的有效性。

translated by 谷歌翻译

Invariant Ancestry Search

Phillip B. Mogensen , Nikolaj Thams , Jonas Peters

分类：机器学习

2022-02-02

最近，已经提出了利用预测模型在不断变化的环境方面的不变性来推断响应变量的因果父母的子集的不变性。如果环境仅影响少数基本机制，则例如不变因果预测（ICP）确定的子集可能很小，甚至是空的。我们介绍了最小不变性的概念，并提出了不变的血统搜索（IAS）。在其人群版本中，IAS输出了一个仅包含响应祖先的集合，并且是ICP输出的超集。当应用于数据时，如果不变性的基础测试具有渐近水平和功率，则相应的保证会渐近。我们开发可扩展算法并在模拟和真实数据上执行实验。

translated by 谷歌翻译

Causal Imitation Learning with Unobserved Confounders

Junzhe Zhang , Daniel Kumor , Elias Bareinboim

分类：机器学习 | 人工智能

2022-08-12

儿童学习的常见方式之一是模仿成年人。模仿学习的重点是从专家产生的示威，没有指定的绩效指标和未观察到的奖励信号的示威中进行的学习政策。模仿学习的流行方法首先直接模仿专家的行为政策（行为克隆）或学习优先考虑观察到的专家轨迹（逆强化学习）的奖励功能。但是，这些方法依赖于以下假设：专家用来确定其行为的协变量得到了完全观察。在本文中，当学习者和专家的感觉输入不同时，我们将放松这一假设和学习模仿学习。首先，我们提供了一个非参数，图形标准，该标准是从示范数据的组合和关于基础环境的定性假设组合来确定模仿的可行性的，该标准以因果模型的形式表示。然后，我们表明，当这种标准不满足时，通过利用专家轨迹的定量知识，模仿仍然可以是可行的。最后，我们开发了一个有效的程序，可以从专家的轨迹中学习模仿政策。

translated by 谷歌翻译