智能论文笔记

Image-based Treatment Effect Heterogeneity

Connor T. Jerzak , Fredrik Johansson , Adel Daoud

分类：机器学习

2022-06-13

随机对照试验（RCT）被认为是估计干预措施影响的黄金标准。最近的工作通过对年龄和种族等表的变量进行调节估计来研究RCT的效应异质性。但是，这种变量通常只在实验时间附近观察到，并且可能无法捕获效果变异的历史或地理原因。当实验单元与特定位置相关联时，卫星图像可以提供此类历史和地理信息，但是没有任何方法将其包含在描述效果异质性。在本文中，我们开发了一种方法，该方法使用深层概率建模框架估算，图像簇在治疗效果上具有相同的分布。我们将提出的方法与模拟中的替代方法进行比较，并在估计乌干达的反贫困干预措施的影响方面进行了比较。引入了因果正规化惩罚，以确保聚类模型在恢复平均治疗效果（ATE）方面的可靠性。最后，我们讨论了这些方法对其他领域的可行性，局限性以及适用性，例如医学和气候科学，其中图像信息很普遍。我们为在开源软件包中公开使用的所有建模策略制作代码。

translated by 谷歌翻译

Estimating Causal Effects Under Image Confounding Bias with an Application to Poverty in Africa

Connor T. Jerzak , Fredrik Johansson , Adel Daoud

分类：机器学习

2022-06-13

因果关系的观察性研究需要调整混杂因素。在这些因素定义明确的单独随机变量的表格环境中，人们可以很好地理解混杂的效果。但是，在公共政策，生态学和医学中，决策通常是在非尾部环境中做出的，这些设置由图像中检测到的模式或对象（例如，地图，卫星或层析成像图像）所告知。使用此类图像进行因果推理会带来机会，因为图像中的对象可能与感兴趣的治疗和结果有关。在这些情况下，我们依靠图像来调整混淆，但观察到的数据并未直接标记重要对象的存在。在现实世界中的激励中，我们正式化了这一挑战，如何处理，以及哪些条件足以识别和估计因果关系。我们使用仿真实验分析有限样本的性能，并使用采用机器学习模型来估计图像混淆的倾向调整算法估算效果。我们的实验还检查了对图像模式机制错误指定的敏感性。最后，我们使用我们的方法来估计卫星图像中政策干预对非洲社区贫困的影响。

translated by 谷歌翻译

Estimating Individual Treatment Effects using Non-Parametric Regression Models: a Review

Alberto Caron , Gianluca Baio , Ioanna Manolopoulou

分类：机器学习 | (统计)机器学习

2020-09-14

大型观察数据越来越多地提供健康，经济和社会科学等学科，研究人员对因果问题而不是预测感兴趣。在本文中，从旨在调查参与学校膳食计划对健康指标的实证研究，研究了使用非参数回归的方法估算异质治疗效果的问题。首先，我们介绍了与观察或非完全随机数据进行因果推断相关的设置和相关的问题，以及如何在统计学习工具的帮助下解决这些问题。然后，我们审查并制定现有最先进的框架的统一分类，允许通过非参数回归模型来估算单个治疗效果。在介绍模型选择问题的简要概述后，我们说明了一些关于三种不同模拟研究的方法的性能。我们通过展示一些关于学校膳食计划数据的实证分析的一些方法的使用来结束。

translated by 谷歌翻译

Clustering of longitudinal data: A tutorial on a variety of approaches

Niek Den Teuling , Steffen Pauws , Edwin van den Heuvel

分类：机器学习 | (统计)机器学习

2021-11-10

在过去二十年中，识别具有不同纵向数据趋势的群体的方法已经成为跨越许多研究领域的兴趣。为了支持研究人员，我们总结了文献关于纵向聚类的指导。此外，我们提供了一种纵向聚类方法，包括基于基团的轨迹建模（GBTM），生长混合模拟（GMM）和纵向K平均值（KML）。该方法在基本级别引入，并列出了强度，限制和模型扩展。在最近数据收集的发展之后，将注意这些方法的适用性赋予密集的纵向数据（ILD）。我们展示了使用R.中可用的包在合成数据集上的应用程序的应用。

translated by 谷歌翻译

How causal machine learning can leverage marketing strategies: Assessing and improving the performance of a coupon campaign

Henrika Langen , Martin Huber

分类： (统计)机器学习

2022-04-22

我们应用因果机学习算法来评估营销干预措施的因果影响，即优惠券活动，对零售商的销售。除了评估不同类型的优惠券的平均影响外，我们还调查了不同客户群的因果关系效应的异质性，例如，在相对较高的客户与先前购买相对较高的客户之间。最后，我们使用最佳政策学习来确定（以数据驱动方式）哪些客户群应针对优惠券活动，以最大程度地提高营销干预措施在销售方面的有效性。我们发现，在检查的五个优惠券类别中，只有两个，即适用于药店产品和其他食品产品类别的优惠券，对零售商销售具有统计学上的显着积极影响。对小组平均治疗效果的评估表明，在商店的先前购买中定义的客户群中，优惠券提供的影响有很大的差异，药品店优惠券在先前购买较高的客户和其他食品优惠券中特别有效先前购买较低的客户。我们的研究提供了一种用例，用于在业务分析中应用因果机学习，以评估特定公司政策（例如营销活动）对决策支持的因果影响。

translated by 谷歌翻译

Feature selection in stratification estimators of causal effects: lessons from potential outcomes, causal diagrams, and structural equations

P. Richard Hahn , Andrew Herren

分类： (统计)机器学习

2022-09-23

估计平均因果效应的理想回归（如果有）是什么？我们在离散协变量的设置中研究了这个问题，从而得出了各种分层估计器的有限样本方差的表达式。这种方法阐明了许多广泛引用的结果的基本统计现象。我们的博览会结合了研究因果效应估计的三种不同的方法论传统的见解：潜在结果，因果图和具有加性误差的结构模型。

translated by 谷歌翻译

Evaluating Causal Inference Methods

Harsh Parikh , Carlos Varjao , Louise Xu , Eric Tchetgen Tchetgen

分类：机器学习

2022-02-09

绘制因果推断的基本挑战是，任何单位都没有完全观察到反事实。此外，在观察性研究中，治疗分配可能会混淆。在不满足的条件下，已经出现了许多统计方法，这些方法在给定预处理的协变量下，包括基于倾向得分的方法，基于预后分数的方法和双重稳健方法。不幸的是，对于应用研究人员而言，没有“一定大小的”因果方法可以在普遍上表现出色。实际上，因果方法主要根据手工制作的模拟数据进行定量评估。这样的数据产生程序可能具有有限的价值，因为它们通常是现实的风格化模型。它们被简化为障碍性，缺乏现实世界数据的复杂性。对于应用研究人员，了解方法对手头数据的表现效果很好至关重要。我们的工作介绍了基于生成模型的深层框架，以验证因果推理方法。该框架的新颖性源于其产生锚定在观察到的样品的经验分布上的合成数据的能力，因此与后者几乎没有区别。该方法使用户可以为因果效应的形式和幅度指定地面真理，并将偏见作为协变量的功能。因此，模拟数据集用于评估与观察到的样本相似的数据时，各种因果估计方法的潜在性能。我们证明了Credence在广泛的仿真研究中准确评估因果估计技术的相对性能以及来自Lalonde和Project Star研究的两个现实世界数据应用的能力。

translated by 谷歌翻译

Evaluating Treatment Prioritization Rules via Rank-Weighted Average Treatment Effects

Steve Yadlowsky , Scott Fleming , Nigam Shah , Emma Brunskill , Stefan Wager

分类： (统计)机器学习

2021-11-15

有许多可用于选择优先考虑治疗的可用方法，包括基于治疗效果估计，风险评分和手工制作规则的遵循申请。我们将秩加权平均治疗效应（RATY）指标作为一种简单常见的指标系列，用于比较水平竞争范围的治疗优先级规则。对于如何获得优先级规则，率是不可知的，并且仅根据他们在识别受益于治疗中受益的单位的方式进行评估。我们定义了一系列速率估算器，并证明了一个中央限位定理，可以在各种随机和观测研究环境中实现渐近精确的推断。我们为使用自主置信区间的使用提供了理由，以及用于测试关于治疗效果中的异质性的假设的框架，与优先级规则相关。我们对速率的定义嵌套了许多现有度量，包括QINI系数，以及我们的分析直接产生了这些指标的推论方法。我们展示了我们从个性化医学和营销的示例中的方法。在医疗环境中，使用来自Sprint和Accor-BP随机对照试验的数据，我们发现没有明显的证据证明异质治疗效果。另一方面，在大量的营销审判中，我们在一些数字广告活动的治疗效果中发现了具有的强大证据，并证明了如何使用率如何比较优先考虑估计风险的目标规则与估计治疗效益优先考虑的目标规则。

translated by 谷歌翻译

A Causal Research Pipeline and Tutorial for Psychologists and Social Scientists

Matthew J. Vowels

分类： (统计)机器学习

2022-06-10

因果关系是理解世界的科学努力的基本组成部分。不幸的是，在心理学和社会科学中，因果关系仍然是禁忌。由于越来越多的建议采用因果方法进行研究的重要性，我们重新制定了心理学研究方法的典型方法，以使不可避免的因果理论与其余的研究渠道协调。我们提出了一个新的过程，该过程始于从因果发现和机器学习的融合中纳入技术的发展，验证和透明的理论形式规范。然后，我们提出将完全指定的理论模型的复杂性降低到与给定目标假设相关的基本子模型中的方法。从这里，我们确定利息量是否可以从数据中估算出来，如果是的，则建议使用半参数机器学习方法来估计因果关系。总体目标是介绍新的研究管道，该管道可以（a）促进与测试因果理论的愿望兼容的科学询问（b）鼓励我们的理论透明代表作为明确的数学对象，（c）将我们的统计模型绑定到我们的统计模型中该理论的特定属性，因此减少了理论到模型间隙通常引起的规范不足问题，以及（d）产生因果关系和可重复性的结果和估计。通过具有现实世界数据的教学示例来证明该过程，我们以摘要和讨论来结论。

translated by 谷歌翻译

Deep Multi-Modal Structural Equations For Causal Effect Estimation With Unstructured Proxies

Shachi Deshpande , Kaiwen Wang , Dhruv Sreenivas , Zheng Li , Volodymyr Kuleshov

分类：机器学习

2022-03-18

在考虑混杂变量时估计干预措施的效果是因果推断的关键任务。通常，混杂因素没有观察到，但是我们可以访问大量的非结构化数据（图像，文本），这些数据包含有关缺失混杂因素的有价值的代理信号。本文表明，利用通常被现有算法未使用的非结构化数据提高了因果效应估计的准确性。具体而言，我们引入了深层多模式结构方程，这是一个生成模型，其中混杂因素是潜在变量，非结构化数据是代理变量。该模型支持多个多模式代理（图像，文本）以及缺少数据。我们从经验上证明了基因组学和医疗保健的任务，我们的方法纠正了使用非结构化输入混淆，从而有可能使用以前在因果推理中不使用的大量数据。

translated by 谷歌翻译

Instrumental Variables in Causal Inference and Machine Learning: A Survey

Anpeng Wu , Kun Kuang , Ruoxuan Xiong , Fei Wu

分类：机器学习 | 人工智能

2022-12-12

Causal inference is the process of using assumptions, study designs, and estimation strategies to draw conclusions about the causal relationships between variables based on data. This allows researchers to better understand the underlying mechanisms at work in complex systems and make more informed decisions. In many settings, we may not fully observe all the confounders that affect both the treatment and outcome variables, complicating the estimation of causal effects. To address this problem, a growing literature in both causal inference and machine learning proposes to use Instrumental Variables (IV). This paper serves as the first effort to systematically and comprehensively introduce and discuss the IV methods and their applications in both causal inference and machine learning. First, we provide the formal definition of IVs and discuss the identification problem of IV regression methods under different assumptions. Second, we categorize the existing work on IV methods into three streams according to the focus on the proposed methods, including two-stage least squares with IVs, control function with IVs, and evaluation of IVs. For each stream, we present both the classical causal inference methods, and recent developments in the machine learning literature. Then, we introduce a variety of applications of IV methods in real-world scenarios and provide a summary of the available datasets and algorithms. Finally, we summarize the literature, discuss the open problems and suggest promising future research directions for IV methods and their applications. We also develop a toolkit of IVs methods reviewed in this survey at https://github.com/causal-machine-learning-lab/mliv.

translated by 谷歌翻译

Causal effect inference with deep latent-variable models

分类：

Learning individual-level causal effects from observational data, such as inferring the most effective medication for a specific patient, is a problem of growing importance for policy makers. The most important aspect of inferring causal effects from observational data is the handling of confounders, factors that affect both an intervention and its outcome. A carefully designed observational study attempts to measure all important confounders. However, even if one does not have direct access to all confounders, there may exist noisy and uncertain measurement of proxies for confounders. We build on recent advances in latent variable modeling to simultaneously estimate the unknown latent space summarizing the confounders and the causal effect. Our method is based on Variational Autoencoders (VAE) which follow the causal structure of inference with proxies. We show our method is significantly more robust than existing methods, and matches the state-of-the-art on previous benchmarks focused on individual treatment effects.

translated by 谷歌翻译

Causal inference in statistics: An overview

分类：

This review presents empirical researchers with recent advances in causal inference, and stresses the paradigmatic shifts that must be undertaken in moving from traditional statistical analysis to causal analysis of multivariate data. Special emphasis is placed on the assumptions that underly all causal inferences, the languages used in formulating those assumptions, the conditional nature of all causal and counterfactual claims, and the methods that have been developed for the assessment of such claims. These advances are illustrated using a general theory of causation based on the Structural Causal Model (SCM) described in Pearl (2000a), which subsumes and unifies other approaches to causation, and provides a coherent mathematical foundation for the analysis of causes and counterfactuals. In particular, the paper surveys the development of mathematical tools for inferring (from a combination of data and assumptions) answers to three types of causal queries: (1) queries about the effects of potential interventions, (also called "causal effects" or "policy evaluation") (2) queries about probabilities of counterfactuals, (including assessment of "regret," "attribution" or "causes of effects") and (3) queries about direct and indirect effects (also known as "mediation"). Finally, the paper defines the formal and conceptual relationships between the structural and potential-outcome frameworks and presents tools for a symbiotic analysis that uses the strong features of both.

translated by 谷歌翻译

Estimating Heterogeneous Bounds for Treatment Effects under Sample Selection and Non-response

Phillip Heiler

分类： (统计)机器学习

2022-09-09

在本文中，我们提出了一种非参数估计的方法，并推断了一般样本选择模型中因果效应参数的异质界限，初始治疗可能会影响干预后结果是否观察到。可观察到的协变量可能会混淆治疗选择，而观察结果和不可观察的结果可能会混淆。该方法提供条件效应界限作为策略相关的预处理变量的功能。它允许对身份不明的条件效应曲线进行有效的统计推断。我们使用灵活的半参数脱偏机学习方法，该方法可以适应柔性功能形式和治疗，选择和结果过程之间的高维混杂变量。还提供了易于验证的高级条件，以进行估计和错误指定的鲁棒推理保证。

translated by 谷歌翻译

Causal Inference in Natural Language Processing: Estimation, Prediction, Interpretation and Beyond

Amir Feder , Katherine A. Keith , Emaad Manzoor , Reid Pryzant , Dhanya Sridhar , Zach Wood-Doughty , Jacob Eisenstein , Justin Grimmer , Roi Reichart , Margaret E. Roberts

分类：自然语言处理 | 机器学习

2021-09-02

科学研究的基本目标是了解因果关系。然而，尽管因果关系在生活和社会科学中的重要作用，但在自然语言处理（NLP）中并不具有相同的重要性，而自然语言处理（NLP）传统上更加重视预测任务。这种区别开始逐渐消失，随着因果推理和语言处理的融合，跨学科研究的新兴领域。尽管如此，关于NLP因果关系的研究仍然散布在没有统一的定义，基准数据集的情况下，并清楚地表达了将因果推论应用于文本领域的挑战和机遇，并具有其独特的属性。在这项调查中，我们巩固了整个学术领域的研究，并将其置于更广泛的NLP景观中。我们介绍了用文本估算因果效应的统计挑战，其中包含文本用作结果，治疗或解决混杂问题的设置。此外，我们探讨了因果推理的潜在用途，以提高NLP模型的鲁棒性，公平性和解释性。因此，我们提供了NLP社区因果推断的统一概述。

translated by 谷歌翻译

Falsification before Extrapolation in Causal Effect Estimation

Zeshan Hussain , Michael Oberst , Ming-Chieh Shih , David Sontag

分类：机器学习

2022-09-27

在制定政策指南时，随机对照试验（RCT）代表了黄金标准。但是，RCT通常是狭窄的，并且缺乏更广泛的感兴趣人群的数据。这些人群中的因果效应通常是使用观察数据集估算的，这可能会遭受未观察到的混杂和选择偏见。考虑到一组观察估计（例如，来自多项研究），我们提出了一个试图拒绝偏见的观察性估计值的元偏值。我们使用验证效应，可以从RCT和观察数据中推断出的因果效应。在拒绝未通过此测试的估计器之后，我们对RCT中未观察到的亚组的外推性效应产生了保守的置信区间。假设至少一个观察估计量在验证和外推效果方面是渐近正常且一致的，我们为我们算法输出的间隔的覆盖率概率提供了保证。为了促进在跨数据集的因果效应运输的设置中，我们给出的条件下，即使使用灵活的机器学习方法用于估计滋扰参数，群体平均治疗效应的双重稳定估计值也是渐近的正常。我们说明了方法在半合成和现实世界数据集上的特性，并表明它与标准的荟萃分析技术相比。

translated by 谷歌翻译

Targeted VAE: Variational and Targeted Learning for Causal Inference

Matthew James Vowels , Necati Cihan Camgoz , Richard Bowden

分类： (统计)机器学习 | 人工智能 | 机器学习

2020-09-28

在广泛的任务中，在包括医疗处理，广告和营销和政策制定的发展中，对观测数据进行因果推断非常有用。使用观察数据进行因果推断有两种重大挑战：治疗分配异质性（\ Texit {IE}，治疗和未经处理的群体之间的差异），并且没有反事实数据（\ TEXTIT {IE}，不知道是什么已经发生了，如果确实得到治疗的人，反而尚未得到治疗）。通过组合结构化推论和有针对性的学习来解决这两个挑战。在结构方面，我们将联合分布分解为风险，混淆，仪器和杂项因素，以及在目标学习方面，我们应用来自影响曲线的规则器，以减少残余偏差。进行了一项消融研究，对基准数据集进行评估表明，TVAE具有竞争力和最先进的艺术表现。

translated by 谷歌翻译

Causal Fairness Analysis

Drago Plecko , Elias Bareinboim

分类：人工智能 | 机器学习 | (统计)机器学习

2022-07-23

基于AI和机器学习的决策系统已在各种现实世界中都使用，包括医疗保健，执法，教育和金融。不再是牵强的，即设想一个未来，自治系统将推动整个业务决策，并且更广泛地支持大规模决策基础设施以解决社会最具挑战性的问题。当人类做出决定时，不公平和歧视的问题普遍存在，并且当使用几乎没有透明度，问责制和公平性的机器做出决定时（或可能会放大）。在本文中，我们介绍了\ textit {Causal公平分析}的框架，目的是填补此差距，即理解，建模，并可能解决决策设置中的公平性问题。我们方法的主要见解是将观察到数据中存在的差异的量化与基本且通常是未观察到的因果机制收集的因果机制的收集，这些机制首先会产生差异，挑战我们称之为因果公平的基本问题分析（FPCFA）。为了解决FPCFA，我们研究了分解差异和公平性的经验度量的问题，将这种变化归因于结构机制和人群的不同单位。我们的努力最终达到了公平地图，这是组织和解释文献中不同标准之间关系的首次系统尝试。最后，我们研究了进行因果公平分析并提出一本公平食谱的最低因果假设，该假设使数据科学家能够评估不同影响和不同治疗的存在。

translated by 谷歌翻译

Shrinkage Bayesian Causal Forests for Heterogeneous Treatment Effects Estimation

Alberto Caron , Gianluca Baio , Ioanna Manolopoulou

分类：机器学习 | (统计)机器学习

2021-02-12

本文开发了贝叶斯因果林的稀疏诱导版本，最近提出的非参数因果回归模型采用贝叶斯添加剂回归树，专门设计用于使用观察数据来估计异质治疗效果。我们介绍的稀疏诱导组件是通过实证研究的动机，其中不是所有可用的协变量相关的，导致在估计个体治疗效果的兴趣表面底层的不同程度。在这项工作中提供的扩展版本，我们命名贝叶斯因果森林，配备了一对允许模型通过树集合中的相应数量的分裂调节每个协变量的重量。这些前瞻改善了模型对稀疏数据产生过程的适应性，并且允许在治疗效果估计的框架中进行完全贝叶斯特征缩收，从而揭示推动异质性的调节因子。此外，该方法允许先前了解相关的混杂协变量和对模型中掺入结果的影响的相对幅度。我们说明了我们在模拟研究中的方法的表现，与贝叶斯因果林和其他最先进的模型相比，展示如何与越来越多的协变量以及其如何处理强烈混淆的情景。最后，我们还提供了使用真实数据的应用程序的示例。

translated by 谷歌翻译

What can the millions of random treatments in nonexperimental data reveal about causes?

Andre F. Ribeiro , Frank Neffke , Ricardo Hausmann

分类：人工智能

2021-05-03

We propose a new method to estimate causal effects from nonexperimental data. Each pair of sample units is first associated with a stochastic 'treatment' - differences in factors between units - and an effect - a resultant outcome difference. It is then proposed that all such pairs can be combined to provide more accurate estimates of causal effects in observational data, provided a statistical model connecting combinatorial properties of treatments to the accuracy and unbiasedness of their effects. The article introduces one such model and a Bayesian approach to combine the $O(n^2)$ pairwise observations typically available in nonexperimnetal data. This also leads to an interpretation of nonexperimental datasets as incomplete, or noisy, versions of ideal factorial experimental designs. This approach to causal effect estimation has several advantages: (1) it expands the number of observations, converting thousands of individuals into millions of observational treatments; (2) starting with treatments closest to the experimental ideal, it identifies noncausal variables that can be ignored in the future, making estimation easier in each subsequent iteration while departing minimally from experiment-like conditions; (3) it recovers individual causal effects in heterogeneous populations. We evaluate the method in simulations and the National Supported Work (NSW) program, an intensively studied program whose effects are known from randomized field experiments. We demonstrate that the proposed approach recovers causal effects in common NSW samples, as well as in arbitrary subpopulations and an order-of-magnitude larger supersample with the entire national program data, outperforming Statistical, Econometrics and Machine Learning estimators in all cases...

translated by 谷歌翻译