智能论文笔记

Revealing Unfair Models by Mining Interpretable Evidence

Mohit Bajaj , Lingyang Chu , Vittorio Romaniello , Gursimran Singh , Jian Pei , Zirui Zhou , Lanjun Wang , Yong Zhang

分类：机器学习 | 人工智能

2022-07-12

机器学习的普及增加了不公平模型的风险，该模型被部署在高级应用程序中，例如司法系统，药物/疫苗接种设计和医学诊断。尽管有有效的方法可以从头开始训练公平模型，但如何自动揭示和解释受过训练的模型的不公平仍然是一项艰巨的任务。以可解释的方式揭示机器学习模型的不公平是朝着公平和值得信赖的AI迈出的关键一步。在本文中，我们系统地解决了通过挖掘可解释的证据（Rumie）来揭示不公平模型的新任务。关键思想是以一组模型区分的数据实例的形式找到可靠的证据。为了使证据可以解释，我们还找到了一组人为理解的关键属性和决策规则，这些属性和决策规则表征了歧视的数据实例，并将其与其他非歧视数据区分开来。正如在许多现实世界数据集上进行的广泛实验所证明的那样，我们的方法找到了高度可解释和可靠的证据，可以有效揭示受过训练的模型的不公平性。此外，它比所有基线方法更可扩展。

translated by 谷歌翻译

TESTSGD: Interpretable Testing of Neural Networks Against Subtle Group Discrimination

Mengdi Zhang , Jun Sun , Jingyi Wang , Bing Sun

分类：机器学习

2022-08-24

在许多机器学习应用中已经显示了歧视，该应用程序要求在与道德相关的领域（例如面部识别，医学诊断和刑事判决）中部署之前进行足够的公平测试。现有的公平测试方法主要设计用于识别个人歧视，即对个人的歧视。然而，作为另一种广泛的歧视类型，对群体歧视（大多数隐藏）的测试却少得多。为了解决差距，在这项工作中，我们提出了测试，一种可解释的测试方法，它系统地识别和措施隐藏了一个神经网络的隐藏（我们称为“微妙”群体歧视}，该神经网络的特征是敏感特征的条件。一个神经网络，TestsgDFirst自动生成可解释的规则集，该规则集将输入空间分为两组，以暴露模型的组歧视。鉴于，Testsgdalso提供了基于对输入空间进行采样的估计组公平得分，以衡量确定的SIXTEL组歧视程度，这可以确保准确地达到错误的限制。我们评估了在包括结构化数据和文本数据在内的流行数据集中训练的测试多个神经网络模型。实验结果表明，测试有效地有效地识别和测量了如此微妙的群体歧视，以至于该测试效率以前从未透露过。矿石，我们表明，测试的测试结果指南生成新样品的测试结果，以通过可忽略不计的准确性下降来减轻这种歧视。

translated by 谷歌翻译

Learning Optimal Fair Classification Trees

Nathanael Jo , Sina Aghaei , Jack Benson , Andrés Gómez , Phebe Vayanos

分类：机器学习 | 人工智能

2022-01-24

在高风险领域（人们的生计受到影响）中，机器学习的日益增长的使用迫切需要解释和公平的算法。在这些设置中，此类算法的准确性也至关重要。考虑到这些需求，我们提出了一个混合整数优化（MIO）框架，用于学习具有固定深度的最佳分类树，可以通过任意域特定的公平约束来方便地增强。我们基于在流行数据集上建造公平树木的最先进方法基准测试；鉴于固定的歧视阈值，我们的方法平均将样本外（OOS）的精度提高了2.3个百分点，并在88.9％的实验上获得了更高的OOS精度。我们还将各种算法公平概念纳入我们的方法中，展示其多功能建模能力，使决策者可以微调准确性和公平性之间的权衡。

translated by 谷歌翻译

Rule Generation for Classification: Scalability, Interpretability, and Fairness

Adia C. Lumadjeng , Tabea Röber , M. Hakan Akyüz , Ş. İlker Birbil

分类：机器学习 | (统计)机器学习

2021-04-21

We introduce a new rule-based optimization method for classification with constraints. The proposed method takes advantage of linear programming and column generation, and hence, is scalable to large datasets. Moreover, the method returns a set of rules along with their optimal weights indicating the importance of each rule for learning. Through assigning cost coefficients to the rules and introducing additional constraints, we show that one can also consider interpretability and fairness of the results. We test the performance of the proposed method on a collection of datasets and present two case studies to elaborate its different aspects. Our results show that a good compromise between interpretability and fairness on the one side, and accuracy on the other side, can be obtained by the proposed rule-based learning method.

translated by 谷歌翻译

Toward a Fairness-Aware Scoring System for Algorithmic Decision-Making

Yi Yang , Ying Wu , Xiangyu Chang , Mei Li

分类：机器学习

2021-09-21

作为一种预测模型的评分系统具有可解释性和透明度的显着优势，并有助于快速决策。因此，评分系统已广泛用于各种行业，如医疗保健和刑事司法。然而，这些模型中的公平问题长期以来一直受到批评，并且使用大数据和机器学习算法在评分系统的构建中提高了这个问题。在本文中，我们提出了一般框架来创建公平知识，数据驱动评分系统。首先，我们开发一个社会福利功能，融入了效率和群体公平。然后，我们将社会福利最大化问题转换为机器学习中的风险最小化任务，并在混合整数编程的帮助下导出了公平感知评分系统。最后，导出了几种理论界限用于提供参数选择建议。我们拟议的框架提供了适当的解决方案，以解决进程中的分组公平问题。它使政策制定者能够设置和定制其所需的公平要求以及其他特定于应用程序的约束。我们用几个经验数据集测试所提出的算法。实验证据支持拟议的评分制度在实现利益攸关方的最佳福利以及平衡可解释性，公平性和效率的需求方面的有效性。

translated by 谷歌翻译

Interpretable Data-Based Explanations for Fairness Debugging

Romila Pradhan , Jiongli Zhu , Boris Glavic , Babak Salimi

分类：机器学习

2021-12-17

在文献中提出了各种各样的公平度量和可解释的人工智能（XAI）方法，以确定在关键现实环境中使用的机器学习模型中的偏差。但是，仅报告模型的偏差，或使用现有XAI技术生成解释不足以定位并最终减轻偏差源。在这项工作中，我们通过识别对这种行为的根本原因的训练数据的连贯子集来引入Gopher，该系统产生紧凑，可解释和意外模型行为的偏差或意外模型行为。具体而言，我们介绍了因果责任的概念，这些责任通过删除或更新其数据集来解决培训数据的程度可以解决偏差。建立在这一概念上，我们开发了一种有效的方法，用于生成解释模型偏差的顶级模式，该模型偏置利用来自ML社区的技术来实现因果责任，并使用修剪规则来管理模式的大搜索空间。我们的实验评估表明了Gopher在为识别和调试偏置来源产生可解释解释时的有效性。

translated by 谷歌翻译

Through the Data Management Lens: Experimental Analysis and Evaluation of Fair Classification

Maliha Tashfia Islam , Anna Fariha , Alexandra Meliou , Babak Salimi

分类：机器学习

2021-01-18

分类，一种重大研究的数据驱动机器学习任务，驱动越来越多的预测系统，涉及批准的人类决策，如贷款批准和犯罪风险评估。然而，分类器经常展示歧视性行为，特别是当呈现有偏置数据时。因此，分类公平已经成为一个高优先级的研究区。数据管理研究显示与数据和算法公平有关的主题的增加和兴趣，包括公平分类的主题。公平分类的跨学科努力，具有最大存在的机器学习研究，导致大量的公平概念和尚未系统地评估和比较的广泛方法。在本文中，我们对13个公平分类方法和额外变种的广泛分析，超越，公平，公平，效率，可扩展性，对数据误差的鲁棒性，对潜在的ML模型，数据效率和使用各种指标的稳定性的敏感性和稳定性现实世界数据集。我们的分析突出了对不同指标的影响的新颖见解和高级方法特征对不同方面的性能方面。我们还讨论了选择适合不同实际设置的方法的一般原则，并确定以数据管理为中心的解决方案可能产生最大影响的区域。

translated by 谷歌翻译

Interpretable and Fair Boolean Rule Sets via Column Generation

Connor Lawless , Sanjeeb Dash , Oktay Gunluk , Dennis Wei

分类：机器学习 | 人工智能

2021-11-16

本文考虑了在分解正常形式（DNF，ANDS的DNF，ANDS，相当于判定规则集）或联合正常形式（CNF，ORS）作为分类模型的联合正常形式的学习。为规则简化，将整数程序配制成最佳贸易分类准确性。我们还考虑公平设定，并扩大制定，以包括对两种不同分类措施的明确限制：机会平等和均等的赔率。列生成（CG）用于有效地搜索候选条款（连词或剖钉）的指数数量，而不需要启发式规则挖掘。此方法还会绑定所选规则集之间的间隙和培训数据上的最佳规则集。要处理大型数据集，我们建议使用随机化的近似CG算法。与三个最近提出的替代方案相比，CG算法主导了16个数据集中的8个中的精度简单折衷。当最大限度地提高精度时，CG与为此目的设计的规则学习者具有竞争力，有时发现明显更简单的解决方案，这些解决方案不太准确。与其他公平和可解释的分类器相比，我们的方法能够找到符合较严格的公平概念的规则集，以适度的折衷准确性。

translated by 谷歌翻译

Adaptive Fairness Improvement Based on Causality Analysis

Mengdi Zhang , Jun Sun

分类：机器学习

2022-09-15

鉴于神经网络有区别，公平性改善的问题是系统地减少歧视，而不会显着削弱其性能（即准确性）。已经提出了针对神经网络的多种公平改进方法，包括预处理，处理和后处理。然而，我们的实证研究表明，这些方法并不总是有效的（例如，它们可以通过支付巨大准确性下降的价格来提高公平性），甚至没有帮助（例如，它们甚至可能使公平性和准确性都恶化）。在这项工作中，我们提出了一种基于因果分析的公平性改进方法的方法。也就是说，我们根据如何在输入属性和隐藏的神经元之间分布的神经元和属性如何选择方法。我们的实验评估表明，我们的方法是有效的（即，始终确定最佳的公平改善方法）和有效的效率（即，平均时间开销为5分钟）。

translated by 谷歌翻译

How Robust is your Fair Model? Exploring the Robustness of Diverse Fairness Strategies

Edward Small , Wei Shao , Zeliang Zhang , Peihan Liu , Jeffrey Chan , Kacper Sokol , Flora Salim

分类：机器学习

2022-07-11

随着在高风险决策中引入机器学习，确保算法公平已成为越来越重要的问题。为此，已经提出了许多关于公平性的数学定义，并且已经开发了多种优化技术，所有这些都旨在最大化明确的公平概念。但是，公平解决方案取决于训练数据的质量，并且对噪声高度敏感。最近的研究表明，鲁棒性（模型在看不见的数据上表现良好的能力）在解决新问题时应使用的策略类型起着重要作用，因此，测量这些策略的鲁棒性已成为一种基本问题。因此，在这项工作中，我们提出了一个新标准，以衡量各种公平优化策略的鲁棒性 - \ textit {稳健性比率}。我们使用三种最受欢迎的公平策略在五个最受欢迎的公平定义方面，在五个基准标记公平数据集上进行了多次广泛的实验。我们的实验从经验上表明，依赖阈值优化的公平方法对所有评估的数据集中的噪声非常敏感，尽管大多数表现优于其他方法。这与其他两种方法相反，这对于低噪声方案而言不太公平，但对于高噪声方案而言更公平。据我们所知，我们是第一个定量评估公平优化策略的鲁棒性的人。这可以作为选择各种数据集的最合适的公平策略的指南。

translated by 谷歌翻译

EiFFFeL: Enforcing Fairness in Forests by Flipping Leaves

Seyum Assefa Abebe , Claudio Lucchese , Salvatore Orlando

分类：机器学习 | 人工智能

2021-12-29

如今机器学习（ML）技术在许多社交敏感的系统中广泛采用，因此需要仔细研究这些系统所采取的决策的公平性。已经提出了许多方法来解决，并确保没有针对个人或特定群体的偏见，这可能来自偏置训练数据集或算法设计。在这方面，我们提出了一种称为eifffel的公平强化方法：通过翻转叶片来强制森林中的公平，该叶片剥夺了基于树木的或基于叶片的后处理策略来重新制作给定森林的选定决策树的叶子。实验结果表明，我们的方法实现了用户定义的群体公平程度，而不会失去大量的准确性。

translated by 谷歌翻译

Fair mapping

Sébastien Gambs , Rosin Claude Ngueveu

分类：机器学习 | 人工智能 | (统计)机器学习

2022-09-01

为了减轻模型中不希望的偏差的影响，几种方法建议预先处理输入数据集，以通过防止敏感属性的推断来减少歧视风险。不幸的是，这些预处理方法中的大多数导致一代新分布与原始分布有很大不同，因此通常导致不切实际的数据。作为副作用，这种新的数据分布意味着需要重新训练现有模型才能做出准确的预测。为了解决这个问题，我们提出了一种新颖的预处理方法，我们将根据保护组的分布转换为所选目标一个，并具有附加的隐私约束，其目的是防止敏感敏感的推断属性。更确切地说，我们利用Wasserstein Gan和Attgan框架的最新作品来实现数据点的最佳运输以及强制保护属性推断的歧视器。我们提出的方法可以保留数据的可解释性，并且可以在不定义敏感组的情况下使用。此外，我们的方法可以专门建模现有的最新方法，从而提出对这些方法的统一观点。最后，关于真实和合成数据集的一些实验表明，我们的方法能够隐藏敏感属性，同时限制数据的变形并改善了后续数据分析任务的公平性。

translated by 谷歌翻译

HTML版本

A benchmark study on methods to ensure fair algorithmic decisions for credit scoring

Darie Moldovan

分类：机器学习 | 人工智能

2022-09-16

自几十年前以来，已经证明了机器学习评估贷款申请人信誉的实用性。但是，自动决策可能会导致对群体或个人的不同治疗方法，可能导致歧视。本文基准了12种最大的偏见缓解方法，讨论其绩效，该绩效基于5个不同的公平指标，获得的准确性以及为金融机构提供的潜在利润。我们的发现表明，在确保准确性和利润的同时，实现公平性方面的困难。此外，它突出了一些表现最好和最差的人，并有助于弥合实验机学习及其工业应用之间的差距。

translated by 谷歌翻译

Fair Tree Classifier using Strong Demographic Parity

António Pereira Barata , Frank W. Takes , H. Jaap van den Herik , Cor J. Veenman

分类：机器学习

2021-10-18

在处理自动化数据驱动的决策中的敏感数据时，一个重要的问题是学习具有高性能的预测因素对类标签进行高性能，同时最小化对从偏置数据引起的性别或种族的任何敏感属性的歧视。存在一些混合树优化标准，即结合分类性能和公平性。虽然无阈值ROC-AUC是测量传统分类模型性能的标准，但目前的公平树分类方法主要针对分类任务以及公平度量的固定阈值优化。在本文中，我们提出了一种复合分裂标准，其将无阈值（即，强）人口统计平价与Roc-Auc称为公允剧的Scaff - 分裂标准AUC - 并且容易延伸到袋装和提升的树框架。我们的方法同时利用多个敏感属性，其中值可以是多语言的或交叉的，并且可以针对不可避免的性能公平折衷来调谐。在我们的实验中，我们展示了Scaff如何在二进制，多语言和多敏感属性方面产生具有性能和公平的模型。

translated by 谷歌翻译

Enhanced Fairness Testing via Generating Effective Initial Individual Discriminatory Instances

Minghua Ma , Zhao Tian , Max Hort , Federica Sarro , Hongyu Zhang , Qingwei Lin , Dongmei Zhang

分类：机器学习

2022-09-17

公平测试旨在减轻数据驱动的AI系统决策过程中的意外歧视。当AI模型为仅根据受保护属性（例如年龄和种族）区分的两个不同的个体做出不同的决定时，可能会发生个人歧视。这样的实例揭示了偏见的AI行为，被称为个人歧视实例（IDI）。在本文中，我们提出了一种选择初始种子以生成IDI进行公平测试的方法。先前的研究主要使用随机的初始种子来实现这一目标。但是，这个阶段至关重要，因为这些种子是后续IDIS生成的基础。我们称我们提出的种子选择方法I＆D。它产生了大量的初始IDI，表现出极大的多样性，旨在提高公平测试的整体性能。我们的实证研究表明，I＆D能够就四种最先进的种子生成方法产生更多的IDI，平均产生1.68倍的IDI。此外，我们比较I＆D在训练机器学习模型中的使用，并发现与最先进的ART相比，使用I＆D将剩余IDI的数量减少了29％，因此表明I＆D有效地改善了模型公平性

translated by 谷歌翻译

Fairness in Credit Scoring: Assessment, Implementation and Profit Implications

Nikita Kozodoi , Johannes Jacob , Stefan Lessmann

分类： (统计)机器学习 | 机器学习

2021-03-02

算法决策的兴起催生了许多关于公平机器学习（ML）的研究。金融机构使用ML来建立支持一系列与信贷有关的决定的风险记分卡。然而，关于信用评分的公平ML的文献很少。该论文做出了三项贡献。首先，我们重新审视统计公平标准，并检查其对信用评分的适当性。其次，我们对将公平目标纳入ML模型开发管道中的算法选项进行了分类。最后，我们从经验上比较了使用现实世界数据以利润为导向的信用评分上下文中的不同公平处理器。经验结果证实了对公平措施的评估，确定了实施公平信用评分的合适选择，并阐明了贷款决策中的利润权衡。我们发现，可以立即达到多个公平标准，并建议分离作为衡量记分卡的公平性的适当标准。我们还发现公平的过程中，可以在利润和公平之间实现良好的平衡，并表明算法歧视可以以相对较低的成本降低到合理的水平。与该论文相对应的代码可在GitHub上获得。

translated by 谷歌翻译

In Pursuit of Interpretable, Fair and Accurate Machine Learning for Criminal Recidivism Prediction

Caroline Wang , Bin Han , Bhrij Patel , Cynthia Rudin

分类： (统计)机器学习 | 机器学习

2020-05-08

目的：我们研究使用机器学习（ML）模型的可解释的累入预测，并在预测能力，稀疏性和公平性方面分析性能。与以前的作品不同，本研究列举了输出概率而不是二进制预测的可解释模型，并使用定量公平定义来评估模型。本研究还研究了模型是否可以横跨地理位置概括。方法：我们在佛罗里达州和肯塔基州的两个不同的刑事核查数据集上生成了黑盒和可解释的ML模型。我们将这些模型的预测性能和公平与目前用于司法系统中使用的两种方法进行了比较，以预测审前常规率：Arnold PSA和Compas。我们评估了所有模型的预测性能，可以在两次跨越两次预测六种不同类型犯罪的模型。结果：几种可解释的ML模型可以预测常规和黑盒ML模型，比Compas或Arnold PSA更准确。这些模型在实践中可能有用。类似于Arnold PSA，这些可解释模型中的一些可以作为一个简单的表格写入。其他可以使用一组可视化显示。我们的地理分析表明ML模型应分开培训，以便单独的位置并随时间更新。我们还为可解释模型提供了公平分析。结论：可解释的机器学习模型可以在预测准确性和公平性方面表现，也可以表现，也可以表现，也可以执行不可解释的方法和目前使用的风险评估尺度。机器学习模型对于单独培训，可以更准确地进行不同的位置，并保持最新。

translated by 谷歌翻译

A Fair Pricing Model via Adversarial Learning

Vincent Grari , Arthur Charpentier , Marcin Detyniecki

分类： (统计)机器学习 | 人工智能 | 机器学习

2022-02-24

At the core of insurance business lies classification between risky and non-risky insureds, actuarial fairness meaning that risky insureds should contribute more and pay a higher premium than non-risky or less-risky ones. Actuaries, therefore, use econometric or machine learning techniques to classify, but the distinction between a fair actuarial classification and "discrimination" is subtle. For this reason, there is a growing interest about fairness and discrimination in the actuarial community Lindholm, Richman, Tsanakas, and Wuthrich (2022). Presumably, non-sensitive characteristics can serve as substitutes or proxies for protected attributes. For example, the color and model of a car, combined with the driver's occupation, may lead to an undesirable gender bias in the prediction of car insurance prices. Surprisingly, we will show that debiasing the predictor alone may be insufficient to maintain adequate accuracy (1). Indeed, the traditional pricing model is currently built in a two-stage structure that considers many potentially biased components such as car or geographic risks. We will show that this traditional structure has significant limitations in achieving fairness. For this reason, we have developed a novel pricing model approach. Recently some approaches have Blier-Wong, Cossette, Lamontagne, and Marceau (2021); Wuthrich and Merz (2021) shown the value of autoencoders in pricing. In this paper, we will show that (2) this can be generalized to multiple pricing factors (geographic, car type), (3) it perfectly adapted for a fairness context (since it allows to debias the set of pricing components): We extend this main idea to a general framework in which a single whole pricing model is trained by generating the geographic and car pricing components needed to predict the pure premium while mitigating the unwanted bias according to the desired metric.

translated by 谷歌翻译

Modeling Techniques for Machine Learning Fairness: A Survey

Mingyang Wan , Daochen Zha , Ninghao Liu , Na Zou

分类：机器学习

2021-11-04

机器学习模型在高赌注应用中变得普遍存在。尽管在绩效方面有明显的效益，但该模型可以表现出对少数民族群体的偏见，并导致决策过程中的公平问题，导致对个人和社会的严重负面影响。近年来，已经开发了各种技术来减轻机器学习模型的偏差。其中，加工方法已经增加了社区的关注，在模型设计期间直接考虑公平，以诱导本质上公平的模型，从根本上减轻了产出和陈述中的公平问题。在本调查中，我们审查了加工偏置减缓技术的当前进展。基于在模型中实现公平的地方，我们将它们分类为明确和隐性的方法，前者直接在培训目标中纳入公平度量，后者重点介绍精炼潜在代表学习。最后，我们在讨论该社区中的研究挑战来讨论调查，以激励未来的探索。

translated by 谷歌翻译

FairBalance: Improving Machine Learning Fairness on MultipleSensitive Attributes With Data Balancing

Zhe Yu , Joymallya Chakraborty , Tim Menzies

分类：机器学习

2021-07-17

本文旨在改善多敏感属性的机器学习公平。自机学习软件越来越多地用于高赌注和高风险决策，机器学习公平吸引了越来越多的关注。大多数现有的机器学习公平解决方案一次只针对一个敏感的属性（例如性别），或者具有魔法参数来调整，或者具有昂贵的计算开销。为了克服这些挑战，我们在培训机器学习模型之前，我们建议平衡每种敏感属性的培训数据分布。我们的研究结果表明，在低计算开销的情况下，在低计算开销的情况下，Fairbalancy可以在每一个已知的敏感属性上显着减少公平度量（AOD，EOD和SPD），如果对预测性能有任何损坏，则可以在没有多大的情况下进行任何已知的敏感属性。此外，FairbalanceClass是非游价的变种，可以平衡培训数据中的班级分布。通过FairbalanceClass，预测将不再支持多数阶级，从而在少数阶级获得更高的F $ _1 $得分。 Fairbalance和FairbalanceClass还以预测性能和公平度量而言，在其他最先进的偏置缓解算法中也优于其他最先进的偏置缓解算法。本研究将通过提供一种简单但有效的方法来利用社会来改善具有多个敏感属性数据的机器学习软件的公平性。我们的结果还验证了在具有无偏见的地面真理标签上的数据集上的假设，学习模型中的道德偏置在很大程度上属于每个组内具有（2）类分布中的组大小和（2）差异的训练数据。

translated by 谷歌翻译