智能论文笔记

Diagnosing AI Explanation Methods with Folk Concepts of Behavior

Alon Jacovi , Jasmijn Bastings , Sebastian Gehrmann , Yoav Goldberg , Katja Filippova

分类：人工智能

2022-01-27

当向人类解释AI行为时，人类的解释如何理解传达的信息，并且它是否与解释试图交流的内容相匹配？我们什么时候可以说解释正在解释某件事？我们旨在通过利用有关人类用来理解行为的民间概念的思维理论来提供答案。我们建立了人类言论的社会归因框架，该框架描述了解释的功能：人类从他们那里理解的信息。具体而言，有效的解释应产生连贯的心理模型（传达有关其他对比案例的信息），完整（传达对对比案例的明确因果叙事，代表原因，影响的表示和外部原因）以及互动（表面和解决矛盾，通过审讯到概括属性）。我们证明，许多XAI机制可以映射到民间行为概念。这使我们能够发现它们的故障模式，以防止当前方法有效解释，以及启用连贯解释所必需的。

translated by 谷歌翻译

Explanation in Artificial Intelligence: Insights from the Social Sciences

Tim Miller

分类：

2017-06-22

There has been a recent resurgence in the area of explainable artificial intelligence as researchers and practitioners seek to make their algorithms more understandable. Much of this research is focused on explicitly explaining decisions or actions to a human observer, and it should not be controversial to say that looking at how humans explain to each other can serve as a useful starting point for explanation in artificial intelligence. However, it is fair to say that most work in explainable artificial intelligence uses only the researchers' intuition of what constitutes a 'good' explanation. There exists vast and valuable bodies of research in philosophy, psychology, and cognitive science of how people define, generate, select, evaluate, and present explanations, which argues that people employ certain cognitive biases and social expectations towards the explanation process. This paper argues that the field of explainable artificial intelligence should build on this existing research, and reviews relevant papers from philosophy, cognitive psychology/science, and social psychology, which study these topics. It draws out some important findings, and discusses ways that these can be infused with work on explainable artificial intelligence.

translated by 谷歌翻译

Explainability Is in the Mind of the Beholder: Establishing the Foundations of Explainable Artificial Intelligence

Kacper Sokol , Peter Flach

分类：人工智能 | 机器学习 | (统计)机器学习

2021-12-29

可解释的人工智能和可解释的机器学习是重要性越来越重要的研究领域。然而，潜在的概念仍然难以捉摸，并且缺乏普遍商定的定义。虽然社会科学最近的灵感已经重新分为人类受助人的需求和期望的工作，但该领域仍然错过了具体的概念化。通过审查人类解释性的哲学和社会基础，我们采取措施来解决这一挑战，然后我们转化为技术领域。特别是，我们仔细审查了算法黑匣子的概念，并通过解释过程确定的理解频谱并扩展了背景知识。这种方法允许我们将可解释性（逻辑）推理定义为在某些背景知识下解释的透明洞察（进入黑匣子）的解释 - 这是一个从事在Admoleis中理解的过程。然后，我们采用这种概念化来重新审视透明度和预测权力之间的争议权差异，以及对安特 - 人穴和后宫后解释者的影响，以及可解释性发挥的公平和问责制。我们还讨论机器学习工作流程的组件，可能需要可解释性，从以人为本的可解释性建立一系列思想，重点介绍声明，对比陈述和解释过程。我们的讨论调整并补充目前的研究，以帮助更好地导航开放问题 - 而不是试图解决任何个人问题 - 从而为实现的地面讨论和解释的人工智能和可解释的机器学习的未来进展奠定了坚实的基础。我们结束了我们的研究结果，重新审视了实现所需的算法透明度水平所需的人以人为本的解释过程。

translated by 谷歌翻译

Beware the Rationalization Trap! When Language Model Explainability Diverges from our Mental Models of Language

Rita Sevastjanova , Mennatallah El-Assady

分类：自然语言处理

2022-07-14

语言模型的学习和表示语言与人类不同。他们学习形式而不是含义。因此，为了评估语言模型解释性的成功，我们需要考虑其与用户语言心理模型的差异的影响。在该立场论文中，我们认为，为了避免有害合理化并实现对语言模型的真实理解，解释过程必须满足三个主要条件：（1）解释必须真实地代表模型行为，即具有很高的忠诚；（2）解释必须完整，因为缺少信息会扭曲事实；（3）解释必须考虑到用户的心理模型，逐步验证一个人的知识并适应他们的理解。我们介绍了一个决策树模型，以展示当前解释未能达到目标的潜在原因。我们进一步强调了以人为本的设计从多个角度解释该模型的必要性，从而逐步将解释调整为不断变化的用户期望。

translated by 谷歌翻译

Towards Human-centered Explainable AI: User Studies for Model Explanations

Yao Rong , Tobias Leemann , Thai-trang Nguyen , Lisa Fiedler , Peizhu Qian , Vaibhav Unhelkar , Tina Seidel , Gjergji Kasneci , Enkelejda Kasneci

分类：人工智能

2022-10-20

Explainable AI (XAI) is widely viewed as a sine qua non for ever-expanding AI research. A better understanding of the needs of XAI users, as well as human-centered evaluations of explainable models are both a necessity and a challenge. In this paper, we explore how HCI and AI researchers conduct user studies in XAI applications based on a systematic literature review. After identifying and thoroughly analyzing 85 core papers with human-based XAI evaluations over the past five years, we categorize them along the measured characteristics of explanatory methods, namely trust, understanding, fairness, usability, and human-AI team performance. Our research shows that XAI is spreading more rapidly in certain application domains, such as recommender systems than in others, but that user evaluations are still rather sparse and incorporate hardly any insights from cognitive or social sciences. Based on a comprehensive discussion of best practices, i.e., common models, design choices, and measures in user studies, we propose practical guidelines on designing and conducting user studies for XAI researchers and practitioners. Lastly, this survey also highlights several open research directions, particularly linking psychological science and human-centered XAI.

translated by 谷歌翻译

Human-Centered Explainable AI (XAI): From Algorithms to User Experiences

Q. Vera Liao , Kush R. Varshney

分类：人工智能

2021-10-20

作为人工智能（AI）的技术子领域，可解释的AI（XAI）已经产生了广泛的算法集合，为研究人员和从业者提供了一个工具箱，用于构建XAI应用程序。凭借丰富的应用机会，解释性已经超越了数据科学家或研究人员的需求，以了解他们发展的模型，成为人们信任的重要要求，并采用部署在众多域中的AI。然而，解释性是一种本质上以人为本的财产，该领域开始接受以人为本的方法。人机互动（HCI）研究和用户体验（UX）设计在该地区的设计越来越重要。在本章中，我们从Xai算法技术景观的高级概述开始，然后选择性地调查我们自己和其他最近的HCI工作，以便以人为本的设计，评估，为Xai提供概念和方法工具。我们询问问题``以人为本的方式为Xai'做了什么，并突出了三个角色，通过帮助导航，评估和扩展Xai工具箱来塑造XAI技术的三个角色：通过用户解释性需要推动技术选择揭示现有XAI方法的缺陷，并通知新方法，为人类兼容的XAI提供概念框架。

translated by 谷歌翻译

Explainable AI (XAI): A Systematic Meta-Survey of Current Challenges and Future Opportunities

Waddah Saeed , Christian Omlin

分类：机器学习 | 人工智能

2021-11-11

过去十年已经看到人工智能（AI）的显着进展，这导致了用于解决各种问题的算法。然而，通过增加模型复杂性并采用缺乏透明度的黑匣子AI模型来满足这种成功。为了响应这种需求，已经提出了说明的AI（Xai）以使AI更透明，从而提高关键结构域中的AI。虽然有几个关于Xai主题的Xai主题的评论，但在Xai中发现了挑战和潜在的研究方向，这些挑战和研究方向被分散。因此，本研究为Xai组织的挑战和未来的研究方向提出了系统的挑战和未来研究方向：（1）基于机器学习生命周期的Xai挑战和研究方向，基于机器的挑战和研究方向阶段：设计，开发和部署。我们认为，我们的META调查通过为XAI地区的未来探索指导提供了XAI文学。

translated by 谷歌翻译

Leveraging Explanations in Interactive Machine Learning: An Overview

Stefano Teso , Öznur Alkan , Wolfang Stammer , Elizabeth Daly

分类：机器学习

2022-07-29

为了提高模型透明度并允许用户形成训练有素的ML模型的心理模型，解释对AI和机器学习（ML）社区的兴趣越来越高。但是，解释可以超越这种方式通信作为引起用户控制的机制，因为一旦用户理解，他们就可以提供反馈。本文的目的是介绍研究概述，其中解释与交互式功能相结合，是从头开始学习新模型并编辑和调试现有模型的手段。为此，我们绘制了最先进的概念图，根据其预期目的以及它们如何构建相互作用，突出它们之间的相似性和差异来分组相关方法。我们还讨论开放研究问题并概述可能的方向，希望促使人们对这个开花研究主题进行进一步的研究。

translated by 谷歌翻译

Towards Faithful Model Explanation in NLP: A Survey

Qing Lyu , Marianna Apidianaki , Chris Callison-Burch

分类：自然语言处理

2022-09-22

众所周知，端到端的神经NLP体系结构很难理解，这引起了近年来为解释性建模的许多努力。模型解释的基本原则是忠诚，即，解释应准确地代表模型预测背后的推理过程。这项调查首先讨论了忠诚的定义和评估及其对解释性的意义。然后，我们通过将方法分为五类来介绍忠实解释的最新进展：相似性方法，模型内部结构的分析，基于反向传播的方法，反事实干预和自我解释模型。每个类别将通过其代表性研究，优势和缺点来说明。最后，我们从它们的共同美德和局限性方面讨论了上述所有方法，并反思未来的工作方向忠实的解释性。对于有兴趣研究可解释性的研究人员，这项调查将为该领域提供可访问且全面的概述，为进一步探索提供基础。对于希望更好地了解自己的模型的用户，该调查将是一项介绍性手册，帮助选择最合适的解释方法。

translated by 谷歌翻译

A Theoretical Framework for AI Models Explainability

Matteo Rizzo , Alberto Veneri , Andrea Albarelli , Claudio Lucchese , Cristina Conati

分类：人工智能 | 计算机视觉 | 机器学习

2022-12-29

Explainability is a vibrant research topic in the artificial intelligence community, with growing interest across methods and domains. Much has been written about the topic, yet explainability still lacks shared terminology and a framework capable of providing structural soundness to explanations. In our work, we address these issues by proposing a novel definition of explanation that is a synthesis of what can be found in the literature. We recognize that explanations are not atomic but the product of evidence stemming from the model and its input-output and the human interpretation of this evidence. Furthermore, we fit explanations into the properties of faithfulness (i.e., the explanation being a true description of the model's decision-making) and plausibility (i.e., how much the explanation looks convincing to the user). Using our proposed theoretical framework simplifies how these properties are ope rationalized and provide new insight into common explanation methods that we analyze as case studies.

translated by 谷歌翻译

Explainability of deep vision-based autonomous driving systems: Review and challenges

Éloi Zablocki , Hédi Ben-Younes , Patrick Pérez , Matthieu Cord

分类：计算机视觉 | 人工智能 | 机器学习 | 机器人

2021-01-13

这项调查回顾了对基于视觉的自动驾驶系统进行行为克隆训练的解释性方法。解释性的概念具有多个方面，并且需要解释性的驾驶强度是一种安全至关重要的应用。从几个研究领域收集贡献，即计算机视觉，深度学习，自动驾驶，可解释的AI（X-AI），这项调查可以解决几点。首先，它讨论了从自动驾驶系统中获得更多可解释性和解释性的定义，上下文和动机，以及该应用程序特定的挑战。其次，以事后方式为黑盒自动驾驶系统提供解释的方法是全面组织和详细的。第三，详细介绍和讨论了旨在通过设计构建更容易解释的自动驾驶系统的方法。最后，确定并检查了剩余的开放挑战和潜在的未来研究方向。

translated by 谷歌翻译

A Comprehensive Taxonomy for Explainable Artificial Intelligence: A Systematic Survey of Surveys on Methods and Concepts

Gesina Schwalbe , Bettina Finzel

分类：机器学习 | 人工智能

2021-05-15

与此同时，在可解释的人工智能（XAI）的研究领域中，已经开发了各种术语，动机，方法和评估标准。随着XAI方法的数量大大增长，研究人员以及从业者以及从业者需要一种方法：掌握主题的广度，比较方法，并根据特定用例所需的特征选择正确的XAI方法语境。在文献中，可以找到许多不同细节水平和深度水平的XAI方法分类。虽然他们经常具有不同的焦点，但它们也表现出许多重叠点。本文统一了这些努力，并提供了XAI方法的分类，这是关于目前研究中存在的概念的概念。在结构化文献分析和元研究中，我们识别并审查了XAI方法，指标和方法特征的50多个最引用和最新的调查。总结在调查调查中，我们将文章的术语和概念合并为统一的结构化分类。其中的单一概念总计超过50个不同的选择示例方法，我们相应地分类。分类学可以为初学者，研究人员和从业者提供服务作为XAI方法特征和方面的参考和广泛概述。因此，它提供了针对有针对性的，用例导向的基础和上下文敏感的未来研究。

translated by 谷歌翻译

Towards a Science of Human-AI Decision Making: A Survey of Empirical Studies

Vivian Lai , Chacha Chen , Q. Vera Liao , Alison Smith-Renner , Chenhao Tan

分类：人工智能 | 自然语言处理 | 机器学习

2021-12-21

随着AI系统表现出越来越强烈的预测性能，它们的采用已经在许多域中种植。然而，在刑事司法和医疗保健等高赌场域中，由于安全，道德和法律问题，往往是完全自动化的，但是完全手工方法可能是不准确和耗时的。因此，对研究界的兴趣日益增长，以增加人力决策。除了为此目的开发AI技术之外，人民AI决策的新兴领域必须采用实证方法，以形成对人类如何互动和与AI合作做出决定的基础知识。为了邀请和帮助结构研究努力了解理解和改善人为 - AI决策的研究，我们近期对本课题的实证人体研究的文献。我们总结了在三个重要方面的100多篇论文中的研究设计选择：（1）决定任务，（2）AI模型和AI援助要素，以及（3）评估指标。对于每个方面，我们总结了当前的趋势，讨论了现场当前做法中的差距，并列出了未来研究的建议。我们的调查强调了开发共同框架的需要考虑人类 - AI决策的设计和研究空间，因此研究人员可以在研究设计中进行严格的选择，研究界可以互相构建并产生更广泛的科学知识。我们还希望这项调查将成为HCI和AI社区的桥梁，共同努力，相互塑造人类决策的经验科学和计算技术。

translated by 谷歌翻译

A User-Centred Framework for Explainable Artificial Intelligence in Human-Robot Interaction

Marco Matarese , Francesco Rea , Alessandra Sciutti

分类：人工智能 | 机器人

2021-09-27

最先进的人工智能（AI）技术达到了令人印象深刻的复杂性。因此，研究人员正在发现越来越多的方法来在现实世界中使用它们。然而，这种系统的复杂性需要引入使那些对人类用户透明的方法。 AI社区正试图通过引入可解释的AI（XAI）字段来克服这个问题，这暂时使AI算法不那么不透明。但是，近年来，Xai更清楚地，Xai远远超过计算机科学问题：由于它是关于沟通，Xai也是一种人类代理互动问题。此外，AI从实验室中出来的实验室。这意味着需要对非专家用户量身定制的XAI解决方案。因此，我们向XAI提出了一个用户以用户为中心的框架，专注于其社会互动的方面，从认知和社会科学的理论和调查中获取灵感。该框架旨在为非专家用户提供互动XAI解决方案的结构。

translated by 谷歌翻译

On the link between conscious function and general intelligence in humans and machines

Arthur Juliani , Kai Arulkumaran , Shuntaro Sasai , Ryota Kanai

分类：人工智能 | 神经与进化计算

2022-03-24

在流行媒体中，人造代理商的意识出现与同时实现人类或超人水平智力的那些相同的代理之间通常存在联系。在这项工作中，我们探讨了意识和智力之间这种看似直观的联系的有效性和潜在应用。我们通过研究与三种当代意识功能理论相关的认知能力：全球工作空间理论（GWT），信息生成理论（IGT）和注意力模式理论（AST）。我们发现，这三种理论都将有意识的功能专门与人类领域将军智力的某些方面联系起来。有了这个见解，我们转向人工智能领域（AI），发现尽管远未证明一般智能，但许多最先进的深度学习方法已经开始纳入三个功能的关键方面理论。确定了这一趋势后，我们以人类心理时间旅行的激励例子来提出方式，其中三种理论中每种理论的见解都可以合并为一个单一的统一和可实施的模型。鉴于三种功能理论中的每一种都可以通过认知能力来实现这一可能，因此，具有精神时间旅行的人造代理不仅具有比当前方法更大的一般智力，而且还与我们当前对意识功能作用的理解更加一致在人类中，这使其成为AI研究的有希望的近期目标。

translated by 谷歌翻译

An Objective Metric for Explainable AI: How and Why to Estimate the Degree of Explainability

Francesco Sovrano , Fabio Vitali

分类：人工智能 | 自然语言处理

2021-09-11

许多政府举措（例如欧盟的GDPR）正在得出结论，即现代软件系统的越来越复杂程度必须与对这些工具的影响评估的一些权利和指标形成鲜明对比，使人们能够理解和监督产出自动化决策系统。可解释的ai诞生于允许人类探索和理解复杂系统的内部工作的途径。但是，建立什么是解释和客观地评估可解释性，不是琐碎的任务。通过本文，我们提出了一种新的模型 - 不可知性的指标，以测量以客观方式测量（正确）信息的解释程度，利用普通语言哲学的特定理论模型，称为ACHINSTEIN的解释理论，通过依赖于算法实现知识图提取和信息检索的深语模型。为了了解这种度量是否实际表现为可解释性，我们已经设计了一些实验和用户研究，涉及超过160名参与者评估了使用包括人工神经网络的着名AI技术的医疗保健和金融的基于医疗保健和金融的基于医疗保健系统和treeshap。我们获得的结果非常令人鼓舞，这表明我们拟议的测量可解释程度的指标对若干情景是强大的，并且最终可以利用自动决策系统的合法影响评估。

translated by 谷歌翻译

Challenges in Applying Explainability Methods to Improve the Fairness of NLP Models

Esma Balkir , Svetlana Kiritchenko , Isar Nejadgholi , Kathleen C. Fraser

分类：自然语言处理

2022-06-08

可解释的人工智能（XAI）中方法的动机通常包括检测，量化和缓解偏见，并为使机器学习模型更加公平而做出贡献。但是，确切的XAI方法可以如何帮助打击偏见。在本文中，我们简要回顾了NLP研究中的解释性和公平性的趋势，确定了当前的实践，其中采用了解释性方法来检测和减轻偏见，并调查了阻止XAI方法在解决公平问题中更广泛使用的障碍。

translated by 谷歌翻译

Explainable Goal-Driven Agents and Robots -- A Comprehensive Review

Fatai Sado , Chu Kiong Loo , Wei Shiung Liew , Matthias Kerzel , Stefan Wermter

分类：机器人 | 人工智能

2020-04-21

最近的自主代理和机器人的应用，如自动驾驶汽车，情景的培训师，勘探机器人和服务机器人带来了关注与当前生成人工智能（AI）系统相关的至关重要的信任相关挑战。尽管取得了巨大的成功，基于连接主义深度学习神经网络方法的神经网络方法缺乏解释他们对他人的决策和行动的能力。没有符号解释能力，它们是黑色盒子，这使得他们的决定或行动不透明，这使得难以信任它们在安全关键的应用中。最近对AI系统解释性的立场目睹了可解释的人工智能（XAI）的几种方法;然而，大多数研究都专注于应用于计算科学中的数据驱动的XAI系统。解决越来越普遍的目标驱动器和机器人的研究仍然缺失。本文评论了可解释的目标驱动智能代理和机器人的方法，重点是解释和沟通代理人感知功能的技术（示例，感官和愿景）和认知推理（例如，信仰，欲望，意图，计划和目标）循环中的人类。审查强调了强调透明度，可辨与和持续学习以获得解释性的关键策略。最后，本文提出了解释性的要求，并提出了用于实现有效目标驱动可解释的代理和机器人的路线图。

translated by 谷歌翻译

Explanations in Autonomous Driving: A Survey

Daniel Omeiza , Helena Webb , Marina Jirotka , Lars Kunze

分类：人工智能 | 机器学习 | 机器人

2021-03-09

汽车行业在过去几十年中见证了越来越多的发展程度;从制造手动操作车辆到具有高自动化水平的制造车辆。随着近期人工智能（AI）的发展，汽车公司现在雇用BlackBox AI模型来使车辆能够感知其环境，并使人类少或没有输入的驾驶决策。希望能够在商业规模上部署自治车辆（AV），通过社会接受AV成为至关重要的，并且可能在很大程度上取决于其透明度，可信度和遵守法规的程度。通过为AVS行为的解释提供对这些接受要求的遵守对这些验收要求的评估。因此，解释性被视为AVS的重要要求。 AV应该能够解释他们在他们运作的环境中的“见到”。在本文中，我们对可解释的自动驾驶的现有工作体系进行了全面的调查。首先，我们通过突出显示并强调透明度，问责制和信任的重要性来开放一个解释的动机;并审查与AVS相关的现有法规和标准。其次，我们识别并分类了参与发展，使用和监管的不同利益相关者，并引出了AV的解释要求。第三，我们对以前的工作进行了严格的审查，以解释不同的AV操作（即，感知，本地化，规划，控制和系统管理）。最后，我们确定了相关的挑战并提供建议，例如AV可解释性的概念框架。该调查旨在提供对AVS中解释性感兴趣的研究人员所需的基本知识。

translated by 谷歌翻译

Mediators: Conversational Agents Explaining NLP Model Behavior

Nils Feldhus , Ajay Madhavan Ravichandran , Sebastian Möller

分类：自然语言处理 | 人工智能 | 机器学习

2022-06-13

以人为中心的可解释人工智能（HCXAI）社区提出了将解释过程作为人与机器之间的对话进行构建。在该立场论文中，我们为基于文本的对话剂建立了Desiderata，能够使用自然语言进行交互方式解释神经模型的行为。从自然语言处理（NLP）研究的角度来看，我们设计了这种调解人的蓝图，以进行情感分析的任务，并评估当前的研究在基于对话的解释方面走上了多远。

translated by 谷歌翻译