智能论文笔记

Post-hoc Interpretability based Parameter Selection for Data Oriented Nuclear Reactor Accident Diagnosis System

Chengyuan Li. Meifu Li , Zhifang Qiu

分类：人工智能 | 机器学习

2022-08-03

在应用面向数据的诊断系统来区分核电站初始事件的严重程度和评估严重程度的过程中，决定将哪些参数用作系统输入至关重要。但是，尽管几个诊断系统已经在诊断精度和速度方面取得了可接受的性能，但研究人员几乎没有讨论监测点选择点及其布局的方法。因此，冗余测量数据用于训练诊断模型，从而导致分类的高度不确定性，额外的训练时间消耗以及培训时过度拟合的可能性更高。在这项研究中，使用深度学习中事后解释性理论的理论提出了一种选择核电站的热液压参数的方法。一开始，引入了新型的时间序列残余卷积神经网络（TRES-CNN）诊断模型，以使用在HPR1000上手动选择的38个参数，以确定LOCA中断裂的位置和流体动力学直径。之后，应用后解释性方法用于评估诊断模型输出的归因，确定哪些15个参数在诊断LOCA详细信息时更具决定性。结果表明，基于TRE的CNN诊断模型通过选定的15个HPR1000参数成功地预测了LOCA中断裂的位置和大小，而训练模型的时间消耗的25％，使用总计38个参数比较了该过程。此外，与模型相比，使用经验选择的参数相比，相对诊断准确性误差在1.5％以内，可以看作是相同量的诊断可靠性。

translated by 谷歌翻译

Representation Learning based and Interpretable Reactor System Diagnosis Using Denoising Padded Autoencoder

Chengyuan Li , Zhifang Qiu , Zhangrui Yan , Meifu Li

分类：人工智能

2022-08-30

随着Gen III核反应堆的质量构建，使用深度学习（DL）技术是一种流行的趋势，以快速有效地诊断可能发生的事故。为了克服使用深度学习理论诊断反应堆事故的先前工作的常见问题，本文提出了一个诊断过程，以确保对嘈杂和残废的数据的鲁棒性稳健性并且可以解释。首先，提出了一种新颖的剥离垫垫自动编码器（DPAE）来提取监视数据，其表示提取器仍在具有高达25.0的信噪比的干扰数据上有效，并监视丢失的数据丢失的数据高达40.0％。其次，提出了使用DPAE编码器提取表示形式的诊断框架，然后提出了浅统计学习算法，并在41.8％和80.8％的分类和回归任务评估指标上测试了这种逐步诊断方法，并在受干扰的数据集上进行了测试 - 到端诊断方法。最后，提出了使用SHAP和特征消融的分层解释算法，以分析输入监视参数的重要性并验证高重要性参数的有效性。这项研究的结果提供了一种参考方法，用于在具有高安全性要求的情况下在场景中构建强大而可解释的智能反应堆异常诊断系统。

translated by 谷歌翻译

Explainable Intrusion Detection Systems (X-IDS): A Survey of Current Methods, Challenges, and Opportunities

Subash Neupane , Jesse Ables , William Anderson , Sudip Mittal , Shahram Rahimi , Ioana Banicescu , Maria Seale

分类：人工智能

2022-07-13

人工智能（AI）和机器学习（ML）在网络安全挑战中的应用已在行业和学术界的吸引力，部分原因是对关键系统（例如云基础架构和政府机构）的广泛恶意软件攻击。入侵检测系统（IDS）使用某些形式的AI，由于能够以高预测准确性处理大量数据，因此获得了广泛的采用。这些系统托管在组织网络安全操作中心（CSOC）中，作为一种防御工具，可监视和检测恶意网络流，否则会影响机密性，完整性和可用性（CIA）。 CSOC分析师依靠这些系统来决定检测到的威胁。但是，使用深度学习（DL）技术设计的IDS通常被视为黑匣子模型，并且没有为其预测提供理由。这为CSOC分析师造成了障碍，因为他们无法根据模型的预测改善决策。解决此问题的一种解决方案是设计可解释的ID（X-IDS）。这项调查回顾了可解释的AI（XAI）的最先进的ID，目前的挑战，并讨论了这些挑战如何涉及X-ID的设计。特别是，我们全面讨论了黑匣子和白盒方法。我们还在这些方法之间的性能和产生解释的能力方面提出了权衡。此外，我们提出了一种通用体系结构，该建筑认为人类在循环中，该架构可以用作设计X-ID时的指南。研究建议是从三个关键观点提出的：需要定义ID的解释性，需要为各种利益相关者量身定制的解释以及设计指标来评估解释的需求。

translated by 谷歌翻译

Explainable Artificial Intelligence Methods in Combating Pandemics: A Systematic Review

Felipe Giuste , Wenqi Shi , Yuanda Zhu , Tarun Naren , Monica Isgut , Ying Sha , Li Tong , Mitali Gupte , May D. Wang

分类：人工智能 | 机器学习

2021-12-23

尽管有无数的同伴审查的论文，证明了新颖的人工智能（AI）基于大流行期间的Covid-19挑战的解决方案，但很少有临床影响。人工智能在Covid-19大流行期间的影响因缺乏模型透明度而受到极大的限制。这种系统审查考察了在大流行期间使用可解释的人工智能（Xai）以及如何使用它可以克服现实世界成功的障碍。我们发现，Xai的成功使用可以提高模型性能，灌输信任在最终用户，并提供影响用户决策所需的值。我们将读者介绍给常见的XAI技术，其实用程序以及其应用程序的具体例子。 XAI结果的评估还讨论了最大化AI的临床决策支持系统的价值的重要步骤。我们说明了Xai的古典，现代和潜在的未来趋势，以阐明新颖的XAI技术的演变。最后，我们在最近出版物支持的实验设计过程中提供了建议的清单。潜在解决方案的具体示例也解决了AI解决方案期间的共同挑战。我们希望本次审查可以作为提高未来基于AI的解决方案的临床影响的指导。

translated by 谷歌翻译

From Interpretable Filters to Predictions of Convolutional Neural Networks with Explainable Artificial Intelligence

Shagufta Henna , Juan Miguel Lopez Alcaraz

分类：机器学习

2022-07-26

卷积神经网络（CNN）以其出色的功能提取能力而闻名，可以从数据中学习模型，但被用作黑匣子。对卷积滤液和相关特征的解释可以帮助建立对CNN的理解，以区分各种类别。在这项工作中，我们关注的是CNN模型的解释性，称为CNNexplain，该模型用于COVID-19和非CoVID-19分类，重点是卷积过滤器的特征解释性，以及这些功能如何有助于分类。具体而言，我们使用了各种可解释的人工智能（XAI）方法，例如可视化，SmoothGrad，Grad-Cam和Lime来提供卷积滤液的解释及相关特征及其在分类中的作用。我们已经分析了使用干咳嗽光谱图的这些方法的解释。从石灰，光滑果实和GRAD-CAM获得的解释结果突出了不同频谱图的重要特征及其与分类的相关性。

translated by 谷歌翻译

Interpretable Time Series Clustering Using Local Explanations

Ozan Ozyegen , Nicholas Prayogo , Mucahit Cevik , Ayse Basar

分类：机器学习

2022-08-01

这项研究重点是探索局部可解释性方法来解释时间序列聚类模型。许多最先进的聚类模型无法直接解释。为了提供这些聚类算法的解释，我们训练分类模型以估计群集标签。然后，我们使用可解释性方法来解释分类模型的决策。这些解释用于获得对聚类模型的见解。我们执行一项详细的数值研究，以测试多个数据集，聚类模型和分类模型上所提出的方法。结果的分析表明，所提出的方法可用于解释时间序列聚类模型，特别是当基础分类模型准确时。最后，我们对结果进行了详细的分析，讨论了如何在现实生活中使用我们的方法。

translated by 谷歌翻译

Explainable AI for clinical and remote health applications: a survey on tabular and time series data

Flavio Di Martino , Franca Delmastro

分类：机器学习 | 人工智能

2022-09-14

如今，人工智能（AI）已成为临床和远程医疗保健应用程序的基本组成部分，但是最佳性能的AI系统通常太复杂了，无法自我解释。可解释的AI（XAI）技术被定义为揭示系统的预测和决策背后的推理，并且在处理敏感和个人健康数据时，它们变得更加至关重要。值得注意的是，XAI并未在不同的研究领域和数据类型中引起相同的关注，尤其是在医疗保健领域。特别是，许多临床和远程健康应用程序分别基于表格和时间序列数据，而XAI并未在这些数据类型上进行分析，而计算机视觉和自然语言处理（NLP）是参考应用程序。为了提供最适合医疗领域表格和时间序列数据的XAI方法的概述，本文提供了过去5年中文献的审查，说明了生成的解释的类型以及为评估其相关性所提供的努力和质量。具体而言，我们确定临床验证，一致性评估，客观和标准化质量评估以及以人为本的质量评估作为确保最终用户有效解释的关键特征。最后，我们强调了该领域的主要研究挑战以及现有XAI方法的局限性。

translated by 谷歌翻译

Explainable Deep Learning Methods in Medical Imaging Diagnosis: A Survey

Cristiano Patrício , João C. Neves , Luís F. Teixeira

分类：人工智能 | 计算机视觉 | 机器学习

2022-05-10

深度学习的显着成功引起了人们对医学成像诊断的应用的兴趣。尽管最新的深度学习模型在分类不同类型的医学数据方面已经达到了人类水平的准确性，但这些模型在临床工作流程中几乎不采用，这主要是由于缺乏解释性。深度学习模型的黑盒子性提出了制定策略来解释这些模型的决策过程的必要性，从而导致了可解释的人工智能（XAI）主题的创建。在这种情况下，我们对应用于医学成像诊断的XAI进行了详尽的调查，包括视觉，基于示例和基于概念的解释方法。此外，这项工作回顾了现有的医学成像数据集和现有的指标，以评估解释的质量。此外，我们还包括一组基于报告生成的方法的性能比较。最后，还讨论了将XAI应用于医学成像以及有关该主题的未来研究指示的主要挑战。

translated by 谷歌翻译

Chronological age estimation of lateral cephalometric radiographs with deep learning

Ningtao Liu

分类：计算机视觉 | 机器学习

2021-01-28

传统的手动年龄估计方法是基于多种X射线图像的关键劳动力。一些目前的研究表明，横向头颅（LC）图像可用于估计年龄。然而，这些方法基于手动测量某些图像特征，并根据经验或得分制定年龄估计。因此，这些方法是耗时和劳动密集型的，效果将受主观意见的影响。在这项工作中，我们提出了显着的图增强年龄估计方法，其可以基于LC图像自动执行年龄估计。同时，它还可以显示年龄估计图像中每个区域的重要性，这无疑会增加方法的解释性。我们的方法在4至40岁以上的3014 LC图像上进行了测试。实验结果的MEA是1.250，这少于最先进的基准的结果，因为它在年龄组中表现得更少，数据较少。此外，我们的模型在每个区域培训，在LC图像中的年龄估计的贡献很高，因此验证了这些不同区域对年龄估计任务的影响。因此，我们得出结论，提出的显着性图增强了横向头颅射线照片的时间年龄估计方法可以很好地在时间年龄估计任务中工作，特别是当数据量很小时。此外，与传统深度学习相比，我们的方法也是可解释的。

translated by 谷歌翻译

TSEM: Temporally Weighted Spatiotemporal Explainable Neural Network for Multivariate Time Series

Anh-Duy Pham , Anastassia Kuestenmacher , Paul G. Ploeger

分类：机器学习 | 人工智能

2022-05-25

由于其灵活性和适应性，深度学习已成为技术和业务领域的一定大小的解决方案。它是使用不透明模型实施的，不幸的是，这破坏了结果的可信度。为了更好地了解系统的行为，尤其是由时间序列驱动的系统的行为，在深度学习模型中，所谓的可解释的人工智能（XAI）方法是重要的。时间序列数据有两种主要类型的XAI类型，即模型不可屈服和特定于模型。在这项工作中考虑了模型特定的方法。尽管其他方法采用了类激活映射（CAM）或注意机制，但我们将两种策略合并为单个系统，简称为时间加权的时空可解释的多元时间序列（TSEM）。 TSEM结合了RNN和CNN模型的功能，使RNN隐藏单元被用作CNN具有暂时轴的注意力权重。结果表明TSEM优于XCM。就准确性而言，它与Stam相似，同时还满足了许多解释性标准，包括因果关系，忠诚度和时空性。

translated by 谷歌翻译

Soft Sensing Model Visualization: Fine-tuning Neural Network from What Model Learned

Xiaoye Qian , Chao Zhang , Jaswanth Yella , Yu Huang , Ming-Chun Huang , Sthitie Bom

分类：机器学习 | 人工智能

2021-11-12

从智能制造收集的数据的不断增长的可用性正在改变生产监测和控制的范式。除了时变的意外的扰动和不确定性之外，晶片制造过程的复杂性和内容的增加，使得用基于模型的方法进行控制过程，使控制过程不可行。结果，数据驱动的软感测建模在晶圆过程诊断中变得更加普遍。最近，在高度非线性和动态时间序列数据中具有高度性能的软感测系统中已经利用了深度学习。然而，尽管它在软感动系统中取得了成功，但深层学习框架的潜在逻辑很难理解。在本文中，我们提出了一种使用高度不平衡数据集的缺陷晶片检测的深度学习模型。要了解所提出的模型如何工作，应用了深度可视化方法。另外，该模型然后通过深度可视化指导进行微调。进行广泛的实验以验证所提出的系统的有效性。结果提供了一种解释模型工作原理和基于解释的有效微调方法的解释。

translated by 谷歌翻译

A Gradient Mapping Guided Explainable Deep Neural Network for Extracapsular Extension Identification in 3D Head and Neck Cancer Computed Tomography Images

Yibin Wang , Abdur Rahman , W. Neil. Duggar , P. Russell Roberts , Toms V. Thomas , Linkan Bian , Haifeng Wang

分类：计算机视觉

2022-01-03

用于头部和颈鳞状细胞癌（HNSCC）的诊断和治疗管理由常规诊断头和颈部计算断层扫描（CT）扫描引导，以识别肿瘤和淋巴结特征。折叠延伸（ECE）是患者的患者生存结果与HNSCC的强烈预测因子。在改变患者的暂存和管理时，必须检测ECE的发生至关重要。目前临床ECE检测依赖于放射科学医生进行的视觉鉴定和病理确认。基于机器学习（ML）的ECE诊断在近年来的潜力上表现出很高的潜力。然而，在大多数基于ML的ECE诊断研究中，手动注释是淋巴结区域的必要数据预处理步骤。此外，本手册注释过程是耗时，劳动密集型和容易出错。因此，在本文中，我们提出了一种梯度映射引导的可解释网络（GMGenet）框架，以自动执行ECE识别而不需要注释的淋巴结区域信息。提出了梯度加权类激活映射（GRAC-CAM）技术，以指导深度学习算法专注于与ECE高度相关的区域。提取信息丰富的兴趣（VoIS），无需标记淋巴结区域信息。在评估中，所提出的方法是使用交叉验证的训练和测试，可分别实现测试精度和90.2％和91.1％的AUC。已经分析了ECE的存在或不存在并与黄金标准组织病理学发现相关。

translated by 谷歌翻译

A CNN-BiLSTM Model with Attention Mechanism for Earthquake Prediction

Parisa Kavianpour , Mohammadreza Kavianpour , Ehsan Jahani , Amin Ramezani

分类：机器学习

2021-12-26

作为自然现象的地震，历史上不断造成伤害和人类生活的损失。地震预测是任何社会计划的重要方面，可以增加公共准备，并在很大程度上减少损坏。然而，由于地震的随机特征以及实现了地震预测的有效和可靠模型的挑战，迄今为止努力一直不足，需要新的方法来解决这个问题。本文意识到这些问题，提出了一种基于注意机制（AM），卷积神经网络（CNN）和双向长短期存储器（BILSTM）模型的新型预测方法，其可以预测数量和最大幅度中国大陆各地区的地震为基于该地区的地震目录。该模型利用LSTM和CNN具有注意机制，以更好地关注有效的地震特性并产生更准确的预测。首先，将零阶保持技术应用于地震数据上的预处理，使得模型的输入数据更适当。其次，为了有效地使用空间信息并减少输入数据的维度，CNN用于捕获地震数据之间的空间依赖性。第三，使用Bi-LSTM层来捕获时间依赖性。第四，引入了AM层以突出其重要的特征来实现更好的预测性能。结果表明，该方法具有比其他预测方法更好的性能和概括能力。

translated by 谷歌翻译

Abs-CAM: A Gradient Optimization Interpretable Approach for Explanation of Convolutional Neural Networks

Chunyan Zeng , Kang Yan , Zhifeng Wang , Yan Yu , Shiyan Xia , Nan Zhao

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-08

深神经网络（DNN）的黑盒性质严重阻碍了其在特定场景中的性能改善和应用。近年来，基于类激活映射的方法已被广泛用于解释计算机视觉任务中模型的内部决策。但是，当此方法使用反向传播获得梯度时，它将在显着图中引起噪声，甚至找到与决策无关的特征。在本文中，我们提出了一个基于绝对价值类激活映射（ABS-CAM）方法，该方法优化了从反向传播中得出的梯度，并将所有这些梯度变成正梯度，以增强输出神经元激活的视觉特征，并改善。显着图的本地化能力。 ABS-CAM的框架分为两个阶段：生成初始显着性图并生成最终显着图。第一阶段通过优化梯度来提高显着性图的定位能力，第二阶段将初始显着性图与原始图像线性结合在一起，以增强显着性图的语义信息。我们对拟议方法进行定性和定量评估，包括删除，插入和指向游戏。实验结果表明，ABS-CAM显然可以消除显着性图中的噪声，并且可以更好地定位与决策相关的功能，并且优于以前的识别和定位任务中的方法。

translated by 谷歌翻译

Explainable Deep Learning in Healthcare: A Methodological Survey from an Attribution View

Di Jin , Elena Sergeeva , Wei-Hung Weng , Geeticka Chauhan , Peter Szolovits

分类：机器学习 | 人工智能

2021-12-05

越来越多的电子健康记录（EHR）数据和深度学习技术进步的越来越多的可用性（DL）已经引发了在开发基于DL的诊断，预后和治疗的DL临床决策支持系统中的研究兴趣激增。尽管承认医疗保健的深度学习的价值，但由于DL的黑匣子性质，实际医疗环境中进一步采用的障碍障碍仍然存在。因此，有一个可解释的DL的新兴需求，它允许最终用户评估模型决策，以便在采用行动之前知道是否接受或拒绝预测和建议。在这篇综述中，我们专注于DL模型在医疗保健中的可解释性。我们首先引入深入解释性的方法，并作为该领域的未来研究人员或临床从业者的方法参考。除了这些方法的细节之外，我们还包括对这些方法的优缺点以及它们中的每个场景都适合的讨论，因此感兴趣的读者可以知道如何比较和选择它们供使用。此外，我们讨论了这些方法，最初用于解决一般域问题，已经适应并应用于医疗保健问题以及如何帮助医生更好地理解这些数据驱动技术。总的来说，我们希望这项调查可以帮助研究人员和从业者在人工智能（AI）和临床领域了解我们为提高其DL模型的可解释性并相应地选择最佳方法。

translated by 谷歌翻译

Deep learning for time series classification: a review

Hassan Ismail Fawaz , Germain Forestier , Jonathan Weber , Lhassane Idoumghar , Pierre-Alain Muller

分类：

2018-09-12

Time Series Classification (TSC) is an important and challenging problem in data mining. With the increase of time series data availability, hundreds of TSC algorithms have been proposed. Among these methods, only a few have considered Deep Neural Networks (DNNs) to perform this task. This is surprising as deep learning has seen very successful applications in the last years. DNNs have indeed revolutionized the field of computer vision especially with the advent of novel deeper architectures such as Residual and Convolutional Neural Networks. Apart from images, sequential data such as text and audio can also be processed with DNNs to reach state-of-the-art performance for document classification and speech recognition. In this article, we study the current state-ofthe-art performance of deep learning algorithms for TSC by presenting an empirical study of the most recent DNN architectures for TSC. We give an overview of the most successful deep learning applications in various time series domains under a unified taxonomy of DNNs for TSC. We also provide an open source deep learning framework to the TSC community where we implemented each of the compared approaches and evaluated them on a univariate TSC benchmark (the UCR/UEA archive) and 12 multivariate time series datasets. By training 8,730 deep learning models on 97 time series datasets, we propose the most exhaustive study of DNNs for TSC to date.

translated by 谷歌翻译

Interpretable Deep Learning: Interpretation, Interpretability, Trustworthiness, and Beyond

Xuhong Li , Haoyi Xiong , Xingjian Li , Xuanyu Wu , Xiao Zhang , Ji Liu , Jiang Bian , Dejing Dou

分类：机器学习

2021-03-19

深层神经网络以其对各种机器学习和人工智能任务的精湛处理而闻名。但是，由于其过度参数化的黑盒性质，通常很难理解深层模型的预测结果。近年来，已经提出了许多解释工具来解释或揭示模型如何做出决策。在本文中，我们回顾了这一研究，并尝试进行全面的调查。具体来说，我们首先介绍并阐明了人们通常会感到困惑的两个基本概念 - 解释和解释性。为了解决解释中的研究工作，我们通过提出新的分类法来阐述许多解释算法的设计。然后，为了了解解释结果，我们还调查了评估解释算法的性能指标。此外，我们总结了使用“可信赖”解释算法评估模型的解释性的当前工作。最后，我们审查并讨论了深层模型的解释与其他因素之间的联系，例如对抗性鲁棒性和从解释中学习，并介绍了一些开源库，以解释算法和评估方法。

translated by 谷歌翻译

Multi-Dimensional Self Attention based Approach for Remaining Useful Life Estimation

Zhi Lai , Mengjuan Liu , Yunzhu Pan , Dajiang Chen

分类：机器学习 | (统计)机器学习

2022-12-12

Remaining Useful Life (RUL) estimation plays a critical role in Prognostics and Health Management (PHM). Traditional machine health maintenance systems are often costly, requiring sufficient prior expertise, and are difficult to fit into highly complex and changing industrial scenarios. With the widespread deployment of sensors on industrial equipment, building the Industrial Internet of Things (IIoT) to interconnect these devices has become an inexorable trend in the development of the digital factory. Using the device's real-time operational data collected by IIoT to get the estimated RUL through the RUL prediction algorithm, the PHM system can develop proactive maintenance measures for the device, thus, reducing maintenance costs and decreasing failure times during operation. This paper carries out research into the remaining useful life prediction model for multi-sensor devices in the IIoT scenario. We investigated the mainstream RUL prediction models and summarized the basic steps of RUL prediction modeling in this scenario. On this basis, a data-driven approach for RUL estimation is proposed in this paper. It employs a Multi-Head Attention Mechanism to fuse the multi-dimensional time-series data output from multiple sensors, in which the attention on features is used to capture the interactions between features and attention on sequences is used to learn the weights of time steps. Then, the Long Short-Term Memory Network is applied to learn the features of time series. We evaluate the proposed model on two benchmark datasets (C-MAPSS and PHM08), and the results demonstrate that it outperforms the state-of-art models. Moreover, through the interpretability of the multi-head attention mechanism, the proposed model can provide a preliminary explanation of engine degradation. Therefore, this approach is promising for predictive maintenance in IIoT scenarios.

translated by 谷歌翻译

A Novel Deep Parallel Time-series Relation Network for Fault Diagnosis

Chun Yang

分类：机器学习 | 人工智能

2021-12-03

考虑到应用时间序列数据的上下文信息的模型可以改善故障诊断性能，提出了一些神经网络结构（例如RNN，LSTM和GRU）有效地对故障诊断进行建模。但是，这些模型受其串行计算的限制，因此无法实现高诊断效率。同样，平行CNN很难以有效的方式实施故障诊断，因为它需要更大的卷积内核或深层结构才能实现长期特征提取能力。此外，BERT模型还采用绝对位置嵌入以将上下文信息引入模型，这将为原始数据带来噪声，因此不能直接应用于故障诊断。为了解决上述问题，本文提出了一个名为“深层平行时间序列关系网络”（DPTRN）的故障诊断模型。 DPTRN有三个优点：（1）我们提出的时间关系单元基于完整的多层感知器（MLP）结构，因此，DPTRN以并行方式执行故障诊断，并显着提高计算效率。（2）通过改善绝对位置的嵌入，我们的新型解耦位置嵌入单元可以直接应用于故障诊断并学习上下文信息。（3）我们提出的DPTRN在功能解释性方面具有明显的优势。我们确认了所提出的方法对四个数据集的影响，结果显示了所提出的DPTRN模型的有效性，效率和解释性。

translated by 谷歌翻译

Explainable AI for Bioinformatics: Methods, Tools, and Applications

Md. Rezaul Karim , Tanhim Islam , Oya Beyan , Christoph Lange , Michael Cochez , Dietrich Rebholz-Schuhmann , Stefan Decker

分类：人工智能 | 机器学习

2022-12-25

Artificial intelligence(AI) systems based on deep neural networks (DNNs) and machine learning (ML) algorithms are increasingly used to solve critical problems in bioinformatics, biomedical informatics, and precision medicine. However, complex DNN or ML models that are unavoidably opaque and perceived as black-box methods, may not be able to explain why and how they make certain decisions. Such black-box models are difficult to comprehend not only for targeted users and decision-makers but also for AI developers. Besides, in sensitive areas like healthcare, explainability and accountability are not only desirable properties of AI but also legal requirements -- especially when AI may have significant impacts on human lives. Explainable artificial intelligence (XAI) is an emerging field that aims to mitigate the opaqueness of black-box models and make it possible to interpret how AI systems make their decisions with transparency. An interpretable ML model can explain how it makes predictions and which factors affect the model's outcomes. The majority of state-of-the-art interpretable ML methods have been developed in a domain-agnostic way and originate from computer vision, automated reasoning, or even statistics. Many of these methods cannot be directly applied to bioinformatics problems, without prior customization, extension, and domain adoption. In this paper, we discuss the importance of explainability with a focus on bioinformatics. We analyse and comprehensively overview of model-specific and model-agnostic interpretable ML methods and tools. Via several case studies covering bioimaging, cancer genomics, and biomedical text mining, we show how bioinformatics research could benefit from XAI methods and how they could help improve decision fairness.

translated by 谷歌翻译