智能论文笔记

Explanation Method for Anomaly Detection on Mixed Numerical and Categorical Spaces

Iñigo López-Riobóo Botana , Carlos Eiras-Franco , Julio Hernandez-Castro , Amparo Alonso-Betanzos

分类：机器学习 | 人工智能

2022-09-09

异常检测领域中的大多数建议仅集中在检测阶段，特别是在最近的深度学习方法上。在提供高度准确的预测的同时，这些模型通常缺乏透明度，充当“黑匣子”。这种批评已经越来越多，即解释在可接受性和可靠性方面被认为非常相关。在本文中，我们通过检查ADMNC（混合数值和分类空间的异常检测）模型来解决此问题，这是一种现有的非常准确的，尽管不透明的异常检测器能够使用数值和分类输入进行操作。这项工作介绍了扩展EADMNC（在混合数值和分类空间上可解释的异常检测），这为原始模型获得的预测提供了解释性。通过Apache Spark Framework，我们保留了原始方法的可伸缩性。 EADMNC利用了先前的ADMNC模型的配方，以提供事前和事后解释性，同时保持原始体系结构的准确性。我们提出了一个事前模型，该模型在全球范围内通过将输入数据分割为均质组，仅使用少数变量来解释输出。我们设计了基于回归树的图形表示，主管可以检查以了解正常数据和异常数据之间的差异。我们的事后解释由基于文本的模板方法组成，该方法在本地提供了支持每个检测的文本参数。我们报告了广泛的现实数据，特别是在网络入侵检测领域的实验结果。使用网络入侵域中的专家知识来评估解释的有用性。

translated by 谷歌翻译

存在许多背景，存在二元数据。社交网络是一个众所周知的例子。在这些情况下，成对的元素是链接的，建立一个反映交互的网络。解释为什么建立这些关系对于获得透明度至关重要，这是一个日益重要的概念。由于自然语言理解任务的传播，这些解释通常是使用文本提出的。我们的目的是代表和解释任何代理人建立的对（例如，推荐系统或付费促销机制），以便考虑到基于文本的个性化。我们已经专注于TripAdvisor平台，考虑到其他二元数据上下文的适用性。这些项目是用户和餐馆的子集以及这些用户发布的评论的互动。我们提出了PTER（个性化基于文本的评论）模型。我们可以从适合特定用户交互的特定餐厅的可用评论中预测。 PTER利用BERT（Transformers来自Transformers transformer-ododer模型的双向编码器表示）。我们按照基于功能的方法定制了一个深神网络，并介绍了LTR（学习排名）下游任务。根据额外的（解释排名）基准，我们与随机基线和其他最新模型进行了几次比较。我们的方法的表现优于其他协作过滤建议。

translated by 谷歌翻译