异常检测领域中的大多数建议仅集中在检测阶段,特别是在最近的深度学习方法上。在提供高度准确的预测的同时,这些模型通常缺乏透明度,充当“黑匣子”。这种批评已经越来越多,即解释在可接受性和可靠性方面被认为非常相关。在本文中,我们通过检查ADMNC(混合数值和分类空间的异常检测)模型来解决此问题,这是一种现有的非常准确的,尽管不透明的异常检测器能够使用数值和分类输入进行操作。这项工作介绍了扩展EADMNC(在混合数值和分类空间上可解释的异常检测),这为原始模型获得的预测提供了解释性。通过Apache Spark Framework,我们保留了原始方法的可伸缩性。 EADMNC利用了先前的ADMNC模型的配方,以提供事前和事后解释性,同时保持原始体系结构的准确性。我们提出了一个事前模型,该模型在全球范围内通过将输入数据分割为均质组,仅使用少数变量来解释输出。我们设计了基于回归树的图形表示,主管可以检查以了解正常数据和异常数据之间的差异。我们的事后解释由基于文本的模板方法组成,该方法在本地提供了支持每个检测的文本参数。我们报告了广泛的现实数据,特别是在网络入侵检测领域的实验结果。使用网络入侵域中的专家知识来评估解释的有用性。
translated by 谷歌翻译
存在许多背景,存在二元数据。社交网络是一个众所周知的例子。在这些情况下,成对的元素是链接的,建立一个反映交互的网络。解释为什么建立这些关系对于获得透明度至关重要,这是一个日益重要的概念。由于自然语言理解任务的传播,这些解释通常是使用文本提出的。我们的目的是代表和解释任何代理人建立的对(例如,推荐系统或付费促销机制),以便考虑到基于文本的个性化。我们已经专注于TripAdvisor平台,考虑到其他二元数据上下文的适用性。这些项目是用户和餐馆的子集以及这些用户发布的评论的互动。我们提出了PTER(个性化基于文本的评论)模型。我们可以从适合特定用户交互的特定餐厅的可用评论中预测。 PTER利用BERT(Transformers来自Transformers transformer-ododer模型的双向编码器表示)。我们按照基于功能的方法定制了一个深神网络,并介绍了LTR(学习排名)下游任务。根据额外的(解释排名)基准,我们与随机基线和其他最新模型进行了几次比较。我们的方法的表现优于其他协作过滤建议。
translated by 谷歌翻译