异常模式检测旨在识别与正常偏差明显的情况,并且广泛适用于域。在现有技术中提出了多种异常的检测技术。但是,有一个常见的原则和可扩展的特征选择方法,以便有效发现。通常通过优化预测结果的性能而不是与预期的系统偏差来实现现有的特征选择技术。在本文中,我们提出了一种基于稀疏的自动特征选择(SAFS)框架,其通过特征驱动的大量比率的稀疏性编码系统的结果偏差。 SAF是一种模型 - 无可争议的方法,具有不同发现技术的可用性。 SAF在可在公开的关键护理数据集上验证时维持检测性能超过3倍,计算时间超过3美元。与特征选择的多个基线相比,SAF也会导致卓越的性能。
translated by 谷歌翻译
使用多种最先进的特征选择技术开发了自动特征选择管道,以选择用于区分护理模式(DPOC)的最佳功能。管道包括三种类型的特征选择技术;过滤器,包装器和嵌入式方法选择顶部K功能。使用具有二进制依赖变量的五种不同的数据集,选择了它们的不同顶部K最佳功能。在现有的多维子集扫描(MDS)中测试了所选特征,其中记录了最异常的亚步骤,大多数异常子集,倾向分数和测量的效果以测试它们的性能。将这种性能与在MDSS管道中数据集中的所有协变量中获得的四个类似的指标进行了比较。我们发现,尽管使用了不同的特征选择技术,但数据分布是在确定要使用的技术时注意的键。
translated by 谷歌翻译