我们引入了一种新的视觉相互作用工具:可解释的标签助手(Xlabel),该工具采用可解释的机器学习方法来进行数据标记。 Xlabel的主要组成部分是可解释的增强机(EBM),该预测模型可以计算每个输入特征对最终预测的贡献。作为案例研究,我们使用Xlabel来预测四种非传染性疾病(NCD)的标签:糖尿病,高血压,慢性肾脏疾病和血脂异常。我们证明EBM是通过将基于规则和其他四个机器学习模型进行比较,是预测模型的绝佳选择。通过对427个病历进行5倍的交叉验证,EBM的预测准确性,精度和F1得分在所有四个NCD中均大于0.95。它执行了两个黑盒模型,并且在这些指标中的其他模型都优于其他模型。在另一项实验中,当有意误标记记录时,EBM可能会回想起这些记录中90%以上的正确标签。
translated by 谷歌翻译