智能论文笔记

DDXPlus: A New Dataset For Automatic Medical Diagnosis

Arsene Fansi Tchango , Rishab Goel , Zhi Wen , Julien Martel , Joumana Ghosn

分类：自然语言处理 | 人工智能 | 机器学习

2022-05-18

机器学习研究文献中，人们对自动症状检测（ASD）和自动诊断（AD）系统的兴趣迅速增强，旨在帮助远程医疗服务的医生。这些系统旨在与患者相互作用，收集有关其症状和相关前因的证据，并可能对潜在疾病做出预测。医生将审查互动，包括证据和预测，如有必要，请在确定下一步之前从患者那里收集其他信息。尽管该领域最近取得了进展，但这些系统的设计中缺少重要的医生与患者的互动，即鉴别诊断。它的缺席很大程度上是由于缺乏包含此类信息供模型进行训练的数据集。在这项工作中，我们为每个患者提供了一个大约130万患者的大规模合成数据集，其中包括鉴别诊断以及地面真理病理，症状和前因。与仅包含二进制症状和先例的现有数据集不同，该数据集还包含分类和多选择症状以及对有效数据收集有用的先决条件。此外，某些症状是在层次结构中组织的，使设计系统可以以逻辑方式与患者互动。作为概念验证，我们扩展了两个现有的AD和ASD系统以结合差异诊断，并提供了经验证据，表明将差异作为训练信号对于此类系统的效率至关重要。该数据集可在\ href {https://figshare.com/articles/dataset/ddxplus_dataset/20043374} {https://figshare.com/articles/articles/articles/dataaset/ddxplus/ddxplus/ddxplus/ddataset/2004343434343433344}。

translated by 谷歌翻译