肺部疾病会导致严重的呼吸问题,如果未及时治疗,导致猝死。许多研究人员利用深度学习系统使用胸部X射线(CXRS)诊断肺疾病。然而,这种系统需要在大规模数据上进行详尽的培训,以有效地诊断胸部异常。此外,采购这种大规模数据通常是不可行的和不切实际的,特别是对于罕见疾病。随着较近的增量学习的进步,研究人员定期调整了深度神经网络,以了解不同的训练示例。虽然,这种系统可以抵抗灾难性的遗忘,但它们彼此独立地对待知识表示,并且这限制了它们的分类性能。此外,据我们所知,没有增量学习驱动的图像诊断框架,专门用于筛选来自CXR的肺部障碍。为了解决这个问题,我们提出了一种新颖的框架,可以学会逐步逐步筛选不同的胸部异常。除此之外,拟议的框架通过增量学习损失函数,即在逐步学习的知识表示之间识别逐步学习知识表示之间的结构和语义互相依赖性,无论扫描仪规格如何,都会识别逐步学习的知识表示之间的结构和语义相互作用。我们在包含不同胸部异常的五个公共CXR数据集上测试了拟议的框架,其中它通过各种指标表现出各种最先进的系统。
translated by 谷歌翻译
视网膜疗法代表一组视网膜疾病,如果不及时治疗,可能会导致严重的视觉障碍甚至失明。许多研究人员已经开发了自治系统,通过眼底和光学相干断层扫描(OCT)图像识别视网膜病变。然而,大多数这些框架采用传统的转移学习和微调方法,需要一种非常良好的注释训练数据来产生准确的诊断性能。本文提出了一种新型增量跨域适应仪,可以通过几次拍摄培训允许任何深度分类模型逐步学习OCT和眼底图像的异常视网膜病理。此外,与其竞争对手不同,所提出的仪器通过贝叶斯多目标函数驱动,不仅执行候选分类网络,不仅在增量培训期间保留其先前学到的知识,而且还确保网络了解先前学习的结构和语义关系病理学和新增的疾病类别在推理阶段有效地识别它们。所提出的框架,在用三种不同的扫描仪获得的六个公共数据集中评估,以筛选十三个视网膜病理,优于最先进的竞争对手,通过分别实现了0.9826和0.9846的整体准确性和F1得分。
translated by 谷歌翻译
筛选行李X射线扫描的筛选杂乱和闭塞违禁品,即使对于专家的安全人员而言,甚至是一个繁琐的任务。本文提出了一种新的策略,其扩展了传统的编码器 - 解码器架构,以执行实例感知分段,并在不使用任何附加子网络或对象检测器的情况下执行违反互斥项的合并实例。编码器 - 解码器网络首先执行传统的语义分割,并检索杂乱的行李物品。然后,该模型在训练期间逐步发展,以识别各个情况,使用显着减少的训练批次。为了避免灾难性的遗忘,一种新颖的客观函数通过保留先前获得的知识来最小化每次迭代中的网络损失,同时通过贝叶斯推断解决其复杂的结构依赖性。对我们两个公开的X射线数据集的框架进行了全面评估,表明它优于最先进的方法,特别是在挑战的杂乱场景中,同时在检测准确性和效率之间实现最佳的权衡。
translated by 谷歌翻译
检测行李中的非法和威胁物品是最大的安全问题之一。即使对于经验丰富的安全人员来说,手动检测也是一种耗时和压力的任务。许多学者都创建了自动框架,用于检测行李X射线扫描的可疑和违禁品数据。然而,为了我们的知识,不存在利用时间行李X射线图像的框架,以有效地筛选高度隐藏和闭塞物体,即使赤裸的眼睛也几乎看不到。为了解决这个问题,我们提出了一种新型的时间融合驱动的多尺度残余方式编码器 - 解码器,将一系列连续扫描作为输入,并融合它们以产生可疑和不可疑行李内容的不同特征表示,导致更准确提取违禁品数据。使用可公开访问的GDXRAY数据集已彻底测试所提出的方法,该数据集是包含时间链接的灰度X射线扫描的唯一数据集,其展示了极其隐藏的违禁品数据。拟议的框架在各种度量标准上的GDXRay数据集上占据了竞争对手。
translated by 谷歌翻译
2019年12月,一个名为Covid-19的新型病毒导致了迄今为止的巨大因果关系。与新的冠状病毒的战斗在西班牙语流感后令人振奋和恐怖。虽然前线医生和医学研究人员在控制高度典型病毒的传播方面取得了重大进展,但技术也证明了在战斗中的重要性。此外,许多医疗应用中已采用人工智能,以诊断许多疾病,甚至陷入困境的经验丰富的医生。因此,本调查纸探讨了提议的方法,可以提前援助医生和研究人员,廉价的疾病诊断方法。大多数发展中国家难以使用传统方式进行测试,但机器和深度学习可以采用显着的方式。另一方面,对不同类型的医学图像的访问已经激励了研究人员。结果,提出了一种庞大的技术数量。本文首先详细调了人工智能域中传统方法的背景知识。在此之后,我们会收集常用的数据集及其用例日期。此外,我们还显示了采用深入学习的机器学习的研究人员的百分比。因此,我们对这种情况进行了彻底的分析。最后,在研究挑战中,我们详细阐述了Covid-19研究中面临的问题,我们解决了我们的理解,以建立一个明亮健康的环境。
translated by 谷歌翻译
客观的。深度神经网络(DNNS)在各种脑机界面应用中表现出了前所未有的成功,例如癫痫发作预测。但是,由于癫痫信号的高度个性化特征,现有方法通常会以特定于患者的方式训练模型。因此,只能将每个受试者的标记录音数量有限用于培训。结果,由于训练数据的不足,目前基于DNN的方法在一定程度上表现出较差的泛化能力。另一方面,与患者无关的模型试图利用更多的患者数据通过将患者数据汇总在一起为所有患者培训通用模型。尽管采用了不同的技术,但结果表明,由于患者的个体差异很高,与患者独立的模型相比性能要比患者特异性模型差。因此,在患者特异性和与患者无关的模型之间存在很大的差距。方法。在本文中,我们提出了一种基于知识蒸馏的新型培训计划,该方案利用了来自多个受试者的大量数据。首先,它从具有预训练的通用模型的所有可用受试者的信号中提取信息。然后可以借助蒸馏知识和其他个性化数据获得患者特异性的模型。主要结果。通过我们建议的计划,对波士顿-MIT儿童医院的Seeg数据库进行了四种最先进的癫痫发作预测方法。由此产生的准确性,敏感性和错误的预测率表明,我们提出的培训方案一致地提高了最先进方法的预测性能。意义。拟议的训练方案显着改善了患者特异性癫痫发作预测因子的性能,并弥合了患者特异性和与患者无关的预测因子之间的差距。
translated by 谷歌翻译
胸部射线照相是一种相对便宜,广泛的医疗程序,可传达用于进行诊断决策的关键信息。胸部X射线几乎总是用于诊断呼吸系统疾病,如肺炎或最近的Covid-19。在本文中,我们提出了一个自我监督的深神经网络,其在未标记的胸部X射线数据集上掠夺。学习的陈述转移到下游任务 - 呼吸系统疾病的分类。在四个公共数据集获得的结果表明,我们的方法在不需要大量标记的培训数据的情况下产生竞争力。
translated by 谷歌翻译
表面缺陷检测是工业质量检查最重要的过程之一。基于深度学习的表面缺陷检测方法已显示出巨大的潜力。但是,表现出色的模型通常需要大量的训练数据,并且只能检测出在训练阶段出现的缺陷。当面对少量数据数据时,缺陷检测模型不可避免地会遭受灾难性遗忘和错误分类问题的困扰。为了解决这些问题,本文提出了一个新的知识蒸馏网络,称为双知识对齐网络(DKAN)。提出的DKAN方法遵循预处理的转移学习范式,并设计了用于微调的知识蒸馏框架。具体而言,提出了增量RCNN以实现不同类别的分离稳定特征表示。在此框架下,设计特征知识对齐(FKA)的损失是在类不足的特征图之间设计的,以解决灾难性的遗忘问题,而logit知识对准(LKA)损失在logit分布之间部署以解决错误分类问题。实验已经在递增的几个neu-det数据集上进行,结果表明,DKAN在各种几个场景上的其他方法都优于其他方法,对平均平均精度度量指标最高可达6.65%,这证明了该方法的有效性。
translated by 谷歌翻译
在这项工作中,我们提出了一种新型视觉注意力驱动的变压器框架Radiotransformer,它利用放射科医生的凝视模式并将其视觉认知行为模拟用于胸部X光片的疾病诊断。诸如放射科医生等领域专家依靠视觉信息进行医学图像解释。另一方面,即使视觉解释具有挑战性,深度神经网络在类似任务中也表现出了巨大的希望。眼睛凝视的跟踪已用于捕获域专家的观看行为,从而对视觉搜索的复杂性提供了洞察力。但是,深度学习框架,即使是依靠注意力机制的框架,也不会利用这种丰富的领域信息。 Radiotransformer通过从放射科医生的视觉搜索模式中学习,在级联的全球 - 焦点变压器框架中编码为“人类视觉注意区域”,从而填补了这一关键差距。总体“全局”图像特征和更详细的“本地”特征分别由拟议的全局和焦点模块捕获。我们通过实验验证了学生教师方法对8个数据集的功效,这些数据集涉及不同的疾病分类任务,在推理阶段无法使用眼睛凝视数据。代码:https://github.com/bmi-imaginelab/radiotransformer。
translated by 谷歌翻译
This paper presents our solution for the 2nd COVID-19 Severity Detection Competition. This task aims to distinguish the Mild, Moderate, Severe, and Critical grades in COVID-19 chest CT images. In our approach, we devise a novel infection-aware 3D Contrastive Mixup Classification network for severity grading. Specifcally, we train two segmentation networks to first extract the lung region and then the inner lesion region. The lesion segmentation mask serves as complementary information for the original CT slices. To relieve the issue of imbalanced data distribution, we further improve the advanced Contrastive Mixup Classification network by weighted cross-entropy loss. On the COVID-19 severity detection leaderboard, our approach won the first place with a Macro F1 Score of 51.76%. It significantly outperforms the baseline method by over 11.46%.
translated by 谷歌翻译
Although deep learning approaches have stood out in recent years due to their state-of-the-art results, they continue to suffer from catastrophic forgetting, a dramatic decrease in overall performance when training with new classes added incrementally. This is due to current neural network architectures requiring the entire dataset, consisting of all the samples from the old as well as the new classes, to update the model-a requirement that becomes easily unsustainable as the number of classes grows. We address this issue with our approach to learn deep neural networks incrementally, using new data and only a small exemplar set corresponding to samples from the old classes. This is based on a loss composed of a distillation measure to retain the knowledge acquired from the old classes, and a cross-entropy loss to learn the new classes. Our incremental training is achieved while keeping the entire framework end-to-end, i.e., learning the data representation and the classifier jointly, unlike recent methods with no such guarantees. We evaluate our method extensively on the CIFAR-100 and Im-ageNet (ILSVRC 2012) image classification datasets, and show state-of-the-art performance.
translated by 谷歌翻译
在现实世界中,医疗数据集通常表现出长尾数据分布(即,一些类占据大多数数据,而大多数类都很少有一些样本),这导致挑战的不平衡学习场景。例如,估计有超过40种不同的视网膜疾病,无论发生了多种发病率,然而,来自全球患者队列的超过30多种条件非常罕见,这导致基于深度学习的筛选典型的长尾学习问题楷模。此外,视网膜中可能存在多种疾病,这导致多标签情景并为重新采样策略带来标签共生问题。在这项工作中,我们提出了一种新颖的框架,利用了视网膜疾病的先验知识,以便在等级 - 明智的约束下培训模型的更强大的代表。然后,首先引入了一个实例 - 明智的类平衡的采样策略和混合知识蒸馏方式,以从长尾的多标签分布中学习。我们的实验培训超过一百万个样品的视网膜数据集展示了我们所提出的方法的优越性,这些方法优于所有竞争对手,并显着提高大多数疾病的识别准确性,特别是那些罕见的疾病。
translated by 谷歌翻译
我们展示了域不变特征学习(DIFL)可以改善深度学习结核筛查算法的域名概括性。众所周知,由于“域移位”,最深入的深度学习算法通常具有难以推广的概念数据分布。在医学成像的背景下,这可能导致意外的偏见,例如从一个患者人口到另一个患者人口的无法概括。我们分析了reset-50分类器的性能,以便用四个最受欢迎的公共数据集在地理上不同的图像来源的核化性筛选的目的。我们表明,如果没有域适应,Reset-50难以通过来自地理分布区域的图像从许多公共结核病筛查数据集之间概括成像分布。然而,随着DIFL的掺入,域外的性能大大提高了。分析标准包括对基线的准确性,灵敏度,特异性和AUC的比较,以及DIFL增强算法。我们得出结论,DIFL在应用跨各种公共数据集时保持结核筛查的易用性,同时在源域图像上保持可接受的准确性。
translated by 谷歌翻译
间质性肺部疾病是一大批以不同程度的肺泡炎和肺纤维化为特征的异质性疾病。准确地诊断这些疾病对于制定治疗计划具有显着的指导价值。尽管以前的工作在分类间隙肺部疾病方面取得了令人印象深刻的结果,但仍有提高这些技术准确性的空间,主要是为了增强自动决策。为了提高分类精度,我们的研究提出了一个基于卷积神经网络的框架,并提供了其他信息。首先,通过在Hounsfield单元中重新缩放原始图像,并添加了ILD图像。其次,修改的CNN模型用于为每个组织产生分类概率的载体。第三,输入图像的位置信息,包括在某些位置在CT扫描中不同疾病的发生频率组成,用于计算位置权重向量。最后,使用两个向量之间的Hadamard产品用于为预测产生决策向量。与最先进的方法相比,使用公开可用的ILD数据库的结果显示了使用不同的其他信息预测这些数据的潜力。
translated by 谷歌翻译
In this paper, deep-learning-based approaches namely fine-tuning of pretrained convolutional neural networks (VGG16 and VGG19), and end-to-end training of a developed CNN model, have been used in order to classify X-Ray images into four different classes that include COVID-19, normal, opacity and pneumonia cases. A dataset containing more than 20,000 X-ray scans was retrieved from Kaggle and used in this experiment. A two-stage classification approach was implemented to be compared to the one-shot classification approach. Our hypothesis was that a two-stage model will be able to achieve better performance than a one-shot model. Our results show otherwise as VGG16 achieved 95% accuracy using one-shot approach over 5-fold of training. Future work will focus on a more robust implementation of the two-stage classification model Covid-TSC. The main improvement will be allowing data to flow from the output of stage-1 to the input of stage-2, where stage-1 and stage-2 models are VGG16 models fine-tuned on the Covid-19 dataset.
translated by 谷歌翻译
随着深度学习方法的进步,如深度卷积神经网络,残余神经网络,对抗网络的进步。 U-Net架构最广泛利用生物医学图像分割,以解决目标区域或子区域的识别和检测的自动化。在最近的研究中,基于U-Net的方法在不同应用中显示了最先进的性能,以便在脑肿瘤,肺癌,阿尔茨海默,乳腺癌等疾病的早期诊断和治疗中发育计算机辅助诊断系统等,使用各种方式。本文通过描述U-Net框架来提出这些方法的成功,然后通过执行1)型号的U-Net变体进行综合分析,2)模特内分类,建立更好的见解相关的挑战和解决方案。此外,本文还强调了基于U-Net框架在持续的大流行病,严重急性呼吸综合征冠状病毒2(SARS-COV-2)中的贡献也称为Covid-19。最后,分析了这些U-Net变体的优点和相似性以及生物医学图像分割所涉及的挑战,以发现该领域的未来未来的研究方向。
translated by 谷歌翻译
深度神经网络在学习新任务时遭受灾难性遗忘的主要限制。在本文中,我们专注于语义细分中的课堂持续学习,其中新类别随着时间的推移,而在未保留以前的训练数据。建议的持续学习方案塑造了潜在的空间来减少遗忘,同时提高了对新型课程的识别。我们的框架是由三种新的组件驱动,我们还毫不费力地结合现有的技术。首先,匹配的原型匹配在旧类上强制执行潜在空间一致性,约束编码器在后续步骤中为先前看到的类生成类似的潜在潜在表示。其次,特征稀疏性允许在潜在空间中腾出空间以容纳新型课程。最后,根据他们的语义,在统一的同时撕裂不同类别的语义,对形成对比的学习。对Pascal VOC2012和ADE20K数据集的广泛评估展示了我们方法的有效性,显着优于最先进的方法。
translated by 谷歌翻译
深入学习模型遭受较旧阶段中课程的灾难性遗忘,因为它们在类增量学习设置中新阶段所引入的课程中受过培训。在这项工作中,我们表明灾难性忘记对模型预测的影响随着相同图像的方向的变化而变化,这是一种新的发现。基于此,我们提出了一种新的数据集合方法,该方法结合了图像的不同取向的预测,以帮助模型保留关于先前所见的类别的进一步信息,从而减少忘记模型预测的效果。但是,如果使用传统技术训练,我们无法直接使用数据集合方法。因此,我们还提出了一种新的双重增量学习框架,涉及共同培训网络,其中包括两个增量学习目标,即类渐进式学习目标以及我们提出的数据增量学习目标。在双增量学习框架中,每个图像属于两个类,即图像类(用于类增量学习)和方向类(用于数据增量学习)。在Class-Incremental学习中,每个新阶段都会引入一组新的类,并且模型无法从较旧阶段访问完整的培训数据。在我们提出的数据增量学习中,方向类在所有阶段保持相同,并且在类 - 增量学习中的新阶段引入的数据充当了这些方向类的新培训数据。我们经验证明双增量学习框架对数据集合方法至关重要。我们将拟议的课程逐步增量学习方法应用拟议方法,并经验表明我们的框架显着提高了这些方法的性能。
translated by 谷歌翻译
深度学习模型在识别医学图像中的发现方面表现出了极大的有效性。但是,他们无法处理不断变化的临床环境,从而带来了来自不同来源的新注释的医学数据。为了利用传入的数据流,这些模型将在很大程度上受益于从新样本中依次学习,而不会忘记先前获得的知识。在本文中,我们通过应用现有的最新持续学习方法介绍了MedMnist收集中连续疾病分类的基准。特别是,我们考虑了三种连续的学习方案,即任务和班级增量学习以及新定义的跨域增量学习。疾病的任务和班级增量学习解决了对新样本进行分类的问题,而无需重新从头开始模型,而跨域增量学习解决了处理源自不同机构的数据集的问题,同时保留了先前获得的知识。我们对表现进行彻底的分析,并研究如何在这种情况下表现出灾难性遗忘的持续学习挑战。令人鼓舞的结果表明,持续学习具有推进疾病分类并为临床环境产生更强大,更有效的学习框架的主要潜力。将公开提供完整基准测试的代码存储库,数据分区和基线结果。
translated by 谷歌翻译
这项工作介绍了一个新颖的知识蒸馏框架,用于分类任务,其中可用并考虑到现有子类信息。在具有少数类或二进制检测的分类任务(两个类)中,从教师到学生网络传递的信息量受到限制,从而限制了知识蒸馏的效用。可以通过利用有关分类任务中可用类中可能子类的信息来提高性能。为此,我们提出了所谓的子类知识蒸馏(SKD)框架,这是将子类的预测知识从大型教师模型转移到较小的学生的过程。通过SKD,其他有意义的信息不在教师的课堂逻辑中,而是在子类中存在(例如,课堂内的相似之处)将被传达给学生并提高其表现。从数学上讲,我们测量老师可以通过SKD框架为学生提供多少额外信息。开发的框架是在临床应用中评估的,即结直肠息肉分类。在此应用程序中,临床医生提供的注释用于根据注释标签的学习方式来定义子类。接受拟议框架培训的轻巧,低复杂性学生的F1得分为85.05%,比在没有常规知识蒸馏的情况下训练的学生分别提高了2.14%和1.49%的增长。这些结果表明,额外的子类知识(即我们实验中的培训样本0.4656标签位)可以提供有关教师概括的更多信息,因此SKD可以从使用更多信息中受益于提高学生的表现。
translated by 谷歌翻译