智能论文笔记

Diabetic Foot Ulcer Grand Challenge 2021: Evaluation and Summary

Bill Cassidy , Connah Kendrick , Neil D. Reeves , Joseph M. Pappachan , Claire O'Shea , David G. Armstrong , Moi Hoon Yap

分类：计算机视觉 | 机器学习

2021-11-19

糖尿病足溃疡分类系统使用伤口感染（伤口内的细菌）和缺血（限制血供给）作为重要的临床指标治疗和预测伤口愈合。研究使用自动化计算机化方法在糖尿病足伤中使用自动化计算机化方法的使用和缺血的使用是有限的，这是有限的，因为存在的公开可用数据集和严重数据不平衡存在。糖尿病脚溃疡挑战2021提供了一种具有更大量数据集的参与者，其总共包括15,683只糖尿病足溃疡贴剂，用于训练5,734，用于测试，额外的3,994个未标记的贴片，以促进半监督和弱的发展 - 监督深度学习技巧。本文提供了对糖尿病足溃疡攻击2021中使用的方法的评估，并总结了从每个网络获得的结果。最佳性能的网络是前3种型号的结果的集合，宏观平均F1分数为0.6307。

translated by 谷歌翻译

Convolutional Nets Versus Vision Transformers for Diabetic Foot Ulcer Classification

Adrian Galdran , Gustavo Carneiro , Miguel A. González Ballester

分类：计算机视觉

2021-11-12

本文将良好的卷积神经网络（CNNS）与最近引入了糖尿病脚溃疡分类任务的最近引入的视觉变压器，在DFUC 2021的宏伟挑战的背景下，这项工作达到了第一位置。综合实验表明，现代CNNS仍然能够在低数据制度中表现出变压器，这可能是它们更好地利用空间相关性的能力。此外，我们经验证明最近的清晰度感知最小化（SAM）优化算法显着提高了两种模型的泛化能力。我们的结果表明，对于此任务，CNN和SAM优化过程的组合导致优于任何其他考虑方法的性能。

translated by 谷歌翻译

Deep learning for understanding multilabel imbalanced Chest X-ray datasets

Helena Liz , Javier Huertas-Tato , Manuel Sánchez-Montañés , Javier Del Ser , David Camacho

分类：计算机视觉 | 机器学习

2022-07-28

在过去的几年中，卷积神经网络（CNN）占据了计算机视野的领域，这要归功于它们提取功能及其在分类问题中出色的表现，例如在自动分析X射线中。不幸的是，这些神经网络被认为是黑盒算法，即不可能了解该算法如何实现最终结果。要将这些算法应用于不同领域并测试方法论的工作原理，我们需要使用可解释的AI技术。医学领域的大多数工作都集中在二进制或多类分类问题上。但是，在许多现实生活中，例如胸部X射线射线，可以同时出现不同疾病的放射学迹象。这引起了所谓的“多标签分类问题”。这些任务的缺点是类不平衡，即不同的标签没有相同数量的样本。本文的主要贡献是一种深度学习方法，用于不平衡的多标签胸部X射线数据集。它为当前未充分利用的Padchest数据集建立了基线，并基于热图建立了可解释的AI技术。该技术还包括概率和模型间匹配。我们系统的结果很有希望，尤其是考虑到使用的标签数量。此外，热图与预期区域相匹配，即它们标志着专家将用来做出决定的区域。

translated by 谷歌翻译

Multi-Label Retinal Disease Classification using Transformers

M. A. Rodriguez , H. AlMarzouqi , P. Liatsis

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-05

早期发现视网膜疾病是预防患者部分或永久失明的最重要手段之一。在这项研究中，提出了一种新型的多标签分类系统，用于使用从各种来源收集的眼底图像来检测多种视网膜疾病。首先，使用许多公开可用的数据集来构建一个新的多标签视网膜疾病数据集，即梅里德数据集。接下来，应用了一系列后处理步骤，以确保图像数据的质量和数据集中存在的疾病范围。在眼底多标签疾病分类中，首次通过大量实验优化的基于变压器的模型用于图像分析和决策。进行了许多实验以优化所提出的系统的配置。结果表明，在疾病检测和疾病分类方面，该方法的性能比在同一任务上的最先进作品要好7.9％和8.1％。获得的结果进一步支持了基于变压器的架构在医学成像领域的潜在应用。

translated by 谷歌翻译

Development of Diabetic Foot Ulcer Datasets: An Overview

Moi Hoon Yap , Connah Kendrick , Neil D. Reeves , Manu Goyal , Joseph M. Pappachan , Bill Cassidy

分类：计算机视觉

2022-01-01

本文提供了在过去十年中开发糖尿病足溃疡数据集的概念基础和程序，有一个时间线来证明进步。我们对脚踏照片的数据捕获方法进行了调查，概述了开发私立和公共数据集的研究，相关的计算机视觉任务（检测，分割和分类），糖尿病足溃疡挑战和未来发展的发展方向数据集。我们通过国家和年度报告数据集用户的分发。我们的目标是分享我们与DataSet开发的良好做法遇到的技术挑战，并为其他研究人员提供参与该域中的数据共享的动机。

translated by 谷歌翻译

A Comparison Study of Deep CNN Architecture in Detecting of Pneumonia

Al Mohidur Rahman Porag , Md. Mahedi Hasan , Dr. Md Taimur Ahad

分类：计算机视觉 | 机器学习

2022-12-30

Pneumonia, a respiratory infection brought on by bacteria or viruses, affects a large number of people, especially in developing and impoverished countries where high levels of pollution, unclean living conditions, and overcrowding are frequently observed, along with insufficient medical infrastructure. Pleural effusion, a condition in which fluids fill the lung and complicate breathing, is brought on by pneumonia. Early detection of pneumonia is essential for ensuring curative care and boosting survival rates. The approach most usually used to diagnose pneumonia is chest X-ray imaging. The purpose of this work is to develop a method for the automatic diagnosis of bacterial and viral pneumonia in digital x-ray pictures. This article first presents the authors' technique, and then gives a comprehensive report on recent developments in the field of reliable diagnosis of pneumonia. In this study, here tuned a state-of-the-art deep convolutional neural network to classify plant diseases based on images and tested its performance. Deep learning architecture is compared empirically. VGG19, ResNet with 152v2, Resnext101, Seresnet152, Mobilenettv2, and DenseNet with 201 layers are among the architectures tested. Experiment data consists of two groups, sick and healthy X-ray pictures. To take appropriate action against plant diseases as soon as possible, rapid disease identification models are preferred. DenseNet201 has shown no overfitting or performance degradation in our experiments, and its accuracy tends to increase as the number of epochs increases. Further, DenseNet201 achieves state-of-the-art performance with a significantly a smaller number of parameters and within a reasonable computing time. This architecture outperforms the competition in terms of testing accuracy, scoring 95%. Each architecture was trained using Keras, using Theano as the backend.

translated by 谷歌翻译

HEROHE Challenge: assessing HER2 status in breast cancer without immunohistochemistry or in situ hybridization

Eduardo Conde-Sousa , João Vale , Ming Feng , Kele Xu , Yin Wang , Vincenzo Della Mea , David La Barbera , Ehsan Montahaei , Mahdieh Soleymani Baghshah , Andreas Turzynski

分类：计算机视觉

2021-11-08

乳腺癌是女性最常见的恶性肿瘤，每年负责超过50万人死亡。因此，早期和准确的诊断至关重要。人类专业知识是诊断和正确分类乳腺癌并定义适当的治疗，这取决于评价不同生物标志物如跨膜蛋白受体HER2的表达。该评估需要几个步骤，包括免疫组织化学或原位杂交等特殊技术，以评估HER2状态。通过降低诊断中的步骤和人类偏差的次数的目标，赫洛挑战是组织的，作为第16届欧洲数字病理大会的并行事件，旨在自动化仅基于苏木精和曙红染色的HER2地位的评估侵袭性乳腺癌的组织样本。评估HER2状态的方法是在全球21个团队中提出的，并通过一些提议的方法实现了潜在的观点，以推进最先进的。

translated by 谷歌翻译

Construction material classification on imbalanced datasets using Vision Transformer (ViT) architecture

Maryam Soleymani , Mahdi Bonyani , Hadi Mahami , Farnad Nasirzadeh

分类：计算机视觉

2021-08-21

这项研究提出了一个可靠的模型，用于识别具有最高精度的不同建筑材料，该模型被利用为用于广泛的施工应用（例如自动进度监控）的有利工具。在这项研究中，一种称为视觉变压器（VIT）的新型深度学习结构用于检测和分类建筑材料。使用不同的图像数据集评估了所采用方法的鲁棒性。为此，对模型进行了训练和测试，并在两个大型不平衡数据集上进行了测试，即建筑材料库（CML）和建筑材料数据集（BMD）。还通过组合CML和BMD来创建更不平衡的数据集并评估使用方法的功能来生成第三个数据集。所达到的结果揭示了评估指标的精度为100％，例如三个不同数据集的每个材料类别的准确性，精度，召回率和F1得分。据信，建议的模型实现了用于检测和分类不同材料类型的强大工具。迄今为止，许多研究试图自动对仍然存在一些错误的各种建筑材料进行分类。这项研究将解决上述缺点，并提出一个模型以更高的精度检测材料类型。所采用的模型也能够被推广到不同的数据集。

translated by 谷歌翻译

Applications of Deep Learning in Fish Habitat Monitoring: A Tutorial and Survey

Alzayat Saleh , Marcus Sheaves , Dean Jerry , Mostafa Rahimi Azghadi

分类：计算机视觉

2022-06-11

海洋生态系统及其鱼类栖息地越来越重要，因为它们在提供有价值的食物来源和保护效果方面的重要作用。由于它们的偏僻且难以接近自然，因此通常使用水下摄像头对海洋环境和鱼类栖息地进行监测。这些相机产生了大量数字数据，这些数据无法通过当前的手动处理方法有效地分析，这些方法涉及人类观察者。 DL是一种尖端的AI技术，在分析视觉数据时表现出了前所未有的性能。尽管它应用于无数领域，但仍在探索其在水下鱼类栖息地监测中的使用。在本文中，我们提供了一个涵盖DL的关键概念的教程，该教程可帮助读者了解对DL的工作原理的高级理解。该教程还解释了一个逐步的程序，讲述了如何为诸如水下鱼类监测等挑战性应用开发DL算法。此外，我们还提供了针对鱼类栖息地监测的关键深度学习技术的全面调查，包括分类，计数，定位和细分。此外，我们对水下鱼类数据集进行了公开调查，并比较水下鱼类监测域中的各种DL技术。我们还讨论了鱼类栖息地加工深度学习的新兴领域的一些挑战和机遇。本文是为了作为希望掌握对DL的高级了解，通过遵循我们的分步教程而为其应用开发的海洋科学家的教程，并了解如何发展其研究，以促进他们的研究。努力。同时，它适用于希望调查基于DL的最先进方法的计算机科学家，以进行鱼类栖息地监测。

translated by 谷歌翻译

Detection and Classification of Brain tumors Using Deep Convolutional Neural Networks

Gopinath Balaji , Ranit Sen , Harsh Kirty

分类：计算机视觉 | 神经与进化计算

2022-08-28

由于肿胀和病态增大，人体组织中组织的异常发育被称为肿瘤。它们主要被归类为良性和恶性。大脑中的肿瘤可能是致命的，因为它可能是癌性的，因此可以以附近的健康细胞为食并不断增加大小。这可能会影响大脑中软组织，神经细胞和小血管。因此，有必要以最高的精度在早期阶段检测和分类。脑肿瘤的大小和位置不同，这使得很难理解其性质。由于附近的健康细胞与肿瘤之间的相似性，即使使用先进的MRI（磁共振成像）技术，脑肿瘤的检测和分类过程也可能是一项繁重的任务。在本文中，我们使用Keras和Tensorflow来实施最先进的卷积神经网络（CNN）架构，例如EdgitionNetB0，Resnet50，Xpection，MobilenetV2和VGG16，使用转移学习来检测和分类三种类型的大脑肿瘤，即神经胶质瘤，脑膜瘤和垂体。我们使用的数据集由3264个2-D磁共振图像和4个类组成。由于数据集的尺寸较小，因此使用各种数据增强技术来增加数据集的大小。我们提出的方法不仅包括数据增强，而且还包括各种图像降级技术，头骨剥离，裁剪和偏置校正。在我们提出的工作效率NETB0体系结构中，最佳准确性为97.61％。本文的目的是区分正常和异常像素，并以更好的准确性对它们进行分类。

translated by 谷歌翻译

HTML版本

Habitat classification from satellite observations with sparse annotations

Mikko Impiö , Pekka Härmä , Anna Tammilehto , Saku Anttila , Jenni Raitoharju

分类：计算机视觉

2022-09-26

与现场测量相比，遥感益处可以通过使大面积的监控更容易地进行栖息地保护，尤其是在可以自动分析遥感数据的情况下。监测的一个重要方面是对受监视区域中存在的栖息地类型进行分类和映射。自动分类是一项艰巨的任务，因为课程具有细粒度的差异，并且它们的分布是长尾巴且不平衡的。通常，用于自动土地覆盖分类的培训数据取决于完全注释的分割图，从遥感的图像到相当高的分类学，即森林，农田或市区等类别。自动栖息地分类的挑战是可靠的数据注释需要现场策略。因此，完整的分割图的生产成本很高，训练数据通常很稀疏，类似点，并且仅限于可以步行访问的区域。需要更有效地利用这些有限数据的方法。我们通过提出一种栖息地分类和映射的方法来解决这些问题，并应用此方法将整个芬兰拉普兰北部地区分类为Natura2000类。该方法的特征是使用从现场收集的细粒，稀疏，单像素注释，并与大量未经通知的数据结合在一起来产生分割图。比较了监督，无监督和半监督的方法，并证明了从较大的室外数据集中转移学习的好处。我们提出了一个\ ac {cnn}偏向于中心像素分类，与随机的森林分类器结合使用，该分类器比单独的模型本身产生更高的质量分类。我们表明，增加种植，测试时间的增加和半监督的学习可以进一步帮助分类。

translated by 谷歌翻译

Weed Recognition using Deep Learning Techniques on Class-imbalanced Imagery

A S M Mahmudul Hasan , Ferdous Sohel , Dean Diepeveen , Hamid Laga , Michael G. K. Jones

分类：计算机视觉 | 人工智能

2021-12-15

大多数杂草物种都会通过竞争高价值作物所需的营养而产生对农业生产力的不利影响。手动除草对于大型种植区不实用。已经开展了许多研究，为农业作物制定了自动杂草管理系统。在这个过程中，其中一个主要任务是识别图像中的杂草。但是，杂草的认可是一个具有挑战性的任务。它是因为杂草和作物植物的颜色，纹理和形状类似，可以通过成像条件，当记录图像时的成像条件，地理或天气条件进一步加剧。先进的机器学习技术可用于从图像中识别杂草。在本文中，我们调查了五个最先进的深神经网络，即VGG16，Reset-50，Inception-V3，Inception-Resnet-V2和MobileNetv2，并评估其杂草识别的性能。我们使用了多种实验设置和多个数据集合组合。特别是，我们通过组合几个较小的数据集，通过数据增强构成了一个大型DataSet，缓解了类别不平衡，并在基于深度神经网络的基准测试中使用此数据集。我们通过保留预先训练的权重来调查使用转移学习技术来利用作物和杂草数据集的图像提取特征和微调它们。我们发现VGG16比小规模数据集更好地执行，而ResET-50比其他大型数据集上的其他深网络更好地执行。

translated by 谷歌翻译

The Prominence of Artificial Intelligence in COVID-19

MD Abdullah Al Nasim , Aditi Dhali , Faria Afrin , Noshin Tasnim Zaman , Nazmul Karim

分类：机器学习 | 人工智能

2021-11-18

2019年12月，一个名为Covid-19的新型病毒导致了迄今为止的巨大因果关系。与新的冠状病毒的战斗在西班牙语流感后令人振奋和恐怖。虽然前线医生和医学研究人员在控制高度典型病毒的传播方面取得了重大进展，但技术也证明了在战斗中的重要性。此外，许多医疗应用中已采用人工智能，以诊断许多疾病，甚至陷入困境的经验丰富的医生。因此，本调查纸探讨了提议的方法，可以提前援助医生和研究人员，廉价的疾病诊断方法。大多数发展中国家难以使用传统方式进行测试，但机器和深度学习可以采用显着的方式。另一方面，对不同类型的医学图像的访问已经激励了研究人员。结果，提出了一种庞大的技术数量。本文首先详细调了人工智能域中传统方法的背景知识。在此之后，我们会收集常用的数据集及其用例日期。此外，我们还显示了采用深入学习的机器学习的研究人员的百分比。因此，我们对这种情况进行了彻底的分析。最后，在研究挑战中，我们详细阐述了Covid-19研究中面临的问题，我们解决了我们的理解，以建立一个明亮健康的环境。

translated by 谷歌翻译

Stain Normalized Breast Histopathology Image Recognition using Convolutional Neural Networks for Cancer Detection

Sruthi Krishna , Suganthi S. S , Shivsubramani Krishnamoorthy , Arnav Bhavsar

分类：计算机视觉

2022-01-04

计算机辅助诊断数字病理学正在变得普遍存在，因为它可以提供更有效和客观的医疗保健诊断。最近的进展表明，卷积神经网络（CNN）架构是一种完善的深度学习范式，可用于设计一种用于乳腺癌检测的计算机辅助诊断（CAD）系统。然而，探索了污染变异性因污染变异性和染色常规化的影响，尚未得到很好的挑战。此外，对于高吞吐量筛选可能是重要的网络模型的性能分析，这也不适用于高吞吐量筛查，也不熟悉。要解决这一挑战，我们考虑了一些当代CNN模型，用于涉及（1）的乳房组织病理学图像的二进制分类。使用基于自适应颜色解卷积（ACD）的颜色归一化算法来处理污染归一化图像的数据以处理染色变量; （2）应用基于转移学习的一些可动性更高效的CNN模型的培训，即视觉几何组网络（VGG16），MobileNet和效率网络。我们在公开的Brankhis数据集上验证了培训的CNN网络，适用于200倍和400x放大的组织病理学图像。实验分析表明，大多数情况下预染额网络在数据增强乳房组织病理学图像中产生更好的质量，而不是污染归一化的情况。此外，我们使用污染标准化图像评估了流行轻量级网络的性能和效率，并发现在测试精度和F1分数方面，高效网络优于VGG16和MOBILENET。我们观察到在测试时间方面的效率比其他网络更好; vgg net，mobilenet，在分类准确性下没有太大降低。

translated by 谷歌翻译

Multi-Label Classification on Remote-Sensing Images

Aditya Kumar Singh , B. Uma Shankar

分类：计算机视觉 | 人工智能 | 机器学习

2022-01-06

通过卫星摄像机获取关于地球表面的大面积的信息使我们能够看到远远超过我们在地面上看到的更多。这有助于我们在检测和监测土地使用模式，大气条件，森林覆盖和许多非上市方面的地区的物理特征。所获得的图像不仅跟踪连续的自然现象，而且对解决严重森林砍伐的全球挑战也至关重要。其中亚马逊盆地每年占最大份额。适当的数据分析将有助于利用可持续健康的氛围来限制对生态系统和生物多样性的不利影响。本报告旨在通过不同的机器学习和优越的深度学习模型用大气和各种陆地覆盖或土地使用亚马逊雨林的卫星图像芯片。评估是基于F2度量完成的，而用于损耗函数，我们都有S形跨熵以及Softmax交叉熵。在使用预先训练的ImageNet架构中仅提取功能之后，图像被间接馈送到机器学习分类器。鉴于深度学习模型，通过传输学习使用微调Imagenet预训练模型的集合。到目前为止，我们的最佳分数与F2度量为0.927。

translated by 谷歌翻译

Discriminative Kernel Convolution Network for Multi-Label Ophthalmic Disease Detection on Imbalanced Fundus Image Dataset

Amit Bhati , Neha Gour , Pritee Khanna , Aparajita Ojha

分类：计算机视觉

2022-07-16

通过研究视网膜生物结构的进展，可以识别眼病的存在和严重性是可行的。眼底检查是检查眼睛的生物结构和异常的诊断程序。诸如青光眼，糖尿病性视网膜病和白内障等眼科疾病是世界各地视觉障碍的主要原因。眼疾病智能识别（ODIR-5K）是研究人员用于多标签的多份多疾病分类的基准结构底面图像数据集。这项工作提出了一个歧视性内核卷积网络（DKCNET），该网络探讨了歧视区域的特征，而无需增加额外的计算成本。 DKCNET由注意力块组成，然后是挤压和激发（SE）块。注意块从主干网络中获取功能，并生成歧视性特征注意图。 SE块采用区分特征图并改善了通道相互依赖性。使用InceptionResnet骨干网络观察到DKCNET的更好性能，用于具有96.08 AUC，94.28 F1-SCORE和0.81 KAPPA得分的ODIR-5K底面图像的多标签分类。所提出的方法根据诊断关键字将通用目标标签拆分为眼对。基于这些标签，进行了过采样和不足采样以解决阶级失衡。为了检查拟议模型对培训数据的偏见，对ODIR数据集进行了训练的模型将在三个公开可用的基准数据集上进行测试。发现它在完全看不见的底面图像上也具有良好的性能。

translated by 谷歌翻译

The Power of Transfer Learning in Agricultural Applications: AgriNet

Zahraa Al Sahili , Mariette Awad

分类：计算机视觉 | 机器学习

2022-07-08

深度学习和转移学习的进步为农业的各种自动化分类任务铺平了道路，包括植物疾病，害虫，杂草和植物物种检测。然而，农业自动化仍然面临各种挑战，例如数据集的大小和缺乏植物域特异性预处理模型。特定于域的预处理模型显示了各种计算机视觉任务的最先进的表现，包括面部识别和医学成像诊断。在本文中，我们提出了Agrinet数据集，该数据集是来自19个地理位置的160k农业图像的集合，几个图像标题为设备，以及423种以上的植物物种和疾病。我们还介绍了Agrinet模型，这是一组预处理的模型：VGG16，VGG19，Inception-V3，InceptionResnet-V2和Xception。 Agrinet-VGG19的分类准确性最高的94％，最高的F1分数为92％。此外，发现所有提出的模型都可以准确地对423种植物物种，疾病，害虫和杂草分类，而Inception-V3模型的精度最低为87％。与ImageNet相比，实验以评估Agrinet模型优势的实验在两个外部数据集上进行了模型：来自孟加拉国的害虫和植物疾病数据集和来自克什米尔的植物疾病数据集。

translated by 谷歌翻译

Deep Multi-Scale Resemblance Network for the Sub-class Differentiation of Adrenal Masses on Computed Tomography Images

Lei Bi , Jinman Kim , Tingwei Su , Michael Fulham , David Dagan Feng , Guang Ning

分类：计算机视觉

2020-07-29

通过计算机断层扫描（CT）检测到的肾上腺（肾上腺肿块）中肿块病变的准确分类对于诊断和患者管理很重要。肾上腺肿块可能是良性或恶性肿瘤，良性肿块的患病率有所不同。基于卷积神经网络（CNN）的分类方法是最大程度地提高大型医学成像训练数据集中阶层差异的最新方法。由于质量病变的大小，CNN的应用，在肾上腺肿块上的应用是具有挑战性的，这是具有挑战性的。我们开发了一个深度的多尺度相似网络（DMRN），以克服这些局限性，并杠杆配对的CNN来评估阶层内相似性。我们使用多尺度功能嵌入来改善类间的可分离性，通过迭代地组合在输入的不同尺度上产生的互补信息以创建结构化特征描述符。我们用随机采样的配对肾上腺肿块增强了训练数据，以减少训练数据不平衡的影响。我们使用229张CT扫描肾上腺肿块患者进行评估。在五倍的交叉验证中，与最先进的方法相比，我们的方法的结果最好（准确性89.52％）（p <0.05）。我们对ImageClef 2016竞赛数据集进行了医学子图分类的竞争数据集进行了普遍分析，该数据集由30个类别的6,776张图像和4,166张图像组成的培训集组成。与现有方法相比，我们的方法获得了更好的分类性能（精度为85.90％），并且与需要额外培训数据的方法相比（准确性降低1.47％）相比具有竞争力。我们在CT上的DMRN亚分类肾上腺肿块，优于最先进的方法。

translated by 谷歌翻译

An Ensemble Method to Automatically Grade Diabetic Retinopathy with Optical Coherence Tomography Angiography Images

Yuhan Zheng , Fuping Wu , Bartłomiej W. Papież

分类：计算机视觉

2022-12-12

Diabetic retinopathy (DR) is a complication of diabetes, and one of the major causes of vision impairment in the global population. As the early-stage manifestation of DR is usually very mild and hard to detect, an accurate diagnosis via eye-screening is clinically important to prevent vision loss at later stages. In this work, we propose an ensemble method to automatically grade DR using ultra-wide optical coherence tomography angiography (UW-OCTA) images available from Diabetic Retinopathy Analysis Challenge (DRAC) 2022. First, we adopt the state-of-the-art classification networks, i.e., ResNet, DenseNet, EfficientNet, and VGG, and train them to grade UW-OCTA images with different splits of the available dataset. Ultimately, we obtain 25 models, of which, the top 16 models are selected and ensembled to generate the final predictions. During the training process, we also investigate the multi-task learning strategy, and add an auxiliary classification task, the Image Quality Assessment, to improve the model performance. Our final ensemble model achieved a quadratic weighted kappa (QWK) of 0.9346 and an Area Under Curve (AUC) of 0.9766 on the internal testing dataset, and the QWK of 0.839 and the AUC of 0.8978 on the DRAC challenge testing dataset.

translated by 谷歌翻译

Computer Vision on X-ray Data in Industrial Production and Security Applications: A survey

Mehdi Rafiei , Jenni Raitoharju , Alexandros Iosifidis

分类：计算机视觉

2022-11-10

X-ray imaging technology has been used for decades in clinical tasks to reveal the internal condition of different organs, and in recent years, it has become more common in other areas such as industry, security, and geography. The recent development of computer vision and machine learning techniques has also made it easier to automatically process X-ray images and several machine learning-based object (anomaly) detection, classification, and segmentation methods have been recently employed in X-ray image analysis. Due to the high potential of deep learning in related image processing applications, it has been used in most of the studies. This survey reviews the recent research on using computer vision and machine learning for X-ray analysis in industrial production and security applications and covers the applications, techniques, evaluation metrics, datasets, and performance comparison of those techniques on publicly available datasets. We also highlight some drawbacks in the published research and give recommendations for future research in computer vision-based X-ray analysis.

translated by 谷歌翻译