智能论文笔记

A Comparison of Deep Learning Models for the Prediction of Hand Hygiene Videos

Rashmi Bakshi

分类：计算机视觉

2021-11-03

本文介绍了各种深度学习模型，如例外，Reset-50和Inception v3，用于根据世界卫生组织（世卫组织）指南记录的手工卫生手势的分类和预测。数据集由视频格式的六个手卫生运动组成，聚集了30名参与者。该网络由预先训练的模型组成，具有图像净权重和模型的修改头。在培训25时25时，在分类报告中，在分类报告中实现了37％（七七型），33％（Inception V3）和72％（Reset-50）的准确性。 Reset-50模型明显优于正确的课程预测。通过使用快速处理GPU可以克服主要速度限制以进行未来的工作。一个完整的手工卫生数据集以及其他通用手势，如单手动运动（线性手动;圆形手旋转）将用Reset-50架构和医疗保健工作者的型号进行测试。

translated by 谷歌翻译

Weed Recognition using Deep Learning Techniques on Class-imbalanced Imagery

A S M Mahmudul Hasan , Ferdous Sohel , Dean Diepeveen , Hamid Laga , Michael G. K. Jones

分类：计算机视觉 | 人工智能

2021-12-15

大多数杂草物种都会通过竞争高价值作物所需的营养而产生对农业生产力的不利影响。手动除草对于大型种植区不实用。已经开展了许多研究，为农业作物制定了自动杂草管理系统。在这个过程中，其中一个主要任务是识别图像中的杂草。但是，杂草的认可是一个具有挑战性的任务。它是因为杂草和作物植物的颜色，纹理和形状类似，可以通过成像条件，当记录图像时的成像条件，地理或天气条件进一步加剧。先进的机器学习技术可用于从图像中识别杂草。在本文中，我们调查了五个最先进的深神经网络，即VGG16，Reset-50，Inception-V3，Inception-Resnet-V2和MobileNetv2，并评估其杂草识别的性能。我们使用了多种实验设置和多个数据集合组合。特别是，我们通过组合几个较小的数据集，通过数据增强构成了一个大型DataSet，缓解了类别不平衡，并在基于深度神经网络的基准测试中使用此数据集。我们通过保留预先训练的权重来调查使用转移学习技术来利用作物和杂草数据集的图像提取特征和微调它们。我们发现VGG16比小规模数据集更好地执行，而ResET-50比其他大型数据集上的其他深网络更好地执行。

translated by 谷歌翻译

Real Time Action Recognition from Video Footage

Tasnim Sakib Apon , Mushfiqul Islam Chowdhury , MD Zubair Reza , Arpita Datta , Syeda Tanjina Hasan , MD. Golam Rabiul Alam

分类：计算机视觉

2021-12-13

犯罪率与人口的增加率成比例地增加。最突出的方法是引入基于闭路电视（CCTV）相机的监视以解决问题。视频监控摄像机增加了一个新的维度来检测犯罪。目前正在进行自动安全摄像机监控的几项研究工作，基本目标是从视频饲料发现暴力活动。从技术方面来看，这是一个具有挑战性的问题，因为分析了一组帧，即时间维度的视频，以检测暴力可能需要仔细的机器学习模型训练，以减少错误的结果。本研究通过整合最先进的深度学习方法来重点介绍该问题，以确保用于检测暴力活动的自主监测的强大管道，例如，踢，冲压和拍打。最初，我们设计了这种特定兴趣的数据集，其中包含600个视频（每个动作200个）。稍后，我们已经利用现有的预先训练的模型架构来提取特征，后来使用深度学习网络进行分类。此外，我们在不同预先训练的架构上分类了我们的模型'准确性，以及像VGG16，Inceptionv3，Reset50，七峰和MobileNet V2的不同预先训练的架构中的混淆矩阵，其中VGG16和MobileNet V2更好。

translated by 谷歌翻译

Detection and Classification of Brain tumors Using Deep Convolutional Neural Networks

Gopinath Balaji , Ranit Sen , Harsh Kirty

分类：计算机视觉 | 神经与进化计算

2022-08-28

由于肿胀和病态增大，人体组织中组织的异常发育被称为肿瘤。它们主要被归类为良性和恶性。大脑中的肿瘤可能是致命的，因为它可能是癌性的，因此可以以附近的健康细胞为食并不断增加大小。这可能会影响大脑中软组织，神经细胞和小血管。因此，有必要以最高的精度在早期阶段检测和分类。脑肿瘤的大小和位置不同，这使得很难理解其性质。由于附近的健康细胞与肿瘤之间的相似性，即使使用先进的MRI（磁共振成像）技术，脑肿瘤的检测和分类过程也可能是一项繁重的任务。在本文中，我们使用Keras和Tensorflow来实施最先进的卷积神经网络（CNN）架构，例如EdgitionNetB0，Resnet50，Xpection，MobilenetV2和VGG16，使用转移学习来检测和分类三种类型的大脑肿瘤，即神经胶质瘤，脑膜瘤和垂体。我们使用的数据集由3264个2-D磁共振图像和4个类组成。由于数据集的尺寸较小，因此使用各种数据增强技术来增加数据集的大小。我们提出的方法不仅包括数据增强，而且还包括各种图像降级技术，头骨剥离，裁剪和偏置校正。在我们提出的工作效率NETB0体系结构中，最佳准确性为97.61％。本文的目的是区分正常和异常像素，并以更好的准确性对它们进行分类。

translated by 谷歌翻译

HTML版本

Feature Extraction and Prediction for Hand Hygiene Gestures with KNN Algorithm

Rashmi Bakshi

分类：计算机视觉

2021-12-30

这项工作侧重于分析洗手过程中涉及的手势。世界卫生组织手卫生指南提供的洗手有六种标准手卫生手势。在本文中，使用计算机视觉库OpenCV来提取手中的手和手的轮廓，手的质心和沿着最大轮廓的极端手指。这些手特征在手卫生视频中为每个数据帧提取。在项目中创建了一只稳健的手卫生数据集。本工作中使用此数据集的子集。基于具有交叉折叠验证技术的KNN算法，进一步将提取的手特征进一步分组到类中，用于分类和预测未标记数据的分类和预测。实现了> 95％的平均准确度分数，并证明了具有适当输入值K = 5的KNN算法对于分类是有效的。具有六个不同的手动卫生课程的完整数据集将与KNN分类器一起使用以供将来的工作一起使用。

translated by 谷歌翻译

The Power of Transfer Learning in Agricultural Applications: AgriNet

Zahraa Al Sahili , Mariette Awad

分类：计算机视觉 | 机器学习

2022-07-08

深度学习和转移学习的进步为农业的各种自动化分类任务铺平了道路，包括植物疾病，害虫，杂草和植物物种检测。然而，农业自动化仍然面临各种挑战，例如数据集的大小和缺乏植物域特异性预处理模型。特定于域的预处理模型显示了各种计算机视觉任务的最先进的表现，包括面部识别和医学成像诊断。在本文中，我们提出了Agrinet数据集，该数据集是来自19个地理位置的160k农业图像的集合，几个图像标题为设备，以及423种以上的植物物种和疾病。我们还介绍了Agrinet模型，这是一组预处理的模型：VGG16，VGG19，Inception-V3，InceptionResnet-V2和Xception。 Agrinet-VGG19的分类准确性最高的94％，最高的F1分数为92％。此外，发现所有提出的模型都可以准确地对423种植物物种，疾病，害虫和杂草分类，而Inception-V3模型的精度最低为87％。与ImageNet相比，实验以评估Agrinet模型优势的实验在两个外部数据集上进行了模型：来自孟加拉国的害虫和植物疾病数据集和来自克什米尔的植物疾病数据集。

translated by 谷歌翻译

Classification of Histopathology Images of Lung Cancer Using Convolutional Neural Network (CNN)

Neha Baranwal , Preethi Doravari , Renu Kachhoria

分类：计算机视觉

2021-12-27

癌症是人体内部异常细胞的无法控制的细胞分裂，可以蔓延到其他身体器官。它是非传染性疾病（NCDS）和NCDS之一，占全世界总死亡人数的71％，而肺癌是女性乳腺癌后第二次诊断的癌症。肺癌的癌症生存率仅为19％。有各种方法用于诊断肺癌，如X射线，CT扫描，PET-CT扫描，支气管镜检查和活组织检查。然而，为了了解基于组织型H和E染色的肺癌亚型，广泛使用，其中染色在从活组织检查中吸入的组织上进行。研究报道，组织学类型与肺癌预后和治疗相关。因此，早期和准确地检测肺癌组织学是一种迫切需要，并且由于其治疗取决于疾病的组织学，分子曲线和阶段的类型，最重要的是分析肺癌的组织病理学图像。因此，为了加快肺癌诊断的重要过程，减少病理学家的负担，使用深层学习技术。这些技术表明了在分析癌症组织病变幻灯片的分析中提高了疗效。几项研究报告说，卷积神经网络（CNN）在脑，皮肤，乳腺癌，肺癌等各种癌症类型的组织病理学图片的分类中的重要性。在本研究中，通过使用Reset50，VGG-19，Inception_Resnet_V2和DenSenet进行特征提取和三重态丢失来引导CNN以引导CNN，以引导CNN，以引导CNN使得其增加群集间距离并减少集群内距离。

translated by 谷歌翻译

Monkeypox virus detection using pre-trained deep learning-based approaches

Chiranjibi Sitaula , Tej Bahadur Shahi

分类：计算机视觉 | 机器学习

2022-09-06

随着世界各地的COVID-19病毒感染的下降，Monkeypox病毒正在缓慢地出现。人们害怕它，认为它看起来像是Covid-19的大流行。因此，在广泛的社区传播之前，至关重要的是检测到它们。基于AI的检测可以帮助他们在早期识别它们。在本文中，我们首先比较了13个不同的预训练的深度学习（DL）模型，以检测蒙基氧基病毒。为此，我们首先将它们添加到所有这些层中，并使用四个完善的措施进行分析：精度，召回，F1得分和准确性。在确定了表现最佳的DL模型之后，我们将它们整合以利用从其获得的概率输出的多数投票来提高整体绩效。我们在公开可用的数据集上执行实验，这表明我们的集合方法提供了精度，召回，F1得分和精度为85.44 \％，85.47 \％，85.40 \％和87.13 \％。这些令人鼓舞的结果表明，所提出的方法适用于卫生从业人员进行大规模筛查。

translated by 谷歌翻译

Deep learning and machine learning for Malaria detection: overview, challenges and future directions

Imen Jdey , Ghazala Hcini , Hela Ltifi

分类：机器学习 | 人工智能

2022-09-27

为了产生最大的影响，必须使用基于证据的决策制定公共卫生计划。创建机器学习算法是为了收集，存储，处理和分析数据以提供知识和指导决策。任何监视系统的关键部分是图像分析。截至最近，计算机视觉和机器学习的社区最终对此感到好奇。这项研究使用各种机器学习和图像处理方法来检测和预测疟疾疾病。在我们的研究中，我们发现了深度学习技术作为具有更广泛适用于疟疾检测的智能工具的潜力，通过协助诊断病情，可以使医生受益。我们研究了针对计算机框架和组织的深度学习的共同限制，计算需要准备数据，准备开销，实时执行和解释能力，并发现对这些限制的轴承的未来询问。

translated by 谷歌翻译

Intelligent 3D Network Protocol for Multimedia Data Classification using Deep Learning

Arslan Syed , Eman A. Aldhahri , Muhammad Munawar Iqbal , Abid Ali , Ammar Muthanna , Harun Jamil , Faisal Jamil

分类：计算机视觉 | 人工智能

2022-07-23

在视频中，人类的行为是三维（3D）信号。这些视频研究了人类行为的时空知识。使用3D卷积神经网络（CNN）研究了有希望的能力。 3D CNN尚未在静止照片中为其建立良好的二维（2D）等效物获得高输出。董事会3D卷积记忆和时空融合面部训练难以防止3D CNN完成非凡的评估。在本文中，我们实施了混合深度学习体系结构，该体系结构结合了Stip和3D CNN功能，以有效地增强3D视频的性能。实施后，在每个时空融合圈中进行训练的较详细和更深的图表。训练模型在处理模型的复杂评估后进一步增强了结果。视频分类模型在此实现模型中使用。引入了使用深度学习的多媒体数据分类的智能3D网络协议，以进一步了解人类努力中的时空关联。在实施结果时，著名的数据集（即UCF101）评估了提出的混合技术的性能。结果击败了提出的混合技术，该混合动力技术基本上超过了最初的3D CNN。将结果与文献的最新框架进行比较，以识别UCF101的行动识别，准确度为95％。

translated by 谷歌翻译

Western Mediterranean wetlands bird species classification: evaluating small-footprint deep learning approaches on a new annotated dataset

Juan Gómez-Gómez , Ester Vidaña-Vila , Xavier Sevillano

分类：人工智能

2022-07-12

由生物声监测设备组成的无线声传感器网络运行的专家系统的部署，从声音中识别鸟类物种将使许多生态价值任务自动化，包括对鸟类种群组成的分析或濒危物种的检测在环境感兴趣的地区。由于人工智能的最新进展，可以将这些设备具有准确的音频分类功能，其中深度学习技术出色。但是，使生物声音设备负担得起的一个关键问题是使用小脚印深神经网络，这些神经网络可以嵌入资源和电池约束硬件平台中。因此，这项工作提供了两个重型和大脚印深神经网络（VGG16和RESNET50）和轻量级替代方案MobilenetV2之间的批判性比较分析。我们的实验结果表明，MobileNetV2的平均F1得分低于RESNET50（0.789 vs. 0.834）的5 \％，其性能优于VGG16，其足迹大小近40倍。此外，为了比较模型，我们创建并公开了西部地中海湿地鸟类数据集，其中包括201.6分钟和5,795个音频摘录，摘录了20种特有鸟类的aiguamolls de l'empord \ e empord \`一个自然公园。

translated by 谷歌翻译

AniWho : A Quick and Accurate Way to Classify Anime Character Faces in Images

Martinus Grady Naftali , Jason Sebastian Sulistyawan , Kelvin Julian , Felix Indra Kurniadi

分类：计算机视觉 | 机器学习

2022-08-23

本文旨在更深入地研究各种可用的模型，包括：InceptionV3，InceptionResnetv2，MobileNetV2和EdgitionNetB7使用转移学习，以对日本动画风格的角色面对面进行分类。本文表明，有效网络-B7的精度率最高，而85.08 \％top-1的精度，其次是MobileNetV2，其准确结果略有较低，但其益处的推理时间较低，所需参数数量较少。本文还使用了一些射击的学习框架，特别是原型网络，该网络可产生不错的结果，可以用作传统转移学习方法的替代方法。

translated by 谷歌翻译

Backbones-Review: Feature Extraction Networks for Deep Learning and Deep Reinforcement Learning Approaches

Omar Elharroussad , Younes Akbari , Noor Almaadeed , Somaya Al-Maadeed

分类：计算机视觉

2022-06-16

为了使用各种类型的数据理解现实世界，人工智能（AI）是当今最常用的技术。在分析数据中找到模式的同时表示主要任务。这是通过提取代表性特征步骤来执行的，该步骤是使用统计算法或使用某些特定过滤器进行的。但是，从大规模数据中选择有用的功能代表了至关重要的挑战。现在，随着卷积神经网络（CNN）的发展，功能提取操作变得更加自动和更容易。 CNN允许处理大规模的数据，并涵盖特定任务的不同方案。对于计算机视觉任务，卷积网络也用于为深度学习模型的其他部分提取功能。选择合适的网络用于特征提取或DL模型的其他部分不是随机工作。因此，这种模型的实现可能与目标任务以及其计算复杂性有关。已经提出了许多网络，并成为任何AI任务中任何DL模型的著名网络。这些网络被利用用于特征提取或在任何名为骨架的DL模型的开头。骨干是以前在许多其他任务中训练并证明其有效性的已知网络。在本文中，现有骨干的概述，例如详细说明给出了VGG，Resnets，Densenet等。此外，通过对所使用的骨干进行审查，讨论了几个计算机视觉任务。此外，还基于每个任务的骨干，还提供了性能的比较。

translated by 谷歌翻译

A Comparison Study of Deep CNN Architecture in Detecting of Pneumonia

Al Mohidur Rahman Porag , Md. Mahedi Hasan , Dr. Md Taimur Ahad

分类：计算机视觉 | 机器学习

2022-12-30

Pneumonia, a respiratory infection brought on by bacteria or viruses, affects a large number of people, especially in developing and impoverished countries where high levels of pollution, unclean living conditions, and overcrowding are frequently observed, along with insufficient medical infrastructure. Pleural effusion, a condition in which fluids fill the lung and complicate breathing, is brought on by pneumonia. Early detection of pneumonia is essential for ensuring curative care and boosting survival rates. The approach most usually used to diagnose pneumonia is chest X-ray imaging. The purpose of this work is to develop a method for the automatic diagnosis of bacterial and viral pneumonia in digital x-ray pictures. This article first presents the authors' technique, and then gives a comprehensive report on recent developments in the field of reliable diagnosis of pneumonia. In this study, here tuned a state-of-the-art deep convolutional neural network to classify plant diseases based on images and tested its performance. Deep learning architecture is compared empirically. VGG19, ResNet with 152v2, Resnext101, Seresnet152, Mobilenettv2, and DenseNet with 201 layers are among the architectures tested. Experiment data consists of two groups, sick and healthy X-ray pictures. To take appropriate action against plant diseases as soon as possible, rapid disease identification models are preferred. DenseNet201 has shown no overfitting or performance degradation in our experiments, and its accuracy tends to increase as the number of epochs increases. Further, DenseNet201 achieves state-of-the-art performance with a significantly a smaller number of parameters and within a reasonable computing time. This architecture outperforms the competition in terms of testing accuracy, scoring 95%. Each architecture was trained using Keras, using Theano as the backend.

translated by 谷歌翻译

Transfer learning for cancer diagnosis in histopathological images

Sandhya Aneja , Nagender Aneja , Pg Emeroylariffion Abas , Abdul Ghani Naim

分类：计算机视觉 | 机器学习

2021-12-31

转移学习使我们能够利用从一项任务中获得的知识来协助解决另一个或相关任务。在现代计算机视觉研究中，问题是哪个架构对给定的数据集更好地表现更好。在本文中，我们将14种预先训练的Imagenet模型的性能进行比较在组织病理学癌症检测数据集上，其中每个模型都被配置为天真的模型，特征提取器模型或微调模型。DENSENET161已被证明具有高精度，而RESET101具有高召回。适用于后续检查成本高的高精度模型，而低精度，但在后续检查成本低时，可以使用高召回/灵敏度模型。结果还表明，转移学习有助于更快地收敛模型。

translated by 谷歌翻译

How Facial Features Convey Attention in Stationary Environments

Janelle Domantay

分类：计算机视觉

2021-11-29

意识检测技术一直在各种企业中获得牵引力;最常用于驾驶员疲劳检测，最近的研究已经转向使用计算机视觉技术来分析在线教室等环境中的用户注意。本文旨在通过分析预测意识和疲劳的最大贡献，扩展了以前的分支检测研究。我们利用开源面部分析工具包OpenFace，以分析不同程度的注意力水平的受试者的视觉数据。然后，使用支持向量机（SVM），我们创建了几种用于用户注意的预测模型，并识别导向渐变（HOG）和动作单位的直方图，是我们测试的功能的最大预测因子。我们还将这种SVM的性能与利用卷积和/或经常性神经网络（CNN和CRNN）的性能进行了比较了这种SVM的性能。有趣的是，CRNN似乎没有比他们的CNN同行更好地表现出来。虽然深入学习方法实现了更大的预测精度，但使用较少的资源，使用某些参数来利用SVMS，能够逼近深度学习方法的性能。

translated by 谷歌翻译

COVID-19 Detection through Deep Feature Extraction

Jash Dalvi , Aziz Bohra

分类：计算机视觉 | 机器学习

2021-11-21

SARS-COV2病毒对人口引起了大量趋势。可以准确地确定一个人是否被Covid-19感染的预测建模是必要的。该研究提出了一种利用深色特征提取技术的新方法，预先训练的Reset50作用为网络的骨干，与Logistic回归相结合作为头部模型。拟议的模型已经在Kaggle Covid-19射线照相数据集上培训。所提出的模型在CoVID-19和正常的X射线图像类上实现了100％的交叉验证精度。同样，当在组合三类上测试时，所提出的模型精度达到98.84％。

translated by 谷歌翻译

Res-Dense Net for 3D Covid Chest CT-scan classification

Quoc-Huy Trinh , Minh-Van Nguyen , Thien-Phuc Nguyen Dinh

分类：计算机视觉 | 机器学习

2022-08-09

医学图像预处理中最有争议的研究领域之一是3D CT扫描。随着Covid-19的快速扩散，CT扫描在正确，迅速诊断疾病的功能变得至关重要。它对预防感染有积极影响。通过CT-Scan图像诊断疾病有许多任务，包括Covid-19。在本文中，我们提出了一种使用堆叠深神经网络的方法，通过一系列3D CT扫描图像来检测COVID 19。在我们的方法中，我们使用两个骨架进行实验是Densenet 121和Resnet101。此方法在某些评估指标上实现了竞争性能

translated by 谷歌翻译

Stain Normalized Breast Histopathology Image Recognition using Convolutional Neural Networks for Cancer Detection

Sruthi Krishna , Suganthi S. S , Shivsubramani Krishnamoorthy , Arnav Bhavsar

分类：计算机视觉

2022-01-04

计算机辅助诊断数字病理学正在变得普遍存在，因为它可以提供更有效和客观的医疗保健诊断。最近的进展表明，卷积神经网络（CNN）架构是一种完善的深度学习范式，可用于设计一种用于乳腺癌检测的计算机辅助诊断（CAD）系统。然而，探索了污染变异性因污染变异性和染色常规化的影响，尚未得到很好的挑战。此外，对于高吞吐量筛选可能是重要的网络模型的性能分析，这也不适用于高吞吐量筛查，也不熟悉。要解决这一挑战，我们考虑了一些当代CNN模型，用于涉及（1）的乳房组织病理学图像的二进制分类。使用基于自适应颜色解卷积（ACD）的颜色归一化算法来处理污染归一化图像的数据以处理染色变量; （2）应用基于转移学习的一些可动性更高效的CNN模型的培训，即视觉几何组网络（VGG16），MobileNet和效率网络。我们在公开的Brankhis数据集上验证了培训的CNN网络，适用于200倍和400x放大的组织病理学图像。实验分析表明，大多数情况下预染额网络在数据增强乳房组织病理学图像中产生更好的质量，而不是污染归一化的情况。此外，我们使用污染标准化图像评估了流行轻量级网络的性能和效率，并发现在测试精度和F1分数方面，高效网络优于VGG16和MOBILENET。我们观察到在测试时间方面的效率比其他网络更好; vgg net，mobilenet，在分类准确性下没有太大降低。

translated by 谷歌翻译

The Prominence of Artificial Intelligence in COVID-19

MD Abdullah Al Nasim , Aditi Dhali , Faria Afrin , Noshin Tasnim Zaman , Nazmul Karim

分类：机器学习 | 人工智能

2021-11-18

2019年12月，一个名为Covid-19的新型病毒导致了迄今为止的巨大因果关系。与新的冠状病毒的战斗在西班牙语流感后令人振奋和恐怖。虽然前线医生和医学研究人员在控制高度典型病毒的传播方面取得了重大进展，但技术也证明了在战斗中的重要性。此外，许多医疗应用中已采用人工智能，以诊断许多疾病，甚至陷入困境的经验丰富的医生。因此，本调查纸探讨了提议的方法，可以提前援助医生和研究人员，廉价的疾病诊断方法。大多数发展中国家难以使用传统方式进行测试，但机器和深度学习可以采用显着的方式。另一方面，对不同类型的医学图像的访问已经激励了研究人员。结果，提出了一种庞大的技术数量。本文首先详细调了人工智能域中传统方法的背景知识。在此之后，我们会收集常用的数据集及其用例日期。此外，我们还显示了采用深入学习的机器学习的研究人员的百分比。因此，我们对这种情况进行了彻底的分析。最后，在研究挑战中，我们详细阐述了Covid-19研究中面临的问题，我们解决了我们的理解，以建立一个明亮健康的环境。

translated by 谷歌翻译