智能论文笔记

Taguchi based Design of Sequential Convolution Neural Network for Classification of Defective Fasteners

Manjeet Kaur , Krishan Kumar Chauhan , Tanya Aggarwal , Pushkar Bharadwaj , Renu Vig , Isibor Kennedy Ihianle , Garima Joshi , Kayode Owa

分类：计算机视觉 | 人工智能

2022-07-22

紧固件在确保机械的各个部位方面起着至关重要的作用。紧固件表面的凹痕，裂缝和划痕等变形是由材料特性和生产过程中设备的错误处理引起的。结果，需要质量控制以确保安全可靠的操作。现有的缺陷检查方法依赖于手动检查，该检查消耗了大量时间，金钱和其他资源；同样，由于人为错误，无法保证准确性。自动缺陷检测系统已证明对缺陷分析的手动检查技术有影响。但是，诸如卷积神经网络（CNN）和基于深度学习的方法之类的计算技术是进化方法。通过仔细选择设计参数值，可以实现CNN的全部电势。使用基于Taguchi的实验和分析设计，已经尝试在本研究中开发强大的自动系统。用于训练系统的数据集是为具有两个标记类别的M14尺寸螺母手动创建的：有缺陷且无缺陷。数据集中共有264张图像。所提出的顺序CNN的验证精度为96.3％，在0.001学习率下的验证损失为0.277。

translated by 谷歌翻译

Automated Defect Recognition of Castings defects using Neural Networks

Alberto García-Pérez , María José Gómez-Silva , Arturo de la Escalera

分类：计算机视觉

2022-09-06

工业X射线分析在需要保证某些零件的结构完整性的航空航天，汽车或核行业中很常见。但是，射线照相图像的解释有时很困难，可能导致两名专家在缺陷分类上不同意。本文介绍的自动缺陷识别（ADR）系统将减少分析时间，还将有助于减少对缺陷的主观解释，同时提高人类检查员的可靠性。我们的卷积神经网络（CNN）模型达到94.2 \％准确性（MAP@iou = 50 \％），当应用于汽车铝铸件数据集（GDXRAR）时，它被认为与预期的人类性能相似，超过了当前状态该数据集的艺术。在工业环境上，其推理时间少于每个DICOM图像，因此可以安装在生产设施上，不会影响交付时间。此外，还进行了对主要高参数的消融研究，以优化从75 \％映射的初始基线结果最高94.2 \％map的模型准确性。

translated by 谷歌翻译

Applications of Deep Learning in Fish Habitat Monitoring: A Tutorial and Survey

Alzayat Saleh , Marcus Sheaves , Dean Jerry , Mostafa Rahimi Azghadi

分类：计算机视觉

2022-06-11

海洋生态系统及其鱼类栖息地越来越重要，因为它们在提供有价值的食物来源和保护效果方面的重要作用。由于它们的偏僻且难以接近自然，因此通常使用水下摄像头对海洋环境和鱼类栖息地进行监测。这些相机产生了大量数字数据，这些数据无法通过当前的手动处理方法有效地分析，这些方法涉及人类观察者。 DL是一种尖端的AI技术，在分析视觉数据时表现出了前所未有的性能。尽管它应用于无数领域，但仍在探索其在水下鱼类栖息地监测中的使用。在本文中，我们提供了一个涵盖DL的关键概念的教程，该教程可帮助读者了解对DL的工作原理的高级理解。该教程还解释了一个逐步的程序，讲述了如何为诸如水下鱼类监测等挑战性应用开发DL算法。此外，我们还提供了针对鱼类栖息地监测的关键深度学习技术的全面调查，包括分类，计数，定位和细分。此外，我们对水下鱼类数据集进行了公开调查，并比较水下鱼类监测域中的各种DL技术。我们还讨论了鱼类栖息地加工深度学习的新兴领域的一些挑战和机遇。本文是为了作为希望掌握对DL的高级了解，通过遵循我们的分步教程而为其应用开发的海洋科学家的教程，并了解如何发展其研究，以促进他们的研究。努力。同时，它适用于希望调查基于DL的最先进方法的计算机科学家，以进行鱼类栖息地监测。

translated by 谷歌翻译

Computer Vision on X-ray Data in Industrial Production and Security Applications: A survey

Mehdi Rafiei , Jenni Raitoharju , Alexandros Iosifidis

分类：计算机视觉

2022-11-10

X-ray imaging technology has been used for decades in clinical tasks to reveal the internal condition of different organs, and in recent years, it has become more common in other areas such as industry, security, and geography. The recent development of computer vision and machine learning techniques has also made it easier to automatically process X-ray images and several machine learning-based object (anomaly) detection, classification, and segmentation methods have been recently employed in X-ray image analysis. Due to the high potential of deep learning in related image processing applications, it has been used in most of the studies. This survey reviews the recent research on using computer vision and machine learning for X-ray analysis in industrial production and security applications and covers the applications, techniques, evaluation metrics, datasets, and performance comparison of those techniques on publicly available datasets. We also highlight some drawbacks in the published research and give recommendations for future research in computer vision-based X-ray analysis.

translated by 谷歌翻译

Two Decades of Bengali Handwritten Digit Recognition: A Survey

A. B. M. Ashikur Rahman , Md. Bakhtiar Hasan , Sabbir Ahmed , Tasnim Ahmed , Md. Hamjajul Ashmafee , Mohammad Ridwan Kabir , Md. Hasanul Kabir

分类：计算机视觉

2022-06-05

手写数字识别（HDR）是光学特征识别（OCR）领域中最具挑战性的任务之一。不管语言如何，HDR都存在一些固有的挑战，这主要是由于个人跨个人的写作风格的变化，编写媒介和环境的变化，无法在反复编写任何数字等时保持相同的笔触。除此之外，特定语言数字的结构复杂性可能会导致HDR的模棱两可。多年来，研究人员开发了许多离线和在线HDR管道，其中不同的图像处理技术与传统的机器学习（ML）基于基于的和/或基于深度学习（DL）的体系结构相结合。尽管文献中存在有关HDR的广泛审查研究的证据，例如：英语，阿拉伯语，印度，法尔西，中文等，但几乎没有对孟加拉人HDR（BHDR）的调查，这缺乏对孟加拉语HDR（BHDR）的研究，而这些调查缺乏对孟加拉语HDR（BHDR）的研究。挑战，基础识别过程以及可能的未来方向。在本文中，已经分析了孟加拉语手写数字的特征和固有的歧义，以及二十年来最先进的数据集的全面见解和离线BHDR的方法。此外，还详细讨论了一些涉及BHDR的现实应用特定研究。本文还将作为对离线BHDR背后科学感兴趣的研究人员的汇编，煽动了对相关研究的新途径的探索，这可能会进一步导致在不同应用领域对孟加拉语手写数字进行更好的离线认识。

translated by 谷歌翻译

Deep learning and machine learning for Malaria detection: overview, challenges and future directions

Imen Jdey , Ghazala Hcini , Hela Ltifi

分类：机器学习 | 人工智能

2022-09-27

为了产生最大的影响，必须使用基于证据的决策制定公共卫生计划。创建机器学习算法是为了收集，存储，处理和分析数据以提供知识和指导决策。任何监视系统的关键部分是图像分析。截至最近，计算机视觉和机器学习的社区最终对此感到好奇。这项研究使用各种机器学习和图像处理方法来检测和预测疟疾疾病。在我们的研究中，我们发现了深度学习技术作为具有更广泛适用于疟疾检测的智能工具的潜力，通过协助诊断病情，可以使医生受益。我们研究了针对计算机框架和组织的深度学习的共同限制，计算需要准备数据，准备开销，实时执行和解释能力，并发现对这些限制的轴承的未来询问。

translated by 谷歌翻译

Review On Deep Learning Technique For Underwater Object Detection

Radhwan Adnan Dakhil , Ali Retha Hasoon Khayeat

分类：计算机视觉

2022-09-21

水下结构的维修和维护以及海洋科学在很大程度上依赖于水下对象检测的结果，这是图像处理工作流程的关键部分。尽管已经提出了许多基于计算机视觉的方法，但还没有人开发出一种可靠，准确地检测并对深海中发现的物体和动物进行分类的系统。这主要是由于障碍物在水下环境中散射和吸收光线。随着深度学习的引入，科学家们已经能够解决广泛的问题，包括保护海洋生态系统，在紧急情况下挽救生命，防止水下灾难，并发现，汤匙和识别水下目标。但是，这些深度学习系统的好处和缺点仍然未知。因此，本文的目的是提供在水下对象检测中使用的数据集的概述，并介绍为此目的所采用的算法的优势和缺点的讨论。

translated by 谷歌翻译

Less is More: Lighter and Faster Deep Neural Architecture for Tomato Leaf Disease Classification

Sabbir Ahmed , Md. Bakhtiar Hasan , Tasnim Ahmed , Redwan Karim Sony , Md. Hasanul Kabir

分类：计算机视觉 | 机器学习

2021-09-06

为了确保全球粮食安全和利益相关者的总体利润，正确检测和分类植物疾病的重要性至关重要。在这方面，基于深度学习的图像分类的出现引入了大量解决方案。但是，这些解决方案在低端设备中的适用性需要快速，准确和计算廉价的系统。这项工作提出了一种基于轻巧的转移学习方法，用于从番茄叶中检测疾病。它利用一种有效的预处理方法来增强具有照明校正的叶片图像，以改善分类。我们的系统使用组合模型来提取功能，该模型由预审计的MobilenETV2体系结构和分类器网络组成，以进行有效的预测。传统的增强方法被运行时的增加取代，以避免数据泄漏并解决类不平衡问题。来自PlantVillage数据集的番茄叶图像的评估表明，所提出的体系结构可实现99.30％的精度，型号大小为9.60mb和4.87亿个浮点操作，使其成为低端设备中现实生活的合适选择。我们的代码和型号可在https://github.com/redwankarimsony/project-tomato中找到。

translated by 谷歌翻译

Fruit Ripeness Classification: a Survey

Matteo Rizzo , Matteo Marcuzzo , Alessandro Zangari , Andrea Gasparetto , Andrea Albarelli

分类：计算机视觉 | 机器学习

2022-12-29

Fruit is a key crop in worldwide agriculture feeding millions of people. The standard supply chain of fruit products involves quality checks to guarantee freshness, taste, and, most of all, safety. An important factor that determines fruit quality is its stage of ripening. This is usually manually classified by experts in the field, which makes it a labor-intensive and error-prone process. Thus, there is an arising need for automation in the process of fruit ripeness classification. Many automatic methods have been proposed that employ a variety of feature descriptors for the food item to be graded. Machine learning and deep learning techniques dominate the top-performing methods. Furthermore, deep learning can operate on raw data and thus relieve the users from having to compute complex engineered features, which are often crop-specific. In this survey, we review the latest methods proposed in the literature to automatize fruit ripeness classification, highlighting the most common feature descriptors they operate on.

translated by 谷歌翻译

Data-Efficient Classification of Radio Galaxies

Ashwin Samudre , Lijo George , Mahak Bansal , Yogesh Wadadekar

分类：机器学习

2020-11-26

无线电星系的连续排放通常可以分为不同的形态学类，如FRI，Frii，弯曲或紧凑。在本文中，我们根据使用深度学习方法使用小规模数据集的深度学习方法来探讨基于形态的无线电星系分类的任务（$ \ SIM 2000 $ Samples）。我们基于双网络应用了几次射击学习技术，并使用预先培训的DENSENET模型进行了先进技术的传输学习技术，如循环学习率和歧视性学习迅速训练模型。我们使用最佳表演模型实现了超过92 \％的分类准确性，其中最大的混乱来源是弯曲和周五型星系。我们的结果表明，专注于一个小但策划数据集随着使用最佳实践来训练神经网络可能会导致良好的结果。自动分类技术对于即将到来的下一代无线电望远镜的调查至关重要，这预计将在不久的将来检测数十万个新的无线电星系。

translated by 谷歌翻译

Human Gender Prediction Based on Deep Transfer Learning from Panoramic Radiograph Images

I. Atas

分类：计算机视觉

2022-05-19

全景牙科射线照相（PDR）图像处理是法医医学中最广泛使用的方法之一。深度学习模型由于其高处理速度，准确性和稳定性而被广泛用于当今放射学图像的自动分析。提出了一些使用转移学习的方法来分类PDR图像。在这项研究中，使用了Densenet121卷积神经网络（CNN）分类器，该分类器是预先训练的深度学习体系结构之一。提出的Densenet121网络已在最后一层之前进行了几层扩展和微调，以提高其从数据中理解更复杂模式的能力。在此阶段结束时，它已经通过包含PDR图像的牙科数据集进行了培训，并变得更有经验。采用了K折的交叉验证方法来提高所提出的Densenet121模型的准确性。在这项研究中，对于4,800个测试数据集的分类精度为97.25％，实现了最佳性能。提出的模型以及基于Grad-CAM的分析还表明，下颌骨和牙齿是性别分类中最重要的领域。

translated by 谷歌翻译

Rice Diseases Detection and Classification Using Attention Based Neural Network and Bayesian Optimization

Yibin Wang , Haifeng Wang , Zhaohua Peng

分类：计算机视觉

2022-01-03

在该研究中，提出了一种具有贝叶斯优化（ADSNN-BO）的关注深度可分离的神经网络，以检测和分类稻米图像的水稻疾病。水稻疾病经常导致20至40％的公司生产损失的产量，与全球经济有关。快速疾病鉴定对于计划及时计划治疗并减少CORP损失至关重要。水稻疾病诊断仍然主要是手动进行的。为实现AI辅助快速准确的疾病检测，我们提出了基于MobileNet结构的Adsnn-Bo模型和增强注意机制。此外，贝叶斯优化方法应用于调整模型的超级参数。交叉验证的分类实验是基于公共米病数据集进行的，总共有四个类别。实验结果表明，我们的移动兼容ADSNN-BO模型实现了94.65 \％的测试精度，这占据了所有最先进的模型。为了检查我们所提出的模型的可解释性，还进行了包括激活图和过滤器可视化方法的特征分析。结果表明，我们提出的基于关注机制可以更有效地引导Adsnn-Bo模型学习信息性功能。本研究的结果将促进农业领域快速植物疾病诊断和控制的人工智能。

translated by 谷歌翻译

A Comparison Study of Deep CNN Architecture in Detecting of Pneumonia

Al Mohidur Rahman Porag , Md. Mahedi Hasan , Dr. Md Taimur Ahad

分类：计算机视觉 | 机器学习

2022-12-30

Pneumonia, a respiratory infection brought on by bacteria or viruses, affects a large number of people, especially in developing and impoverished countries where high levels of pollution, unclean living conditions, and overcrowding are frequently observed, along with insufficient medical infrastructure. Pleural effusion, a condition in which fluids fill the lung and complicate breathing, is brought on by pneumonia. Early detection of pneumonia is essential for ensuring curative care and boosting survival rates. The approach most usually used to diagnose pneumonia is chest X-ray imaging. The purpose of this work is to develop a method for the automatic diagnosis of bacterial and viral pneumonia in digital x-ray pictures. This article first presents the authors' technique, and then gives a comprehensive report on recent developments in the field of reliable diagnosis of pneumonia. In this study, here tuned a state-of-the-art deep convolutional neural network to classify plant diseases based on images and tested its performance. Deep learning architecture is compared empirically. VGG19, ResNet with 152v2, Resnext101, Seresnet152, Mobilenettv2, and DenseNet with 201 layers are among the architectures tested. Experiment data consists of two groups, sick and healthy X-ray pictures. To take appropriate action against plant diseases as soon as possible, rapid disease identification models are preferred. DenseNet201 has shown no overfitting or performance degradation in our experiments, and its accuracy tends to increase as the number of epochs increases. Further, DenseNet201 achieves state-of-the-art performance with a significantly a smaller number of parameters and within a reasonable computing time. This architecture outperforms the competition in terms of testing accuracy, scoring 95%. Each architecture was trained using Keras, using Theano as the backend.

translated by 谷歌翻译

Convolutional neural networks and multi-threshold analysis for contamination detection in the apparel industry

Marco Boresta , Tommaso Colombo , Alberto De Santis

分类：计算机视觉

2022-07-26

在现代纺织工业中，服装项目的质量控制是必须的，因为消费者对最高标准的意识和期望不断增加，以支持可持续和道德的纺织品。从原材料到盒装股票，可以通过检查产品在其整个生命周期中检查其质量水平。检查可能包括颜色阴影测试，紧固件疲劳测试，织物称重测试，污染测试等。这项工作专门针对成品中小零件给出的污染物的自动检测，例如原材料，例如小石头和塑料碎片或材料从施工过程中，例如整针或夹子。识别是通过对项目的X射线图像进行两级处理来执行的：在第一个中，多阈值分析识别灰度和形状属性的污染；第二层由一个深度学习分类器组成，该分类器经过训练，以区分真正的阳性和误报。由于结果满足了该过程的技术规范，即自动检测器成功地部署在实际生产工厂中，即小于3％的虚假负面因素和小于15％的虚假阳性。

translated by 谷歌翻译

Object Detection with Deep Learning: A Review

Zhong-Qiu Zhao , Peng Zheng , Shou-tao Xu , Xindong Wu

分类：

2018-07-15

Due to object detection's close relationship with video analysis and image understanding, it has attracted much research attention in recent years. Traditional object detection methods are built on handcrafted features and shallow trainable architectures. Their performance easily stagnates by constructing complex ensembles which combine multiple low-level image features with high-level context from object detectors and scene classifiers. With the rapid development in deep learning, more powerful tools, which are able to learn semantic, high-level, deeper features, are introduced to address the problems existing in traditional architectures. These models behave differently in network architecture, training strategy and optimization function, etc. In this paper, we provide a review on deep learning based object detection frameworks. Our review begins with a brief introduction on the history of deep learning and its representative tool, namely Convolutional Neural Network (CNN). Then we focus on typical generic object detection architectures along with some modifications and useful tricks to improve detection performance further. As distinct specific detection tasks exhibit different characteristics, we also briefly survey several specific tasks, including salient object detection, face detection and pedestrian detection. Experimental analyses are also provided to compare various methods and draw some meaningful conclusions. Finally, several promising directions and tasks are provided to serve as guidelines for future work in both object detection and relevant neural network based learning systems.

translated by 谷歌翻译

Real-Time Oil Leakage Detection on Aftermarket Motorcycle Damping System with Convolutional Neural Networks

Federico Bianchi , Stefano Speziali , Andrea Marini , Massimiliano Proietti , Lorenzo Menculini , Alberto Garinei , Gabriele Bellani , Marcello Marconi

分类：计算机视觉

2022-08-10

在这项工作中，我们详细描述了深度学习和计算机视觉如何帮助检测AirTender系统的故障事件，AirTender系统是售后摩托车阻尼系统组件。监测飞行员运行的最有效方法之一是在其表面上寻找油污渍。从实时图像开始，首先在摩托车悬架系统中检测到Airtender，然后二进制分类器确定Airtender是否在溢出油。该检测是在YOLO5架构的帮助下进行的，而分类是在适当设计的卷积神经网络油网40的帮助下进行的。为了更清楚地检测油的泄漏，我们用荧光染料稀释了荧光染料，激发波长峰值约为390 nm。然后用合适的紫外线LED照亮飞行员。整个系统是设计低成本检测设置的尝试。船上设备（例如迷你计算机）被放置在悬架系统附近，并连接到全高清摄像头框架架上。板载设备通过我们的神经网络算法，然后能够将AirTender定位并分类为正常功能（非泄漏图像）或异常（泄漏图像）。

translated by 谷歌翻译

Breast Cancer Classification Based on Histopathological Images Using a Deep Learning Capsule Network

Hayder A. Khikani , Naira Elazab , Ahmed Elgarayhi , Mohammed Elmogy , Mohammed Sallah

分类：计算机视觉

2022-08-01

乳腺癌是女性可能发生的最严重的癌症之一。通过分析组织学图像（HIS）来自动诊断乳腺癌对患者及其预后很重要。他的分类为临床医生提供了对疾病的准确了解，并使他们可以更有效地治疗患者。深度学习（DL）方法已成功地用于各种领域，尤其是医学成像，因为它们有能力自动提取功能。这项研究旨在使用他的乳腺癌对不同类型的乳腺癌进行分类。在这项研究中，我们提出了一个增强的胶囊网络，该网络使用RES2NET块和四个额外的卷积层提取多尺度特征。此外，由于使用了小的卷积内核和RES2NET块，因此所提出的方法具有较少的参数。结果，新方法的表现优于旧方法，因为它会自动学习最佳功能。测试结果表明该模型的表现优于先前的DL方法。

translated by 谷歌翻译

Computer vision system to count crustacean larvae

Chen Rothschild

分类：计算机视觉

2022-09-13

截至2017年，鱼类产品约占全球人类饮食的16％。计数作用是生产和生产这些产品的重要组成部分。种植者必须准确计算鱼类，以便这样做技术解决方案。开发了两个计算机视觉系统，以自动计算在工业池塘中生长的甲壳类幼虫。第一个系统包括带有3024x4032分辨率的iPhone 11摄像头，该摄像头在室内条件下从工业池塘中获取图像。使用该系统进行了两次实验，第一部实验包括在一天的增长阶段，在9,10的一天中使用iPhone 11相机在特定照明条件下获得的200张图像。在第二个实验中，用两个设备iPhone 11和索尼DSCHX90V摄像机拍摄了一个幼虫工业池。使用第一个设备（iPhone 11）测试了两个照明条件。在每种情况下，都获得了110张图像。该系统的准确性为88.4％的图像检测。第二个系统包括DSLR Nikon D510相机，具有2000x2000分辨率，在工业池塘外进行了七次实验。在幼虫生长阶段的第1天获取图像，从而获得了总共700张图像。该系统的密度为50的精度为86％。一种基于Yolov5 CNN模型开发的算法，该算法自动计算两种情况的幼虫数量。此外，在这项研究中，开发了幼虫生长函数。每天，从工业池塘手动取几个幼虫，并在显微镜下进行分析。确定生长阶段后，就获得了幼虫的图像。每个幼虫的长度都是通过图像手动测量的。最合适的模型是Gompertz模型，其拟合指数的良好性r平方为0.983。

translated by 谷歌翻译

A Novel Enhanced Convolution Neural Network with Extreme Learning Machine: Facial Emotional Recognition in Psychology Practices

Nitesh Banskota , Abeer Alsadoon , P. W. C. Prasad , Ahmed Dawoud , Tarik A. Rashid , Omar Hisham Alsadoon

分类：计算机视觉 | 机器学习 | 神经与进化计算

2022-08-05

面部情感识别是识别心理学用来诊断患者的重要工具之一。面部和面部情感识别是机器学习卓越的领域。由于不同的环境，例如照明条件，姿势变化，偏航运动和遮挡，面部情绪识别是对数字图像处理的开放挑战。深度学习方法已显示出图像识别的显着改善。但是，准确性和时间仍然需要改进。这项研究旨在在训练期间提高面部情绪识别的准确性，并使用Extreme Learning Machine（CNNeelm）增强的修改后的卷积神经网络减少处理时间。该系统需要（CNNeelm）提高培训期间图像注册的准确性。此外，该系统通过拟议的CNNeelm模型认识到六种面部情绪快乐，悲伤，厌恶，恐惧，惊喜和中立。研究表明，与经过改进的随机梯度下降（SGD）技术相比，总体面部情绪识别精度的提高了2％。借助Extreme Learning Machine（ELM）分类器，处理时间从113ms中降至65ms，可以从20fps的视频剪辑中平滑地对每个帧进行分类。使用预先训练的InceptionV3模型，建议使用JAFFE，CK+和FER2013表达数据集训练所提出的CNNeelm模型。仿真结果显示出准确性和处理时间的显着改善，使该模型适合视频分析过程。此外，该研究解决了处理面部图像所需的大量处理时间的问题。

translated by 谷歌翻译

Proceedings of the 3rd International Workshop on Reading Music Systems

Jorge Calvo-Zaragoza , Alexander Pacha

分类：计算机视觉 | 机器学习

2022-12-01

The International Workshop on Reading Music Systems (WoRMS) is a workshop that tries to connect researchers who develop systems for reading music, such as in the field of Optical Music Recognition, with other researchers and practitioners that could benefit from such systems, like librarians or musicologists. The relevant topics of interest for the workshop include, but are not limited to: Music reading systems; Optical music recognition; Datasets and performance evaluation; Image processing on music scores; Writer identification; Authoring, editing, storing and presentation systems for music scores; Multi-modal systems; Novel input-methods for music to produce written music; Web-based Music Information Retrieval services; Applications and projects; Use-cases related to written music. These are the proceedings of the 3rd International Workshop on Reading Music Systems, held in Alicante on the 23rd of July 2021.

translated by 谷歌翻译