智能论文笔记

Semi-Automatic Labeling and Semantic Segmentation of Gram-Stained Microscopic Images from DIBaS Dataset

Chethan Reddy G. P. , Pullagurla Abhijith Reddy , Vidyashree R. Kanabur , Deepu Vijayasenan , Sumam S. David , Sreejith Govindan

分类：计算机视觉

2022-08-23

在本文中，使用聚类和阈值算法实现了DIBA数据集细菌属和物种的半自动注释。深度学习模型经过训练，以实现细菌物种的语义分割和分类。分类精度达到95％。深度学习模型在生物医学图像处理中发现了巨大的应用。从革兰氏阴性微观图像中自动分割细菌对于诊断呼吸道和尿路感染，检测癌症等至关重要。深度学习将有助于生物学家在更少的时间内获得可靠的结果。此外，可以减少许多人类干预措施。这项工作可能有助于检测尿液涂片图像，痰液涂片图像等的细菌，以诊断尿路感染，结核病，肺炎等。

translated by 谷歌翻译

Computer Vision on X-ray Data in Industrial Production and Security Applications: A survey

Mehdi Rafiei , Jenni Raitoharju , Alexandros Iosifidis

分类：计算机视觉

2022-11-10

X-ray imaging technology has been used for decades in clinical tasks to reveal the internal condition of different organs, and in recent years, it has become more common in other areas such as industry, security, and geography. The recent development of computer vision and machine learning techniques has also made it easier to automatically process X-ray images and several machine learning-based object (anomaly) detection, classification, and segmentation methods have been recently employed in X-ray image analysis. Due to the high potential of deep learning in related image processing applications, it has been used in most of the studies. This survey reviews the recent research on using computer vision and machine learning for X-ray analysis in industrial production and security applications and covers the applications, techniques, evaluation metrics, datasets, and performance comparison of those techniques on publicly available datasets. We also highlight some drawbacks in the published research and give recommendations for future research in computer vision-based X-ray analysis.

translated by 谷歌翻译

PlasmoID: A dataset for Indonesian malaria parasite detection and segmentation in thin blood smear

Hanung Adi Nugroho , Rizki Nurfauzi , E. Elsa Herdiana Murhandarwati , Purwono Purwono

分类：计算机视觉

2022-11-28

Indonesia holds the second-highest-ranking country for the highest number of malaria cases in Southeast Asia. A different malaria parasite semantic segmentation technique based on a deep learning approach is an alternative to reduce the limitations of traditional methods. However, the main problem of the semantic segmentation technique is raised since large parasites are dominant, and the tiny parasites are suppressed. In addition, the amount and variance of data are important influences in establishing their models. In this study, we conduct two contributions. First, we collect 559 microscopic images containing 691 malaria parasites of thin blood smears. The dataset is named PlasmoID, and most data comes from rural Indonesia. PlasmoID also provides ground truth for parasite detection and segmentation purposes. Second, this study proposes a malaria parasite segmentation and detection scheme by combining Faster RCNN and a semantic segmentation technique. The proposed scheme has been evaluated on the PlasmoID dataset. It has been compared with recent studies of semantic segmentation techniques, namely UNet, ResFCN-18, DeepLabV3, DeepLabV3plus and ResUNet-18. The result shows that our proposed scheme can improve the segmentation and detection of malaria parasite performance compared to original semantic segmentation techniques.

translated by 谷歌翻译

HyperionSolarNet: Solar Panel Detection from Aerial Images

Poonam Parhar , Ryan Sawasaki , Alberto Todeschini , Colorado Reed , Hossein Vahabi , Nathan Nusaputra , Felipe Vergara

分类：计算机视觉

2022-01-06

随着全球气候变化影响影响世界的影响，需要集体努力来减少温室气体排放。能源部门是气候变化的最大贡献者，许多努力集中在减少对碳源发电厂的依赖，并转向可再生能源，如太阳能。太阳能电池板位置的全面数据库对于协助分析师和政策制定者来说，在定义太阳能的进一步扩展方面的策略方面很重要。在本文中，我们专注于创建太阳能电池板的世界地图。我们识别给定地理区域内的太阳能电池板的位置和总表面积。我们使用深度学习方法来使用空中图像自动检测太阳能电池板位置及其表面积。该框架由使用具有语义分割模型的串联串联使用图像分类器的双分支模型组成的框架在我们创建的卫星图像的日数据集上培训。我们的作品提供了一种用于检测太阳能电池板的高效和可扩展的方法，实现分类的精度为0.96，并且对于分割性能，IOU分数为0.82。

translated by 谷歌翻译

A Weakly-Supervised Surface Crack Segmentation Method using Localisation with a Classifier and Thresholding

Jacob König , Mark Jenkins , Mike Mannion , Peter Barrie , Gordon Morison

分类：计算机视觉

2021-09-01

如今，表面裂缝是公共基础设施的常见景象。最近的工作通过支持使用背景曲面裂缝的机器学习方法支持结构维护措施，解决了这个问题，使它们易于本地化。然而，这些方法的常见问题是创建一个良好的运行算法，训练数据需要详细地注释属于裂缝的像素。我们的工作提出了一种弱监督的方法，它利用CNN分类器来创建曲面裂纹分割图。我们使用此分类器通过使用其类激活映射和基于贴片的分类方法来创建粗糙的裂缝本地化地图，并用基于阈值的方法熔断器来融合它，以分段为大多数较暗的裂纹像素。分类器有助于抑制背景区域的噪声，这通常是通过标准阈值处理方法被错误地突出显示的裂缝。我们专注于我们的方法的易于实现，并且显示在几个表面裂纹数据集上表现良好，即使用于训练的唯一数据是简单的分类标签，也可以有效地进行分割裂缝。

translated by 谷歌翻译

AlertTrap: A study on object detection in remote insects trap monitoring system using on-the-edge deep learning platform

An D. Le , Duy A. Pham , Dong T. Pham , Hien B. Vo

分类：计算机视觉

2021-12-26

水果苍蝇是果实产量最有害的昆虫物种之一。在AlertTrap中，使用不同的最先进的骨干功能提取器（如MobiLenetv1和MobileNetv2）的SSD架构的实现似乎是实时检测问题的潜在解决方案。SSD-MobileNetv1和SSD-MobileNetv2表现良好并导致AP至0.5分别为0.957和1.0。YOLOV4-TINY优于SSD家族，在AP@0.5中为1.0;但是，其吞吐量速度略微慢。

translated by 谷歌翻译

Applications of Deep Learning in Fish Habitat Monitoring: A Tutorial and Survey

Alzayat Saleh , Marcus Sheaves , Dean Jerry , Mostafa Rahimi Azghadi

分类：计算机视觉

2022-06-11

海洋生态系统及其鱼类栖息地越来越重要，因为它们在提供有价值的食物来源和保护效果方面的重要作用。由于它们的偏僻且难以接近自然，因此通常使用水下摄像头对海洋环境和鱼类栖息地进行监测。这些相机产生了大量数字数据，这些数据无法通过当前的手动处理方法有效地分析，这些方法涉及人类观察者。 DL是一种尖端的AI技术，在分析视觉数据时表现出了前所未有的性能。尽管它应用于无数领域，但仍在探索其在水下鱼类栖息地监测中的使用。在本文中，我们提供了一个涵盖DL的关键概念的教程，该教程可帮助读者了解对DL的工作原理的高级理解。该教程还解释了一个逐步的程序，讲述了如何为诸如水下鱼类监测等挑战性应用开发DL算法。此外，我们还提供了针对鱼类栖息地监测的关键深度学习技术的全面调查，包括分类，计数，定位和细分。此外，我们对水下鱼类数据集进行了公开调查，并比较水下鱼类监测域中的各种DL技术。我们还讨论了鱼类栖息地加工深度学习的新兴领域的一些挑战和机遇。本文是为了作为希望掌握对DL的高级了解，通过遵循我们的分步教程而为其应用开发的海洋科学家的教程，并了解如何发展其研究，以促进他们的研究。努力。同时，它适用于希望调查基于DL的最先进方法的计算机科学家，以进行鱼类栖息地监测。

translated by 谷歌翻译

Image Translation Based Nuclei Segmentation for Immunohistochemistry Images

Roger Trullo , Quoc-Anh Bui , Qi Tang , Reza Olfati-Saber

分类：计算机视觉 | 机器学习

2022-08-12

已经开发了许多基于深度学习的方法，用于用于H＆E图像的核分割，并已接近人类的表现。但是，将这种方法直接应用于另一种图像方式，例如免疫组织化学（IHC）图像，可能无法实现令人满意的性能。因此，我们开发了一种基于生成的对抗网络（GAN）方法，以将IHC图像转换为H＆E图像，同时保留核位置和形态，然后将预训练的核分割模型应用于虚拟H＆E图像。我们证明了所提出的方法比几种基线方法更好地工作，包括直接应用对H＆E培训的细胞核分割方法，例如Cellpose和Hover-Net，并使用两个公共IHC图像数据集进行了培训。

translated by 谷歌翻译

Cell segmentation from telecentric bright-field transmitted light microscopy images using a Residual Attention U-Net: a case study on HeLa line

Ali Ghaznavi , Renata Rychtarikova , Mohammadmehdi Saberioon , Dalibor Stys

分类：计算机视觉

2022-03-23

由于图像的复杂性和活细胞的时间变化，来自明亮场光显微镜图像的活细胞分割具有挑战性。最近开发的基于深度学习（DL）的方法由于其成功和有希望的结果而在医学和显微镜图像分割任务中变得流行。本文的主要目的是开发一种基于U-NET的深度学习方法，以在明亮场传输光学显微镜中分割HeLa系的活细胞。为了找到适合我们数据集的最合适的体系结构，提出了剩余的注意U-net，并将其与注意力和简单的U-NET体系结构进行了比较。注意机制突出了显着的特征，并抑制了无关图像区域中的激活。残余机制克服了消失的梯度问题。对于简单，注意力和剩余的关注U-NET，我们数据集的平均值得分分别达到0.9505、0.9524和0.9530。通过将残留和注意机制应用在一起，在平均值和骰子指标中实现了最准确的语义分割结果。应用的分水岭方法适用于这种最佳的（残留的关注）语义分割结果，使每个单元格的特定信息进行了分割。

translated by 谷歌翻译

Weed Recognition using Deep Learning Techniques on Class-imbalanced Imagery

A S M Mahmudul Hasan , Ferdous Sohel , Dean Diepeveen , Hamid Laga , Michael G. K. Jones

分类：计算机视觉 | 人工智能

2021-12-15

大多数杂草物种都会通过竞争高价值作物所需的营养而产生对农业生产力的不利影响。手动除草对于大型种植区不实用。已经开展了许多研究，为农业作物制定了自动杂草管理系统。在这个过程中，其中一个主要任务是识别图像中的杂草。但是，杂草的认可是一个具有挑战性的任务。它是因为杂草和作物植物的颜色，纹理和形状类似，可以通过成像条件，当记录图像时的成像条件，地理或天气条件进一步加剧。先进的机器学习技术可用于从图像中识别杂草。在本文中，我们调查了五个最先进的深神经网络，即VGG16，Reset-50，Inception-V3，Inception-Resnet-V2和MobileNetv2，并评估其杂草识别的性能。我们使用了多种实验设置和多个数据集合组合。特别是，我们通过组合几个较小的数据集，通过数据增强构成了一个大型DataSet，缓解了类别不平衡，并在基于深度神经网络的基准测试中使用此数据集。我们通过保留预先训练的权重来调查使用转移学习技术来利用作物和杂草数据集的图像提取特征和微调它们。我们发现VGG16比小规模数据集更好地执行，而ResET-50比其他大型数据集上的其他深网络更好地执行。

translated by 谷歌翻译

A Hyperspectral and RGB Dataset for Building Facade Segmentation

Nariman Habili , Ernest Kwan , Weihao Li , Christfried Webers , Jeremy Oorloff , Mohammad Ali Armin , Lars Petersson

分类：计算机视觉

2022-12-06

Hyperspectral Imaging (HSI) provides detailed spectral information and has been utilised in many real-world applications. This work introduces an HSI dataset of building facades in a light industry environment with the aim of classifying different building materials in a scene. The dataset is called the Light Industrial Building HSI (LIB-HSI) dataset. This dataset consists of nine categories and 44 classes. In this study, we investigated deep learning based semantic segmentation algorithms on RGB and hyperspectral images to classify various building materials, such as timber, brick and concrete.

translated by 谷歌翻译

Treatment classification of posterior capsular opacification (PCO) using automated ground truths

Raisha Shrestha , Waree Kongprawechnon , Teesid Leelasawassuk , Nattapon Wongcumchang , Oliver Findl , Nino Hirnschall

分类：计算机视觉

2022-11-11

Determination of treatment need of posterior capsular opacification (PCO)-- one of the most common complication of cataract surgery -- is a difficult process due to its local unavailability and the fact that treatment is provided only after PCO occurs in the central visual axis. In this paper we propose a deep learning (DL)-based method to first segment PCO images then classify the images into \textit{treatment required} and \textit{not yet required} cases in order to reduce frequent hospital visits. To train the model, we prepare a training image set with ground truths (GT) obtained from two strategies: (i) manual and (ii) automated. So, we have two models: (i) Model 1 (trained with image set containing manual GT) (ii) Model 2 (trained with image set containing automated GT). Both models when evaluated on validation image set gave Dice coefficient value greater than 0.8 and intersection-over-union (IoU) score greater than 0.67 in our experiments. Comparison between gold standard GT and segmented results from our models gave a Dice coefficient value greater than 0.7 and IoU score greater than 0.6 for both the models showing that automated ground truths can also result in generation of an efficient model. Comparison between our classification result and clinical classification shows 0.98 F2-score for outputs from both the models.

translated by 谷歌翻译

Weakly Supervised Deep Instance Nuclei Detection using Points Annotation in 3D Cardiovascular Immunofluorescent Images

Nazanin Moradinasab , Yash Sharma , Laura S. Shankman , Gary K. Owens , Donald E. Brown

分类：计算机视觉 | 人工智能

2022-07-29

美国和全球的两个主要死亡原因是中风和心肌梗塞。两者的根本原因是由破裂或侵蚀的不稳定的动脉粥样硬化斑块释放的，这些斑块阻塞了心脏（心肌梗塞）或大脑（中风）的血管。临床研究表明，在斑块破裂或侵蚀事件中，斑块组成比病变大小更重要。为了确定斑块组成，计算了3D心血管免疫荧光图像的各种细胞类型的斑块病变。但是，手动计算这些细胞是昂贵的，耗时的，并且容易发生人为错误。手动计数的这些挑战激发了对自动化方法进行定位和计算图像中细胞的需求。这项研究的目的是开发一种自动方法，以最少的注释工作在3D免疫荧光图像中准确检测和计数细胞。在这项研究中，我们使用弱监督的学习方法使用点注释来训练悬停网络分割模型，以检测荧光图像中的核。使用点注释的优点是，与像素的注释相比，它们需要更少的精力。为了使用点注释训练悬停的网络模型，我们采用了一种普遍使用的群集标记方法，将点注释转换为精确的细胞核二进制掩模。传统上，这些方法从点注释产生了二进制面具，使该物体周围的区域未标记（通常在模型训练中被忽略）。但是，这些区域可能包含重要信息，有助于确定细胞之间的边界。因此，我们在这些区域使用了熵最小化的损失函数，以鼓励模型在未标记区域上输出更自信的预测。我们的比较研究表明，使用我们的弱训练的悬停网络模型...

translated by 谷歌翻译

Red Blood Cell Segmentation with Overlapping Cell Separation and Classification on Imbalanced Dataset

Korranat Naruenatthanaset , Thanarat H. Chalidabhongse , Duangdao Palasuwan , Nantheera Anantrasirichai , Attakorn Palasuwan

分类：计算机视觉

2020-12-02

血液涂片图像的自动化红细胞（RBC）分类有助于血液医生在降低的时间和成本下分析RBC实验室的结果。但是，重叠的单元格可能会导致错误的预测结果，因此必须在分类之前将它们分成多个RBC。为了对具有深度学习进行深度学习的多个类，医学成像中的不平衡问题是常见的，因为正常样本总是高于罕见疾病样本。本文提出了一种新方法，用于从血液涂片图像进行分类和分类RBC，专门用于解决细胞重叠和数据不平衡问题。专注于重叠的细胞分离，我们的分割过程首先估计省略号来代表RBC。该方法检测凹点，然后使用指向椭圆拟合找到椭圆点。 20血涂片图像的精度为0.889。分类需要平衡的培训数据集。但是，一些RBC类型很少见。来自20,875个单独的RBC样本的12个RBC课程的该数据集的不平衡比为34.538。因此，使用机器学习与不平衡数据集的RBC分类是比许多其他应用更具挑战性的。我们分析了处理这个问题的技术。最佳精度和F1分数分别使用带增强的有效网络-B1分别为0.921和0.8679。实验结果表明，通过改善少数群体课程的F1分数，增强的重量平衡技术有可能处理不平衡问题，而数据增强显着提高了整体分类性能。

translated by 谷歌翻译

Uncertainty, Edge, and Reverse-Attention Guided Generative Adversarial Network for Automatic Building Detection in Remotely Sensed Images

Somrita Chattopadhyay , Avinash C. Kak

分类：计算机视觉 | 机器学习

2021-12-10

尽管近期基于深度学习的语义细分，但远程感测图像的自动建筑检测仍然是一个具有挑战性的问题，由于全球建筑物的出现巨大变化。误差主要发生在构建足迹的边界，阴影区域，以及检测外表面具有与周围区域非常相似的反射率特性的建筑物。为了克服这些问题，我们提出了一种生成的对抗基于网络的基于网络的分割框架，其具有嵌入在发电机中的不确定性关注单元和改进模块。由边缘和反向关注单元组成的细化模块，旨在精炼预测的建筑地图。边缘注意力增强了边界特征，以估计更高的精度，并且反向关注允许网络探索先前估计区域中缺少的功能。不确定性关注单元有助于网络解决分类中的不确定性。作为我们方法的权力的衡量标准，截至2021年12月4日，它在Deepglobe公共领导板上的第二名，尽管我们的方法的主要重点 - 建筑边缘 - 并不完全对齐用于排行榜排名的指标。 DeepGlobe充满挑战数据集的整体F1分数为0.745。我们还报告了对挑战的Inria验证数据集的最佳成绩，我们的网络实现了81.28％的总体验证，总体准确性为97.03％。沿着同一条线，对于官方Inria测试数据集，我们的网络总体上得分77.86％和96.41％，而且准确性。

translated by 谷歌翻译

An application of Pixel Interval Down-sampling (PID) for dense tiny microorganism counting on environmental microorganism images

Jiawei Zhang , Ning Xu , Chen Li , Md Mamunur Rahaman , Yu-Dong Yao , Yu-Hao Lin , Jinghua Zhang , Tao Jiang , Wenjun Qin , Marcin Grzegorzek

分类：计算机视觉 | 人工智能

2022-04-04

本文提出了一个新颖的像素间隔下采样网络（PID-NET），以较高的精度计算任务，以更高的精度计数任务。 PID-NET是具有编码器架构的端到端卷积神经网络（CNN）模型。像素间隔向下采样操作与最大功能操作相连，以结合稀疏和密集的特征。这解决了计数时茂密物体的轮廓凝结的局限性。使用经典分割指标（骰子，Jaccard和Hausdorff距离）以及计数指标进行评估。实验结果表明，所提出的PID-NET具有最佳的性能和潜力，可以实现密集的微小对象计数任务，该任务在数据集上具有2448个酵母单元图像在数据集上达到96.97 \％的计数精度。通过与最新的方法进行比较，例如注意U-NET，SWIN U-NET和TRANS U-NET，提出的PID-NET可以分割具有更清晰边界和较少不正确的碎屑的密集的微小物体，这表明PID网络在准确计数的任务中的巨大潜力。

translated by 谷歌翻译

Two-phase training mitigates class imbalance for camera trap image classification with CNNs

Farjad Malik , Simon Wouters , Ruben Cartuyvels , Erfan Ghadery , Marie-Francine Moens

分类：计算机视觉 | 机器学习

2021-12-29

通过利用深度学习来自动分类相机陷阱图像，生态学家可以更有效地监测生物多样性保护努力和气候变化对生态系统的影响。由于相机陷阱数据集的不平衡类分布，当前模型偏向于多数类。因此，他们为少数多数课程获得了良好的表现，而是许多少数阶级的表现不佳。我们使用两阶段培训来增加这些少数阶级的表现。我们培训，旁边是基线模型，四个模型，它在高度不平衡快照Serengeti数据集的子集上实现了不同版本的两阶段训练。我们的研究结果表明，两阶段培训可以提高许多少数群体课程的性能，对其他课程的性能有限。我们发现，基于多数欠采样的两阶段培训将等级特定的F1分数增加到3.0％。我们还发现，两阶段培训胜过仅使用过采样或欠采样的F1分数平均使用6.1％。最后，我们发现过度和欠采样的组合导致更好的性能，而不是单独使用它们。

translated by 谷歌翻译

Exploration of Convolutional Neural Network Architectures for Large Region Map Automation

R. M. Tsenov , C. J. Henry , J. L. Storie , C. D. Storie , B. Murray , M. Sokolov

分类：计算机视觉 | 机器学习

2022-11-07

Deep learning semantic segmentation algorithms have provided improved frameworks for the automated production of Land-Use and Land-Cover (LULC) maps, which significantly increases the frequency of map generation as well as consistency of production quality. In this research, a total of 28 different model variations were examined to improve the accuracy of LULC maps. The experiments were carried out using Landsat 5/7 or Landsat 8 satellite images with the North American Land Change Monitoring System labels. The performance of various CNNs and extension combinations were assessed, where VGGNet with an output stride of 4, and modified U-Net architecture provided the best results. Additional expanded analysis of the generated LULC maps was also provided. Using a deep neural network, this work achieved 92.4% accuracy for 13 LULC classes within southern Manitoba representing a 15.8% improvement over published results for the NALCMS. Based on the large regions of interest, higher radiometric resolution of Landsat 8 data resulted in better overall accuracies (88.04%) compare to Landsat 5/7 (80.66%) for 16 LULC classes. This represents an 11.44% and 4.06% increase in overall accuracy compared to previously published NALCMS results, including larger land area and higher number of LULC classes incorporated into the models compared to other published LULC map automation methods.

translated by 谷歌翻译

Less is More: Lighter and Faster Deep Neural Architecture for Tomato Leaf Disease Classification

Sabbir Ahmed , Md. Bakhtiar Hasan , Tasnim Ahmed , Redwan Karim Sony , Md. Hasanul Kabir

分类：计算机视觉 | 机器学习

2021-09-06

为了确保全球粮食安全和利益相关者的总体利润，正确检测和分类植物疾病的重要性至关重要。在这方面，基于深度学习的图像分类的出现引入了大量解决方案。但是，这些解决方案在低端设备中的适用性需要快速，准确和计算廉价的系统。这项工作提出了一种基于轻巧的转移学习方法，用于从番茄叶中检测疾病。它利用一种有效的预处理方法来增强具有照明校正的叶片图像，以改善分类。我们的系统使用组合模型来提取功能，该模型由预审计的MobilenETV2体系结构和分类器网络组成，以进行有效的预测。传统的增强方法被运行时的增加取代，以避免数据泄漏并解决类不平衡问题。来自PlantVillage数据集的番茄叶图像的评估表明，所提出的体系结构可实现99.30％的精度，型号大小为9.60mb和4.87亿个浮点操作，使其成为低端设备中现实生活的合适选择。我们的代码和型号可在https://github.com/redwankarimsony/project-tomato中找到。

translated by 谷歌翻译

Automatic tracing of mandibular canal pathways using deep learning

Mrinal Kanti Dhar , Zeyun Yu

分类：计算机视觉

2021-11-30

医疗行业的需求越来越多，具有自动化系统，用于检测和定位，否则是手动低效的。在牙科，它非常感兴趣地追踪下颌运河的途径。垂直牙龈神经（IAN）的颌骨运河位置的适当定位降低了在牙科植入术期间损坏其的风险。在时间和劳动中，手工检测运河路径不是有效的方式。在这里，我们提出了一种基于深度学习的框架来检测来自CBCT数据的下颌管。这是一个3级过程全自动端到端。在预处理阶段产生地面真理。我们不是使用常用的固定直径管状的地面真理，而是生成下颌运河的中心线，并在培训过程中使用它们作为地面真理。 3D U-Net架构用于模型培训。开发了一种有效的后处理阶段来纠正初始预测。测量精度，召回，F1分数和IOU分析体素级分割性能。然而，为了分析基于距离的测量，计算从地面真理到预测和预测地面真理的平均曲线距离（MCD）。进行广泛的实验以证明模型的有效性。

translated by 谷歌翻译