The task of image segmentation is to classify each pixel in the image based on the appropriate label. Various deep learning approaches have been proposed for image segmentation that offers high accuracy and deep architecture. However, the deep learning technique uses a pixel-wise loss function for the training process. Using pixel-wise loss neglected the pixel neighbor relationships in the network learning process. The neighboring relationship of the pixels is essential information in the image. Utilizing neighboring pixel information provides an advantage over using only pixel-to-pixel information. This study presents regularizers to give the pixel neighbor relationship information to the learning process. The regularizers are constructed by the graph theory approach and topology approach: By graph theory approach, graph Laplacian is used to utilize the smoothness of segmented images based on output images and ground-truth images. By topology approach, Euler characteristic is used to identify and minimize the number of isolated objects on segmented images. Experiments show that our scheme successfully captures pixel neighbor relations and improves the performance of the convolutional neural network better than the baseline without a regularization term.
translated by 谷歌翻译
The deep learning technique was used to increase the performance of single image super-resolution (SISR). However, most existing CNN-based SISR approaches primarily focus on establishing deeper or larger networks to extract more significant high-level features. Usually, the pixel-level loss between the target high-resolution image and the estimated image is used, but the neighbor relations between pixels in the image are seldom used. On the other hand, according to observations, a pixel's neighbor relationship contains rich information about the spatial structure, local context, and structural knowledge. Based on this fact, in this paper, we utilize pixel's neighbor relationships in a different perspective, and we propose the differences of neighboring pixels to regularize the CNN by constructing a graph from the estimated image and the ground-truth image. The proposed method outperforms the state-of-the-art methods in terms of quantitative and qualitative evaluation of the benchmark datasets. Keywords: Super-resolution, Convolutional Neural Networks, Deep Learning
translated by 谷歌翻译
捕获图像的全局拓扑对于提出对其域的准确分割至关重要。但是,大多数现有的分割方法都不能保留给定输入的初始拓扑,这对许多下游基于对象的任务有害。对于大多数在本地尺度上工作的深度学习模型来说,这是更真实的。在本文中,我们提出了一种新的拓扑深度图像分割方法,该方法依赖于新的泄漏损失:Pathloss。我们的方法是Baloss [1]的扩展,其中我们希望改进泄漏检测,以更好地恢复图像分割的接近度。这种损失使我们能够正确定位并修复预测中可能发生的关键点(边界中的泄漏),并基于最短路径搜索算法。这样,损失最小化仅在必要时才能强制连接,并最终提供了图像中对象边界的良好定位。此外,根据我们的研究,与无需使用拓扑损失的方法相比,我们的Pathloss学会了保持更强的细长结构。通过我们的拓扑损失函数培训,我们的方法在两个代表性数据集上优于最先进的拓扑感知方法:电子显微镜和历史图。
translated by 谷歌翻译
本文为异构变化检测(HCD)问题提供了一种新的策略:从图形信号处理(GSP)的角度解决HCD。我们为每个图像构造一个图表以捕获结构信息,并将每个图像视为图形信号。通过这种方式,我们将HCD转换为GSP问题:对两个图上定义的不同系统的响应的比较,试图找到结构性差异(第I部分)和信号差异(第II部分)异质图像之间的变化。在第一部分中,我们用顶点域的GSP分析了HCD。我们首先证明,对于未改变的图像,它们的结构是一致的,然后在两个图上定义的系统上的相同信号的输出相似。但是,一旦区域发生变化,图像的局部结构会发生变化,即包含该区域的顶点的连通性发生变化。然后,我们可以比较通过在两个图上定义的过滤器的相同输入图信号的输出信号以检测更改。我们设计了来自顶点域的不同过滤器,可以灵活地探索原始图中隐藏的高阶邻域信息。我们还从信号传播的角度分析了变化区域对变化检测结果的有害影响。在七个真实数据集上进行的实验显示了基于顶点域滤波的HCD方法的有效性。
translated by 谷歌翻译
这是本文的第二部分,为异质变化检测(HCD)问题提供了新的策略,即从图形信号处理(GSP)的角度解决HCD。我们构造一个图表以表示每个图像的结构,并将每个图像视为图表上定义的图形信号。这样,我们可以将HCD问题转换为图表上定义的系统的信号响应的比较。在第一部分中,通过比较顶点域的图之间的结构差来衡量变化。在本第二部分中,我们分析了来自光谱域的HCD的GSP。我们首先分析同一图上不同图像的光谱特性,并表明它们的光谱表现出共同点和差异。特别是,正是变化导致了光谱的差异。然后,我们提出了HCD的回归模型,该模型将源信号分解为回归信号并更改信号,并且需要回归的信号具有与同一图上的目标信号相同的光谱属性。借助图光谱分析,提出的回归模型是灵活且可扩展的。对七个真实数据集进行的实验显示了该方法的有效性。
translated by 谷歌翻译
本文提出了一个新颖的像素间隔下采样网络(PID-NET),以较高的精度计算任务,以更高的精度计数任务。 PID-NET是具有编码器架构的端到端卷积神经网络(CNN)模型。像素间隔向下采样操作与最大功能操作相连,以结合稀疏和密集的特征。这解决了计数时茂密物体的轮廓凝结的局限性。使用经典分割指标(骰子,Jaccard和Hausdorff距离)以及计数指标进行评估。实验结果表明,所提出的PID-NET具有最佳的性能和潜力,可以实现密集的微小对象计数任务,该任务在数据集上具有2448个酵母单元图像在数据集上达到96.97 \%的计数精度。通过与最新的方法进行比较,例如注意U-NET,SWIN U-NET和TRANS U-NET,提出的PID-NET可以分割具有更清晰边界和较少不正确的碎屑的密集的微小物体,这表明PID网络在准确计数的任务中的巨大潜力。
translated by 谷歌翻译
分割是图像处理的基本操作。卷积操作遭受有限的接收领域,而全球建模是对分段任务的基础。在本文中,我们将图形卷积应用于分割任务,并提出改进的\ Texit {Laplacian}。与现有方法不同,我们的\ Textit {Laplacian}是数据相关的,我们介绍了两个注意力对角线矩阵来学习更好的顶点关系。另外,在执行基于图形的信息传播时,它利用了区域和边界信息。具体地,我们通过学习图表表示的关于不同类的边界意识区域 - 明智相关的模型和原因,其能够操纵沿着物体边界的空间增强的各个区域的长距离语义推理。我们的模型非常适合获得全局语义区域信息,同时也可以同时容纳局部空间边界特征。两种挑战数据集的实验表明,我们的方法优于最先进的方法在结肠镜检查中的息肉中的息肉和光盘和光学杯中的光盘和光学杯在彩色眼底图像上的分割。
translated by 谷歌翻译
晶体中砂岩的晶粒分割从其周围基质/水泥划分薄片是计算机辅助矿物识别和砂岩分类的主要步骤。砂岩的显微图像含有许多矿物颗粒及其周围的基质/水泥。相邻谷物和基质之间的区别通常是模糊的,使晶粒分割困难。文献中存在各种解决方案来处理这些问题;然而,他们对砂岩岩画的不同模式并不强大。在本文中,我们将谷物分割制定为像素 - 明智的两类(即谷物和背景)语义分割任务。我们开发一个基于深度学习的端到端培训框架,名为Deep语义粒度分割网络(DSGSN),数据驱动方法,提供通用解决方案。根据作者的知识,这是探索深度神经网络来解决谷物分割问题的第一个工作。对微观图像的广泛实验强调我们的方法比具有更多参数的各种分段架构获得更好的分割精度。
translated by 谷歌翻译
深度信息在许多图像处理应用程序中是有用的。然而,由于拍摄图像是在2D成像传感器上投射3D场景的过程,因此深度信息嵌入图像中。从图像中提取深度信息是一个具有挑战性的任务。引导原理是由于散焦引起的蓝色水平与物体和焦平面之间的距离有关。基于该原理和广泛使用的假设,即高斯模糊是散焦模糊的良好模型,我们制定了作为高斯模糊分类问题的空间变化散焦模糊的问题。我们通过培训深度神经网络来解决图像补丁中的20级蓝色蓝色之一来解决问题。我们创建了一个超过500000美元的尺寸为32 \ times32 $的数据集,用于培训和测试几种知名网络模型。我们发现MobileNetv2由于其较低的内存要求和高精度而适用于此应用。训练模型用于确定通过施加迭代加权引导滤波器来改进的贴剂模糊。结果是散焦图,其携带每个像素的模糊度的信息。我们将提出的方法与最先进的技术进行比较,我们展示了其在自适应图像增强,散焦倍率和多聚焦图像融合中的成功应用。
translated by 谷歌翻译
与许多研究领域相关的管状网络样结构(例如血管,神经元或道路)的准确分割与许多研究领域有关。对于这种结构,拓扑是它们最重要的特征。特别保留连接性:在血管网络的情况下,缺少连接的容器完全改变了血液流动的动力学。我们介绍了一种新颖的相似性度量,称为Centerlinedice(短CLDICE),该度量是根据分割掩模及其(形态)骨骼的相交进行计算的。从理论上讲,我们证明,CLDICE保证拓扑保存至二进制2D和3D分割的同型等效性。扩展这一点,我们提出了一种计算高效,可区分的损失函数(软性的),用于训练任意的神经分割网络。我们在五个公共数据集上基准了软性损失,包括船只,道路和神经元(2D和3D)。对软性播放的培训可通过更准确的连通性信息,更高的图形相似性和更好的体积分数进行分割。
translated by 谷歌翻译
Deep learning methods have contributed substantially to the rapid advancement of medical image segmentation, the quality of which relies on the suitable design of loss functions. Popular loss functions, including the cross-entropy and dice losses, often fall short of boundary detection, thereby limiting high-resolution downstream applications such as automated diagnoses and procedures. We developed a novel loss function that is tailored to reflect the boundary information to enhance the boundary detection. As the contrast between segmentation and background regions along the classification boundary naturally induces heterogeneity over the pixels, we propose the piece-wise two-sample t-test augmented (PTA) loss that is infused with the statistical test for such heterogeneity. We demonstrate the improved boundary detection power of the PTA loss compared to benchmark losses without a t-test component.
translated by 谷歌翻译
盒子监督的实例分割最近吸引了大量的研究工作,而在空中图像域中则收到很少的关注。与通用物体集合相比,空中对象具有大型内部差异和阶级相似性与复杂的背景。此外,高分辨率卫星图像中存在许多微小的物体。这使得最近的一对亲和力建模方法不可避免地涉及具有劣势的噪声监督。为了解决这些问题,我们提出了一种新颖的空中实例分割方法,该方法驱动网络为空中对象的一系列级别设置功能,只有盒子注释以端到端的方式。具有精心设计的能量函数的级别集方法而不是学习成对亲和力将对象分段视为曲线演进,这能够准确地恢复对象的边界并防止来自无法区分的背景和类似对象的干扰。实验结果表明,所提出的方法优于最先进的盒子监督实例分段方法。源代码可在https://github.com/liwentomng/boxLevelset上获得。
translated by 谷歌翻译
This paper addresses the problem of segmenting an image into regions. We define a predicate for measuring the evidence for a boundary between two regions using a graph-based representation of the image. We then develop an efficient segmentation algorithm based on this predicate, and show that although this algorithm makes greedy decisions it produces segmentations that satisfy global properties. We apply the algorithm to image segmentation using two different kinds of local neighborhoods in constructing the graph, and illustrate the results with both real and synthetic images. The algorithm runs in time nearly linear in the number of graph edges and is also fast in practice. An important characteristic of the method is its ability to preserve detail in low-variability image regions while ignoring detail in high-variability regions.
translated by 谷歌翻译
Superpixels在众多计算机视觉任务中用作强大的预处理工具。通过使用Superpixel表示,图像基元的数量可以大大降低倍数。随着近年来深度学习的兴起,少数作品试图将深受学习的特征/图饲养成现有的经典超像素技术。然而,他们都没有能够在近乎实时生产超像素,这对超像素在实践中适用性至关重要。在这项工作中,我们提出了一个基于图形的基于图形的Superpixel分割框架。在第一阶段,我们介绍了一种高效的深度亲和学习(DAL)网络,通过聚合多尺度信息来学习成对像素亲和力。在第二阶段,我们提出了一种称为分层熵速率分割(HERS)的高效超像素方法。使用来自第一阶段的学习亲和力,HERS构建了一个分层树结构,可以瞬间产生任何数量的高度自适应超像素。我们通过视觉和数值实验证明,我们的方法的有效性和效率与各种最先进的超像素方法相比。
translated by 谷歌翻译
高光谱成像是一种重要的传感技术,具有广泛的应用和环境科学,天气和地理/空间探索的地区的影响。高光谱图像(HSI)处理的一个重要任务是频谱空间特征的提取。利用多层网络(M-GSP)的最近开发的曲线图信号处理,这项工作提出了基于M-GSP特征提取的几种方法对HSI分段的方法。为了捕获联合光谱空间信息,我们首先为HSI定制一个基于张力的多层网络(MLN)模型,并为特征提取定义MLN奇异空间。然后,我们通过利用MLN谱聚类来开发无监督的HSI分段方法。通过MLN的聚类重新组合HSI像素,我们进一步提出了一种基于Superpixels的多分辨率融合的半监控HSI分类。我们的实验结果表明了HSI处理中M-GSP的强度和光谱 - 空间信息提取。
translated by 谷歌翻译
医学成像是检测医学内部并发症的最重要工具。如今,随着图像处理技术的开发以及将照片的大小更改为数字医学成像领域中更高分辨率的图像,有一个有效且准确的系统来细分。由于多种原因,异质性,噪音和对比度的现实世界图像至关重要。医学中的数字图像分割用于诊断和治疗分析,这对医生非常有帮助。在这项研究中,我们旨在更准确地检测肝脏的肝癌照片,因为对肿瘤的准确和及时检测在患者的生存和生命中非常重要。本文的目的是简化与MR图像研究有关的令人讨厌的研究问题。肝脏是转移性疾病最通用的第二个器官,是肝癌是全球死亡的重大原因之一。没有健康的肝脏,一个人将无法生存。这是威胁生命的疾病,对于医学和工程技术人员来说都是非常具有挑战性的。医疗图像处理被用作检测肿瘤的非侵入性方法。具有肝肿瘤生存的机会高度取决于肿瘤的早期检测,然后将其分类为癌性和非癌性肿瘤。用于自动检测大脑的图像处理技术包括预处理和增强,图像分割,分类和体积计算,已开发出用于检测肝肿瘤以及用于肿瘤诊断的不同肝脏肿瘤或不同肝脏TOM或检测方法的方法。检测和诊断肝肿瘤的新方法。
translated by 谷歌翻译
3D图像分割是许多医学分析和识别方案的最新至关重要的步骤。实际上,由于其重要性和影响力,它代表了一个相关的研究主题和基本挑战。本文提供了一个基于深度学习的系统,该系统杂交了各种有效的方法,以获取最佳的3D分割输出。首先,为了减少数据量并加速处理时间,建议并证明了脱节压缩技术的应用。然后,我们使用CNN模型将牙科图像分为15个分离的类。最后,采用特殊的基于KNN的转换,目的是为了去除孤立的网格和校正牙齿形式。实验证明了在私人临床基准内应用于3D牙科图像的所选框架的精度和鲁棒性。
translated by 谷歌翻译
数字病理学是现代医学中最重要的发展之一。病理检查是医疗方案的黄金标准,并在诊断中发挥基本作用。最近,随着数字扫描仪的出现,现在可以将组织组织病理学载玻片数字化并作为数字图像存储。结果,数字化组织病理组织可用于计算机辅助图像分析程序和机器学习技术。核的检测和分割是癌症诊断中的一些基本步骤。最近,深度学习已被用于核细胞分割。然而,核细胞分割的深度学习方法中的一个问题是缺乏斑块的信息。本文提出了深入的基于学习的核细胞分割方法,这解决了补丁边界地区误入歧途的问题。我们使用本地和全局修补程序来预测最终的分割图。多器官组织病理学数据集上的实验结果表明,我们的方法优于基线核细胞分割和流行分割模型。
translated by 谷歌翻译
图像分段是许多图像处理和计算机视觉任务中的重要组成部分。图像分割的主要目标是简化图像以进行更容易的分析,并且有两种广泛的方法来实现这一点:基于边缘的方法,提取特定已知对象的边界,以及基于区域的方法,将图像分区为区域是统计上同质的。一种更突出的边缘查找方法,称为级别设置方法,在具有梯度下降之前在图像平面中演化的零电平轮廓,直到轮廓融合到对象边界。虽然经典水平集合方法及其变体已经证明在分割真实图像中成功,但是在没有先验的图像的情况下,它们易于变得卡在图像平面的噪声区域中,并且它们不能提供超出物体外边界位置的细节。我们提出了对变分级别设置图像分割方法的修改,该方法可以通过利用随机点初始化来快速检测对象边界。我们通过比较我们对真实图像对突出肉体方法的方法来展示我们方法的功效。
translated by 谷歌翻译
Background and Purpose: Colorectal cancer is a common fatal malignancy, the fourth most common cancer in men, and the third most common cancer in women worldwide. Timely detection of cancer in its early stages is essential for treating the disease. Currently, there is a lack of datasets for histopathological image segmentation of rectal cancer, which often hampers the assessment accuracy when computer technology is used to aid in diagnosis. Methods: This present study provided a new publicly available Enteroscope Biopsy Histopathological Hematoxylin and Eosin Image Dataset for Image Segmentation Tasks (EBHI-Seg). To demonstrate the validity and extensiveness of EBHI-Seg, the experimental results for EBHI-Seg are evaluated using classical machine learning methods and deep learning methods. Results: The experimental results showed that deep learning methods had a better image segmentation performance when utilizing EBHI-Seg. The maximum accuracy of the Dice evaluation metric for the classical machine learning method is 0.948, while the Dice evaluation metric for the deep learning method is 0.965. Conclusion: This publicly available dataset contained 5,170 images of six types of tumor differentiation stages and the corresponding ground truth images. The dataset can provide researchers with new segmentation algorithms for medical diagnosis of colorectal cancer, which can be used in the clinical setting to help doctors and patients.
translated by 谷歌翻译