智能论文笔记

Building Segmentation on Satellite Images and Performance of Post-Processing Methods

Metehan Yalçın , Ahmet Alp Kindiroglu , Furkan Burak Bağcı , Ufuk Uyan , Mahiye Uluyağmur Öztürk

分类：计算机视觉

2022-12-28

Researchers are doing intensive work on satellite images due to the information it contains with the development of computer vision algorithms and the ease of accessibility to satellite images. Building segmentation of satellite images can be used for many potential applications such as city, agricultural, and communication network planning. However, since no dataset exists for every region, the model trained in a region must gain generality. In this study, we trained several models in China and post-processing work was done on the best model selected among them. These models are evaluated in the Chicago region of the INRIA dataset. As can be seen from the results, although state-of-art results in this area have not been achieved, the results are promising. We aim to present our initial experimental results of a building segmentation from satellite images in this study.

translated by 谷歌翻译

Semi-Supervised Domain Adaptation for Semantic Segmentation of Roads from Satellite Images

Ahmet Alp Kindiroglu , Metehan Yalçın , Furkan Burak Bağcı , Mahiye Uluyağmur Öztürk

分类：计算机视觉

2022-12-26

This paper presents the preliminary findings of a semi-supervised segmentation method for extracting roads from sattelite images. Artificial Neural Networks and image segmentation methods are among the most successful methods for extracting road data from satellite images. However, these models require large amounts of training data from different regions to achieve high accuracy rates. In cases where this data needs to be of more quantity or quality, it is a standard method to train deep neural networks by transferring knowledge from annotated data obtained from different sources. This study proposes a method that performs path segmentation with semi-supervised learning methods. A semi-supervised field adaptation method based on pseudo-labeling and Minimum Class Confusion method has been proposed, and it has been observed to increase performance in targeted datasets.

translated by 谷歌翻译

Profitable Trade-Off Between Memory and Performance In Multi-Domain Chatbot Architectures

D Emre Tasar , Sukru Ozan , M Fatih Akca , Oguzhan Olmez , Semih Gulum , Secilay Kutay , Ceren Belhan

分类：自然语言处理 | 人工智能

2021-11-06

文本分类问题是自然语言处理领域的一个非常广泛的研究领域。简而言之，文本分类问题是确定给定文本所属的先前确定的哪个类别。在过去的研究中，在这一领域进行了成功的研究。在该研究中，使用用于变压器（BERT）的双向编码器表示，其是用于解决自然语言处理领域中的分类问题的常用方法。通过通过在Chatbot架构中使用的单个模型来解决分类问题，旨在缓解服务器上的负载，该负载将由一个以上的模型创建，用于解决多个分类问题。此时，利用在估计在多于一个主题中为分类而创建的单个BERT模型期间应用的掩蔽方法，基于问题的基础提供了模型的估计。覆盖不同字段的三个单独的数据集被各种方法除以各种方法，以使问题复杂化，并且在这种方式中也包括在字段中彼此非常接近的分类问题。以这种方式使用的数据集包括五个课程的五个分类问题。在性能和服务器上占用的空间方面相互比较包含所有分类问题和专门用于问题的其他BERT模型的BERT模型。

translated by 谷歌翻译

Segmentation of Weakly Visible Environmental Microorganism Images Using Pair-wise Deep Learning Features

Frank Kulwa , Chen Li , Marcin Grzegorzek , Md Mamunur Rahaman , Kimiaki Shirahama , Sergey Kosov

分类：计算机视觉

2022-08-31

环境微生物（EMS）的使用通过监测和分解污染物提供了高效，低成本和无害的环境污染补救措施。这取决于如何正确分段和确定EMS。为了增强透明，嘈杂且对比度较低的弱可见EM图像的分割，在本研究中提出了成对深度学习功能网络（PDLF-NET）。 PDLFS的使用使网络通过将每个图像的成对深度学习特征与基本模型Segnet的不同块相连，从而使网络更加关注前景（EMS）。利用shi和tomas描述符，我们在贴片上提取每个图像的深度特征，这些图像使用VGG-16模型以每个描述符为中心。然后，为了学习描述符之间的中间特征，基于Delaunay三角定理进行功能的配对以形成成对的深度学习特征。在该实验中，PDLF-NET可实现89.24％，63.20％，77.27％，35.15％，89.72％，91.44％和89.30％的出色分割结果，分别为IOU，DICE，DICE，VOE，灵敏度，精确性和特定性，精确性和特定性，精确性和特定性，精确性和特定性。

translated by 谷歌翻译

HTML版本

End-to-End Segmentation via Patch-wise Polygons Prediction

Tal Shaharabany , Lior Wolf

分类：计算机视觉

2021-12-05

前导分割方法将输出图表示为像素网格。我们研究了一个替代表示，其中每个图像修补程序都是对象边缘的建模，作为具有与每种补丁标签概率耦合的$ k $顶点的多边形。通过采用可分辨率的神经渲染器来创建光栅图像来优化顶点。然后将划分区域与地面真相分割进行比较。我们的方法获得多个最先进的结果：76.26 \％Miou在城市景观验证，90.92 \％iou vaihingen建筑分割基准，66.82 \％iou for monu显微镜数据集，鸟类的90.91 \％基准幼崽。我们的培训和再现这些结果的代码作为补充。

translated by 谷歌翻译

HistoSeg : Quick attention with multi-loss function for multi-structure segmentation in digital histology images

Saad Wazir , Muhammad Moazam Fraz

分类：计算机视觉

2022-09-01

医疗图像分割有助于计算机辅助诊断，手术和治疗。数字化组织载玻片图像用于分析和分段腺，核和其他生物标志物，这些标志物进一步用于计算机辅助医疗应用中。为此，许多研究人员开发了不同的神经网络来对组织学图像进行分割，主要是这些网络基于编码器编码器体系结构，并且还利用了复杂的注意力模块或变压器。但是，这些网络不太准确地捕获相关的本地和全局特征，并在多个尺度下具有准确的边界检测，因此，我们提出了一个编码器折叠网络，快速注意模块和多损耗函数（二进制交叉熵（BCE）损失的组合），焦点损失和骰子损失）。我们在两个公开可用数据集上评估了我们提出的网络的概括能力，用于医疗图像分割Monuseg和Glas，并胜过最先进的网络，在Monuseg数据集上提高了1.99％的提高，而GLAS数据集则提高了7.15％。实施代码可在此链接上获得：https：//bit.ly/histoseg

translated by 谷歌翻译

Comprehensive study of good model training for prostate segmentation in volumetric MRI

Carlos Nácher Collado

分类：计算机视觉 | 机器学习

2022-08-29

前列腺癌是2020年国际上第三大常见的癌症，是乳腺癌和肺癌之后的。此外，近年来前列腺癌显示出趋势的增加。根据临床经验，如果发现此问题并提早治疗，则可能有很高的生存机会。有助于诊断前列腺癌的一项任务是磁共振成像中的前列腺分割。临床专家进行的手动分割具有其缺点，例如：观察者所需的高时间和集中度；以及观察者内和观察者的变异性。这就是为什么近年来出现了基于卷积神经网络的前列腺的自动方法。他们中的许多人都有新颖的构建结构。在本文中，我通过将它们调整为前列腺预测的任务，对几个深度学习模型进行详尽的研究。我不使用新颖的体系结构，而是将我的工作更多地关注如何训练网络。我的方法基于Resnext101 3D编码器和UNET3D解码器。我提供了一项研究，研究决议在重新采样数据中的重要性，这是其他人以前做过的。

translated by 谷歌翻译

Automated liver tissues delineation techniques: A systematic survey on machine learning current trends and future orientations

Ayman Al-Kababji , Faycal Bensaali , Sarada Prasad Dakua , Yassine Himeur

分类：计算机视觉 | 机器学习

2021-03-10

机器学习和计算机视觉技术近年来由于其自动化，适合性和产生惊人结果的能力而迅速发展。因此，在本文中，我们调查了2014年至2022年之间发表的关键研究，展示了不同的机器学习算法研究人员用来分割肝脏，肝肿瘤和肝脉管结构的研究。我们根据感兴趣的组织（肝果，肝肿瘤或肝毒剂）对被调查的研究进行了划分，强调了同时解决多个任务的研究。此外，机器学习算法被归类为受监督或无监督的，如果属于某个方案的工作量很大，则将进一步分区。此外，对文献和包含上述组织面具的网站发现的不同数据集和挑战进行了彻底讨论，强调了组织者的原始贡献和其他研究人员的贡献。同样，在我们的评论中提到了文献中过度使用的指标，这强调了它们与手头的任务的相关性。最后，强调创新研究人员应对需要解决的差距的关键挑战和未来的方向，例如许多关于船舶分割挑战的研究的稀缺性以及为什么需要早日处理他们的缺席。

translated by 谷歌翻译

Performance evaluation of deep segmentation models on Landsat-8 imagery

Akshat Bhandari , Sriya Rallabandi , Sanchit Singhal , Aditya Kasliwal , Pratinav Seth

分类：计算机视觉 | 机器学习

2022-11-27

Contrails, short for condensation trails, are line-shaped ice clouds produced by aircraft engine exhaust when they fly through cold and humid air. They generate a greenhouse effect by absorbing or directing back to Earth approximately 33% of emitted outgoing longwave radiation. They account for over half of the climate change resulting from aviation activities. Avoiding contrails and adjusting flight routes could be an inexpensive and effective way to reduce their impact. An accurate, automated, and reliable detection algorithm is required to develop and evaluate contrail avoidance strategies. Advancement in contrail detection has been severely limited due to several factors, primarily due to a lack of quality-labeled data. Recently, proposed a large human-labeled Landsat-8 contrails dataset. Each contrail is carefully labeled with various inputs in various scenes of Landsat-8 satellite imagery. In this work, we benchmark several popular segmentation models with combinations of different loss functions and encoder backbones. This work is the first to apply state-of-the-art segmentation techniques to detect contrails in low-orbit satellite imagery. Our work can also be used as an open benchmark for contrail segmentation and is publicly available.

translated by 谷歌翻译

TransResU-Net: Transformer based ResU-Net for Real-Time Colonoscopy Polyp Segmentation

Nikhil Kumar Tomar , Annie Shergill , Brandon Rieders , Ulas Bagci , Debesh Jha

分类：计算机视觉

2022-06-17

结直肠癌（CRC）是全球癌症和与癌症有关的死亡率最常见的原因之一。及时进行结肠癌筛查是早期发现的关键。结肠镜检查是用于诊断结肠癌的主要方式。然而，息肉，腺瘤和晚期腺瘤的错率仍然很高。在癌前阶段对息肉的早期发现可以帮助减少死亡率和与结直肠癌相关的经济负担。基于深度学习的计算机辅助诊断（CADX）系统可能会帮助胃肠病学家识别可能遗漏的息肉，从而提高息肉检测率。此外，CADX系统可能被证明是一种具有成本效益的系统，可改善长期结直肠癌的预防。在这项研究中，我们提出了一种基于学习的深度架构，用于自动息肉分割，称为变压器resu-net（Transresu-net）。我们提出的架构建立在带有Resnet-50作为骨架的残留块上，并利用变压器自我发项机制以及扩张的卷积。我们对两个公开息肉分割基准数据集的实验结果表明，Transresu-net获得了高度有希望的骰子得分和实时速度。在我们的性能指标中，我们得出的结论是，Transresu-NET可能是建立实时息肉检测系统的强大基准，用于早期诊断，治疗和预防结直肠癌。拟议的transun-net的源代码可在https://github.com/nikhilroxtomar/transresunet上公开获得。

translated by 谷歌翻译

A Semantic Segmentation Network for Urban-Scale Building Footprint Extraction Using RGB Satellite Imagery

Aatif Jiwani , Shubhrakanti Ganguly , Chao Ding , Nan Zhou , David M. Chan

分类：计算机视觉

2021-04-02

城市地区消耗了世界上三分之二的能源，占全球二氧化碳排放量的70％以上。正如IPCC全球预热的1.5C报告所述，到2050年实现碳中型需要清楚地了解城市几何形状。卫星图像的高质量建筑占地面积可以加速这一预测过程和授权在规模上的授权市决策。然而，以前的深度学习的方法面临相应的问题，例如缩放不变性和缺陷的足迹，部分原因是由于持续存在的类别不平衡。此外，大多数方法都需要补充数据，例如点云数据，建筑物高度信息和多频段图像 - 这具有有限的可用性并且产生乏味。在本文中，我们提出了一种改进的Deeplabv3 +模块，其具有扩张的REN底座骨架，仅产生从三声道RGB卫星图像的建筑占地面积的掩模。此外，我们在客观函数中引入了F-Beta测量，以帮助模型账户进行偏斜类分布，并防止假阳性占地面积。除F-Beta之外，我们还纳入了指数加权的边界损失，并使用跨数据集培训策略来进一步提高预测的质量。因此，我们跨越三个公共基准实现最先进的表演，并证明我们的RGB方法产生更高质量的视觉结果，并且对卫星图像的规模，分辨率和城市密度不可知。

translated by 谷歌翻译

GAN-based Super-Resolution and Segmentation of Retinal Layers in Optical coherence tomography Scans

Paria Jeihouni , Omid Dehzangi , Annahita Amireskandari , Ali Rezai , Nasser M. Nasrabadi

分类：计算机视觉

2022-06-28

在本文中，我们设计了一种基于生成的对抗网络（GAN）的解决方案，用于视网膜层的光学相干断层扫描（OCT）扫描的超分辨率和分割。 OCT已被确定为成像的一种非侵入性和廉价的模态，可发现潜在的生物标志物，以诊断和进展神经退行性疾病，例如阿尔茨海默氏病（AD）。当前的假设假设在OCT扫描中可分析的视网膜层的厚度可能是有效的生物标志物。作为逻辑第一步，这项工作集中在视网膜层分割的挑战性任务以及超级分辨率的挑战性任务上，以提高清晰度和准确性。我们提出了一个基于GAN的细分模型，并评估合并流行网络，即U-NET和RESNET，在GAN体系结构中，并具有其他转置卷积和子像素卷积的块，以通过将OCT图像从低分辨率提高到高分辨率到高分辨率的任务。四个因素。我们还将骰子损失纳入了额外的重建损失项，以提高该联合优化任务的性能。我们的最佳模型配置从经验上实现了0.867的骰子系数，MIOU为0.765。

translated by 谷歌翻译

NFANet: A Novel Method for Weakly Supervised Water Extraction from High-Resolution Remote Sensing Imagery

Ming Lu , Leyuan Fang , Muxing Li , Bob Zhang , Yi Zhang , Pedram Ghamisi

分类：计算机视觉 | 机器学习

2022-01-10

利用深度学习的水提取需要精确的像素级标签。然而，在像素级别标记高分辨率遥感图像非常困难。因此，我们研究如何利用点标签来提取水体并提出一种名为邻居特征聚合网络（NFANET）的新方法。与PixelLevel标签相比，Point标签更容易获得，但它们会失去许多信息。在本文中，我们利用了局部水体的相邻像素之间的相似性，并提出了邻居采样器来重塑遥感图像。然后，将采样的图像发送到网络以进行特征聚合。此外，我们使用改进的递归训练算法进一步提高提取精度，使水边界更加自然。此外，我们的方法利用相邻特征而不是全局或本地特征来学习更多代表性。实验结果表明，所提出的NFANET方法不仅优于其他研究的弱监管方法，而且还获得与最先进的结果相似。

translated by 谷歌翻译

Image Segmentation Using Deep Learning: A Survey

Shervin Minaee , Yuri Boykov , Fatih Porikli , Antonio Plaza , Nasser Kehtarnavaz , Demetri Terzopoulos

分类：

2020-01-15

Image segmentation is a key topic in image processing and computer vision with applications such as scene understanding, medical image analysis, robotic perception, video surveillance, augmented reality, and image compression, among many others. Various algorithms for image segmentation have been developed in the literature. Recently, due to the success of deep learning models in a wide range of vision applications, there has been a substantial amount of works aimed at developing image segmentation approaches using deep learning models. In this survey, we provide a comprehensive review of the literature at the time of this writing, covering a broad spectrum of pioneering works for semantic and instance-level segmentation, including fully convolutional pixel-labeling networks, encoder-decoder architectures, multi-scale and pyramid based approaches, recurrent networks, visual attention models, and generative models in adversarial settings. We investigate the similarity, strengths and challenges of these deep learning models, examine the most widely used datasets, report performances, and discuss promising future research directions in this area.

translated by 谷歌翻译

Predição da Idade Cerebral a partir de Imagens de Ressonância Magnética utilizando Redes Neurais Convolucionais

Victor H. R. Oliveira , Augusto Antunes , Alexandre S. Soares , Arthur D. Reys , Robson Z. Júnior , Saulo D. S. Pedro , Danilo Silva

分类：计算机视觉

2021-12-23

在这项工作中，研究了来自磁共振图像的脑年龄预测的深度学习技术，旨在帮助鉴定天然老化过程的生物标志物。生物标志物的鉴定可用于检测早期神经变性过程，以及预测与年龄相关或与非年龄相关的认知下降。在这项工作中实施并比较了两种技术：应用于体积图像的3D卷积神经网络和应用于从轴向平面的切片的2D卷积神经网络，随后融合各个预测。通过2D模型获得的最佳结果，其达到了3.83年的平均绝对误差。 - Neste Trabalho S \〜AO InvestigaDAS T \'Ecnicas de Aprendizado Profundo Para a previ \ c {c} \〜ate daade脑电站a partir de imagens de resson \ ^ ancia magn \'etica，Visando辅助Na Identifica \ c {C} \〜AO de BioMarcadores Do Processo Natural de Envelhecimento。一个identifica \ c {c} \〜ao de bioMarcarcores \'e \'util para a detec \ c {c} \〜ao de um processo neurodegenerativo em Est \'Agio无数，Al \'em de possibilitar Prever Um decl 'inio cognitivo relacionado ou n \〜ao \`一个懒惰。 Duas T \'ECICAS S \〜AO ImportyAdas E Comparadas Teste Trabalho：Uma Rede神经卷应3D APLICADA NA IMAGEM VOLUM \'ETRICA E UME REDE神经卷轴2D APLICADA A FATIAS DO PANIAS轴向，COM后面fus \〜AO DAS PREDI \ C {c} \ \ oes个人。 o Melhor ResultAdo Foi optido Pelo Modelo 2D，Que Alcan \ C {C} OU UM ERRO M \'EDIO ABSOLUTO DE 3.83 ANOS。

translated by 谷歌翻译

Focal-UNet: UNet-like Focal Modulation for Medical Image Segmentation

MohammadReza Naderi , MohammadHossein Givkashi , Fatemeh Piri , Nader Karimi , Shadrokh Samavi

分类：计算机视觉

2022-12-19

Recently, many attempts have been made to construct a transformer base U-shaped architecture, and new methods have been proposed that outperformed CNN-based rivals. However, serious problems such as blockiness and cropped edges in predicted masks remain because of transformers' patch partitioning operations. In this work, we propose a new U-shaped architecture for medical image segmentation with the help of the newly introduced focal modulation mechanism. The proposed architecture has asymmetric depths for the encoder and decoder. Due to the ability of the focal module to aggregate local and global features, our model could simultaneously benefit the wide receptive field of transformers and local viewing of CNNs. This helps the proposed method balance the local and global feature usage to outperform one of the most powerful transformer-based U-shaped models called Swin-UNet. We achieved a 1.68% higher DICE score and a 0.89 better HD metric on the Synapse dataset. Also, with extremely limited data, we had a 4.25% higher DICE score on the NeoPolyp dataset. Our implementations are available at: https://github.com/givkashi/Focal-UNet

translated by 谷歌翻译

BDG-Net: Boundary Distribution Guided Network for Accurate Polyp Segmentation

Zihuan Qiu , Zhichuan Wang , Miaomiao Zhang , Ziyong Xu , Jie Fan , Linfeng Xu

分类：计算机视觉

2022-01-03

结肠直肠癌（CRC）是世界上最常见的致命癌症之一。果切除术可以有效地中断腺瘤的进展到腺癌，从而降低了CRC发育的风险。结肠镜检查是找到结肠息肉的主要方法。然而，由于息肉的不同尺寸和息肉和周围的粘膜之间的阴影不明确，因此精确地对分段息肉挑战。为了解决这个问题，我们设计了一个用于精确的息肉分割的边界分布引导网络（BDG-Net）。具体地，在理想边界分布图（BDM）的监督下，我们使用边界分布生成模块（BDGM）来聚合高级功能并生成BDM。然后，BDM被发送到边界分布引导解码器（BDGD）作为互补空间信息以引导息肉分割。此外，BDGD采用了多尺度特征交互策略，以提高不同尺寸的息肉的分割精度。广泛的定量和定性评估展示了我们模型的有效性，这在五个公共息肉数据集上显着优于最先进的模型，同时保持低计算复杂性。

translated by 谷歌翻译

Airway Tree Modeling Using Dual-channel 3D UNet 3+ with Vesselness Prior

Hsiang-Chin Chien , Ching-Ping Wang , Jung-Chih Chen , Chia-Yen Lee

分类：机器学习

2022-08-30

肺气道树建模对于诊断肺部疾病的诊断至关重要，尤其是对于X射线计算机断层扫描（CT）。 CT图像上的气道树建模可以为专家提供3维测量，例如壁厚等。此信息可以极大地帮助诊断诸如慢性阻塞性肺疾病等肺部疾病[1-4]。许多学者尝试了各种方法来建模肺气道树，可以根据其性质将其分为两个主要类别。也就是说，基于模型的方法和深度学习方法。基于典型模型的方法的性能通常取决于模型参数的手动调整，这可能是其优点和缺点。优势是它不需要大量的培训数据，这可能对像医学成像这样的小数据集有益。另一方面，基于模型的性能可能是错误的[5,6]。近年来，深度学习在医学图像处理领域取得了良好的结果，许多学者在医学图像分割中使用了基于UNET的方法[7-11]。在UNET的所有变化中，UNET 3+ [11]具有相对较好的结果，与UNET的其余部分相比。因此，为了进一步提高肺气道建模的准确性，本研究将Frangi滤波器[5]与UNET 3+ [11]结合在一起，以开发双通道3D UNET 3+。 Frangi过滤器用于提取类似容器的特征。然后，类似容器的功能用作指导双通道UNET 3+训练和测试程序的输入。

translated by 谷歌翻译

DeepPyramid: Enabling Pyramid View and Deformable Pyramid Reception for Semantic Segmentation in Cataract Surgery Videos

Negin Ghamsarian , Mario Taschwer , Raphael Sznitman , Klaus Schoeffmann

分类：计算机视觉

2022-07-04

白内障手术中的语义分割具有广泛的应用，可导致外科结果增强和降低临床风险。但是，在这些手术中分割不同相关结构的不同问题使得指定独特的网络非常具有挑战性。本文提出了一个语义分割网络，称为Deeppyramid，可以使用三个新颖性来应对这些挑战：（1）金字塔视图融合模块，该模块可在输入卷积中每个像素位置的周围区域中提供不同的角度的全球视图功能图；（2）一个可变形的金字塔接收模块，该模块可实现一个可适应感兴趣对象的几何变换的广泛可变形接收场；（3）专用的金字塔损失，可自适应监督多尺度语义特征图。结合在一起，我们表明这些模块可以有效地提高语义分割性能，尤其是在对象中透明度，可变形性，可伸缩性和钝边缘的情况下。我们证明我们的方法在最先进的级别上执行，并且优于许多现有方法，其利润率很高（与最佳竞争对手的方法相比，联合的交叉路口总体改善为3.66％）。

translated by 谷歌翻译

Distribution-aware Margin Calibration for Semantic Segmentation in Images

Litao Yu , Zhibin Li , Min Xu , Yongsheng Gao , Jiebo Luo , Jian Zhang

分类：计算机视觉

2021-12-21

Jaccard索引，也称为交叉联盟（iou），是图像语义分段中最关键的评估度量之一。然而，由于学习目的既不可分解也不是可分解的，则iou得分的直接优化是非常困难的。虽然已经提出了一些算法来优化其代理，但没有提供泛化能力的保证。在本文中，我们提出了一种边缘校准方法，可以直接用作学习目标，在数据分布上改善IOO的推广，通过刚性下限为基础。本方案理论上，根据IOU分数来确保更好的分割性能。我们评估了在七个图像数据集中所提出的边缘校准方法的有效性，显示使用深度分割模型的其他学习目标的IOU分数大量改进。

translated by 谷歌翻译