智能论文笔记

Deep Decomposition Network for Image Processing: A Case Study for Visible and Infrared Image Fusion

Yu Fu , Xiao-Jun Wu , Josef Kittler

分类：计算机视觉

2021-02-21

图像分解是图像处理领域的关键主题。它可以从源图像中提取显着特征。我们提出了一种基于卷积神经网络的新图像分解方法。该方法可以应用于许多图像处理任务。在本文中，我们将图像分解网络应用于图像融合任务。我们输入红外图像和可见光图像，并将它们分解为三个高频特征图像和低频特征图像。使用特定的融合策略融合了两组特征图像，以获得融合特征图像。最后，重建功能图像以获得融合图像。与最先进的融合方法相比，该方法在主观和客观评估中都取得了更好的性能。

translated by 谷歌翻译

PPT Fusion: Pyramid Patch Transformerfor a Case Study in Image Fusion

Yu Fu , TianYang Xu , XiaoJun Wu , Josef Kittler

分类：计算机视觉

2021-07-29

近年来，变压器架构目睹了快速发展，优于许多计算机视觉任务中的CNN架构，如视觉变压器（VIV）用于图像分类。然而，现有的视觉变压器模型旨在提取用于高级任务的语义信息，例如分类和检测。这些方法忽略输入图像的空间分辨率的重要性，从而牺牲相邻像素的局部相关信息。在本文中，我们提出了一个贴片金字塔变换器（PPT），以有效地解决上述问题。一致地，我们首先设计一个贴片变换器，将图像转换为一系列补丁，其中对每个修补程序执行变压器编码以提取本地表示。此外，我们构建了金字塔变换器，以有效地从整个图像中提取非本地信息。在获得原始图像的一组多尺度，多维和多角度特征之后，我们设计图像重建网络，以确保可以将特征重建为原始输入。为了验证有效性，我们将建议的贴片金字塔变压器应用于图像融合任务。实验结果表明其具有卓越的性能，而最先进的融合方法，在几种评估指标上实现了最佳结果。由于PPT网络的潜在代表性容量，它可以直接应用于不同的图像融合任务，而无需重新设计或再培训网络。

translated by 谷歌翻译

Res2NetFuse: A Fusion Method for Infrared and Visible Images

Xu Song , Xiao-Jun Wu , Hui Li , Jun Sun , Vasile Palade

分类：计算机视觉 | 人工智能

2021-12-29

本文提出了一种用于红外和可见图像的新型Res2net的融合框架。所提出的融合模型分别有三个部分：分别是编码器，融合层和解码器。基于RES2Net的编码器用于提取源图像的多尺度特征，该文件引入了用于培训仅使用单个图像的Res2net的编码器的新培训策略。然后，基于注意模型开发了一种新的融合策略。最后，解码器重建融合图像。还详细分析了所提出的方法。实验表明，我们的方法通过与现有方法进行比较，实现了客观和主观评估中的最先进的融合性能。

translated by 谷歌翻译

An Attention-based Multi-Scale Feature Learning Network for Multimodal Medical Image Fusion

Meng Zhou , Xiaolan Xu , Yuxuan Zhang

分类：计算机视觉

2022-12-09

Medical images play an important role in clinical applications. Multimodal medical images could provide rich information about patients for physicians to diagnose. The image fusion technique is able to synthesize complementary information from multimodal images into a single image. This technique will prevent radiologists switch back and forth between different images and save lots of time in the diagnostic process. In this paper, we introduce a novel Dilated Residual Attention Network for the medical image fusion task. Our network is capable to extract multi-scale deep semantic features. Furthermore, we propose a novel fixed fusion strategy termed Softmax-based weighted strategy based on the Softmax weights and matrix nuclear norm. Extensive experiments show our proposed network and fusion strategy exceed the state-of-the-art performance compared with reference image fusion methods on four commonly used fusion metrics.

translated by 谷歌翻译

A Medical Image Fusion Method based on MDLatLRRv2

Xu Song , Xiao-Jun Wu , Hui Li

分类：计算机视觉 | 机器学习

2022-06-30

由于MDLATLRR仅考虑通过潜在低级表示（LATLRR）提取的输入图像的详细零件（显着特征），因此它不使用LATLRR提取的基本零件（主要特征）。因此，我们提出了一种称为MDLATLRV2的改进的多级分解方法，该方法有效地分析并利用了LATLRR获得的所有图像特征。然后，我们将MDLATLRV2应用于医疗图像融合。基本部分是按平均策略融合的，细节零件是通过核电 - 运行融合的。与现有方法的比较表明，所提出的方法可以在客观和主观评估中实现最先进的融合性能。

translated by 谷歌翻译

Interactive Feature Embedding for Infrared and Visible Image Fusion

Fan Zhao , Wenda Zhao , Huchuan Lu

分类：计算机视觉

2022-11-09

General deep learning-based methods for infrared and visible image fusion rely on the unsupervised mechanism for vital information retention by utilizing elaborately designed loss functions. However, the unsupervised mechanism depends on a well designed loss function, which cannot guarantee that all vital information of source images is sufficiently extracted. In this work, we propose a novel interactive feature embedding in self-supervised learning framework for infrared and visible image fusion, attempting to overcome the issue of vital information degradation. With the help of self-supervised learning framework, hierarchical representations of source images can be efficiently extracted. In particular, interactive feature embedding models are tactfully designed to build a bridge between the self-supervised learning and infrared and visible image fusion learning, achieving vital information retention. Qualitative and quantitative evaluations exhibit that the proposed method performs favorably against state-of-the-art methods.

translated by 谷歌翻译

Visible and Near Infrared Image Fusion Based on Texture Information

Guanyu Zhang , Beichen Sun , Yuehan Qi , Yang Liu

分类：计算机视觉

2022-07-22

多传感器融合被广泛用于自动驾驶汽车的环境感知系统。它解决了由环境变化引起的干扰，并使整个驾驶系统更安全，更可靠。在本文中，提出了一种基于纹理信息的新型可见和近红外融合方法，以增强非结构化的环境图像。它针对传统可见和近红外图像融合方法中的工件，信息丢失和噪声问题。首先，通过相对总变化（RTV）计算，可见图像（RGB）的结构信息（RGB）和近红外图像（NIR）作为融合图像的基础层；其次，建立了贝叶斯分类模型来计算噪声重量和可见图像中的噪声信息和噪声信息通过关节双侧滤波器自适应过滤；最后，融合图像是通过颜色空间转换获得的。实验结果表明，所提出的算法可以保留光谱特性和无伪影和颜色失真的可见和近红外图像的独特信息，并且具有良好的鲁棒性以及保留独特的质地。

translated by 谷歌翻译

Cross Attention-guided Dense Network for Images Fusion

Zhengwen Shen , Jun Wang , Zaiyu Pan , Yulian Li , Jiangyu Wang

分类：计算机视觉

2021-09-23

近年来，基于深度学习，各种计算机视觉应用已取得了重大进展，该进展已被广泛用于图像融合，并证明可以实现足够的性能。然而，对于不同源图像的空间对应关系的能力有限，对于现有的无监督图像融合模型的挑战仍然是一个巨大的挑战，即提取适当的功能并实现适应性和平衡的融合。在本文中，我们提出了一个新颖的跨注意指导图像融合网络，该网络是多模式图像融合，多曝光图像融合和多聚焦图像融合的统一且无监督的框架。与现有的自我发项模块不同，我们的交叉意见模块着重于建模不同源图像之间的互相关。使用拟议的交叉注意模块作为核心块，建立一个密集连接的交叉注意引导网络是为了动态地学习空间对应，以从不同的输入图像中获得更好的重要细节。同时，还设计了一个辅助分支来对远程信息进行建模，并附加了合并网络以最终重建融合图像。在公开可用的数据集上进行了广泛的实验，结果表明，所提出的模型在定量和质量上优于最先进的模型。

translated by 谷歌翻译

TransMEF: A Transformer-Based Multi-Exposure Image Fusion Framework using Self-Supervised Multi-Task Learning

Linhao Qu , Shaolei Liu , Manning Wang , Zhijian Song

分类：计算机视觉

2021-12-02

在本文中，我们提出了一种使用自我监督的多任务学习的基于变换器的多曝光图像融合框架的传输。该框架基于编码器解码器网络，可以在大型自然图像数据集上培训，并且不需要地面真理融合图像。我们根据多曝光图像的特点设计三个自我监督的重建任务，并使用多任务学习同时进行这些任务;通过该过程，网络可以学习多曝光图像的特征并提取更多的广义特征。此外，为了补偿在基于CNN的架构中建立远程依赖性的缺陷，我们设计了一个与变压器模块相结合的编码器。这种组合使网络能够专注于本地和全局信息。我们评估了我们的方法，并将其与最新释放的多曝光图像融合基准数据集进行了11个基于竞争的传统和深入学习的方法，我们的方法在主观和客观评估中实现了最佳性能。

translated by 谷歌翻译

Explicit and implicit models in infrared and visible image fusion

Zixuan Wang , Bin Sun

分类：计算机视觉

2022-06-20

作为多模式图像对，红外和可见图像在同一场景的表达中显示出显着差异。图像融合任务面临两个问题：一个是保持不同方式之间的独特功能，而另一个是将功能保持在本地和全局功能等各个层面。本文讨论了图像融合中深度学习模型的局限性和相应的优化策略。基于人为设计的结构和约束，我们将模型分为明确的模型，并将模型自适应地学习高级功能或可以建立全局像素关联。筛选了21个测试组的十种比较实验模型。定性和定量结果表明，隐式模型具有更全面的学习图像特征的能力。同时，需要提高它们的稳定性。针对现有算法要解决的优势和局限性，我们讨论了多模式图像融合和未来研究方向的主要问题。

translated by 谷歌翻译

Holistic Attention-Fusion Adversarial Network for Single Image Defogging

Wei Liu , Cheng Chen , Rui Jiang , Tao Lu , Zixiang Xiong

分类：计算机视觉

2022-02-19

基于对抗性学习的图像抑制方法，由于其出色的性能，已经在计算机视觉中进行了广泛的研究。但是，大多数现有方法对实际情况的质量功能有限，因为它们在相同场景的透明和合成的雾化图像上进行了培训。此外，它们在保留鲜艳的色彩和丰富的文本细节方面存在局限性。为了解决这些问题，我们开发了一个新颖的生成对抗网络，称为整体注意力融合对抗网络（HAAN），用于单个图像。 Haan由Fog2FogFogre块和FogFree2Fog块组成。在每个块中，有三个基于学习的模块，即雾除雾，颜色纹理恢复和雾合成，它们相互限制以生成高质量的图像。 Haan旨在通过学习雾图图像之间的整体通道空间特征相关性及其几个派生图像之间的整体通道空间特征相关性来利用纹理和结构信息的自相似性。此外，在雾合成模块中，我们利用大气散射模型来指导它，以通过新颖的天空分割网络专注于大气光优化来提高生成质量。关于合成和现实世界数据集的广泛实验表明，就定量准确性和主观的视觉质量而言，Haan的表现优于最先进的脱落方法。

translated by 谷歌翻译

Infrared Image Super-Resolution: Systematic Review, and Future Trends

Yongsong Huang , Tomo Miyazaki , Xiaofeng Liu , Shinichiro Omachi

分类：计算机视觉 | 机器学习

2022-12-22

Image Super-Resolution (SR) is essential for a wide range of computer vision and image processing tasks. Investigating infrared (IR) image (or thermal images) super-resolution is a continuing concern within the development of deep learning. This survey aims to provide a comprehensive perspective of IR image super-resolution, including its applications, hardware imaging system dilemmas, and taxonomy of image processing methodologies. In addition, the datasets and evaluation metrics in IR image super-resolution tasks are also discussed. Furthermore, the deficiencies in current technologies and possible promising directions for the community to explore are highlighted. To cope with the rapid development in this field, we intend to regularly update the relevant excellent work at \url{https://github.com/yongsongH/Infrared_Image_SR_Survey

translated by 谷歌翻译

A Comprehensive Survey and Taxonomy on Single Image Dehazing Based on Deep Learning

Jie Gui , Xiaofeng Cong , Yuan Cao , Wenqi Ren , Jun Zhang , Jing Zhang , Jiuxin Cao , Dacheng Tao

分类：计算机视觉 | 机器学习

2021-06-07

With the development of convolutional neural networks, hundreds of deep learning based dehazing methods have been proposed. In this paper, we provide a comprehensive survey on supervised, semi-supervised, and unsupervised single image dehazing. We first discuss the physical model, datasets, network modules, loss functions, and evaluation metrics that are commonly used. Then, the main contributions of various dehazing algorithms are categorized and summarized. Further, quantitative and qualitative experiments of various baseline methods are carried out. Finally, the unsolved issues and challenges that can inspire the future research are pointed out. A collection of useful dehazing materials is available at \url{https://github.com/Xiaofeng-life/AwesomeDehazing}.

translated by 谷歌翻译

Wavelet Transform-assisted Adaptive Generative Modeling for Colorization

Jin Li , Wanyun Li , Zichen Xu , Yuhao Wang , Qiegen Liu

分类：计算机视觉

2021-07-09

无监督的深度学习最近证明了生产高质量样本的希望。尽管它具有促进图像着色任务的巨大潜力，但由于数据歧管和模型能力的高维度，性能受到限制。这项研究提出了一种新的方案，该方案利用小波域中的基于得分的生成模型来解决这些问题。通过利用通过小波变换来利用多尺度和多渠道表示，该模型可以共同有效地从堆叠的粗糙小波系数组件中了解较富裕的先验。该策略还降低了原始歧管的维度，并减轻了维度的诅咒，这对估计和采样有益。此外，设计了小波域中的双重一致性项，即数据一致性和结构一致性，以更好地利用着色任务。具体而言，在训练阶段，一组由小波系数组成的多通道张量被用作训练网络以denoising得分匹配的输入。在推论阶段，样品是通过具有数据和结构一致性的退火Langevin动力学迭代生成的。实验证明了所提出的方法在发电和着色质量方面的显着改善，尤其是在着色鲁棒性和多样性方面。

translated by 谷歌翻译

A Comprehensive Review of Deep Learning-based Single Image Super-resolution

Syed Muhammad Arsalan Bashir , Yi Wang , Mahrukh Khan , Yilong Niu

分类：计算机视觉 | 机器学习

2021-02-18

图像超分辨率（SR）是重要的图像处理方法之一，可改善计算机视野领域的图像分辨率。在过去的二十年中，在超级分辨率领域取得了重大进展，尤其是通过使用深度学习方法。这项调查是为了在深度学习的角度进行详细的调查，对单像超分辨率的最新进展进行详细的调查，同时还将告知图像超分辨率的初始经典方法。该调查将图像SR方法分类为四个类别，即经典方法，基于学习的方法，无监督学习的方法和特定领域的SR方法。我们还介绍了SR的问题，以提供有关图像质量指标，可用参考数据集和SR挑战的直觉。使用参考数据集评估基于深度学习的方法。一些审查的最先进的图像SR方法包括增强的深SR网络（EDSR），周期循环gan（Cincgan），多尺度残留网络（MSRN），Meta残留密度网络（META-RDN），反复反射网络（RBPN），二阶注意网络（SAN），SR反馈网络（SRFBN）和基于小波的残留注意网络（WRAN）。最后，这项调查以研究人员将解决SR的未来方向和趋势和开放问题的未来方向和趋势。

translated by 谷歌翻译

Multi-scale Sampling and Aggregation Network For High Dynamic Range Imaging

Jun Xiao , Qian Ye , Tianshan Liu , Cong Zhang , Kin-Man Lam

分类：计算机视觉

2022-08-04

高动态范围（HDR）成像是图像处理中的一个基本问题，即使在场景中存在不同的照明的情况下，它旨在产生暴露良好的图像。近年来，多曝光融合方法已取得了显着的结果，该方法合并了多个具有不同暴露的动态范围（LDR）图像，以生成相应的HDR图像。但是，在动态场景中综合HDR图像仍然具有挑战性，并且需求量很高。生产HDR图像有两个挑战：1）。 LDR图像之间的对象运动很容易在生成的结果中引起不良的幽灵伪像。 2）。由于在合并阶段对这些区域的补偿不足，因此下区域和过度曝光的区域通常包含扭曲的图像含量。在本文中，我们提出了一个多尺度采样和聚合网络，用于在动态场景中进行HDR成像。为了有效地减轻小动作和大型动作引起的问题，我们的方法通过以粗到精细的方式对LDR图像进行了暗中对齐LDR图像。此外，我们提出了一个基于离散小波转换的密集连接的网络，以改善性能，该网络将输入分解为几个非重叠频率子带，并在小波域中自适应地执行补偿。实验表明，与其他有希望的HDR成像方法相比，我们提出的方法可以在不同场景下实现最新的性能。此外，由我们的方法生成的HDR图像包含清洁剂和更详细的内容，扭曲较少，从而带来更好的视觉质量。

translated by 谷歌翻译

Low-Light Hyperspectral Image Enhancement

Xuelong Li , Guanlin Li , Bin Zhao

分类：计算机视觉

2022-08-05

由于高光谱摄像机传感器在较差的照明条件下捕获的能量不足，因此低光谱图像（HSIS）通常会遭受视野较低，光谱失真和各种噪音的遭受的影响。已经开发了一系列HSI恢复方法，但它们在增强低光HSIS方面的有效性受到限制。这项工作着重于低光HSI增强任务，该任务旨在揭示隐藏在黑暗区域中的空间光谱信息。为了促进低光HSI处理的开发，我们收集了室内和室外场景的低光HSI（LHSI）数据集。基于Laplacian金字塔分解和重建，我们开发了在LHSI数据集中训练的端到端数据驱动的低光HSI增强（HSIE）方法。通过观察到照明与HSI的低频组件有关，而纹理细节与高频组件密切相关，因此建议的HSIE设计为具有两个分支。采用照明增强分支以减少分辨率来启发低频组件。高频改进分支用于通过预测的掩码来完善高频组件。此外，为了提高信息流量和提高性能，我们引入了具有残留致密连接的有效通道注意块（CAB），该连接是照明增强分支的基本块。 LHSI数据集的实验结果证明了HSIE在定量评估措施和视觉效果中的有效性和效率。根据遥感印度松树数据集的分类性能，下游任务受益于增强的HSI。可用数据集和代码：\ href {https://github.com/guanguanboy/hsie} {https://github.com/guanguanboy/hsie}。

translated by 谷歌翻译

A survey on computational spectral reconstruction methods from RGB to hyperspectral imaging

Jingang Zhang , Runmu Su , Wenqi Ren , Qiang Fu , Felix Heide , Yunfeng Nie

分类：计算机视觉

2021-06-30

高光谱成像由于其在捕获丰富的空间和光谱信息的能力上提供了多功能应用，这对于识别物质至关重要。但是，获取高光谱图像的设备昂贵且复杂。因此，已经通过直接从低成本，更多可用的RGB图像重建高光谱信息来提出了许多替代光谱成像方法。我们详细研究了来自广泛的RGB图像的这些最先进的光谱重建方法。对25种方法的系统研究和比较表明，尽管速度较低，但大多数数据驱动的深度学习方法在重建精度和质量方面都优于先前的方法。这项全面的审查可以成为同伴研究人员的富有成果的参考来源，从而进一步启发了相关领域的未来发展方向。

translated by 谷歌翻译

Hitchhiker's Guide to Super-Resolution: Introduction and Recent Advances

Brian Moser , Federico Raue , Stanislav Frolov , Jörn Hees , Sebastian Palacio , Andreas Dengel

分类：计算机视觉

2022-09-27

随着深度学习（DL）的出现，超分辨率（SR）也已成为一个蓬勃发展的研究领域。然而，尽管结果有希望，但该领域仍然面临需要进一步研究的挑战，例如，允许灵活地采样，更有效的损失功能和更好的评估指标。我们根据最近的进步来回顾SR的域，并检查最新模型，例如扩散（DDPM）和基于变压器的SR模型。我们对SR中使用的当代策略进行了批判性讨论，并确定了有前途但未开发的研究方向。我们通过纳入该领域的最新发展，例如不确定性驱动的损失，小波网络，神经体系结构搜索，新颖的归一化方法和最新评估技术来补充先前的调查。我们还为整章中的模型和方法提供了几种可视化，以促进对该领域趋势的全球理解。最终，这篇综述旨在帮助研究人员推动DL应用于SR的界限。

translated by 谷歌翻译

Snow Mask Guided Adaptive Residual Network for Image Snow Removal

Bodong Cheng , Juncheng Li , Ying Chen , Shuyi Zhang , Tieyong Zeng

分类：计算机视觉

2022-07-11

在恶劣天气下的图像修复是一项艰巨的任务。过去的大多数作品都集中在消除图像中的雨水和阴霾现象。但是，雪也是一种极为普遍的大气现象，它将严重影响高级计算机视觉任务的性能，例如对象检测和语义分割。最近，已经提出了一些用于降雪的方法，大多数方法直接将雪图像作为优化对象。但是，雪地点和形状的分布很复杂。因此，未能有效地检测雪花 /雪连胜将影响降雪并限制模型性能。为了解决这些问题，我们提出了一个雪地掩模的自适应残留网络（SMGARN）。具体而言，SMGARN由三个部分组成，即Mask-Net，Guidance-Fusion Network（GF-NET）和重建-NET。首先，我们构建了一个以自像素的注意（SA）和跨像素的注意（CA），以捕获雪花的特征并准确地定位了雪的位置，从而预测了准确的雪山。其次，预测的雪面被发送到专门设计的GF-NET中，以适应指导模型去除雪。最后，使用有效的重建网络来消除面纱效果并纠正图像以重建最终的无雪图像。广泛的实验表明，我们的SMGARN数值优于所有现有的降雪方法，并且重建的图像在视觉对比度上更清晰。所有代码都将可用。

translated by 谷歌翻译