智能论文笔记

A Color Image Steganography Based on Frequency Sub-band Selection

Hai Su , Shan Yang , Shuqing Zhang , Songsen Yu

分类：计算机视觉

2021-12-29

基于深度学习的彩色图像隐写术是彩色图像中隐藏信息的艺术。其中，近年来，图像隐藏的隐藏隐身（躲藏图像）近年来引起了很多关注，因为它的书签容量很大。然而，由图像隐藏的隐藏术产生的图像可以显示一些明显的颜色失真或人为纹理迹线。我们提出了一种基于频率子带选择的彩色图像隐写模型，以解决上述问题。首先，我们讨论了不同颜色空间/频率子带的特征与所生成的图像质量之间的关系。然后，我们选择RGB图像的B沟道作为嵌入信道和高频子频带作为嵌入域。 DWT（离散小波变换）将B信道信息和秘密灰度图像变换为频域信息，然后嵌入秘密图像并在频域中提取。综合实验表明，我们的模型产生的图像具有更好的图像质量，并且难以察觉率显着增加。

translated by 谷歌翻译

Wavelet Transform-assisted Adaptive Generative Modeling for Colorization

Jin Li , Wanyun Li , Zichen Xu , Yuhao Wang , Qiegen Liu

分类：计算机视觉

2021-07-09

无监督的深度学习最近证明了生产高质量样本的希望。尽管它具有促进图像着色任务的巨大潜力，但由于数据歧管和模型能力的高维度，性能受到限制。这项研究提出了一种新的方案，该方案利用小波域中的基于得分的生成模型来解决这些问题。通过利用通过小波变换来利用多尺度和多渠道表示，该模型可以共同有效地从堆叠的粗糙小波系数组件中了解较富裕的先验。该策略还降低了原始歧管的维度，并减轻了维度的诅咒，这对估计和采样有益。此外，设计了小波域中的双重一致性项，即数据一致性和结构一致性，以更好地利用着色任务。具体而言，在训练阶段，一组由小波系数组成的多通道张量被用作训练网络以denoising得分匹配的输入。在推论阶段，样品是通过具有数据和结构一致性的退火Langevin动力学迭代生成的。实验证明了所提出的方法在发电和着色质量方面的显着改善，尤其是在着色鲁棒性和多样性方面。

translated by 谷歌翻译

U-shape Transformer for Underwater Image Enhancement

Lintao Peng , Chunli Zhu , Liheng Bian

分类：计算机视觉

2021-11-23

水下杂质的光吸收和散射导致水下较差的水下成像质量。现有的基于数据驱动的基于数据的水下图像增强（UIE）技术缺乏包含各种水下场景和高保真参考图像的大规模数据集。此外，不同颜色通道和空间区域的不一致衰减不完全考虑提升增强。在这项工作中，我们构建了一个大规模的水下图像（LSUI）数据集，包括5004个图像对，并报告了一个U形变压器网络，其中变压器模型首次引入UIE任务。 U形变压器与通道 - 方面的多尺度特征融合变压器（CMSFFT）模块和空间全局功能建模变压器（SGFMT）模块集成在一起，可使用更多地加强网络对色频道和空间区域的关注严重衰减。同时，为了进一步提高对比度和饱和度，在人类视觉原理之后，设计了组合RGB，实验室和LCH颜色空间的新型损失函数。可用数据集的广泛实验验证了报告的技术的最先进性能，具有超过2dB的优势。

translated by 谷歌翻译

USLN: A statistically guided lightweight network for underwater image enhancement via dual-statistic white balance and multi-color space stretch

Ziyuan Xiao , Yina Han , Susanto Rahardja , Yuanliang Ma

分类：计算机视觉

2022-09-06

水下图像不可避免地会受到颜色失真和对比度减少的影响。基于统计的方法，例如白平衡和直方图拉伸，试图调整颜色通道的不平衡和狭窄的强度分布，因此性能有限。最近，基于深度学习的方法取得了令人鼓舞的结果。但是，所涉及的架构复杂化和高计算成本可能会阻碍其在实用的约束平台中的部署。受上述作品的启发，我们提出了一个统计学的轻量级水下图像增强网络（USLN）。具体而言，我们首先开发一个双统计的白平衡模块，该模块可以学会使用平均图像和最大图像来补偿每个特定像素的颜色失真。然后是一个多色空间拉伸模块，以适应RGB，HSI和实验室颜色空间中的直方图分布。广泛的实验表明，在统计数据的指导下，USLN大大降低了所需的网络容量（超过98％）并实现最先进的性能。代码和相关资源可在https://github.com/deepxzy/usln上获得。

translated by 谷歌翻译

A Compact Neural Network-based Algorithm for Robust Image Watermarking

Hong-Bo Xu , Rong Wang , Jia Wei , Shao-Ping Lu

分类：计算机视觉

2021-12-27

数字图像水印寻求保护数字媒体信息免受未经授权的访问，其中消息被嵌入到数字图像中并从中提取，甚至在各种数据处理下应用一些噪声或失真，包括有损图像压缩和交互式内容编辑。在用一些事先约束时，传统图像水印解决方案容易受到鲁棒性，而最近的基于深度学习的水印方法无法在特征编码器和解码器的各种单独管道下进行良好的信息丢失问题。在本文中，我们提出了一种新的数字图像水印解决方案，具有一个小巧的神经网络，名为可逆的水印网络（IWN）。我们的IWN架构基于单个可逆的神经网络（INN），这种双翼飞变传播框架使我们能够通过将它们作为彼此的一对逆问题同时解决信息嵌入和提取的挑战，并学习稳定的可逆性映射。为了增强我们的水印解决方案的稳健性，我们具体地引入了一个简单但有效的位消息归一化模块，以冷凝要嵌入的位消息，并且噪声层旨在模拟我们的iWN框架下的各种实际攻击。广泛的实验表明了我们在各种扭曲下的解决方案的优越性。

translated by 谷歌翻译

Snow Mask Guided Adaptive Residual Network for Image Snow Removal

Bodong Cheng , Juncheng Li , Ying Chen , Shuyi Zhang , Tieyong Zeng

分类：计算机视觉

2022-07-11

在恶劣天气下的图像修复是一项艰巨的任务。过去的大多数作品都集中在消除图像中的雨水和阴霾现象。但是，雪也是一种极为普遍的大气现象，它将严重影响高级计算机视觉任务的性能，例如对象检测和语义分割。最近，已经提出了一些用于降雪的方法，大多数方法直接将雪图像作为优化对象。但是，雪地点和形状的分布很复杂。因此，未能有效地检测雪花 /雪连胜将影响降雪并限制模型性能。为了解决这些问题，我们提出了一个雪地掩模的自适应残留网络（SMGARN）。具体而言，SMGARN由三个部分组成，即Mask-Net，Guidance-Fusion Network（GF-NET）和重建-NET。首先，我们构建了一个以自像素的注意（SA）和跨像素的注意（CA），以捕获雪花的特征并准确地定位了雪的位置，从而预测了准确的雪山。其次，预测的雪面被发送到专门设计的GF-NET中，以适应指导模型去除雪。最后，使用有效的重建网络来消除面纱效果并纠正图像以重建最终的无雪图像。广泛的实验表明，我们的SMGARN数值优于所有现有的降雪方法，并且重建的图像在视觉对比度上更清晰。所有代码都将可用。

translated by 谷歌翻译

A Comprehensive Review of Deep Learning-based Single Image Super-resolution

Syed Muhammad Arsalan Bashir , Yi Wang , Mahrukh Khan , Yilong Niu

分类：计算机视觉 | 机器学习

2021-02-18

图像超分辨率（SR）是重要的图像处理方法之一，可改善计算机视野领域的图像分辨率。在过去的二十年中，在超级分辨率领域取得了重大进展，尤其是通过使用深度学习方法。这项调查是为了在深度学习的角度进行详细的调查，对单像超分辨率的最新进展进行详细的调查，同时还将告知图像超分辨率的初始经典方法。该调查将图像SR方法分类为四个类别，即经典方法，基于学习的方法，无监督学习的方法和特定领域的SR方法。我们还介绍了SR的问题，以提供有关图像质量指标，可用参考数据集和SR挑战的直觉。使用参考数据集评估基于深度学习的方法。一些审查的最先进的图像SR方法包括增强的深SR网络（EDSR），周期循环gan（Cincgan），多尺度残留网络（MSRN），Meta残留密度网络（META-RDN），反复反射网络（RBPN），二阶注意网络（SAN），SR反馈网络（SRFBN）和基于小波的残留注意网络（WRAN）。最后，这项调查以研究人员将解决SR的未来方向和趋势和开放问题的未来方向和趋势。

translated by 谷歌翻译

DEANet: Decomposition Enhancement and Adjustment Network for Low-Light Image Enhancement

Yonglong Jiang , Liangliang Li , Yuan Xue , Hongbing Ma

分类：计算机视觉

2022-09-14

在弱光条件下获得的图像将严重影响图像的质量。解决较差的弱光图像质量的问题可以有效地提高图像的视觉质量，并更好地改善计算机视觉的可用性。此外，它在许多领域都具有非常重要的应用。本文提出了基于视网膜的Deanet，以增强弱光图像。它将图像的频率信息和内容信息结合到三个子网络中：分解网络，增强网络和调整网络。这三个子网络分别用于分解，变形，对比度增强和细节保存，调整和图像产生。我们的模型对于所有低光图像都具有良好的良好结果。该模型对公共数据集进行了培训，实验结果表明，就视力和质量而言，我们的方法比现有的最新方法更好。

translated by 谷歌翻译

Deep Decomposition Network for Image Processing: A Case Study for Visible and Infrared Image Fusion

Yu Fu , Xiao-Jun Wu , Josef Kittler

分类：计算机视觉

2021-02-21

图像分解是图像处理领域的关键主题。它可以从源图像中提取显着特征。我们提出了一种基于卷积神经网络的新图像分解方法。该方法可以应用于许多图像处理任务。在本文中，我们将图像分解网络应用于图像融合任务。我们输入红外图像和可见光图像，并将它们分解为三个高频特征图像和低频特征图像。使用特定的融合策略融合了两组特征图像，以获得融合特征图像。最后，重建功能图像以获得融合图像。与最先进的融合方法相比，该方法在主观和客观评估中都取得了更好的性能。

translated by 谷歌翻译

SGUIE-Net: Semantic Attention Guided Underwater Image Enhancement with Multi-Scale Perception

Qi Qi , Kunqian Li , Haiyong Zheng , Xiang Gao , Guojia Hou , Kun Sun

分类：计算机视觉

2022-01-08

由于波长依赖性的光衰减，折射和散射，水下图像通常遭受颜色变形和模糊的细节。然而，由于具有未变形图像的数量有限数量的图像作为参考，培训用于各种降解类型的深度增强模型非常困难。为了提高数据驱动方法的性能，必须建立更有效的学习机制，使得富裕监督来自有限培训的示例资源的信息。在本文中，我们提出了一种新的水下图像增强网络，称为Sguie-net，其中我们将语义信息引入了共享常见语义区域的不同图像的高级指导。因此，我们提出了语义区域 - 明智的增强模块，以感知不同语义区域从多个尺度的劣化，并将其送回从其原始比例提取的全局注意功能。该策略有助于实现不同的语义对象的强大和视觉上令人愉快的增强功能，这应该由于对差异化增强的语义信息的指导应该。更重要的是，对于在训练样本分布中不常见的那些劣化类型，指导根据其语义相关性与已经良好的学习类型连接。对公共数据集的广泛实验和我们拟议的数据集展示了Sguie-Net的令人印象深刻的表现。代码和建议的数据集可用于：https：//trentqq.github.io/sguie-net.html

translated by 谷歌翻译

A Secure and Efficient Multi-Object Grasping Detection Approach for Robotic Arms

Hui Wang , Jieren Cheng , Yichen Xu , Sirui Ni , Zaijia Yang , Jiangpeng Li

分类：机器人 | 人工智能

2022-09-08

机器人武器广泛用于自动行业。但是，随着在机器人臂中深入学习的广泛应用，存在新的挑战，例如分配掌握计算能力和对安全性的需求不断增长。在这项工作中，我们提出了一种基于深度学习和边缘云协作的机器人手臂抓握方法。这种方法意识到了机器人组的任意掌握计划，并考虑了掌握效率和信息安全性。此外，由GAN训练的编码器和解码器使图像在压缩时可以加密，从而确保隐私的安全性。该模型在OCID数据集上达到92％的精度，图像压缩比达到0.03％，结构差值高于0.91。

translated by 谷歌翻译

A Comprehensive Survey and Taxonomy on Single Image Dehazing Based on Deep Learning

Jie Gui , Xiaofeng Cong , Yuan Cao , Wenqi Ren , Jun Zhang , Jing Zhang , Jiuxin Cao , Dacheng Tao

分类：计算机视觉 | 机器学习

2021-06-07

With the development of convolutional neural networks, hundreds of deep learning based dehazing methods have been proposed. In this paper, we provide a comprehensive survey on supervised, semi-supervised, and unsupervised single image dehazing. We first discuss the physical model, datasets, network modules, loss functions, and evaluation metrics that are commonly used. Then, the main contributions of various dehazing algorithms are categorized and summarized. Further, quantitative and qualitative experiments of various baseline methods are carried out. Finally, the unsolved issues and challenges that can inspire the future research are pointed out. A collection of useful dehazing materials is available at \url{https://github.com/Xiaofeng-life/AwesomeDehazing}.

translated by 谷歌翻译

Visible and Near Infrared Image Fusion Based on Texture Information

Guanyu Zhang , Beichen Sun , Yuehan Qi , Yang Liu

分类：计算机视觉

2022-07-22

多传感器融合被广泛用于自动驾驶汽车的环境感知系统。它解决了由环境变化引起的干扰，并使整个驾驶系统更安全，更可靠。在本文中，提出了一种基于纹理信息的新型可见和近红外融合方法，以增强非结构化的环境图像。它针对传统可见和近红外图像融合方法中的工件，信息丢失和噪声问题。首先，通过相对总变化（RTV）计算，可见图像（RGB）的结构信息（RGB）和近红外图像（NIR）作为融合图像的基础层；其次，建立了贝叶斯分类模型来计算噪声重量和可见图像中的噪声信息和噪声信息通过关节双侧滤波器自适应过滤；最后，融合图像是通过颜色空间转换获得的。实验结果表明，所提出的算法可以保留光谱特性和无伪影和颜色失真的可见和近红外图像的独特信息，并且具有良好的鲁棒性以及保留独特的质地。

translated by 谷歌翻译

Unsupervised Low-Light Image Enhancement via Histogram Equalization Prior

Feng Zhang , Yuanjie Shao , Yishi Sun , Kai Zhu , Changxin Gao , Nong Sang

分类：计算机视觉

2021-12-03

基于深度学习的低光图像增强方法通常需要巨大的配对训练数据，这对于在现实世界的场景中捕获是不切实际的。最近，已经探索了无监督的方法来消除对成对训练数据的依赖。然而，由于没有前衣，它们在不同的现实情景中表现得不稳定。为了解决这个问题，我们提出了一种基于先前（HEP）的有效预期直方图均衡的无监督的低光图像增强方法。我们的作品受到了有趣的观察，即直方图均衡增强图像的特征图和地面真理是相似的。具体而言，我们制定了HEP，提供了丰富的纹理和亮度信息。嵌入一个亮度模块（LUM），它有助于将低光图像分解为照明和反射率图，并且反射率图可以被视为恢复的图像。然而，基于Retinex理论的推导揭示了反射率图被噪声污染。我们介绍了一个噪声解剖学模块（NDM），以解除反射率图中的噪声和内容，具有不配对清洁图像的可靠帮助。通过直方图均衡的先前和噪声解剖，我们的方法可以恢复更精细的细节，更有能力抑制现实世界低光场景中的噪声。广泛的实验表明，我们的方法对最先进的无监督的低光增强算法有利地表现出甚至与最先进的监督算法匹配。

translated by 谷歌翻译

Attention based Broadly Self-guided Network for Low light Image Enhancement

Zilong Chen , Yaling Liang , Minghui Du

分类：计算机视觉

2021-12-12

在过去几年中，深度卷积神经网络在低光图像增强中取得了令人印象深刻的成功。深度学习方法大多通过堆叠网络结构并加深网络深度来提高特征提取的能力。在单个时导致更多的运行时间成本为了减少推理时间，在完全提取本地特征和全局特征的同时，我们通过SGN定期，我们提出了基于广泛的自我引导网络（Absgn）的现实世界低灯图像增强。策略是一种广泛的策略处理不同曝光的噪音。所提出的网络被许多主流基准验证.Aditional实验结果表明，所提出的网络优于最先进的低光图像增强解决方案。

translated by 谷歌翻译

Image Generation Network for Covert Transmission in Online Social Network

Zhengxin You , Qichao Ying , Sheng Li , Zhenxing Qian , Xinpeng Zhang

分类：计算机视觉

2022-07-21

在线社交网络比以往任何时候都更加激发了互联网的通信，这使得在此类嘈杂渠道上传输秘密消息是可能的。在本文中，我们提出了一个名为CIS-NET的无封面图像隐志网络，该网络合成了直接在秘密消息上传输的高质量图像。 CIS-NET由四个模块组成，即生成，对抗，提取和噪声模块。接收器可以提取隐藏的消息而不会损失任何损失，即使图像已被JPEG压缩攻击扭曲。为了掩盖隐肌的行为，我们在个人资料照片和贴纸的背景下收集了图像，并相应地训练了我们的网络。因此，生成的图像更倾向于摆脱恶意检测和攻击。与先前的图像隐志方法相比，区分主要是针对各种攻击的鲁棒性和无损性。各种公共数据集的实验已经表现出抗坚果分析的卓越能力。

translated by 谷歌翻译

PyTorch Image Quality: Metrics for Image Quality Assessment

Sergey Kastryulin , Jamil Zakirov , Denis Prokopenko , Dmitry V. Dylov

分类：计算机视觉

2022-08-31

图像质量评估（IQA）指标被广泛用于定量估计一些形成，恢复，转换或增强算法后图像降解的程度。我们提出了Pytorch图像质量（PIQ），这是一个以可用性为中心的库，其中包含最受欢迎的现代IQA算法，并保证根据其原始命题正确实现并进行了彻底验证。在本文中，我们详细介绍了图书馆基础背后的原则，描述了使其可靠的评估策略，提供了展示性能时间权衡的基准，并强调了GPU加速的好处Pytorch后端。Pytorch图像质量是一个开源软件：https：//github.com/photosynthesis-team/piq/。

translated by 谷歌翻译

HTML版本

Adaptive Uncertainty Distribution in Deep Learning for Unsupervised Underwater Image Enhancement

Alzayat Saleh , Marcus Sheaves , Dean Jerry , Mostafa Rahimi Azghadi

分类：计算机视觉

2022-12-18

One of the main challenges in deep learning-based underwater image enhancement is the limited availability of high-quality training data. Underwater images are difficult to capture and are often of poor quality due to the distortion and loss of colour and contrast in water. This makes it difficult to train supervised deep learning models on large and diverse datasets, which can limit the model's performance. In this paper, we explore an alternative approach to supervised underwater image enhancement. Specifically, we propose a novel unsupervised underwater image enhancement framework that employs a conditional variational autoencoder (cVAE) to train a deep learning model with probabilistic adaptive instance normalization (PAdaIN) and statistically guided multi-colour space stretch that produces realistic underwater images. The resulting framework is composed of a U-Net as a feature extractor and a PAdaIN to encode the uncertainty, which we call UDnet. To improve the visual quality of the images generated by UDnet, we use a statistically guided multi-colour space stretch module that ensures visual consistency with the input image and provides an alternative to training using a ground truth image. The proposed model does not need manual human annotation and can learn with a limited amount of data and achieves state-of-the-art results on underwater images. We evaluated our proposed framework on eight publicly-available datasets. The results show that our proposed framework yields competitive performance compared to other state-of-the-art approaches in quantitative as well as qualitative metrics. Code available at https://github.com/alzayats/UDnet .

translated by 谷歌翻译

FreqNet: A Frequency-domain Image Super-Resolution Network with Dicrete Cosine Transform

Runyuan Cai , Yue Ding , Hongtao Lu

分类：计算机视觉

2021-11-21

单个图像超分辨率（SISR）是一个不良问题，旨在获得从低分辨率（LR）输入的高分辨率（HR）输出，在此期间应该添加额外的高频信息以改善感知质量。现有的SISR工作主要通过最小化平均平方重建误差来在空间域中运行。尽管高峰峰值信噪比（PSNR）结果，但难以确定模型是否正确地添加所需的高频细节。提出了一些基于基于残余的结构，以指导模型暗示高频率特征。然而，由于空间域度量的解释是有限的，如何验证这些人为细节的保真度仍然是一个问题。在本文中，我们提出了频率域视角来的直观管道，解决了这个问题。由现有频域的工作启发，我们将图像转换为离散余弦变换（DCT）块，然后改革它们以获取DCT功能映射，它用作我们模型的输入和目标。设计了专门的管道，我们进一步提出了符合频域任务的性质的频率损失功能。我们的SISR方法在频域中可以明确地学习高频信息，为SR图像提供保真度和良好的感知质量。我们进一步观察到我们的模型可以与其他空间超分辨率模型合并，以提高原始SR输出的质量。

translated by 谷歌翻译

Underwater enhancement based on a self-learning strategy and attention mechanism for high-intensity regions

Claudio D. Mello Jr. , Bryan U. Moreira , Paulo J. O. Evald , Paulo L. Drews Jr. , Silvia S. Botelho

分类：计算机视觉

2022-08-04

在水下活动期间获得的图像遭受了水的环境特性，例如浊度和衰减。这些现象会导致颜色失真，模糊和对比度减少。另外，不规则的环境光分布会导致色道不平衡和具有高强度像素的区域。最近的作品与水下图像增强有关，并基于深度学习方法，解决了缺乏生成合成基地真相的配对数据集。在本文中，我们提出了一种基于深度学习的水下图像增强的自我监督学习方法，不需要配对的数据集。提出的方法估计了水下图像中存在的降解。此外，自动编码器重建此图像，并使用估计的降解信息降解其输出图像。因此，该策略在训练阶段的损失函数中用降级版本代替了输出图像。此过程\ textIt {Misleads}学会补偿其他降解的神经网络。结果，重建的图像是输入图像的增强版本。此外，该算法还提出了一个注意模块，以减少通过颜色通道不平衡和异常区域在增强图像中产生的高强度区域。此外，提出的方法不需要基本真实。此外，仅使用真实的水下图像来训练神经网络，结果表明该方法在颜色保存，颜色铸造降低和对比度改进方面的有效性。

translated by 谷歌翻译