智能论文笔记

FINO: Flow-based Joint Image and Noise Model

Lanqing Guo , Siyu Huang , Haosen Liu , Bihan Wen

分类：计算机视觉

2021-11-11

图像恢复中的一个根本挑战是去噪，目标是从其嘈杂的测量中估计清洁图像。为了解决这种不良反对问题，现有的去噪方法通常专注于利用有效的自然图像前提。噪声模型的利用和分析通常被忽略，尽管噪声模型可以向去噪算法提供互补信息。在本文中，我们提出了一种新的流基的联合图像和噪声模型（Fino），其明显地与潜在空间中的图像和噪声分离，并且无损地通过一系列可逆的转换来重建它们。我们进一步提出了一种可变交换策略，以对准图像的结构信息和噪声相关矩阵，以基于空间最小化相关信息来限制噪声。实验结果表明，Fino去除合成添加剂白高斯噪声（AWGN）和真实噪音的能力。此外，铜的概括到除去空间变体噪声和具有不准确估计的噪声的噪声超越了大幅边缘的流行和最先进的方法。

translated by 谷歌翻译

Enhancing Low-Light Images in Real World via Cross-Image Disentanglement

Lanqing Guo , Renjie Wan , Wenhan Yang , Alex Kot , Bihan Wen

分类：计算机视觉

2022-01-10

在低灯条件下捕获的图像遭受低可视性和各种成像伪影，例如真实噪音。现有的监督启示算法需要大量的像素对齐的训练图像对，这很难在实践中准备。虽然弱监督或无人监督的方法可以缓解这些挑战，但不使用配对的训练图像，由于缺乏相应的监督，一些现实世界的文物不可避免地被错误地放大。在本文中，而不是使用完美的对齐图像进行培训，我们创造性地使用未对准的现实世界图像作为指导，这很容易收集。具体地，我们提出了一个交叉图像解剖线程（CIDN），以分别提取来自低/常光图像的交叉图像亮度和图像特定内容特征。基于此，CIDN可以同时校正特征域中的亮度和抑制图像伪像，其在很大程度上将鲁棒性增加到像素偏移。此外，我们收集了一个新的低光图像增强数据集，包括具有现实世界腐败的未对准培训图像。实验结果表明，我们的模型在新建议的数据集和其他流行的低光数据集中实现了最先进的表演。

translated by 谷歌翻译

Deep Variational Network Toward Blind Image Restoration

Zongsheng Yue , Hongwei Yong , Qian Zhao , Lei Zhang , Deyu Meng , Kwan-Yen K. Wong

分类：计算机视觉

2020-08-25

盲图修复（IR）是计算机视觉中常见但充满挑战的问题。基于经典模型的方法和最新的深度学习（DL）方法代表了有关此问题的两种不同方法，每种方法都有自己的优点和缺点。在本文中，我们提出了一种新颖的盲图恢复方法，旨在整合它们的两种优势。具体而言，我们为盲IR构建了一个普通的贝叶斯生成模型，该模型明确描绘了降解过程。在此提出的模型中，PICEL的非I.I.D。高斯分布用于适合图像噪声。它的灵活性比简单的I.I.D。在大多数常规方法中采用的高斯或拉普拉斯分布，以处理图像降解中包含的更复杂的噪声类型。为了解决该模型，我们设计了一个变异推理算法，其中所有预期的后验分布都被参数化为深神经网络，以提高其模型能力。值得注意的是，这种推论算法诱导统一的框架共同处理退化估计和图像恢复的任务。此外，利用了前一种任务中估计的降解信息来指导后一种红外过程。对两项典型的盲型IR任务进行实验，即图像降解和超分辨率，表明所提出的方法比当前最新的方法实现了卓越的性能。

translated by 谷歌翻译

DnSwin: Toward Real-World Denoising via Continuous Wavelet Sliding-Transformer

Hao Li , Zhijing Yang , Xiaobin Hong , Ziying Zhao , Junyang Chen , Yukai Shi , Jinshan Pan

分类：计算机视觉

2022-07-28

现实世界图像Denoising是一个实用的图像恢复问题，旨在从野外嘈杂的输入中获取干净的图像。最近，Vision Transformer（VIT）表现出强大的捕获远程依赖性的能力，许多研究人员试图将VIT应用于图像DeNosing任务。但是，现实世界的图像是一个孤立的框架，它使VIT构建了内部贴片的远程依赖性，该依赖性将图像分为贴片并混乱噪声模式和梯度连续性。在本文中，我们建议通过使用连续的小波滑动转换器来解决此问题，该小波滑动转换器在现实世界中构建频率对应关系，称为dnswin。具体而言，我们首先使用CNN编码器从嘈杂的输入图像中提取底部功能。 DNSWIN的关键是将高频和低频信息与功能和构建频率依赖性分开。为此，我们提出了小波滑动窗口变压器，该变压器利用离散的小波变换，自我注意力和逆离散小波变换来提取深度特征。最后，我们使用CNN解码器将深度特征重建为DeNo的图像。对现实世界的基准测试的定量和定性评估都表明，拟议的DNSWIN对最新方法的表现良好。

translated by 谷歌翻译

PD-Flow: A Point Cloud Denoising Framework with Normalizing Flows

Aihua Mao , Zihui Du , Yu-Hui Wen , Jun Xuan , Yong-Jin Liu

分类：计算机视觉

2022-03-11

点云降级旨在从噪音和异常值损坏的原始观察结果中恢复清洁点云，同时保留细粒细节。我们提出了一种新型的基于深度学习的DeNoising模型，该模型结合了正常的流量和噪声解散技术，以实现高降解精度。与提取点云特征以进行点校正的现有作品不同，我们从分布学习和特征分离的角度制定了denoising过程。通过将嘈杂的点云视为清洁点和噪声的联合分布，可以从将噪声对应物从潜在点表示中解散出来，而欧几里得和潜在空间之间的映射是通过标准化流量来建模的。我们评估了具有各种噪声设置的合成3D模型和现实世界数据集的方法。定性和定量结果表明，我们的方法表现优于先前的最先进的基于深度学习的方法。

translated by 谷歌翻译

Variational Deep Image Restoration

Jae Woong Soh , Nam Ik Cho

分类：计算机视觉

2022-07-03

本文提出了图像恢复的新变异推理框架和一个卷积神经网络（CNN）结构，该结构可以解决所提出的框架所描述的恢复问题。较早的基于CNN的图像恢复方法主要集中在网络体系结构设计或培训策略上，具有非盲方案，其中已知或假定降解模型。为了更接近现实世界的应用程序，CNN还接受了整个数据集的盲目培训，包括各种降解。然而，给定有多样化的图像的高质量图像的条件分布太复杂了，无法通过单个CNN学习。因此，也有一些方法可以提供其他先验信息来培训CNN。与以前的方法不同，我们更多地专注于基于贝叶斯观点以及如何重新重新重构目标的恢复目标。具体而言，我们的方法放松了原始的后推理问题，以更好地管理子问题，因此表现得像分裂和互动方案。结果，与以前的框架相比，提出的框架提高了几个恢复问题的性能。具体而言，我们的方法在高斯denoising，现实世界中的降噪，盲图超级分辨率和JPEG压缩伪像减少方面提供了最先进的性能。

translated by 谷歌翻译

Learn from Unpaired Data for Image Restoration: A Variational Bayes Approach

Dihan Zheng , Xiaowen Zhang , Kaisheng Ma , Chenglong Bao

分类：计算机视觉

2022-04-21

在实践中，很难收集配对的培训数据，但是不合格的样本广泛存在。当前的方法旨在通过探索损坏的数据和清洁数据之间的关系来从未配对样本中生成合成的培训数据。这项工作提出了Lud-Vae，这是一种从边际分布中采样的数据中学习关节概率密度函数的深层生成方法。我们的方法基于一个经过精心设计的概率图形模型，在该模型中，干净和损坏的数据域在条件上是独立的。使用变异推断，我们最大化证据下限（ELBO）以估计关节概率密度函数。此外，我们表明在推理不变假设下没有配对样品的情况下，ELBO是可以计算的。该属性在未配对的环境中提供了我们方法的数学原理。最后，我们将我们的方法应用于现实世界图像denoising，超分辨率和低光图像增强任务，并使用Lud-vae生成的合成数据训练模型。实验结果验证了我们方法比其他方法的优势。

translated by 谷歌翻译

Deep Plug-and-Play Prior for Hyperspectral Image Restoration

Zeqiang Lai , Kaixuan Wei , Ying Fu

分类：计算机视觉 | 机器学习

2022-09-17

基于深度学习的高光谱图像（HSI）恢复方法因其出色的性能而广受欢迎，但每当任务更改的细节时，通常都需要昂贵的网络再培训。在本文中，我们建议使用有效的插入方法以统一的方法恢复HSI，该方法可以共同保留基于优化方法的灵活性，并利用深神经网络的强大表示能力。具体而言，我们首先开发了一个新的深HSI DeNoiser，利用了门控复发单元，短期和长期的跳过连接以及增强的噪声水平图，以更好地利用HSIS内丰富的空间光谱信息。因此，这导致在高斯和复杂的噪声设置下，在HSI DeNosing上的最新性能。然后，在处理各种HSI恢复任务之前，将提议的DeNoiser插入即插即用的框架中。通过对HSI超分辨率，压缩感测和内部进行的广泛实验，我们证明了我们的方法经常实现卓越的性能，这与每个任务上的最先进的竞争性或甚至更好任何特定任务的培训。

translated by 谷歌翻译

An Effective Image Restorer: Denoising and Luminance Adjustment for Low-photon-count Imaging

Shansi Zhang , Edmund Y. Lam

分类：计算机视觉

2021-10-29

在光子 - 稀缺情况下的成像引入了许多应用的挑战，因为捕获的图像具有低信噪比和较差的亮度。在本文中，我们通过模拟量子图像传感器（QIS）的成像来研究低光子计数条件下的原始图像恢复。我们开发了一个轻量级框架，由多级金字塔去噪网络（MPDNET）和亮度调整（LA）模块组成，以实现单独的去噪和亮度增强。我们框架的主要组成部分是多跳过的剩余块（MARB），其集成了多尺度特征融合和注意机制，以实现更好的特征表示。我们的MPDNET采用拉普拉斯金字塔的想法，以了解不同级别的小规模噪声图和大规模的高频细节，在多尺度输入图像上进行特征提取，以编码更丰富的上下文信息。我们的LA模块通过估计其照明来增强去噪图像的亮度，这可以更好地避免颜色变形。广泛的实验结果表明，通过抑制噪声并有效地恢复亮度和颜色，我们的图像恢复器可以在具有各种光子水平的具有各种光子水平的降解图像上实现优异的性能。

translated by 谷歌翻译

Unsupervised Image Denoising with Frequency Domain Knowledge

Nahyun Kim , Donggon Jang , Sunhyeok Lee , Bomi Kim , Dae-Shik Kim

分类：计算机视觉

2021-11-29

受监管的基于学习的方法屈服于强大的去噪结果，但它们本质上受到大规模清洁/嘈杂配对数据集的需要。另一方面，使用无监督的脱言机需要更详细地了解潜在的图像统计数据。特别是，众所周知，在高频频带上，清洁和嘈杂的图像之间的表观差异是最突出的，证明使用低通滤波器作为传统图像预处理步骤的一部分。然而，基于大多数基于学习的去噪方法在不考虑频域信息的情况下仅利用来自空间域的片面信息。为了解决这一限制，在本研究中，我们提出了一种频率敏感的无监督去噪方法。为此，使用生成的对抗性网络（GaN）作为基础结构。随后，我们包括光谱鉴别器和频率重建损失，以将频率知识传输到发电机中。使用自然和合成数据集的结果表明，我们无监督的学习方法增强了频率信息，实现了最先进的去噪能力，表明频域信息可能是提高无监督基于学习的方法的整体性能的可行因素。

translated by 谷歌翻译

Toward Convolutional Blind Denoising of Real Photographs

Shi Guo , Zifei Yan , Kai Zhang , Wangmeng Zuo , Lei Zhang

分类：

2018-07-12

While deep convolutional neural networks (CNNs) have achieved impressive success in image denoising with additive white Gaussian noise (AWGN), their performance remains limited on real-world noisy photographs. The main reason is that their learned models are easy to overfit on the simplified AWGN model which deviates severely from the complicated real-world noise model. In order to improve the generalization ability of deep CNN denoisers, we suggest training a convolutional blind denoising network (CBDNet) with more realistic noise model and real-world noisy-clean image pairs. On the one hand, both signaldependent noise and in-camera signal processing pipeline is considered to synthesize realistic noisy images. On the other hand, real-world noisy photographs and their nearly noise-free counterparts are also included to train our CBD-Net. To further provide an interactive strategy to rectify denoising result conveniently, a noise estimation subnetwork with asymmetric learning to suppress under-estimation of noise level is embedded into CBDNet. Extensive experimental results on three datasets of real-world noisy photographs clearly demonstrate the superior performance of CBDNet over state-of-the-arts in terms of quantitative metrics and visual quality. The code has been made available at https://github.com/GuoShi28/CBDNet.

translated by 谷歌翻译

Denoising single images by feature ensemble revisited

Masud An Nur Islam Fahim , Nazmus Saqib , Shafkat Khan Siam , Ho Yub Jung

分类：计算机视觉 | 机器学习

2022-07-11

在许多计算机视觉子域中，图像降级仍然是一个具有挑战性的问题。最近的研究表明，在有监督的环境中取得了重大改进。但是，很少有挑战（例如空间忠诚度和类似卡通的平滑度）仍未解决或果断地忽略。我们的研究提出了一个简单而有效的架构，用于解决上述问题的降级问题。所提出的体系结构重新审视了模块化串联的概念，而不是长时间和更深的级联连接，以恢复给定图像的更清洁近似。我们发现不同的模块可以捕获多功能表示形式，而串联表示为低级图像恢复创造了更丰富的子空间。所提出的架构的参数数量仍然小于以前的大多数网络的数量，并且仍然对当前最新网络进行了重大改进。

translated by 谷歌翻译

NBD-GAP: Non-Blind Image Deblurring Without Clean Target Images

Nithin Gopalakrishnan Nair , Rajeev Yasarla , Vishal M. Patel

分类：计算机视觉

2022-09-20

近年来，基于神经网络的深度恢复方法已实现了最先进的方法，从而导致了各种图像过度的任务。但是，基于深度学习的Deblurring网络的一个主要缺点是，训练需要大量模糊清洁图像对才能实现良好的性能。此外，当测试过程中的模糊图像和模糊内核与训练过程中使用的图像和模糊内核时，深层网络通常无法表现良好。这主要是因为网络参数在培训数据上过度拟合。在这项工作中，我们提出了一种解决这些问题的方法。我们将非盲图像脱毛问题视为一个脱氧问题。为此，我们在一对模糊图像上使用相应的模糊内核进行Wiener过滤。这导致一对具有彩色噪声的图像。因此，造成造成的问题被转化为一个降解问题。然后，我们在不使用明确的清洁目标图像的情况下解决了降解问题。进行了广泛的实验，以表明我们的方法取得了与最先进的非盲人脱毛作品相提并论的结果。

translated by 谷歌翻译

Enhancing Image Rescaling using Dual Latent Variables in Invertible Neural Network

Min Zhang , Zhihong Pan , Xin Zhou , C. -C. Jay Kuo

分类：计算机视觉

2022-07-24

通过将自然图像的复杂分布近似通过可逆神经网络（INN）近似于潜在空间中的简单拖延分布，已成功地用于生成图像超分辨率（SR）。这些模型可以使用潜在空间中的随机采样点从一个低分辨率（LR）输入中生成多个逼真的SR图像，从而模拟图像升级的不足的性质，其中多个高分辨率（HR）图像对应于同一LR。最近，INN中的可逆过程也通过双向图像重新缩放模型（如IRN和HCFLOW）成功使用，以优化降尺度和逆向上尺度的关节，从而显着改善了高尺度的图像质量。尽管它们也被优化用于图像降尺度，但图像降尺度的不良性质可以根据不同的插值内核和重新采样方法将一个HR图像缩小到多个LR图像。除了代表图像放大的不确定性的原始缩小潜在变量外，还引入了图像降压过程中的模型变化。这种双重可变变量增强功能适用于不同的图像重新缩放模型，并且在广泛的实验中显示，它可以始终如一地提高图像升级精度，而无需牺牲缩小的LR图像中的图像质量。它还显示可有效增强基于Inn的其他模型，用于图像恢复应用（例如图像隐藏）。

translated by 谷歌翻译

Considering Image Information and Self-similarity: A Compositional Denoising Network

Jiahong Zhang , Yonggui Zhu , Wenshu Yu , Jingning Ma

分类：计算机视觉

2022-09-14

最近，卷积神经网络（CNN）已被广泛用于图像DeNoising。现有方法受益于剩余学习并获得高性能。许多研究都注意到优化CNN的网络体系结构，但忽略了残留学习的局限性。本文提出了两个局限性。一个是残留学习的重点是估计噪声，从而忽略图像信息。另一个是图像自相似性没有被有效考虑。本文提出了一个组成剥落网络（CDN），其图像信息路径（IIP）和噪声估计路径（NEP）将分别解决这两个问题。 IIP通过图像到图像的方法来培训图像信息。对于NEP，它从训练的角度利用了图像自相似性。这种基于相似性的训练方法将NEP限制为输出具有特定类型噪声的不同图像贴片的相似估计噪声分布。最后，将全面考虑图像信息和噪声分布信息，以进行图像denoising。实验表明，CDN达到最新的结果会导致合成和现实世界图像降解。我们的代码将在https://github.com/jiahongz/cdn上发布。

translated by 谷歌翻译

Ultrasound Speckle Suppression and Denoising using MRI-derived Normalizing Flow Priors

Vincent van de Schaft , Ruud J. G. van Sloun

分类：计算机视觉

2021-12-24

超声波术提供廉价，广泛可接近和紧凑的医疗成像解决方案。然而，与其他成像方式相比，例如CT和MRI，超声图像臭名昭着地遭受强大的散斑噪声，其源自子波长散射的随机干扰。这恶化了超声图像质量并使解释具有挑战性。我们在此提出了一种基于从高质量MRI图像中学到的深生成前的最大-A-Bouthiori估计的新的无监督超声斑点和图像去噪方法。为了模拟生成组织反射率，我们利用标准化流量，近年来已经表现出在各种应用中建模信号前沿的强大。为了促进拓展，我们将先前和培训我们的流量模型从NYU FastMri（完全采样）数据集的补丁上。然后将该之前用于迭代去噪方案的推理。我们首先验证我们在嘈杂的MRI数据（无前域移位）上的学习前沿的实用程序，然后转向从PICMU和CUBDL数据集的模拟和体内超声图像上的评估性能。结果表明，该方法优于定量和定性的其他（无监督）超声的去噪方法（NLM和OBNLM）。

translated by 谷歌翻译

Learning Degradation Representations for Image Deblurring

Dasong Li , Yi Zhang , Ka Chun Cheung , Xiaogang Wang , Hongwei Qin , Hongsheng Li

分类：计算机视觉

2022-08-10

在各种基于学习的图像恢复任务（例如图像降解和图像超分辨率）中，降解表示形式被广泛用于建模降解过程并处理复杂的降解模式。但是，在基于学习的图像deblurring中，它们的探索程度较低，因为在现实世界中挑战性的情况下，模糊内核估计不能很好地表现。我们认为，对于图像降低的降解表示形式是特别必要的，因为模糊模式通常显示出比噪声模式或高频纹理更大的变化。在本文中，我们提出了一个框架来学习模糊图像的空间自适应降解表示。提出了一种新颖的联合图像re毁和脱蓝色的学习过程，以提高降解表示的表现力。为了使学习的降解表示有效地启动和降解，我们提出了一个多尺度退化注入网络（MSDI-NET），以将它们集成到神经网络中。通过集成，MSDI-NET可以适应各种复杂的模糊模式。 GoPro和Realblur数据集上的实验表明，我们提出的具有学识渊博的退化表示形式的Deblurring框架优于最先进的方法，具有吸引人的改进。该代码在https://github.com/dasongli1/learning_degradation上发布。

translated by 谷歌翻译

INFWIDE: Image and Feature Space Wiener Deconvolution Network for Non-blind Image Deblurring in Low-Light Conditions

Zhihong Zhang , Yuxiao Cheng , Jinli Suo , Liheng Bian , Qionghai Dai

分类：计算机视觉

2022-07-17

在弱光环境下，手持式摄影在长时间的曝光设置下遭受了严重的相机震动。尽管现有的Deblurry算法在暴露良好的模糊图像上表现出了令人鼓舞的性能，但它们仍然无法应对低光快照。在实用的低光脱毛中，复杂的噪声和饱和区是两个主导挑战。在这项工作中，我们提出了一种称为图像的新型非盲脱毛方法，并具有特征空间Wiener Deonervolution网络（Infwide），以系统地解决这些问题。在算法设计方面，Infwide提出了一个两分支的架构，该体系结构明确消除了噪声并幻觉，使图像空间中的饱和区域抑制了特征空间中的响起文物，并将两个互补输出与一个微妙的多尺度融合网络集成在一起高质量的夜间照片浮雕。为了进行有效的网络培训，我们设计了一组损失功能，集成了前向成像模型和向后重建，以形成近环的正则化，以确保深神经网络的良好收敛性。此外，为了优化Infwide在实际弱光条件下的适用性，采用基于物理过程的低光噪声模型来合成现实的嘈杂夜间照片进行模型训练。利用传统的Wiener Deonervolution算法的身体驱动的特征并引起了深层神经网络的表示能力，Infwide可以恢复细节，同时抑制在脱毛期间的不愉快的人工制品。关于合成数据和实际数据的广泛实验证明了所提出的方法的出色性能。

translated by 谷歌翻译

Towards Blind Watermarking: Combining Invertible and Non-invertible Mechanisms

Rui Ma , Mengxi Guo , Yi Hou , Fan Yang , Yuan Li , Huizhu Jia , Xiaodong Xie

分类：计算机视觉

2022-12-24

Blind watermarking provides powerful evidence for copyright protection, image authentication, and tampering identification. However, it remains a challenge to design a watermarking model with high imperceptibility and robustness against strong noise attacks. To resolve this issue, we present a framework Combining the Invertible and Non-invertible (CIN) mechanisms. The CIN is composed of the invertible part to achieve high imperceptibility and the non-invertible part to strengthen the robustness against strong noise attacks. For the invertible part, we develop a diffusion and extraction module (DEM) and a fusion and split module (FSM) to embed and extract watermarks symmetrically in an invertible way. For the non-invertible part, we introduce a non-invertible attention-based module (NIAM) and the noise-specific selection module (NSM) to solve the asymmetric extraction under a strong noise attack. Extensive experiments demonstrate that our framework outperforms the current state-of-the-art methods of imperceptibility and robustness significantly. Our framework can achieve an average of 99.99% accuracy and 67.66 dB PSNR under noise-free conditions, while 96.64% and 39.28 dB combined strong noise attacks. The code will be available in https://github.com/rmpku/CIN.

translated by 谷歌翻译

Wavelet Transform-assisted Adaptive Generative Modeling for Colorization

Jin Li , Wanyun Li , Zichen Xu , Yuhao Wang , Qiegen Liu

分类：计算机视觉

2021-07-09

无监督的深度学习最近证明了生产高质量样本的希望。尽管它具有促进图像着色任务的巨大潜力，但由于数据歧管和模型能力的高维度，性能受到限制。这项研究提出了一种新的方案，该方案利用小波域中的基于得分的生成模型来解决这些问题。通过利用通过小波变换来利用多尺度和多渠道表示，该模型可以共同有效地从堆叠的粗糙小波系数组件中了解较富裕的先验。该策略还降低了原始歧管的维度，并减轻了维度的诅咒，这对估计和采样有益。此外，设计了小波域中的双重一致性项，即数据一致性和结构一致性，以更好地利用着色任务。具体而言，在训练阶段，一组由小波系数组成的多通道张量被用作训练网络以denoising得分匹配的输入。在推论阶段，样品是通过具有数据和结构一致性的退火Langevin动力学迭代生成的。实验证明了所提出的方法在发电和着色质量方面的显着改善，尤其是在着色鲁棒性和多样性方面。

translated by 谷歌翻译