智能论文笔记

Image quality measurements and denoising using Fourier Ring Correlations

J. Kaczmar-Michalska , N. R. Hajizadeh , A. J. Rzepiela , S. F. Nørrelykke

分类：计算机视觉 | 机器学习

2022-01-11

图像质量是一个模糊的概念，对不同的人不同的含义。为了量化图像质量，通常在损坏的图像和地面真实图像之间计算相对差异。但是我们应该使用哪些指标来测量这种差异？理想情况下，公制应对自然和科学图像表现良好。结构相似度指数（SSIM）是人类如何感知图像相似性的好措施，但对显微镜中科学有意义的差异不敏感。在电子和超分辨率显微镜中，经常使用傅里叶环相关（FRC），但在这些领域之外几乎是知名的。在这里，我们表明FRC同样可以应用于自然图像，例如自然图像。 Google打开图像数据集。然后，我们基于FRC定义了损失功能，表明它是在分析上可分的，并使用它来训练U-Net以用于去噪图像。这种基于FRC的损耗功能允许网络训练更快并达到与使用基于L1或L2的损失相似或更好的结果。我们还研究了通过FRC分析的神经网络去噪的性质和局限性。

translated by 谷歌翻译

Fully Adaptive Bayesian Algorithm for Data Analysis, FABADA

Pablo M Sanchez-Alarcon , Yago Ascasibar Sequeiros

分类：计算机视觉

2022-01-13

本文的目的是描述一种从贝叶斯推理的观点来描述一种新的非参数降噪技术，其可以自动提高一个和二维数据的信噪比，例如例如，例如，天文图像和光谱。该算法迭代地评估数据的可能的平滑版本，平滑模型，获得与嘈杂测量统计上兼容的底层信号的估计。迭代基于最后一个顺利模型的证据和$ \ Chi ^ 2 $统计数据，并且我们将信号的预期值计算为整个平滑模型的加权平均值。在本文中，我们解释了算法的数学形式主义和数值实现，我们在利用真正的天文观测的电池对峰值信号，结构相似性指数和时间有效载荷来评估其性能。我们完全自适应的贝叶斯算法用于数据分析（Fabada）产生结果，没有任何参数调谐，与标准图像处理算法相当，其参数基于要恢复的真实信号进行了优化，在实际应用中不可能。诸如BM3D的最先进的非参数方法，以高信噪比提供稍微更好的性能，而我们的算法对于极其嘈杂的数据显着更准确（高于20-40 \％$相对错误，在天文领域特别兴趣的情况）。在此范围内，通过我们的重建获得的残差的标准偏差可能变得比原始测量值低的数量级。复制本报告中显示的所有结果所需的源代码，包括该方法的实现，在https://github.com/pablolyanala/fabada公开使用

translated by 谷歌翻译

Image quality assessment: from error visibility to structural similarity

分类：

Objective methods for assessing perceptual image quality have traditionally attempted to quantify the visibility of errors between a distorted image and a reference image using a variety of known properties of the human visual system. Under the assumption that human visual perception is highly adapted for extracting structural information from a scene, we introduce an alternative framework for quality assessment based on the degradation of structural information. As a specific example of this concept, we develop a Structural Similarity Index and demonstrate its promise through a set of intuitive examples, as well as comparison to both subjective ratings and state-of-the-art objective methods on a database of images compressed with JPEG and JPEG2000. 1

translated by 谷歌翻译

On Measuring and Controlling the Spectral Bias of the Deep Image Prior

Zenglin Shi , Pascal Mettes , Subhransu Maji , Cees G. M. Snoek

分类：计算机视觉

2021-07-02

深度图像先验表明，通过简单地优化它的参数来重建单个降级图像，可以训练具有合适架构的随机初始化网络以解决反向成像问题。但是，它受到了两个实际限制。首先，它仍然不清楚如何在网络架构选择之前控制。其次，培训需要Oracle停止标准，因为在优化期间，在达到最佳值后性能降低。为了解决这些挑战，我们引入频带对应度量以表征在之前的深图像的光谱偏压，其中低频图像信号比高频对应物更快且更好地学习。根据我们的观察，我们提出了防止最终性能下降和加速收敛的技术。我们介绍了Lipschitz受控的卷积层和高斯控制的上采样层，作为深度架构中使用的层的插件替代品。实验表明，随着这些变化，在优化期间，性能不会降低，从需要对Oracle停止标准的需求中脱离我们。我们进一步勾勒出停止标准以避免多余的计算。最后，我们表明我们的方法与各种去噪，去块，染色，超级分辨率和细节增强任务的当前方法相比获得了有利的结果。代码可用于\ url {https:/github.com/shizenglin/measure-and-control-spectraL-bias}。

translated by 谷歌翻译

As if by magic: self-supervised training of deep despeckling networks with MERLIN

Emanuele Dalsasso , Loïc Denis , Florence Tupin

分类：计算机视觉

2021-10-25

斑点波动严重限制了合成孔径雷达（SAR）图像的可解释性。因此，散斑减少是跨越至少四十年的众多作品的主题。基于深度神经网络的技术最近在SAR图像恢复质量方面实现了一种新的性能。超出了合适的网络架构的设计或选择足够的损失功能，培训集的构建是最重要的。到目前为止，大多数方法都考虑了监督培训策略：培训网络以产生尽可能靠近斑点的参考图像的输出。无斑点图像通常不可用，这需要采用自然或光学图像或在长时间序列中选择稳定区域，以规避缺乏地面真理。另一方面，自我监督避免使用无斑点图像。我们介绍了一个自我监督的战略，基于单眼复杂的SAR图像的真实和虚构部分的分离，称为Merlin（复杂的自我监督的机除），并表明它提供了一种培训各种深度掠夺的直接途径网络。由于特定于给定传感器和成像模式的SAR传输功能，使用Merlin培训的网络考虑了空间相关性。通过只需要一个图像，并且可能利用大型档案，Merlin将门打开了无忧无虑的机器，以及对机器网络的大规模培训。培训型号的代码是在https://gitlab.telecom-paris.fr/ring/mollin的。

translated by 谷歌翻译

Suppression of Correlated Noise with Similarity-based Unsupervised Deep Learning

Chuang Niu , Mengzhou Li , Fenglei Fan , Weiwen Wu , Xiaodong Guo , Qing Lyu , Ge Wang

分类：机器学习 | 计算机视觉

2020-11-06

图像去噪是许多领域下游任务的先决条件。低剂量和光子计数计算断层扫描（CT）去噪可以在最小化辐射剂量下优化诊断性能。监督深层去噪方法是流行的，但需要成对的清洁或嘈杂的样本通常在实践中不可用。受独立噪声假设的限制，电流无监督的去噪方法不能处理与CT图像中的相关噪声。在这里，我们提出了一种基于类似的类似性的无人监督的无监督的深度去噪方法，称为Coxing2Sim，以非局部和非线性方式起作用，不仅抑制独立而且还具有相关的噪音。从理论上讲，噪声2SIM在温和条件下渐近相当于监督学习方法。通过实验，Nosie2SIM从嘈杂的低剂量CT和光子计数CT图像中的内在特征，从视觉上，定量和统计上有效地或甚至优于实际数据集的监督学习方法。 Coke2Sim是一般无监督的去噪方法，在不同的应用中具有很大的潜力。

translated by 谷歌翻译

Blind Image Deblurring with Unknown Kernel Size and Substantial Noise

Zhong Zhuang , Taihui Li , Hengkang Wang , Ju Sun

分类：计算机视觉 | 机器学习

2022-08-18

在计算机视觉和邻近字段中，已广泛研究了盲图片脱毛（BID）。投标的现代方法可以分为两类：使用统计推断和数值优化处理单个实例的单个实体方法，以及数据驱动的方法，这些方法可以直接训练深度学习模型来直接删除未来实例。数据驱动的方法可以摆脱得出准确的模型模型的困难，但从根本上受到培训数据的多样性和质量的限制 - 收集足够表达和现实的培训数据是一个坚定的挑战。在本文中，我们专注于保持竞争力和必不可少的单一稳定方法。但是，大多数此类方法没有规定如何处理未知内核大小和实质性噪音，从而排除了实际部署。实际上，我们表明，当核大小被明确指定时，几种最新的（SOTA）单位方法是不稳定的，并且/或噪声水平很高。从积极的一面来看，我们提出了一种实用的出价方法，该方法对这两者都是稳定的，这是同类的。我们的方法建立在最新的思想，即通过整合物理模型和结构深度神经网络而没有额外的培训数据来解决反问题。我们引入了几种关键修改以实现所需的稳定性。与SOTA单位结构以及数据驱动的方法相比，对标准合成数据集以及现实世界中的NTIRE2020和REALBLUR数据集进行了广泛的经验测试。我们方法的代码可在：\ url {https://github.com/sun-unm/blind-image-deblurring}中获得。

translated by 谷歌翻译

Reverse image filtering using total derivative approximation and accelerated gradient descent

Fernando J. Galetto , Guang Deng

分类：计算机视觉

2021-12-08

在本文中，我们解决了逆转图像滤波器效果的新问题，该图像过滤器可以是线性的或非线性的。假设是滤波器的算法未知，滤波器可作为黑框。我们为最小化本地补丁的成本函数和使用总衍生物来近似于梯度下降以解决问题的渐变来制定该逆问题。我们分析影响傅里叶域中输出的收敛和质量的因素。我们还研究加速梯度下降算法在三个无梯度的反向滤波器中的应用，包括本文提出的较方案。我们提出了广泛的实验结果，以评估所提出的算法的复杂性和有效性。结果表明，所提出的算法优于现有技术（1），它与最快的反向滤波器的复杂程度相同，但它可以反转更多数量的滤波器，并且（2）它可以反转与非常复杂的反滤波器的过滤器相同的滤波器列表，但其复杂性要小得多。

translated by 谷歌翻译

Parametric Level-sets Enhanced To Improve Reconstruction (PaLEnTIR)

Ege Ozsar , Misha Kilmer , Eric Miller , Eric de Sturler , Arvind Saibaba

分类：计算机视觉

2022-04-21

在本文中，我们考虑使用Palentir在两个和三个维度中对分段常数对象的恢复和重建，这是相对于当前最新ART的显着增强的参数级别集（PALS）模型。本文的主要贡献是一种新的PALS公式，它仅需要一个单个级别的函数来恢复具有具有多个未知对比度的分段常数对象的场景。我们的模型比当前的多对抗性，多对象问题提供了明显的优势，所有这些问题都需要多个级别集并明确估计对比度大小。给定对比度上的上限和下限，我们的方法能够以任何对比度分布恢复对象，并消除需要知道给定场景中的对比度或其值的需求。我们提供了一个迭代过程，以找到这些空间变化的对比度限制。相对于使用径向基函数（RBF）的大多数PAL方法，我们的模型利用了非异型基函数，从而扩展了给定复杂性的PAL模型可以近似的形状类别。最后，Palentir改善了作为参数识别过程一部分所需的Jacobian矩阵的条件，因此通过控制PALS扩展系数的幅度来加速优化方法，固定基本函数的中心，以及参数映射到图像映射的唯一性，由新参数化提供。我们使用X射线计算机断层扫描，弥漫性光学断层扫描（DOT），Denoising，DeonConvolution问题的2D和3D变体证明了新方法的性能。应用于实验性稀疏CT数据和具有不同类型噪声的模拟数据，以进一步验证所提出的方法。

translated by 谷歌翻译

Deep Image Prior

Dmitry Ulyanov , Andrea Vedaldi , Victor Lempitsky

分类：

2017-11-29

Deep convolutional networks have become a popular tool for image generation and restoration. Generally, their excellent performance is imputed to their ability to learn realistic image priors from a large number of example images. In this paper, we show that, on the contrary, the structure of a generator network is sufficient to capture a great deal of low-level image statistics prior to any learning. In order to do so, we show that a randomly-initialized neural network can be used as a handcrafted prior with excellent results in standard inverse problems such as denoising, superresolution, and inpainting. Furthermore, the same prior can be used to invert deep neural representations to diagnose them, and to restore images based on flash-no flash input pairs.

translated by 谷歌翻译

Wavelet-based Loss for High-frequency Interface Dynamics

Lukas Prantl , Jan Bender , Tassilo Kugelstadt , Nils Thuerey

分类：机器学习

2022-09-06

生成高度详细的复杂数据是机器学习领域中的长期存在且经常考虑的问题。但是，开发细节感知的发电机仍然是一个具有挑战性和开放的问题。生成对抗网络是许多最新方法的基础。但是，他们引入了第二个网络作为损失函数训练，使对学习功能的解释变得更加困难。作为替代方案，我们提出了一种基于小波损耗公式的新方法，该方法在优化方面保持透明。在生成具有高频细节的数据时，基于小波的损耗函数用于克服常规距离指标（例如L1或L2距离）的局限性。我们表明，我们的方法可以在说明性合成测试案例中成功重建高频细节。此外，我们根据物理模拟应用于更复杂的表面时评估性能。以大致近似的模拟为输入，我们的方法在考虑它们的发展方式的同时进化了相应的空间细节。我们考虑了这个问题，从空间和时间频率方面，并利用训练有我们的小波损失的生成网络来学习表面动力学的所需时空信号。我们通过一组合成波函数测试以及弹性塑料材料的复杂2D和3D动力学测试方法的功能。

translated by 谷歌翻译

ISNAS-DIP: Image-Specific Neural Architecture Search for Deep Image Prior

Metin Ersin Arican , Ozgur Kara , Gustav Bredell , Ender Konukoglu

分类：计算机视觉

2021-11-27

最近的作品表明，卷积神经网络（CNN）架构具有朝向较低频率的光谱偏压，这已经针对在之前（DIP）框架中的深度图像中的各种图像恢复任务而被利用。归纳偏置的益处网络施加在DIP框架中取决于架构。因此，研究人员研究了如何自动化搜索来确定最佳性能的模型。然而，常见的神经结构搜索（NAS）技术是资源和时间密集的。此外，最佳性能的模型是针对整个图像的整个数据集而不是为每个图像独立地确定，这将是非常昂贵的。在这项工作中，我们首先表明DIP框架中的最佳神经结构是依赖于图像的。然后利用这种洞察力，我们提出了一种特定于DIP框架的图像特定的NAS策略，其需要比典型的NAS方法大得多，有效地实现特定于图像的NA。对于给定的图像，噪声被馈送到大量未训练的CNN，并且它们的输出的功率谱密度（PSD）与使用各种度量的损坏图像进行比较。基于此，选择并培训了一个小型的图像特定架构，以重建损坏的图像。在这种队列中，选择重建最接近重建图像的平均值的模型作为最终模型。我们向拟议的战略证明（1）证明其在NAS数据集上的表现效果，该数据集包括来自特定搜索空间（2）的500多种模型，在特定的搜索空间（2）上进行了广泛的图像去噪，染色和超级分辨率任务。我们的实验表明，图像特定度量可以将搜索空间减少到小型模型队列，其中最佳模型优于电流NAS用于图像恢复的方法。

translated by 谷歌翻译

Deep Variation Prior: Joint Image Denoising and Noise Variance Estimation without Clean Data

Rihuan Ke

分类：计算机视觉 | 机器学习

2022-09-19

通过最近基于深度学习的方法显示出令人鼓舞的结果，可以消除图像中的噪音，在有监督的学习设置中报道了最佳的降级性能，该设置需要大量的配对嘈杂图像和训练的基础真相。强大的数据需求可以通过无监督的学习技术来减轻，但是，对于高质量的解决方案，图像或噪声方差的准确建模仍然至关重要。对于未知的噪声分布而言，学习问题不足。本文研究了单个联合学习框架中图像降解和噪声方差估计的任务。为了解决问题的不良性，我们提出了深度差异先验（DVP），该差异指出，适当学到的DeNoiser在噪声变化方面的变化满足了一些平滑度的特性，这是良好DeNoiser的关键标准。建立在DVP的基础上，这是一个无监督的深度学习框架，同时学习了Denoiser并估算了噪声差异。我们的方法不需要任何干净的训练图像或噪声估计的外部步骤，而是仅使用一组嘈杂的图像近似于最小平方误差Denoisiser。在一个框架中考虑了两个基本任务，我们允许它们相互优化。实验结果表明，具有与监督的学习和准确的噪声方差估计值相当的质量。

translated by 谷歌翻译

Image Denoising with Control over Deep Network Hallucination

Qiyuan Liang , Florian Cassayre , Haley Owsianko , Majed El Helou , Sabine Süsstrunk

分类：计算机视觉

2022-01-02

深度图像置位者实现最先进的结果，但具有隐藏的成本。如最近的文献所见，这些深度网络能够过度接受其训练分布，导致将幻觉不准确地添加到输出并概括到不同的数据。为了更好地控制和解释性，我们提出了一种新颖的框架，利用了去噪网络。我们称之为可控的基于席位的图像去噪（CCID）。在此框架中，我们利用深度去噪网络的输出与通过可靠的过滤器卷积的图像一起。这样的过滤器可以是一个简单的卷积核，其不会增加添加幻觉信息。我们建议使用频域方法熔断两个组件，该方法考虑了深网络输出的可靠性。通过我们的框架，用户可以控制频域中两个组件的融合。我们还提供了一个用户友好的地图估算，空间上的置信度可能包含网络幻觉。结果表明，我们的CCID不仅提供了更多的可解释性和控制，而且甚至可以优于深脱离机构的定量性能和可靠的过滤器的定量性能，尤其是当测试数据从训练数据发散时。

translated by 谷歌翻译

Unsupervised Image Denoising with Frequency Domain Knowledge

Nahyun Kim , Donggon Jang , Sunhyeok Lee , Bomi Kim , Dae-Shik Kim

分类：计算机视觉

2021-11-29

受监管的基于学习的方法屈服于强大的去噪结果，但它们本质上受到大规模清洁/嘈杂配对数据集的需要。另一方面，使用无监督的脱言机需要更详细地了解潜在的图像统计数据。特别是，众所周知，在高频频带上，清洁和嘈杂的图像之间的表观差异是最突出的，证明使用低通滤波器作为传统图像预处理步骤的一部分。然而，基于大多数基于学习的去噪方法在不考虑频域信息的情况下仅利用来自空间域的片面信息。为了解决这一限制，在本研究中，我们提出了一种频率敏感的无监督去噪方法。为此，使用生成的对抗性网络（GaN）作为基础结构。随后，我们包括光谱鉴别器和频率重建损失，以将频率知识传输到发电机中。使用自然和合成数据集的结果表明，我们无监督的学习方法增强了频率信息，实现了最先进的去噪能力，表明频域信息可能是提高无监督基于学习的方法的整体性能的可行因素。

translated by 谷歌翻译

Variational Deep Image Restoration

Jae Woong Soh , Nam Ik Cho

分类：计算机视觉

2022-07-03

本文提出了图像恢复的新变异推理框架和一个卷积神经网络（CNN）结构，该结构可以解决所提出的框架所描述的恢复问题。较早的基于CNN的图像恢复方法主要集中在网络体系结构设计或培训策略上，具有非盲方案，其中已知或假定降解模型。为了更接近现实世界的应用程序，CNN还接受了整个数据集的盲目培训，包括各种降解。然而，给定有多样化的图像的高质量图像的条件分布太复杂了，无法通过单个CNN学习。因此，也有一些方法可以提供其他先验信息来培训CNN。与以前的方法不同，我们更多地专注于基于贝叶斯观点以及如何重新重新重构目标的恢复目标。具体而言，我们的方法放松了原始的后推理问题，以更好地管理子问题，因此表现得像分裂和互动方案。结果，与以前的框架相比，提出的框架提高了几个恢复问题的性能。具体而言，我们的方法在高斯denoising，现实世界中的降噪，盲图超级分辨率和JPEG压缩伪像减少方面提供了最先进的性能。

translated by 谷歌翻译

NBD-GAP: Non-Blind Image Deblurring Without Clean Target Images

Nithin Gopalakrishnan Nair , Rajeev Yasarla , Vishal M. Patel

分类：计算机视觉

2022-09-20

近年来，基于神经网络的深度恢复方法已实现了最先进的方法，从而导致了各种图像过度的任务。但是，基于深度学习的Deblurring网络的一个主要缺点是，训练需要大量模糊清洁图像对才能实现良好的性能。此外，当测试过程中的模糊图像和模糊内核与训练过程中使用的图像和模糊内核时，深层网络通常无法表现良好。这主要是因为网络参数在培训数据上过度拟合。在这项工作中，我们提出了一种解决这些问题的方法。我们将非盲图像脱毛问题视为一个脱氧问题。为此，我们在一对模糊图像上使用相应的模糊内核进行Wiener过滤。这导致一对具有彩色噪声的图像。因此，造成造成的问题被转化为一个降解问题。然后，我们在不使用明确的清洁目标图像的情况下解决了降解问题。进行了广泛的实验，以表明我们的方法取得了与最先进的非盲人脱毛作品相提并论的结果。

translated by 谷歌翻译

No-reference image quality assessment in the spatial domain

分类：

We propose a natural scene statistic-based distortion-generic blind/no-reference (NR) image quality assessment (IQA) model that operates in the spatial domain. The new model, dubbed blind/referenceless image spatial quality evaluator (BRISQUE) does not compute distortion-specific features, such as ringing, blur, or blocking, but instead uses scene statistics of locally normalized luminance coefficients to quantify possible losses of "naturalness" in the image due to the presence of distortions, thereby leading to a holistic measure of quality. The underlying features used derive from the empirical distribution of locally normalized luminances and products of locally normalized luminances under a spatial natural scene statistic model. No transformation to another coordinate frame (DCT, wavelet, etc.) is required, distinguishing it from prior NR IQA approaches. Despite its simplicity, we are able to show that BRISQUE is statistically better than the full-reference peak signal-tonoise ratio and the structural similarity index, and is highly competitive with respect to all present-day distortion-generic NR IQA algorithms. BRISQUE has very low computational complexity, making it well suited for real time applications. BRISQUE features may be used for distortion-identification as well. To illustrate a new practical application of BRISQUE, we describe how a nonblind image denoising algorithm can be augmented with BRISQUE in order to perform blind image denoising. Results show that BRISQUE augmentation leads to performance improvements over state-of-the-art methods. A software release of BRISQUE is available online: http:// live.ece.utexas.edu/ research/ quality/ BRISQUE_release.zip for public use and evaluation.

translated by 谷歌翻译

Resampling and super-resolution of hexagonally sampled images using deep learning

Dylan Flaute , Russell C. Hardie , Hamed Elwarfalli

分类：人工智能 | 计算机视觉 | 机器学习

2021-11-03

超级分辨率（SR）旨在增加图像的分辨率。应用程序包括安全性，医学成像和对象识别。我们提出了一种基于深度学习的SR系统，其将六角采样的低分辨率图像作为输入，并产生矩形采样的SR图像作为输出。为了进行培训和测试，我们使用一种现实观察模型，包括从衍射和传感器劣化的光学劣化，从检测器集成。我们的SR方法首先使用非均匀插值来部分地上置观察到的六边形图像并将其转换为矩形网格。然后，我们利用了设计用于SR的最先进的卷积神经网络（CNN）架构，该架构被称为残留通道注意网络（RCAN）。特别是，我们使用RCAN进一步上表并恢复图像以产生最终的SR图像估计。我们证明该系统优于将RCAN直接施加到具有等效样本密度的矩形采样的LR图像。六边形取样的理论优势是众所周知的。然而，据我们所知，六角形取样的实际好处，即RCAN SR等现代加工技术是迄今为止未经测试的。我们的SR系统演示了六角形样式在采用修改的RCAN进行六边形SR时的显着优势。

translated by 谷歌翻译

ENSURE: A General Approach for Unsupervised Training of Deep Image Reconstruction Algorithms

Hemant Kumar Aggarwal , Aniket Pramanik , Maneesh John , Mathews Jacob

分类：计算机视觉 | 机器学习 | (统计)机器学习

2020-10-20

Image reconstruction using deep learning algorithms offers improved reconstruction quality and lower reconstruction time than classical compressed sensing and model-based algorithms. Unfortunately, clean and fully sampled ground-truth data to train the deep networks is often unavailable in several applications, restricting the applicability of the above methods. We introduce a novel metric termed the ENsemble Stein's Unbiased Risk Estimate (ENSURE) framework, which can be used to train deep image reconstruction algorithms without fully sampled and noise-free images. The proposed framework is the generalization of the classical SURE and GSURE formulation to the setting where the images are sampled by different measurement operators, chosen randomly from a set. We evaluate the expectation of the GSURE loss functions over the sampling patterns to obtain the ENSURE loss function. We show that this loss is an unbiased estimate for the true mean-square error, which offers a better alternative to GSURE, which only offers an unbiased estimate for the projected error. Our experiments show that the networks trained with this loss function can offer reconstructions comparable to the supervised setting. While we demonstrate this framework in the context of MR image recovery, the ENSURE framework is generally applicable to arbitrary inverse problems.

translated by 谷歌翻译