智能论文笔记

Gaussian Fourier Pyramid for Local Laplacian Filter

Yuto Sumiya , Tomoki Otsuka , Yoshihiro Maeda , Norishige Fukushima

分类：计算机视觉

2022-06-08

多尺度处理对于图像处理和计算机图形至关重要。光环是多尺度处理中的核心问题。通过扩展Laplacian金字塔以具有边缘保留特性，几种边缘保护分解可以解决局部拉普拉斯滤波（LLF）。它的处理成本很高；因此，提出了快速LLF的近似加速度，以线性插值多个拉普拉斯金字塔。本文通过傅立叶系列扩展进一步提高了精度，称为傅立叶LLF。我们的结果表明，对于相同数量的金字塔，傅立叶LLF具有更高的精度。此外，傅立叶LLF表现出用于内容自适应过滤的参数自适应性能。该代码可在以下网址获得：https：//norishigefukushima.github.io/gaussianfourierpyramid/。

translated by 谷歌翻译

Gradient Domain Weighted Guided Image Filtering

Bo Wang

分类：计算机视觉

2022-11-30

As an excellent local filter, guided image filters are subject to halo artifacts. In this paper, the algorithm uses gradient information to accurately determine the edge of the image, and uses the weighted information to further accurately distinguish the flat area and edge area of the image. As a result, the edges of the image are sharper and the level of blur in flat areas is reduced, avoiding halo artifacts caused by excessive blurring near edges. Experiments show that the proposed algorithm can better suppress halo artifacts at the edges. The proposed algorithm has good performance in both image denoising and image detail enhancement.

translated by 谷歌翻译

Single image deep defocus estimation and its applications

Fernando J. Galetto , Guang Deng

分类：计算机视觉

2021-07-30

深度信息在许多图像处理应用程序中是有用的。然而，由于拍摄图像是在2D成像传感器上投射3D场景的过程，因此深度信息嵌入图像中。从图像中提取深度信息是一个具有挑战性的任务。引导原理是由于散焦引起的蓝色水平与物体和焦平面之间的距离有关。基于该原理和广泛使用的假设，即高斯模糊是散焦模糊的良好模型，我们制定了作为高斯模糊分类问题的空间变化散焦模糊的问题。我们通过培训深度神经网络来解决图像补丁中的20级蓝色蓝色之一来解决问题。我们创建了一个超过500000美元的尺寸为32 \ times32 $的数据集，用于培训和测试几种知名网络模型。我们发现MobileNetv2由于其较低的内存要求和高精度而适用于此应用。训练模型用于确定通过施加迭代加权引导滤波器来改进的贴剂模糊。结果是散焦图，其携带每个像素的模糊度的信息。我们将提出的方法与最先进的技术进行比较，我们展示了其在自适应图像增强，散焦倍率和多聚焦图像融合中的成功应用。

translated by 谷歌翻译

Multi-Scale Single Image Dehazing Using Laplacian and Gaussian Pyramids

Zhengguo Li , Haiyan Shu , Chaobing Zheng

分类：计算机视觉

2021-11-10

由于其广泛的应用，模型驱动的单幅图像脱色在不同的前方之上被广泛研究。天空区域的物体光线和雾度与噪声放大之间的模糊性是模型驱动的单图像脱水的两个固有问题。在本文中，提出了先前（DDAP）的黑暗直接衰减，以解决前一个问题。提出了一种新的阴霾线平均来减少由DDAP引起的形态学伪像，其使加权引导图像过滤器能够进一步减少形态伪像，同时保留图像中的细结构。然后提出了一种通过采用拉普拉斯和瓜山金字塔将朦胧图像分解成不同水平并应用不同的雾度去除和降噪方法来解决后一种问题，以解决金字塔的不同级别的场景辐射。将得到的金字塔折叠以恢复无雾图像。实验结果表明，所提出的算法优于艺术脱水算法的状态，并且确实防止了噪声在天空区域中被放大。

translated by 谷歌翻译

Color Image Edge Detection using Multi-scale and Multi-directional Gabor filter

Yunhong Li , Yuandong Bi , Weichuan Zhang , Jie Ren , Jinni Chen

分类：计算机视觉

2022-08-16

在本文中，提出了一种颜色边缘检测方法，其中使用多尺度Gabor滤波器从输入颜色图像获得边缘。该方法的主要优点是在保持良好的噪声稳健性的同时，达到了高边缘检测精度。提出的方法包括三个方面：首先，RGB颜色图像由于其宽阔的着色区域和均匀的颜色分布而转换为CIE L*A*B*空间。其次，使用一组Gabor过滤器来平滑输入图像，并提取了色边缘强度图，并将其融合到具有噪声稳健性和准确边缘提取的新ESM中。第三，将熔融ESM嵌入精美探测器的途径中会产生噪声颜色边缘检测器。结果表明，所提出的检测器在检测准确性和噪声过程中具有更好的经验。

translated by 谷歌翻译

Point spread function estimation for blind image deblurring problems based on framelet transform

Reza Parvaz

分类：计算机视觉

2021-12-21

图像处理中最重要的问题之一是由于模糊过程而丢失的图像的近似。这些类型的事项分为非盲目和盲目问题。由于原始图像和点扩展功能估计未知，第二种问题比计算比第一个问题更复杂。在本文中，引入了一种基于$ L_0-\ alpha L_1 $正则化和帧转换的基于粗细迭代的算法，以近似传播函数估计。由于内核的分解到不同频率，Framefet转移改善了恢复的内核。同样在所提出的模型分数梯度运算符代替普通梯度操作员。在不同种类的图像上调查了所提出的方法，例如文本，面部，自然。所提出的方法的输出反映了所提出的算法在恢复图像中恢复盲问题的有效性。

translated by 谷歌翻译

Variational Approach for Intensity Domain Multi-exposure Image Fusion

Harbinder Singh , Dinesh Arora , Vinay Kumar

分类：计算机视觉

2022-07-09

最近的创新表明，通过单个低动态范围（LDR）传感器捕获的细节的混合克服了标准数码相机的局限性，以捕获高动态范围场景的细节。我们提出了一种生成曝光良好的融合图像的方法，该图像可以直接显示在常规显示器上。野心是为了保存细节较差且鲜明照明的地区。提出的方法不需要真正的辐射重建和音调操纵步骤。通过考虑到跨输入暴露的地方信息衡量的本地信息度量，可以实现上述目标。此外，引入了对比度有限的自适应直方图均衡（CLAHE），以提高融合之前输入多曝光图像的均匀性。

translated by 谷歌翻译

Reverse image filtering using total derivative approximation and accelerated gradient descent

Fernando J. Galetto , Guang Deng

分类：计算机视觉

2021-12-08

在本文中，我们解决了逆转图像滤波器效果的新问题，该图像过滤器可以是线性的或非线性的。假设是滤波器的算法未知，滤波器可作为黑框。我们为最小化本地补丁的成本函数和使用总衍生物来近似于梯度下降以解决问题的渐变来制定该逆问题。我们分析影响傅里叶域中输出的收敛和质量的因素。我们还研究加速梯度下降算法在三个无梯度的反向滤波器中的应用，包括本文提出的较方案。我们提出了广泛的实验结果，以评估所提出的算法的复杂性和有效性。结果表明，所提出的算法优于现有技术（1），它与最快的反向滤波器的复杂程度相同，但它可以反转更多数量的滤波器，并且（2）它可以反转与非常复杂的反滤波器的过滤器相同的滤波器列表，但其复杂性要小得多。

translated by 谷歌翻译

Visible and Near Infrared Image Fusion Based on Texture Information

Guanyu Zhang , Beichen Sun , Yuehan Qi , Yang Liu

分类：计算机视觉

2022-07-22

多传感器融合被广泛用于自动驾驶汽车的环境感知系统。它解决了由环境变化引起的干扰，并使整个驾驶系统更安全，更可靠。在本文中，提出了一种基于纹理信息的新型可见和近红外融合方法，以增强非结构化的环境图像。它针对传统可见和近红外图像融合方法中的工件，信息丢失和噪声问题。首先，通过相对总变化（RTV）计算，可见图像（RGB）的结构信息（RGB）和近红外图像（NIR）作为融合图像的基础层；其次，建立了贝叶斯分类模型来计算噪声重量和可见图像中的噪声信息和噪声信息通过关节双侧滤波器自适应过滤；最后，融合图像是通过颜色空间转换获得的。实验结果表明，所提出的算法可以保留光谱特性和无伪影和颜色失真的可见和近红外图像的独特信息，并且具有良好的鲁棒性以及保留独特的质地。

translated by 谷歌翻译

Wavelets on Graphs via Spectral Graph Theory

David K Hammond , Pierre Vandergheynst , Rémi Gribonval

分类：

2009-12-19

We propose a novel method for constructing wavelet transforms of functions defined on the vertices of an arbitrary finite weighted graph. Our approach is based on defining scaling using the the graph analogue of the Fourier domain, namely the spectral decomposition of the discrete graph Laplacian L. Given a wavelet generating kernel g and a scale parameter t, we define the scaled wavelet operator T t g = g(tL). The spectral graph wavelets are then formed by localizing this operator by applying it to an indicator function. Subject to an admissibility condition on g, this procedure defines an invertible transform. We explore the localization properties of the wavelets in the limit of fine scales. Additionally, we present a fast Chebyshev polynomial approximation algorithm for computing the transform that avoids the need for diagonalizing L. We highlight potential applications of the transform through examples of wavelets on graphs corresponding to a variety of different problem domains.

translated by 谷歌翻译

Image scaling by de la Vallée-Poussin filtered interpolation

Donatella Occorsio , Giuliana Ramella , Woula Themistoclakis

分类：计算机视觉

2021-09-28

我们提出了一种新的图像缩放方法，既用于缩小和放大尺寸，都以任何比例因子或所需的大小运行。调整大小的图像是通过对全球范围内的双变量多项式进行采样来实现的。该方法的特殊性在于我们使用的采样模型和插值多项式。我们考虑了基于第一类Chebyshev零的不寻常的采样系统，而不是经典的统一网格。这种节点的最佳分布允许考虑由de la vall \'ee poussin型过滤器定义的接近最佳的插值多项式。该过滤器的动作射线提供了一个附加参数，可以适当调节以改善近似值。该方法已在大量不同的图像数据集上进行了测试。结果以定性和定量术语进行评估，并与其他可用竞争方法进行比较。所得缩放图像的感知质量使得保留了重要的细节，并且伪像的外观很低。竞争性质量测量值，良好的视觉质量，有限的计算工作和中等记忆需求使该方法适合现实世界应用。

translated by 谷歌翻译

Multiresolution Neural Networks for Imaging

Hallison Paz , Tiago Novello , Vinicius Silva , Luiz Schirmer , Guilherme Schardong , Luiz Velho

分类：计算机视觉 | 机器学习

2022-08-25

我们介绍MR-NET，这是一种用于多分辨率神经网络的一般体系结构，也是基于此体系结构进行成像应用的框架。我们的基于坐标的网络在空间和规模上都是连续的，因为它们由多个阶段组成，这些阶段逐渐增加了更细节。除此之外，它们是一个紧凑而有效的表示。我们展示了多分辨率图像表示以及用于纹理放大和缩小以及抗脉化的应用。

translated by 谷歌翻译

The Emerging Field of Signal Processing on Graphs: Extending High-Dimensional Data Analysis to Networks and Other Irregular Domains

David I Shuman , Sunil K. Narang , Pascal Frossard , Antonio Ortega , Pierre Vandergheynst

分类：

2012-10-31

In applications such as social, energy, transportation, sensor, and neuronal networks, high-dimensional data naturally reside on the vertices of weighted graphs. The emerging field of signal processing on graphs merges algebraic and spectral graph theoretic concepts with computational harmonic analysis to process such signals on graphs. In this tutorial overview, we outline the main challenges of the area, discuss different ways to define graph spectral domains, which are the analogues to the classical frequency domain, and highlight the importance of incorporating the irregular structures of graph data domains when processing signals on graphs. We then review methods to generalize fundamental operations such as filtering, translation, modulation, dilation, and downsampling to the graph setting, and survey the localized, multiscale transforms that have been proposed to efficiently extract information from high-dimensional data on graphs. We conclude with a brief discussion of open issues and possible extensions.

translated by 谷歌翻译

Perceptual Optimization of a Biologically-Inspired Tone Mapping Operator

Peibei Cao , Chenyang Le , Yuming Fang , Kede Ma

分类：人工智能 | 计算机视觉

2022-06-18

随着高动态范围（HDR）摄影的日益普及和可访问性，用于动态范围压缩和中等呈现的音调映射操作员（TMO）实际上是要求的。在本文中，我们开发了一种基于生物学的，计算效率和感知优化的两阶段神经网络图像TMO。在第一阶段，由人类视觉系统（HVS）早期阶段的生理学动机，我们首先将HDR图像分解为标准化的Laplacian金字塔。然后，我们使用两个轻巧的深神经网络（DNN），将这种归一化表示作为输入并估计相应LDR图像的拉普拉斯金字塔。我们通过最小化标准化的拉普拉斯金字塔距离（NLPD）来优化音调映射网络，这是一种对人类对音调映射图像质量判断的校准的感知度量。在第二阶段中，我们通过输入HDR图像``校准''，生成具有不同颜色饱和度和细节可见性的伪型曝光图像堆栈。然后，我们通过最大化MEF-SSIM的变体，这是另一个具有感知校准的度量以进行图像融合，将另一个轻巧的DNN训练将LDR图像堆叠融合到所需的LDR图像中。通过这样做，提出的TMO是完全自动的，以映射未校准的HDR图像。在一组独立的HDR图像中，我们发现我们的方法生成具有更好的视觉质量的图像，并且是本地最快的TMO之一。

translated by 谷歌翻译

Standardised convolutional filtering for radiomics

Adrien Depeursinge , Vincent Andrearczyk , Philip Whybra , Joost van Griethuysen , Henning Müller , Roger Schaer , Martin Vallières , Alex Zwanenburg

分类：计算机视觉

2020-06-09

图像生物标准化倡议（IBSI）旨在通过标准化从图像中提取图像生物标志物（特征）的计算过程来提高射致研究的再现性。我们之前建立了169个常用特征的参考值，创建了标准的射频图像处理方案，并开发了用于垄断研究的报告指南。但是，若干方面没有标准化。在这里，我们提出了在射频中使用卷积图像过滤器的参考手册的初步版本。滤波器，例如高斯滤波器的小波或拉普拉斯，在强调特定图像特征（如边缘和Blob）中发挥重要组成部分。已发现从过滤滤波器响应图派生的功能可重复差。此参考手册构成了持续工作的基础，用于标准化卷积滤波器中的覆盖物中的持续工作，并在这项工作进行时更新。

translated by 谷歌翻译

Wavelet Transform-assisted Adaptive Generative Modeling for Colorization

Jin Li , Wanyun Li , Zichen Xu , Yuhao Wang , Qiegen Liu

分类：计算机视觉

2021-07-09

无监督的深度学习最近证明了生产高质量样本的希望。尽管它具有促进图像着色任务的巨大潜力，但由于数据歧管和模型能力的高维度，性能受到限制。这项研究提出了一种新的方案，该方案利用小波域中的基于得分的生成模型来解决这些问题。通过利用通过小波变换来利用多尺度和多渠道表示，该模型可以共同有效地从堆叠的粗糙小波系数组件中了解较富裕的先验。该策略还降低了原始歧管的维度，并减轻了维度的诅咒，这对估计和采样有益。此外，设计了小波域中的双重一致性项，即数据一致性和结构一致性，以更好地利用着色任务。具体而言，在训练阶段，一组由小波系数组成的多通道张量被用作训练网络以denoising得分匹配的输入。在推论阶段，样品是通过具有数据和结构一致性的退火Langevin动力学迭代生成的。实验证明了所提出的方法在发电和着色质量方面的显着改善，尤其是在着色鲁棒性和多样性方面。

translated by 谷歌翻译

Intrinsic Image Transfer for Illumination Manipulation

Junqing Huang , Michael Ruzhansky , Qianying Zhang , Haihui Wang

分类：计算机视觉

2021-07-01

This paper presents a novel intrinsic image transfer (IIT) algorithm for illumination manipulation, which creates a local image translation between two illumination surfaces. This model is built on an optimization-based framework consisting of three photo-realistic losses defined on the sub-layers factorized by an intrinsic image decomposition. We illustrate that all losses can be reduced without the necessity of taking an intrinsic image decomposition under the well-known spatial-varying illumination illumination-invariant reflectance prior knowledge. Moreover, with a series of relaxations, all of them can be directly defined on images, giving a closed-form solution for image illumination manipulation. This new paradigm differs from the prevailing Retinex-based algorithms, as it provides an implicit way to deal with the per-pixel image illumination. We finally demonstrate its versatility and benefits to the illumination-related tasks such as illumination compensation, image enhancement, and high dynamic range (HDR) image compression, and show the high-quality results on natural image datasets.

translated by 谷歌翻译

MINER: Multiscale Implicit Neural Representations

Vishwanath Saragadam , Jasper Tan , Guha Balakrishnan , Richard G. Baraniuk , Ashok Veeraraghavan

分类：计算机视觉

2022-02-07

我们引入了一种新的神经信号模型，设计用于有效的大型信号的高分辨率表示。我们的多尺度隐式神经表示（矿工）中的关键创新是通过拉普拉斯金字塔的内部表示，它提供了信号的稀疏多尺度分解，可捕获跨尺度的信号的正交部分。我们通过用小型MLP在每个尺度上代表金字塔的小差异斑块来利用拉普拉斯金字塔的优势。这使网络能够适应从粗尺度到细尺度的能力增加，仅代表具有强信号能量的信号的一部分。每个MLP的参数是从粗到细节优化的，从而在更粗糙的尺度下更快地近似，从而最终是一个非常快速的训练过程。我们将矿工应用于一系列大规模信号表示任务，包括吉吉像素图像和非常大的点云，并证明它需要少于参数的25％，33％的内存足迹和10％的计算时间和10％竞争技术（例如橡子）达到相同的表示准确性。

translated by 谷歌翻译

Deep Decomposition Network for Image Processing: A Case Study for Visible and Infrared Image Fusion

Yu Fu , Xiao-Jun Wu , Josef Kittler

分类：计算机视觉

2021-02-21

图像分解是图像处理领域的关键主题。它可以从源图像中提取显着特征。我们提出了一种基于卷积神经网络的新图像分解方法。该方法可以应用于许多图像处理任务。在本文中，我们将图像分解网络应用于图像融合任务。我们输入红外图像和可见光图像，并将它们分解为三个高频特征图像和低频特征图像。使用特定的融合策略融合了两组特征图像，以获得融合特征图像。最后，重建功能图像以获得融合图像。与最先进的融合方法相比，该方法在主观和客观评估中都取得了更好的性能。

translated by 谷歌翻译

Image Feature Information Extraction for Interest Point Detection: A Review

Junfeng Jing , Tian Gao , Weichuan Zhang , Yongsheng Gao , Changming Sun

分类：计算机视觉

2021-06-15

兴趣点检测是计算机视觉和图像处理中最根本，最关键的问题之一。在本文中，我们对图像特征信息（IFI）提取技术进行了全面综述，以进行利益点检测。为了系统地介绍现有的兴趣点检测方法如何从输入图像中提取IFI，我们提出了IFI提取技术的分类学检测。根据该分类法，我们讨论了不同类型的IFI提取技术以进行兴趣点检测。此外，我们确定了与现有的IFI提取技术有关的主要未解决的问题，以及以前尚未讨论过的任何兴趣点检测方法。提供了现有的流行数据集和评估标准，并评估和讨论了18种最先进方法的性能。此外，还详细阐述了有关IFI提取技术的未来研究方向。

translated by 谷歌翻译