智能论文笔记

Image scaling by de la Vallée-Poussin filtered interpolation

Donatella Occorsio , Giuliana Ramella , Woula Themistoclakis

分类：计算机视觉

2021-09-28

我们提出了一种新的图像缩放方法，既用于缩小和放大尺寸，都以任何比例因子或所需的大小运行。调整大小的图像是通过对全球范围内的双变量多项式进行采样来实现的。该方法的特殊性在于我们使用的采样模型和插值多项式。我们考虑了基于第一类Chebyshev零的不寻常的采样系统，而不是经典的统一网格。这种节点的最佳分布允许考虑由de la vall \'ee poussin型过滤器定义的接近最佳的插值多项式。该过滤器的动作射线提供了一个附加参数，可以适当调节以改善近似值。该方法已在大量不同的图像数据集上进行了测试。结果以定性和定量术语进行评估，并与其他可用竞争方法进行比较。所得缩放图像的感知质量使得保留了重要的细节，并且伪像的外观很低。竞争性质量测量值，良好的视觉质量，有限的计算工作和中等记忆需求使该方法适合现实世界应用。

translated by 谷歌翻译

Fully Adaptive Bayesian Algorithm for Data Analysis, FABADA

Pablo M Sanchez-Alarcon , Yago Ascasibar Sequeiros

分类：计算机视觉

2022-01-13

本文的目的是描述一种从贝叶斯推理的观点来描述一种新的非参数降噪技术，其可以自动提高一个和二维数据的信噪比，例如例如，例如，天文图像和光谱。该算法迭代地评估数据的可能的平滑版本，平滑模型，获得与嘈杂测量统计上兼容的底层信号的估计。迭代基于最后一个顺利模型的证据和$ \ Chi ^ 2 $统计数据，并且我们将信号的预期值计算为整个平滑模型的加权平均值。在本文中，我们解释了算法的数学形式主义和数值实现，我们在利用真正的天文观测的电池对峰值信号，结构相似性指数和时间有效载荷来评估其性能。我们完全自适应的贝叶斯算法用于数据分析（Fabada）产生结果，没有任何参数调谐，与标准图像处理算法相当，其参数基于要恢复的真实信号进行了优化，在实际应用中不可能。诸如BM3D的最先进的非参数方法，以高信噪比提供稍微更好的性能，而我们的算法对于极其嘈杂的数据显着更准确（高于20-40 \％$相对错误，在天文领域特别兴趣的情况）。在此范围内，通过我们的重建获得的残差的标准偏差可能变得比原始测量值低的数量级。复制本报告中显示的所有结果所需的源代码，包括该方法的实现，在https://github.com/pablolyanala/fabada公开使用

translated by 谷歌翻译

A Survey of Orthogonal Moments for Image Representation: Theory, Implementation, and Evaluation

Shuren Qi , Yushu Zhang , Chao Wang , Jiantao Zhou , Xiaochun Cao

分类：计算机视觉

2021-03-27

图像表示是计算机视觉和模式识别中的一个重要主题。它在一系列应用中扮演了了解视觉内容的基本作用。据报道，基于矩的图像表示在满足其由于其有益的数学特性而满足语义描述的核心条件，特别是几何不变性和独立性。本文介绍了对图像表示的正交矩的全面调查，涵盖了快速/准确计算，鲁棒性/不变性优化，定义扩展和应用程序的最新进步。我们还为各种广泛使用的正交瞬间创建一个软件包，并在同一基地中评估此类方法。提出的理论分析，软件实施和评估结果可以支持社区，特别是在开发新颖的技术和促进现实世界的应用方面。

translated by 谷歌翻译

Hitchhiker's Guide to Super-Resolution: Introduction and Recent Advances

Brian Moser , Federico Raue , Stanislav Frolov , Jörn Hees , Sebastian Palacio , Andreas Dengel

分类：计算机视觉

2022-09-27

随着深度学习（DL）的出现，超分辨率（SR）也已成为一个蓬勃发展的研究领域。然而，尽管结果有希望，但该领域仍然面临需要进一步研究的挑战，例如，允许灵活地采样，更有效的损失功能和更好的评估指标。我们根据最近的进步来回顾SR的域，并检查最新模型，例如扩散（DDPM）和基于变压器的SR模型。我们对SR中使用的当代策略进行了批判性讨论，并确定了有前途但未开发的研究方向。我们通过纳入该领域的最新发展，例如不确定性驱动的损失，小波网络，神经体系结构搜索，新颖的归一化方法和最新评估技术来补充先前的调查。我们还为整章中的模型和方法提供了几种可视化，以促进对该领域趋势的全球理解。最终，这篇综述旨在帮助研究人员推动DL应用于SR的界限。

translated by 谷歌翻译

A Comprehensive Review of Deep Learning-based Single Image Super-resolution

Syed Muhammad Arsalan Bashir , Yi Wang , Mahrukh Khan , Yilong Niu

分类：计算机视觉 | 机器学习

2021-02-18

图像超分辨率（SR）是重要的图像处理方法之一，可改善计算机视野领域的图像分辨率。在过去的二十年中，在超级分辨率领域取得了重大进展，尤其是通过使用深度学习方法。这项调查是为了在深度学习的角度进行详细的调查，对单像超分辨率的最新进展进行详细的调查，同时还将告知图像超分辨率的初始经典方法。该调查将图像SR方法分类为四个类别，即经典方法，基于学习的方法，无监督学习的方法和特定领域的SR方法。我们还介绍了SR的问题，以提供有关图像质量指标，可用参考数据集和SR挑战的直觉。使用参考数据集评估基于深度学习的方法。一些审查的最先进的图像SR方法包括增强的深SR网络（EDSR），周期循环gan（Cincgan），多尺度残留网络（MSRN），Meta残留密度网络（META-RDN），反复反射网络（RBPN），二阶注意网络（SAN），SR反馈网络（SRFBN）和基于小波的残留注意网络（WRAN）。最后，这项调查以研究人员将解决SR的未来方向和趋势和开放问题的未来方向和趋势。

translated by 谷歌翻译

Saliency-based segmentation of dermoscopic images using color information

Giuliana Ramella

分类：计算机视觉

2020-11-26

皮肤病变分割是高效的非侵入性计算机辅助性早期诊断黑素瘤的关键步骤之一。本文调查了除了显着性的颜色信息，可用于自动测定着色的病变区。与仅使用显着性的大多数现有的分割方法不同，以便与周围地区的皮肤病变区分，我们提出了一种采用二值化过程的新方法，其与新的感知标准相结合，受到人类视觉感知的启发，与显着性的性质有关和输入图像数据分布的颜色。作为改进所提出的方法的准确性的手段，在分割步骤之前前面通过预处理，旨在减少计算负担，消除伪像和改善对比度。我们已经在两个公共数据库上评估了该方法，包括1497个Dermoscopic图像。我们还通过明确为DerMicopic图像明确设计的经典和最近的基于显着的方法的性能。定性和定量评估表明，该方法是有前途的，因为它产生了精确的皮肤病变分割，与其他基于显着性的分段方法相比令人满意地表现得令人满意。

translated by 谷歌翻译

Identity-Preserving Pose-Robust Face Hallucination Through Face Subspace Prior

Ali Abbasi , Mohammad Rahmati

分类：计算机视觉

2021-11-20

在过去的几十年中，已经进行了许多尝试来解决从其相应的低分辨率（LR）对应物中恢复高分辨率（HR）面部形象的问题，这是通常被称为幻觉的任务。尽管通过位置补丁和基于深度学习的方法实现了令人印象深刻的性能，但大多数技术仍然无法恢复面孔的特定特定功能。前一组算法通常在存在更高水平的降解存在下产生模糊和过天气输出，而后者产生的面部有时绝不使得输入图像中的个体类似于个体。在本文中，将引入一种新的面部超分辨率方法，其中幻觉面被迫位于可用训练面跨越的子空间中。因此，与大多数现有面的幻觉技术相比，由于这种面部子空间之前，重建是为了回收特定人的面部特征，而不是仅仅增加图像定量分数。此外，通过最近的3D面部重建领域的进步启发，还呈现了一种有效的3D字典对齐方案，通过该方案，该算法能够处理在不受控制的条件下拍摄的低分辨率面。在几个众所周知的面部数据集上进行的广泛实验中，所提出的算法通过生成详细和接近地面真理结果来显示出色的性能，这在定量和定性评估中通过显着的边距来实现了最先进的面部幻觉算法。

translated by 谷歌翻译

Resampling and super-resolution of hexagonally sampled images using deep learning

Dylan Flaute , Russell C. Hardie , Hamed Elwarfalli

分类：人工智能 | 计算机视觉 | 机器学习

2021-11-03

超级分辨率（SR）旨在增加图像的分辨率。应用程序包括安全性，医学成像和对象识别。我们提出了一种基于深度学习的SR系统，其将六角采样的低分辨率图像作为输入，并产生矩形采样的SR图像作为输出。为了进行培训和测试，我们使用一种现实观察模型，包括从衍射和传感器劣化的光学劣化，从检测器集成。我们的SR方法首先使用非均匀插值来部分地上置观察到的六边形图像并将其转换为矩形网格。然后，我们利用了设计用于SR的最先进的卷积神经网络（CNN）架构，该架构被称为残留通道注意网络（RCAN）。特别是，我们使用RCAN进一步上表并恢复图像以产生最终的SR图像估计。我们证明该系统优于将RCAN直接施加到具有等效样本密度的矩形采样的LR图像。六边形取样的理论优势是众所周知的。然而，据我们所知，六角形取样的实际好处，即RCAN SR等现代加工技术是迄今为止未经测试的。我们的SR系统演示了六角形样式在采用修改的RCAN进行六边形SR时的显着优势。

translated by 谷歌翻译

Generative Adversarial Super-Resolution at the Edge with Knowledge Distillation

Simone Angarano , Francesco Salvetti , Mauro Martini , Marcello Chiaberge

分类：人工智能 | 计算机视觉 | 机器学习 | 机器人

2022-09-07

单像超分辨率可以在需要可靠的视觉流以监视任务，处理远程操作或研究相关视觉细节的环境中支持机器人任务。在这项工作中，我们为实时超级分辨率提出了一个有效的生成对抗网络模型。我们采用了原始SRGAN的量身定制体系结构和模型量化，以提高CPU和Edge TPU设备上的执行，最多达到200 fps的推断。我们通过将其知识提炼成较小版本的网络，进一步优化我们的模型，并与标准培训方法相比获得显着的改进。我们的实验表明，与较重的最新模型相比，我们的快速和轻量级模型可保持相当令人满意的图像质量。最后，我们对图像传输进行带宽降解的实验，以突出提出的移动机器人应用系统的优势。

translated by 谷歌翻译

EnhanceNet: Single Image Super-Resolution Through Automated Texture Synthesis

Mehdi S. M. Sajjadi , Bernhard Schölkopf , Michael Hirsch

分类：

2016-12-23

Single image super-resolution is the task of inferring a high-resolution image from a single low-resolution input. Traditionally, the performance of algorithms for this task is measured using pixel-wise reconstruction measures such as peak signal-to-noise ratio (PSNR) which have been shown to correlate poorly with the human perception of image quality. As a result, algorithms minimizing these metrics tend to produce over-smoothed images that lack highfrequency textures and do not look natural despite yielding high PSNR values.We propose a novel application of automated texture synthesis in combination with a perceptual loss focusing on creating realistic textures rather than optimizing for a pixelaccurate reproduction of ground truth images during training. By using feed-forward fully convolutional neural networks in an adversarial training setting, we achieve a significant boost in image quality at high magnification ratios. Extensive experiments on a number of datasets show the effectiveness of our approach, yielding state-of-the-art results in both quantitative and qualitative benchmarks.

translated by 谷歌翻译

Image quality assessment: from error visibility to structural similarity

分类：

Objective methods for assessing perceptual image quality have traditionally attempted to quantify the visibility of errors between a distorted image and a reference image using a variety of known properties of the human visual system. Under the assumption that human visual perception is highly adapted for extracting structural information from a scene, we introduce an alternative framework for quality assessment based on the degradation of structural information. As a specific example of this concept, we develop a Structural Similarity Index and demonstrate its promise through a set of intuitive examples, as well as comparison to both subjective ratings and state-of-the-art objective methods on a database of images compressed with JPEG and JPEG2000. 1

translated by 谷歌翻译

Reverse image filtering using total derivative approximation and accelerated gradient descent

Fernando J. Galetto , Guang Deng

分类：计算机视觉

2021-12-08

在本文中，我们解决了逆转图像滤波器效果的新问题，该图像过滤器可以是线性的或非线性的。假设是滤波器的算法未知，滤波器可作为黑框。我们为最小化本地补丁的成本函数和使用总衍生物来近似于梯度下降以解决问题的渐变来制定该逆问题。我们分析影响傅里叶域中输出的收敛和质量的因素。我们还研究加速梯度下降算法在三个无梯度的反向滤波器中的应用，包括本文提出的较方案。我们提出了广泛的实验结果，以评估所提出的算法的复杂性和有效性。结果表明，所提出的算法优于现有技术（1），它与最快的反向滤波器的复杂程度相同，但它可以反转更多数量的滤波器，并且（2）它可以反转与非常复杂的反滤波器的过滤器相同的滤波器列表，但其复杂性要小得多。

translated by 谷歌翻译

Wavelet Transform-assisted Adaptive Generative Modeling for Colorization

Jin Li , Wanyun Li , Zichen Xu , Yuhao Wang , Qiegen Liu

分类：计算机视觉

2021-07-09

无监督的深度学习最近证明了生产高质量样本的希望。尽管它具有促进图像着色任务的巨大潜力，但由于数据歧管和模型能力的高维度，性能受到限制。这项研究提出了一种新的方案，该方案利用小波域中的基于得分的生成模型来解决这些问题。通过利用通过小波变换来利用多尺度和多渠道表示，该模型可以共同有效地从堆叠的粗糙小波系数组件中了解较富裕的先验。该策略还降低了原始歧管的维度，并减轻了维度的诅咒，这对估计和采样有益。此外，设计了小波域中的双重一致性项，即数据一致性和结构一致性，以更好地利用着色任务。具体而言，在训练阶段，一组由小波系数组成的多通道张量被用作训练网络以denoising得分匹配的输入。在推论阶段，样品是通过具有数据和结构一致性的退火Langevin动力学迭代生成的。实验证明了所提出的方法在发电和着色质量方面的显着改善，尤其是在着色鲁棒性和多样性方面。

translated by 谷歌翻译

Parametric Level-sets Enhanced To Improve Reconstruction (PaLEnTIR)

Ege Ozsar , Misha Kilmer , Eric Miller , Eric de Sturler , Arvind Saibaba

分类：计算机视觉

2022-04-21

在本文中，我们考虑使用Palentir在两个和三个维度中对分段常数对象的恢复和重建，这是相对于当前最新ART的显着增强的参数级别集（PALS）模型。本文的主要贡献是一种新的PALS公式，它仅需要一个单个级别的函数来恢复具有具有多个未知对比度的分段常数对象的场景。我们的模型比当前的多对抗性，多对象问题提供了明显的优势，所有这些问题都需要多个级别集并明确估计对比度大小。给定对比度上的上限和下限，我们的方法能够以任何对比度分布恢复对象，并消除需要知道给定场景中的对比度或其值的需求。我们提供了一个迭代过程，以找到这些空间变化的对比度限制。相对于使用径向基函数（RBF）的大多数PAL方法，我们的模型利用了非异型基函数，从而扩展了给定复杂性的PAL模型可以近似的形状类别。最后，Palentir改善了作为参数识别过程一部分所需的Jacobian矩阵的条件，因此通过控制PALS扩展系数的幅度来加速优化方法，固定基本函数的中心，以及参数映射到图像映射的唯一性，由新参数化提供。我们使用X射线计算机断层扫描，弥漫性光学断层扫描（DOT），Denoising，DeonConvolution问题的2D和3D变体证明了新方法的性能。应用于实验性稀疏CT数据和具有不同类型噪声的模拟数据，以进一步验证所提出的方法。

translated by 谷歌翻译

A Latent Encoder Coupled Generative Adversarial Network (LE-GAN) for Efficient Hyperspectral Image Super-resolution

Yue Shi , Liangxiu Han , Lianghao Han , Sheng Chang , Tongle Hu , Darren Dancey

分类：计算机视觉

2021-11-16

现实的高光谱图像（HSI）超分辨率（SR）技术旨在从其低分辨率（LR）对应物中产生具有更高光谱和空间忠诚的高分辨率（HR）HSI。生成的对抗网络（GAN）已被证明是图像超分辨率的有效深入学习框架。然而，现有GaN的模型的优化过程经常存在模式崩溃问题，导致光谱间不变重建容量有限。这可能导致所生成的HSI上的光谱空间失真，尤其是具有大的升级因子。为了缓解模式崩溃的问题，这项工作提出了一种与潜在编码器（Le-GaN）耦合的新型GaN模型，其可以将产生的光谱空间特征从图像空间映射到潜在空间并产生耦合组件正规化生成的样本。基本上，我们将HSI视为嵌入在潜在空间中的高维歧管。因此，GaN模型的优化被转换为学习潜在空间中的高分辨率HSI样本的分布的问题，使得产生的超分辨率HSI的分布更接近其原始高分辨率对应物的那些。我们对超级分辨率的模型性能进行了实验评估及其在缓解模式崩溃中的能力。基于具有不同传感器（即Aviris和UHD-185）的两种实际HSI数据集进行了测试和验证，用于各种升高因素并增加噪声水平，并与最先进的超分辨率模型相比（即Hyconet，LTTR，Bagan，SR-GaN，Wgan）。

translated by 谷歌翻译

Deep Variation Prior: Joint Image Denoising and Noise Variance Estimation without Clean Data

Rihuan Ke

分类：计算机视觉 | 机器学习

2022-09-19

通过最近基于深度学习的方法显示出令人鼓舞的结果，可以消除图像中的噪音，在有监督的学习设置中报道了最佳的降级性能，该设置需要大量的配对嘈杂图像和训练的基础真相。强大的数据需求可以通过无监督的学习技术来减轻，但是，对于高质量的解决方案，图像或噪声方差的准确建模仍然至关重要。对于未知的噪声分布而言，学习问题不足。本文研究了单个联合学习框架中图像降解和噪声方差估计的任务。为了解决问题的不良性，我们提出了深度差异先验（DVP），该差异指出，适当学到的DeNoiser在噪声变化方面的变化满足了一些平滑度的特性，这是良好DeNoiser的关键标准。建立在DVP的基础上，这是一个无监督的深度学习框架，同时学习了Denoiser并估算了噪声差异。我们的方法不需要任何干净的训练图像或噪声估计的外部步骤，而是仅使用一组嘈杂的图像近似于最小平方误差Denoisiser。在一个框架中考虑了两个基本任务，我们允许它们相互优化。实验结果表明，具有与监督的学习和准确的噪声方差估计值相当的质量。

translated by 谷歌翻译

Parallel Discrete Convolutions on Adaptive Particle Representations of Images

Joel Jonsson , Bevan L. Cheeseman , Suryanarayana Maddu , Krzysztof Gonciarz , Ivo F. Sbalzarini

分类：计算机视觉

2021-12-07

我们在并行计算机架构上的图像的自适应粒子表示（APR）上的离散卷积运算符的本机实现数据结构和算法。 APR是一个内容 - 自适应图像表示，其本地地将采样分辨率局部调整到图像信号。已经开发为大，稀疏图像的像素表示的替代方案，因为它们通常在荧光显微镜中发生。已经显示出降低存储，可视化和处理此类图像的存储器和运行时成本。然而，这要求图像处理本身在APRS上运行，而无需中间恢复为像素。然而，设计高效和可扩展的APR-Native图像处理原语是APR的不规则内存结构的复杂性。这里，我们提供了使用可以在离散卷积方面配制的各种算法有效和本地地处理APR图像所需的算法建筑块。我们表明APR卷积自然地导致缩放 - 自适应算法，可在多核CPU和GPU架构上有效地平行化。与基于像素的算法和概念性数据的卷积相比，我们量化了加速度。我们在单个NVIDIA GeForce RTX 2080 Gaming GPU上实现了最多1 TB / s的像素等效吞吐量，而不是基于像素的实现的存储器最多两个数量级。

translated by 谷歌翻译

Deep Learning Methods for Partial Differential Equations and Related Parameter Identification Problems

Derick Nganyu Tanyu , Jianfeng Ning , Tom Freudenberg , Nick Heilenkötter , Andreas Rademacher , Uwe Iben , Peter Maass

分类：机器学习

2022-12-06

Recent years have witnessed a growth in mathematics for deep learning--which seeks a deeper understanding of the concepts of deep learning with mathematics, and explores how to make it more robust--and deep learning for mathematics, where deep learning algorithms are used to solve problems in mathematics. The latter has popularised the field of scientific machine learning where deep learning is applied to problems in scientific computing. Specifically, more and more neural network architectures have been developed to solve specific classes of partial differential equations (PDEs). Such methods exploit properties that are inherent to PDEs and thus solve the PDEs better than classical feed-forward neural networks, recurrent neural networks, and convolutional neural networks. This has had a great impact in the area of mathematical modeling where parametric PDEs are widely used to model most natural and physical processes arising in science and engineering, In this work, we review such methods and extend them for parametric studies as well as for solving the related inverse problems. We equally proceed to show their relevance in some industrial applications.

translated by 谷歌翻译

Neural Operator: Learning Maps Between Function Spaces

Nikola Kovachki , Zongyi Li , Burigede Liu , Kamyar Azizzadenesheli , Kaushik Bhattacharya , Andrew Stuart , Anima Anandkumar

分类：机器学习

2021-08-19

神经网络的经典发展主要集中在有限维欧基德空间或有限组之间的学习映射。我们提出了神经网络的概括，以学习映射无限尺寸函数空间之间的运算符。我们通过一类线性积分运算符和非线性激活函数的组成制定运营商的近似，使得组合的操作员可以近似复杂的非线性运算符。我们证明了我们建筑的普遍近似定理。此外，我们介绍了四类运算符参数化：基于图形的运算符，低秩运算符，基于多极图形的运算符和傅里叶运算符，并描述了每个用于用每个计算的高效算法。所提出的神经运营商是决议不变的：它们在底层函数空间的不同离散化之间共享相同的网络参数，并且可以用于零击超分辨率。在数值上，与现有的基于机器学习的方法，达西流程和Navier-Stokes方程相比，所提出的模型显示出卓越的性能，而与传统的PDE求解器相比，与现有的基于机器学习的方法有关的基于机器学习的方法。

translated by 谷歌翻译

Generative Adversarial Network (GAN) based Image-Deblurring

Yuhong Lu , Nicholas Polydorides

分类：计算机视觉

2022-08-24

该论文根据近年来提出的基于经典定理和最先进的方法来分析图像过度的挑战性问题。通过光谱分析，我们从数学上显示了光谱正则化方法的有效性，并指出光谱滤波结果与正则化优化目标的解决方案之间的联系。对于诸如Image Deblurring之类的不适性问题，优化目标包含一个正则化项（也称为正则化功能），该项将我们的先验知识编码为解决方案。我们使用最大后验估计的想法来演示如何通过手工制作正规化术语。然后，我们指出了这种基于正则化方法的局限性，并介入基于神经网络的方法。基于Wasserstein生成对抗模型的想法，我们可以训练CNN学习正则化功能。这种数据驱动的方法能够捕获复杂性，这可能在分析上不可调节。此外，近年来，随着体系结构的改善，由于观察到模糊的观察，该网络已经能够近似于地面真相的图像。生成对抗网络（GAN）在此图像到图像翻译的想法上工作。我们分析了Orest Kupyn等人提出的DeBlurgan-V2方法。 [14] 2019年基于数值测试。并且，根据实验结果和我们的知识，我们提出了一些改进此方法的建议。

translated by 谷歌翻译