智能论文笔记

Fast Two-step Blind Optical Aberration Correction

Thomas Eboli , Jean-Michel Morel , Gabriele Facciolo

分类：计算机视觉

2022-08-01

任何相机的光学元件都会降低照片的清晰度，这是关键的视觉质量标准。该降解的特征是点传播函数（PSF），该函数取决于光的波长，并且在整个成像场中都是可变的。在本文中，我们提出了一个两步方案，以纠正单个RAW或JPEG图像中的光学畸变，即没有相机或镜头上任何事先信息。首先，我们估计当地的高斯模糊内核，以重叠斑块，并通过非盲脱毛技术锐化它们。基于数十个透镜的PSF的测量值，这些模糊内核被建模为由七个参数定义的RGB高斯人。其次，我们使用卷积神经网络去除其余的侧向色差（第一步中未考虑），该网络被训练，可将红色/绿色和蓝色/绿色残留图像最小化。关于合成图像和真实图像的实验表明，这两个阶段的组合产生了一种快速的最新盲目畸变补偿技术，该技术与商业非盲算法竞争。

translated by 谷歌翻译

High Dynamic Range and Super-Resolution from Raw Image Bursts

Bruno Lecouat , Thomas Eboli , Jean Ponce , Julien Mairal

分类：计算机视觉

2022-07-29

由智能手机和中端相机捕获的照片的空间分辨率和动态范围有限，在饱和区域中未充满刺激的区域和颜色人工制品中的嘈杂响应。本文介绍了第一种方法（据我们所知），以重建高分辨率，高动态范围的颜色图像，这些颜色来自带有曝光括号的手持相机捕获的原始照相爆发。该方法使用图像形成的物理精确模型来结合迭代优化算法，用于求解相应的逆问题和学习的图像表示，以进行健壮的比对，并以前的自然图像。所提出的算法很快，与基于最新的学习图像恢复方法相比，内存需求较低，并且从合成但逼真的数据终止学习的特征。广泛的实验证明了其出色的性能，具有最多$ \ times 4 $的超分辨率因子在野外拍摄的带有手持相机的真实照片，以及对低光条件，噪音，摄像机摇动和中等物体运动的高度鲁棒性。

translated by 谷歌翻译

Face Deblurring using Dual Camera Fusion on Mobile Phones

Wei-Sheng Lai , YiChang Shih , Lun-Cheng Chu , Xiaotong Wu , Sung-Fang Tsai , Michael Krainin , Deqing Sun , Chia-Kai Liang

分类：计算机视觉

2022-07-23

快速移动受试者的运动模糊是摄影中的一个长期问题，由于收集效率有限，尤其是在弱光条件下，在手机上非常常见。尽管近年来我们目睹了图像脱毛的巨大进展，但大多数方法都需要显着的计算能力，并且在处理高分辨率照片的情况下具有严重的局部动作。为此，我们根据手机的双摄像头融合技术开发了一种新颖的面部脱毛系统。该系统检测到主题运动以动态启用参考摄像头，例如，最近在高级手机上通常可用的Ultrawide Angle摄像机，并捕获带有更快快门设置的辅助照片。虽然主镜头是低噪音但模糊的，但参考镜头却很锋利，但嘈杂。我们学习ML模型，以对齐和融合这两张镜头，并在没有运动模糊的情况下输出清晰的照片。我们的算法在Google Pixel 6上有效运行，每次拍摄需要463毫秒的开销。我们的实验证明了系统对替代单片，多帧，面部特异性和视频脱张算法以及商业产品的优势和鲁棒性。据我们所知，我们的工作是第一个用于面部运动脱毛的移动解决方案，在各种运动和照明条件下，在数千个图像中可靠地工作。

translated by 谷歌翻译

Imaging through the Atmosphere using Turbulence Mitigation Transformer

Xingguang Zhang , Zhiyuan Mao , Nicholas Chimitt , Stanley H. Chan

分类：计算机视觉

2022-07-13

由于大气湍流的扭曲而恢复图像是一个长期存在的问题，这是由于变形的空间变化，图像形成过程的非线性以及训练和测试数据的稀缺性。现有方法通常在失真模型上具有强大的统计假设，在许多情况下，由于没有概括，因此在现实世界中的性能有限。为了克服挑战，本文提出了一种端到端物理驱动的方法，该方法有效，可以推广到现实世界的湍流。在数据合成方面，我们通过通过宽sense式的平稳性近似随机场来显着增加SOTA湍流模拟器可以处理的图像分辨率。新的数据合成过程使大规模的多级湍流和训练的地面真相对产生。在网络设计方面，我们提出了湍流缓解变压器（TMT），这是一个两级U-NET形状的多帧恢复网络，该网络具有Noval有效的自发机制，称为暂时通道关节关注（TCJA）。我们还引入了一种新的培训方案，该方案由新的模拟器启用，并设计新的变压器单元以减少内存消耗。在静态场景和动态场景上的实验结果是有希望的，包括各种真实的湍流场景。

translated by 谷歌翻译

Digital Gimbal: End-to-end Deep Image Stabilization with Learnable Exposure Times

Omer Dahary , Matan Jacoby , Alex M. Bronstein

分类：计算机视觉

2020-12-08

使用致动万向节的机械图像稳定使得能够捕获长曝光镜头而不会因相机运动而遭受模糊。然而，这些装置通常是物理上繁琐和昂贵的，限制了他们广泛的使用。在这项工作中，我们建议通过输入快速未稳定的相机的输入来数字化地模拟机械稳定的系统。在短曝光的长曝光和低SNR处开发运动模糊之间的折衷，我们通过聚集由未知运动相关的嘈杂短曝光框架来培训估计尖锐的高SNR图像的CNN。我们进一步建议以端到端的方式学习突发的曝光时间，从而平衡噪声和模糊穿过框架。我们展示了这种方法，通过传统的去掩盖单个图像或在合成和实际数据上去除固定曝光突发的传统方法的优势。

translated by 谷歌翻译

A high-quality denoising dataset for smartphone cameras

分类：

The last decade has seen an astronomical shift from imaging with DSLR and point-and-shoot cameras to imaging with smartphone cameras. Due to the small aperture and sensor size, smartphone images have notably more noise than their DSLR counterparts. While denoising for smartphone images is an active research area, the research community currently lacks a denoising image dataset representative of real noisy images from smartphone cameras with high-quality ground truth. We address this issue in this paper with the following contributions. We propose a systematic procedure for estimating ground truth for noisy images that can be used to benchmark denoising performance for smartphone cameras. Using this procedure, we have captured a dataset -the Smartphone Image Denoising Dataset (SIDD) -of ~30,000 noisy images from 10 scenes under different lighting conditions using five representative smartphone cameras and generated their ground truth images. We used this dataset to benchmark a number of denoising algorithms. We show that CNN-based methods perform better when trained on our high-quality dataset than when trained using alternative strategies, such as low-ISO images used as a proxy for ground truth data.

translated by 谷歌翻译

Programmable Spectral Filter Arrays using Phase Spatial Light Modulator

Vishwanath Saragadam , Vijay Rengarajan , Ryuichi Tadano , Tuo Zhuang , Hideki Oyaizu , Jun Murayama , Aswin C. Sankaranarayanan

分类：计算机视觉

2021-09-29

Spatially varying spectral modulation can be implemented using a liquid crystal spatial light modulator (SLM) since it provides an array of liquid crystal cells, each of which can be purposed to act as a programmable spectral filter array. However, such an optical setup suffers from strong optical aberrations due to the unintended phase modulation, precluding spectral modulation at high spatial resolutions. In this work, we propose a novel computational approach for the practical implementation of phase SLMs for implementing spatially varying spectral filters. We provide a careful and systematic analysis of the aberrations arising out of phase SLMs for the purposes of spatially varying spectral modulation. The analysis naturally leads us to a set of "good patterns" that minimize the optical aberrations. We then train a deep network that overcomes any residual aberrations, thereby achieving ideal spectral modulation at high spatial resolution. We show a number of unique operating points with our prototype including dynamic spectral filtering, material classification, and single- and multi-image hyperspectral imaging.

translated by 谷歌翻译

Deep Multi-Scale Feature Learning for Defocus Blur Estimation

Ali Karaali , Naomi Harte , Claudio Rosito Jung

分类：计算机视觉 | 机器学习

2020-09-24

本文介绍了一种来自单个离焦图像的边缘散焦模糊估计方法。我们首先将位于深度不连续（称为深度边缘的边缘）的边缘区分从近似恒定的深度区域（称为模糊估计的被称为模糊估计的图案边缘）的边缘中的深度不连续性（含义模糊估计是模糊的）。然后，我们仅估计图案边缘的散焦模糊量，并探索基于引导滤波器的内插方案，该导向滤波器防止检测到的深度边缘的数据传播，以获得具有明确定义的对象边界的密集模糊图。两个任务（边缘分类和模糊估计）由深度卷积神经网络（CNNS）执行，该网络（CNN）共享权重以从边缘位置为中心的多尺度补丁学习有意义的本地特征。在自然散焦的图像上的实验表明，该方法提出了优异的最先进（SOTA）方法的定性和定量结果，在运行时间和准确度之间具有良好的折衷。

translated by 谷歌翻译

Single-image Defocus Deblurring by Integration of Defocus Map Prediction Tracing the Inverse Problem Computation

Qian Ye , Masanori Suganuma , Takayuki Okatani

分类：计算机视觉

2022-07-07

在本文中，我们考虑了Defocus图像去缩合中的问题。以前的经典方法遵循两步方法，即首次散焦映射估计，然后是非盲目脱毛。在深度学习时代，一些研究人员试图解决CNN的这两个问题。但是，代表模糊级别的Defocus图的简单串联导致了次优性能。考虑到Defocus Blur的空间变体特性和Defocus Map中指示的模糊级别，我们采用Defocus Map作为条件指导来调整输入模糊图像而不是简单串联的特征。然后，我们提出了一个基于Defocus图的空间调制的简单但有效的网络。为了实现这一目标，我们设计了一个由三个子网络组成的网络，包括DeFocus Map估计网络，该网络将DeFocus Map编码为条件特征的条件网络以及根据条件功能执行空间动态调制的DeFocus Deblurring网络。此外，空间动态调制基于仿射变换函数，以调整输入模糊图像的特征。实验结果表明，与常用的公共测试数据集中的现有最新方法相比，我们的方法可以实现更好的定量和定性评估性能。

translated by 谷歌翻译

Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring

Seungjun Nah , Tae Hyun Kim , Kyoung Mu Lee

分类：

2016-12-07

Non-uniform blind deblurring for general dynamic scenes is a challenging computer vision problem as blurs arise not only from multiple object motions but also from camera shake, scene depth variation. To remove these complicated motion blurs, conventional energy optimization based methods rely on simple assumptions such that blur kernel is partially uniform or locally linear. Moreover, recent machine learning based methods also depend on synthetic blur datasets generated under these assumptions. This makes conventional deblurring methods fail to remove blurs where blur kernel is difficult to approximate or parameterize (e.g. object motion boundaries). In this work, we propose a multi-scale convolutional neural network that restores sharp images in an end-to-end manner where blur is caused by various sources. Together, we present multiscale loss function that mimics conventional coarse-to-fine approaches. Furthermore, we propose a new large-scale dataset that provides pairs of realistic blurry image and the corresponding ground truth sharp image that are obtained by a high-speed camera. With the proposed model trained on this dataset, we demonstrate empirically that our method achieves the state-of-the-art performance in dynamic scene deblurring not only qualitatively, but also quantitatively.

translated by 谷歌翻译

LEDNet: Joint Low-light Enhancement and Deblurring in the Dark

Shangchen Zhou , Chongyi Li , Chen Change Loy

分类：计算机视觉

2022-02-07

夜间摄影通常由于昏暗的环境和长期使用而遭受弱光和模糊问题。尽管现有的光增强和脱毛方法可以单独解决每个问题，但一系列此类方法不能和谐地适应可见性和纹理的共同降解。训练端到端网络也是不可行的，因为没有配对数据可以表征低光和模糊的共存。我们通过引入新的数据合成管道来解决该问题，该管道对现实的低光模糊降解进行建模。使用管道，我们介绍了第一个用于关节低光增强和去皮的大型数据集。数据集，LOL-BLUR，包含12,000个低Blur/正常出现的对，在不同的情况下具有不同的黑暗和运动模糊。我们进一步提出了一个名为LEDNET的有效网络，以执行关节弱光增强和脱毛。我们的网络是独一无二的，因为它是专门设计的，目的是考虑两个相互连接的任务之间的协同作用。拟议的数据集和网络都为这项具有挑战性的联合任务奠定了基础。广泛的实验证明了我们方法对合成和现实数据集的有效性。

translated by 谷歌翻译

Annular Computational Imaging: Capture Clear Panoramic Images through Simple Lens

Qi Jiang , Hao Shi , Lei Sun , Shaohua Gao , Kailun Yang , Kaiwei Wang

分类：计算机视觉

2022-06-13

由少量镜头组成的全景环形镜头（PAL）在全景周围具有巨大潜力，该镜头围绕着移动和可穿戴设备的传感任务，因为其尺寸很小，并且视野很大（FOV）。然而，由于缺乏畸变校正的镜头，小体积PAL的图像质量仅限于光学极限。在本文中，我们提出了一个环形计算成像（ACI）框架，以打破轻质PAL设计的光学限制。为了促进基于学习的图像恢复，我们引入了基于波浪的模拟管道，用于全景成像，并通过多个数据分布来应对合成间隙。提出的管道可以轻松地适应具有设计参数的任何PAL，并且适用于宽松的设计。此外，我们考虑了全景成像和物理知识学习的物理先验，我们设计了物理知情的图像恢复网络（PI2RNET）。在数据集级别，我们创建了Divpano数据集，其广泛的实验表明，我们提出的网络在空间变化的降级下在全景图像恢复中设置了新的最新技术。此外，对只有3个球形镜头的简单PAL上提议的ACI的评估揭示了高质量全景成像与紧凑设计之间的微妙平衡。据我们所知，我们是第一个探索PAL中计算成像（CI）的人。代码和数据集将在https://github.com/zju-jiangqi/aci-pi2rnet上公开提供。

translated by 谷歌翻译

Leveraging blur information for plenoptic camera calibration

Mathieu Labussière , Céline Teulière , Frédéric Bernardin , Omar Ait-Aider

分类：计算机视觉

2021-11-09

本文提出了一种新型电镀摄像机的校准算法，尤其是多焦距配置，其中使用了几种类型的微透镜，仅使用原始图像。电流校准方法依赖于简化投影模型，使用重建图像的功能，或者需要每种类型的微透镜进行分离的校准。在多聚焦配置中，根据微透镜焦距，场景的相同部分将展示不同量的模糊。通常，使用具有最小模糊量的微图像。为了利用所有可用的数据，我们建议在新推出的模糊的模糊（BAP）功能的帮助下，在新的相机模型中明确地模拟Defocus模糊。首先，它用于检索初始相机参数的预校准步骤，而第二步骤，以表达在我们的单个优化过程中最小化的新成本函数。第三，利用它来校准微图像之间的相对模糊。它将几何模糊，即模糊圈链接到物理模糊，即点传播函数。最后，我们使用产生的模糊概况来表征相机的景深。实际数据对受控环境的定量评估展示了我们校准的有效性。

translated by 谷歌翻译

Single image deep defocus estimation and its applications

Fernando J. Galetto , Guang Deng

分类：计算机视觉

2021-07-30

深度信息在许多图像处理应用程序中是有用的。然而，由于拍摄图像是在2D成像传感器上投射3D场景的过程，因此深度信息嵌入图像中。从图像中提取深度信息是一个具有挑战性的任务。引导原理是由于散焦引起的蓝色水平与物体和焦平面之间的距离有关。基于该原理和广泛使用的假设，即高斯模糊是散焦模糊的良好模型，我们制定了作为高斯模糊分类问题的空间变化散焦模糊的问题。我们通过培训深度神经网络来解决图像补丁中的20级蓝色蓝色之一来解决问题。我们创建了一个超过500000美元的尺寸为32 \ times32 $的数据集，用于培训和测试几种知名网络模型。我们发现MobileNetv2由于其较低的内存要求和高精度而适用于此应用。训练模型用于确定通过施加迭代加权引导滤波器来改进的贴剂模糊。结果是散焦图，其携带每个像素的模糊度的信息。我们将提出的方法与最先进的技术进行比较，我们展示了其在自适应图像增强，散焦倍率和多聚焦图像融合中的成功应用。

translated by 谷歌翻译

Deep Variational Network Toward Blind Image Restoration

Zongsheng Yue , Hongwei Yong , Qian Zhao , Lei Zhang , Deyu Meng , Kwan-Yen K. Wong

分类：计算机视觉

2020-08-25

盲图修复（IR）是计算机视觉中常见但充满挑战的问题。基于经典模型的方法和最新的深度学习（DL）方法代表了有关此问题的两种不同方法，每种方法都有自己的优点和缺点。在本文中，我们提出了一种新颖的盲图恢复方法，旨在整合它们的两种优势。具体而言，我们为盲IR构建了一个普通的贝叶斯生成模型，该模型明确描绘了降解过程。在此提出的模型中，PICEL的非I.I.D。高斯分布用于适合图像噪声。它的灵活性比简单的I.I.D。在大多数常规方法中采用的高斯或拉普拉斯分布，以处理图像降解中包含的更复杂的噪声类型。为了解决该模型，我们设计了一个变异推理算法，其中所有预期的后验分布都被参数化为深神经网络，以提高其模型能力。值得注意的是，这种推论算法诱导统一的框架共同处理退化估计和图像恢复的任务。此外，利用了前一种任务中估计的降解信息来指导后一种红外过程。对两项典型的盲型IR任务进行实验，即图像降解和超分辨率，表明所提出的方法比当前最新的方法实现了卓越的性能。

translated by 谷歌翻译

Camera Condition Monitoring and Readjustment by means of Noise and Blur

Maik Wischow , Guillermo Gallego , Ines Ernst , Anko Börner

分类：计算机视觉

2021-12-10

自治车辆和机器人需要越来越多的鲁棒性和可靠性，以满足现代任务的需求。这些要求特别适用于相机，因为它们是获取环境和支持行动的信息的主要传感器。相机必须保持适当的功能，并在必要时采取自动对策。但是，几乎没有作品，审查了相机的一般情况监测方法的实际应用，并在设想的高级别应用程序中设计对策。我们为基于数据和物理接地模型的相机提出了一种通用和可解释的自我保健框架。为此，我们通过比较传统和血液的机器学习的方法，确定一种可靠的两种可靠，实时的估计，用于诸如难以释放的情况（Defocus Blur，运动模糊，不同噪声现象和最常见的噪声现象和最常见的组合）的典型图像效果广泛的实验。此外，我们展示了如何根据实验（非线性和非单调）输入 - 输出性能曲线来调整相机参数（例如，曝光时间和ISO增益）以实现最佳的全系统能力，使用对象检测，运动模糊和传感器噪声作为示例。我们的框架不仅提供了一种实用的即用的解决方案，可以评估和维护摄像机的健康，但也可以作为扩展来解决更复杂的问题的基础，以凭经验组合附加的数据源（例如，传感器或环境参数或环境参数）为了获得完全可靠和强大的机器。

translated by 谷歌翻译

ISP-Agnostic Image Reconstruction for Under-Display Cameras

Miao Qi , Yuqi Li , Wolfgang Heidrich

分类：计算机视觉

2021-11-02

近年来已经提出了显示屏下的显示器，作为减少移动设备的形状因子的方式，同时最大化屏幕区域。不幸的是，将相机放在屏幕后面导致显着的图像扭曲，包括对比度，模糊，噪音，色移，散射伪像和降低光敏性的损失。在本文中，我们提出了一种图像恢复管道，其是ISP-Annostic，即它可以与任何传统ISP组合，以产生使用相同的ISP与常规相机外观匹配的最终图像。这是通过执行Raw-Raw Image Restoration的深度学习方法来实现的。为了获得具有足够对比度和场景多样性的大量实际展示摄像机培训数据，我们还开发利用HDR监视器的数据捕获方法，以及数据增强方法以产生合适的HDR内容。监视器数据补充有现实世界的数据，该数据具有较少的场景分集，但允许我们实现细节恢复而不受监视器分辨率的限制。在一起，这种方法成功地恢复了颜色和对比度以及图像细节。

translated by 谷歌翻译

SVBR-NET: A Non-Blind Spatially Varying Defocus Blur Removal Network

Ali Karaali , Claudio Rosito Jung

分类：计算机视觉

2022-06-26

Defocus Blur是大多数相机中使用的光学传感器的物理后果。尽管它可以用作摄影风格，但通常被视为图像降解，以形成模型的尖锐图像，并具有空间变化的模糊内核。在过去几年的模糊估计方法的推动下，我们提出了一种非盲方法来处理图像脱毛的方法，可以处理空间变化的核。我们介绍了两个编码器子网络网络，它们分别用模糊图像和估计的模糊图，并作为输出作为输出（Deconvolved）图像的输出。每个子网络都会呈现几个跳过连接，这些连接允许分开分开的数据传播，还可以通过划线跳过连接，以简化模块之间的通信。该网络经过合成的模糊内核训练，这些核被增强以模拟现有模糊估计方法产生的模糊图，我们的实验结果表明，当与多种模糊估计方法结合使用时，我们的方法很好地工作。

translated by 谷歌翻译

NeRF in the Dark: High Dynamic Range View Synthesis from Noisy Raw Images

Ben Mildenhall , Peter Hedman , Ricardo Martin-Brualla , Pratul Srinivasan , Jonathan T. Barron

分类：计算机视觉

2021-11-26

神经辐射字段（NERF）是一种用于高质量新颖观看综合的技术从一系列姿势输入图像。与大多数视图合成方法一样，NERF使用TONEMAPPED的低动态范围（LDR）作为输入;这些图像已经通过流畅的相机管道处理，平滑细节，剪辑突出显示，并扭曲了原始传感器数据的简单噪声分布。我们修改NERF以直接在线性原始图像直接培训，保持场景的完整动态范围。通过从生成的NERF渲染原始输出图像，我们可以执行新颖的高动态范围（HDR）视图综合任务。除了改变相机的观点外，我们还可以在事实之后操纵焦点，曝光和调度率。虽然单个原始图像显然比后处理的原始图像显着更大，但我们表明NERF对原始噪声的零平均分布非常强大。当优化许多嘈杂的原始输入（25-200）时，NERF会产生一个场景表示，如此准确的，即其呈现的新颖视图优于在同一宽基线输入图像上运行的专用单个和多像深生物丹机。因此，我们调用Rawnerf的方法可以从近黑暗中捕获的极其嘈杂的图像中重建场景。

translated by 谷歌翻译

A Practical Calibration Method for RGB Micro-Grid Polarimetric Cameras

Joaquin Rodriguez , Lew Lew-Yan-Voon , Renato Martins , Olivier Morel

分类：计算机视觉

2022-08-29

极化成像已应用于越来越多的机器人视觉应用中（例如，水下导航，眩光去除，脱落，对象分类和深度估计）。可以在市场RGB极化摄像机上找到可以在单个快照中捕获颜色和偏振状态的摄像头。由于传感器的特性分散和镜头的使用，至关重要的是校准这些类型的相机以获得正确的极化测量。到目前为止开发的校准方法要么不适合这种类型的相机，要么需要在严格的设置中进行复杂的设备和耗时的实验。在本文中，我们提出了一种新方法来克服对复杂的光学系统有效校准这些相机的需求。我们表明，所提出的校准方法具有多个优点，例如任何用户都可以使用统一的线性极化光源轻松校准相机，而无需任何先验地了解其偏振状态，并且收购数量有限。我们将公开提供校准代码。

translated by 谷歌翻译

HTML版本