智能论文笔记

ISP-Agnostic Image Reconstruction for Under-Display Cameras

Miao Qi , Yuqi Li , Wolfgang Heidrich

分类：计算机视觉

2021-11-02

近年来已经提出了显示屏下的显示器，作为减少移动设备的形状因子的方式，同时最大化屏幕区域。不幸的是，将相机放在屏幕后面导致显着的图像扭曲，包括对比度，模糊，噪音，色移，散射伪像和降低光敏性的损失。在本文中，我们提出了一种图像恢复管道，其是ISP-Annostic，即它可以与任何传统ISP组合，以产生使用相同的ISP与常规相机外观匹配的最终图像。这是通过执行Raw-Raw Image Restoration的深度学习方法来实现的。为了获得具有足够对比度和场景多样性的大量实际展示摄像机培训数据，我们还开发利用HDR监视器的数据捕获方法，以及数据增强方法以产生合适的HDR内容。监视器数据补充有现实世界的数据，该数据具有较少的场景分集，但允许我们实现细节恢复而不受监视器分辨率的限制。在一起，这种方法成功地恢复了颜色和对比度以及图像细节。

translated by 谷歌翻译

Continuous Exposure for Extreme Low-Light Imaging

Evgeny Hershkovitch Neiterman , Michael Klyuchka , Gil Ben-Artzi

分类：计算机视觉

2020-12-07

我们考虑了在无法检测到细节的非常低光的环境中增强未忽视的深色图像的问题。现有方法学会将输入图像的暴露调整为预定值。但是，实际上，最佳增强曝光量从一个输入图像到另一个输入图像不等，因此，增强的图像可能包含视觉伪像，例如低对比度或黑暗区域。我们通过引入一个深度学习模型来解决此限制，该模型允许用户在运行时不断调整增强的曝光水平，以便根据其偏好优化输出。我们提供一个在极端弱光条件下在室外和室内场景中捕获的1500张原始图像的数据集，具有五个不同的曝光水平和各种相机参数，作为关键贡献。我们证明，与以前的方法相比，我们的方法可以显着提高在各种条件下在极度低光条件下捕获的图像的增强质量。

translated by 谷歌翻译

Burst Photography for Learning to Enhance Extremely Dark Images

Ahmet Serdar Karadeniz , Erkut Erdem , Aykut Erdem

分类：计算机视觉

2020-06-17

在极低光线条件下捕获图像会对标准相机管道带来重大挑战。图像变得太黑了，太吵了，这使得传统的增强技术几乎不可能申请。最近，基于学习的方法已经为此任务显示了非常有希望的结果，因为它们具有更大的表现力能力来允许提高质量。这些研究中的激励，在本文中，我们的目标是利用爆破摄影来提高性能，并从极端暗的原始图像获得更加锐利和更准确的RGB图像。我们提出的框架的骨干是一种新颖的粗良好网络架构，逐步产生高质量的输出。粗略网络预测了低分辨率，去噪的原始图像，然后将其馈送到精细网络以恢复微尺的细节和逼真的纹理。为了进一步降低噪声水平并提高颜色精度，我们将该网络扩展到置换不变结构，使得它作为输入突发为低光图像，并在特征级别地合并来自多个图像的信息。我们的实验表明，我们的方法通过生产更详细和相当更高的质量的图像来引起比最先进的方法更令人愉悦的结果。

translated by 谷歌翻译

Learning to See in the Dark

Chen Chen , Qifeng Chen , Jia Xu , Vladlen Koltun

分类：

2018-05-04

a) Camera output with ISO 8,000 (b) Camera output with ISO 409,600 (c) Our result from the raw data of (a) Figure 1. Extreme low-light imaging with a convolutional network. Dark indoor environment. The illuminance at the camera is < 0.1 lux. The Sony α7S II sensor is exposed for 1/30 second. (a) Image produced by the camera with ISO 8,000. (b) Image produced by the camera with ISO 409,600. The image suffers from noise and color bias. (c) Image produced by our convolutional network applied to the raw sensor data from (a).

translated by 谷歌翻译

Face Deblurring using Dual Camera Fusion on Mobile Phones

Wei-Sheng Lai , YiChang Shih , Lun-Cheng Chu , Xiaotong Wu , Sung-Fang Tsai , Michael Krainin , Deqing Sun , Chia-Kai Liang

分类：计算机视觉

2022-07-23

快速移动受试者的运动模糊是摄影中的一个长期问题，由于收集效率有限，尤其是在弱光条件下，在手机上非常常见。尽管近年来我们目睹了图像脱毛的巨大进展，但大多数方法都需要显着的计算能力，并且在处理高分辨率照片的情况下具有严重的局部动作。为此，我们根据手机的双摄像头融合技术开发了一种新颖的面部脱毛系统。该系统检测到主题运动以动态启用参考摄像头，例如，最近在高级手机上通常可用的Ultrawide Angle摄像机，并捕获带有更快快门设置的辅助照片。虽然主镜头是低噪音但模糊的，但参考镜头却很锋利，但嘈杂。我们学习ML模型，以对齐和融合这两张镜头，并在没有运动模糊的情况下输出清晰的照片。我们的算法在Google Pixel 6上有效运行，每次拍摄需要463毫秒的开销。我们的实验证明了系统对替代单片，多帧，面部特异性和视频脱张算法以及商业产品的优势和鲁棒性。据我们所知，我们的工作是第一个用于面部运动脱毛的移动解决方案，在各种运动和照明条件下，在数千个图像中可靠地工作。

translated by 谷歌翻译

Progressive Joint Low-light Enhancement and Noise Removal for Raw Images

Yucheng Lu , Seung-Won Jung

分类：计算机视觉

2021-06-28

移动设备上的低光成像通常是由于不足的孔径穿过相对较小的孔径而挑战，导致信噪比较低。以前的大多数关于低光图像处理的作品仅关注单个任务，例如照明调整，颜色增强或删除噪声；或在密切依赖于从特定的摄像机模型中收集的长时间曝光图像对的关节照明调整和降解任务上，因此，这些方法在需要摄像机特定的关节增强和恢复的现实环境中不太实用且可推广。为了解决这个问题，在本文中，我们提出了一个低光图像处理框架，该框架可以执行关节照明调整，增强色彩和降解性。考虑到模型特异性数据收集的难度和捕获图像的超高定义，我们设计了两个分支：系数估计分支以及关节增强和denoising分支。系数估计分支在低分辨率空间中起作用，并预测通过双边学习增强的系数，而关节增强和去核分支在全分辨率空间中工作，并逐步执行关节增强和脱氧。与现有方法相反，我们的框架在适应另一个摄像机模型时不需要回忆大量数据，这大大减少了微调我们用于实际使用方法所需的努力。通过广泛的实验，与当前的最新方法相比，我们在现实世界中的低光成像应用中证明了它的巨大潜力。

translated by 谷歌翻译

Towards Low Light Enhancement with RAW Images

Haofeng Huang , Wenhan Yang , Yueyu Hu , Jiaying Liu , Ling-Yu Duan

分类：计算机视觉

2021-12-28

在本文中，我们使第一个基准测试精力阐述在低光增强中使用原始图像的优越性，并开发一种以更灵活和实用的方式利用原始图像的新颖替代路线。通过对典型图像处理管道进行充分考虑的启发，我们受到启发，开发了一种新的评估框架，分解增强模型（FEM），它将原始图像的属性分解成可测量的因素，并提供了探索原始图像属性的工具凭经验影响增强性能。经验基金基准结果表明，在元数据中记录的数据和曝光时间的线性起作用最关键的作用，这在将SRGB图像作为输入中的方法采取各种措施中提出了不同的性能增益。通过从基准测试结果中获得的洞察力，开发了一种原始曝光增强网络（REENET），这在实际应用中的实际应用中的优缺点与仅在原始图像中的原始应用中的优点和可接近之间的权衡培训阶段。 Reenet将SRGB图像投影到线性原域中，以应用相应的原始图像的约束，以减少建模培训的难度。之后，在测试阶段，我们的reenet不依赖于原始图像。实验结果不仅展示了Reenet到最先进的SRGB的方法以及原始指导和所有组件的有效性。

translated by 谷歌翻译

D2HNet: Joint Denoising and Deblurring with Hierarchical Network for Robust Night Image Restoration

Yuzhi Zhao , Yongzhe Xu , Qiong Yan , Dingdong Yang , Xuehui Wang , Lai-Man Po

分类：计算机视觉

2022-07-07

使用现代智能手机摄像机的夜成像由于光子计数低和成像系统中不可避免的噪声而变得麻烦。直接调整曝光时间和ISO等级在弱光条件下无法同时获得锋利和无噪声图像。尽管已经提出了许多方法来增强嘈杂或模糊的夜晚图像，但由于两个主要原因，它们在现实世界中的照片仍然不令人满意：1）单个图像中的信息有限和2）合成训练图像和真实图像之间的域间隙 - 世界照片（例如，模糊区域和分辨率的差异）。为了利用连续的长期和短曝光图像中的信息，我们提出了一条基于学习的管道来融合它们。开发了D2HNET框架，以通过在短期曝光图像的指导下脱毛和增强长期暴露图像来恢复高质量的图像。为了缩小域间隙，我们利用了两相deblernet-enhancenet架构，该体系结构在固定的低分辨率上执行准确的模糊去除，以便能够在不同的分辨率输入中处理大范围模糊。此外，我们从HD视频中合成了D2数据，并在其上进行了实验。验证集和真实照片的结果表明，我们的方法获得了更好的视觉质量和最先进的定量分数。可以在https://github.com/zhaoyuzhi/d2hnet上找到D2HNET代码，模型和D2-DATASET。

translated by 谷歌翻译

Towards Efficient and Scale-Robust Ultra-High-Definition Image Demoireing

Xin Yu , Peng Dai , Wenbo Li , Lan Ma , Jiajun Shen , Jia Li , Xiaojuan Qi

分类：计算机视觉

2022-07-20

随着移动设备的快速开发，现代使用的手机通常允许用户捕获4K分辨率（即超高定义）图像。然而，对于图像进行示范，在低级视觉中，一项艰巨的任务，现有作品通常是在低分辨率或合成图像上进行的。因此，这些方法对4K分辨率图像的有效性仍然未知。在本文中，我们探索了Moire模式的删除，以进行超高定义图像。为此，我们提出了第一个超高定义的演示数据集（UHDM），其中包含5,000个现实世界4K分辨率图像对，并对当前最新方法进行基准研究。此外，我们提出了一个有效的基线模型ESDNET来解决4K Moire图像，其中我们构建了一个语义对准的比例感知模块来解决Moire模式的尺度变化。广泛的实验表明了我们的方法的有效性，这可以超过最轻巧的优于最先进的方法。代码和数据集可在https://xinyu-andy.github.io/uhdm-page上找到。

translated by 谷歌翻译

Low-Light Image and Video Enhancement Using Deep Learning: A Survey

Chongyi Li , Chunle Guo , Linghao Han , Jun Jiang , Ming-Ming Cheng , Jinwei Gu , Chen Change Loy

分类：计算机视觉

2021-04-21

低光图像增强（LLIE）旨在提高在环境中捕获的图像的感知或解释性，较差的照明。该领域的最新进展由基于深度学习的解决方案为主，其中许多学习策略，网络结构，丢失功能，培训数据等已被采用。在本文中，我们提供了全面的调查，以涵盖从算法分类到开放问题的各个方面。为了检查现有方法的概括，我们提出了一个低光图像和视频数据集，其中图像和视频是在不同的照明条件下的不同移动电话的相机拍摄的。除此之外，我们首次提供统一的在线平台，涵盖许多流行的LLIE方法，其中结果可以通过用户友好的Web界面生产。除了在公开和我们拟议的数据集上对现有方法的定性和定量评估外，我们还验证了他们在黑暗中的脸部检测中的表现。这项调查与拟议的数据集和在线平台一起作为未来研究的参考来源和促进该研究领域的发展。拟议的平台和数据集以及收集的方法，数据集和评估指标是公开可用的，并将经常更新。

translated by 谷歌翻译

Deep Learning for HDR Imaging: State-of-the-Art and Future Trends

Lin Wang , Kuk-Jin Yoon

分类：计算机视觉 | 机器学习

2021-10-20

高动态范围（HDR）成像是一种允许广泛的动态曝光范围的技术，这在图像处理，计算机图形和计算机视觉中很重要。近年来，使用深度学习（DL），HDR成像有重大进展。本研究对深层HDR成像方法的最新发展进行了综合和富有洞察力的调查和分析。在分层和结构上，将现有的深层HDR成像方法基于（1）输入曝光的数量/域，（2）学习任务数，（3）新传感器数据，（4）新的学习策略，（5）应用程序。重要的是，我们对关于其潜在和挑战的每个类别提供建设性的讨论。此外，我们审查了深度HDR成像的一些关键方面，例如数据集和评估指标。最后，我们突出了一些打开的问题，并指出了未来的研究方向。

translated by 谷歌翻译

A Comprehensive Survey and Taxonomy on Single Image Dehazing Based on Deep Learning

Jie Gui , Xiaofeng Cong , Yuan Cao , Wenqi Ren , Jun Zhang , Jing Zhang , Jiuxin Cao , Dacheng Tao

分类：计算机视觉 | 机器学习

2021-06-07

With the development of convolutional neural networks, hundreds of deep learning based dehazing methods have been proposed. In this paper, we provide a comprehensive survey on supervised, semi-supervised, and unsupervised single image dehazing. We first discuss the physical model, datasets, network modules, loss functions, and evaluation metrics that are commonly used. Then, the main contributions of various dehazing algorithms are categorized and summarized. Further, quantitative and qualitative experiments of various baseline methods are carried out. Finally, the unsolved issues and challenges that can inspire the future research are pointed out. A collection of useful dehazing materials is available at \url{https://github.com/Xiaofeng-life/AwesomeDehazing}.

translated by 谷歌翻译

Towards Robust Drone Vision in the Wild

Xiaoyu Lin

分类：计算机视觉

2022-08-21

在过去的几年中，目睹了基于无人机的应用，计算机视觉起着至关重要的作用。但是，大多数基于公共无人机的视力数据集都集中在检测和跟踪上。另一方面，大多数现有图像超分辨率方法的性能对数据集敏感，特别是高分辨率和低分辨率图像之间的退化模型。在本文中，我们提出了第一个用于无人机视觉的超分辨率数据集。图像对由具有不同焦距的无人机上的两个摄像机捕获。我们在不同的高度收集数据，然后提出预处理步骤以对齐图像对。广泛的经验研究表明，在不同高度捕获的图像之间存在域间隙。同时，经过验证的图像超分辨率网络的性能在我们的数据集上也有所下降，并且海拔不同。最后，我们提出了两种方法，以在不同高度建立强大的图像超分辨率网络。第一个通过高度感知的层将高度信息馈送到网络中。第二个使用单次学习来快速使超分辨率模型适应未知高度。我们的结果表明，所提出的方法可以有效地提高不同海拔高度的超分辨率网络的性能。

translated by 谷歌翻译

Holistic Attention-Fusion Adversarial Network for Single Image Defogging

Wei Liu , Cheng Chen , Rui Jiang , Tao Lu , Zixiang Xiong

分类：计算机视觉

2022-02-19

基于对抗性学习的图像抑制方法，由于其出色的性能，已经在计算机视觉中进行了广泛的研究。但是，大多数现有方法对实际情况的质量功能有限，因为它们在相同场景的透明和合成的雾化图像上进行了培训。此外，它们在保留鲜艳的色彩和丰富的文本细节方面存在局限性。为了解决这些问题，我们开发了一个新颖的生成对抗网络，称为整体注意力融合对抗网络（HAAN），用于单个图像。 Haan由Fog2FogFogre块和FogFree2Fog块组成。在每个块中，有三个基于学习的模块，即雾除雾，颜色纹理恢复和雾合成，它们相互限制以生成高质量的图像。 Haan旨在通过学习雾图图像之间的整体通道空间特征相关性及其几个派生图像之间的整体通道空间特征相关性来利用纹理和结构信息的自相似性。此外，在雾合成模块中，我们利用大气散射模型来指导它，以通过新颖的天空分割网络专注于大气光优化来提高生成质量。关于合成和现实世界数据集的广泛实验表明，就定量准确性和主观的视觉质量而言，Haan的表现优于最先进的脱落方法。

translated by 谷歌翻译

High Dynamic Range and Super-Resolution from Raw Image Bursts

Bruno Lecouat , Thomas Eboli , Jean Ponce , Julien Mairal

分类：计算机视觉

2022-07-29

由智能手机和中端相机捕获的照片的空间分辨率和动态范围有限，在饱和区域中未充满刺激的区域和颜色人工制品中的嘈杂响应。本文介绍了第一种方法（据我们所知），以重建高分辨率，高动态范围的颜色图像，这些颜色来自带有曝光括号的手持相机捕获的原始照相爆发。该方法使用图像形成的物理精确模型来结合迭代优化算法，用于求解相应的逆问题和学习的图像表示，以进行健壮的比对，并以前的自然图像。所提出的算法很快，与基于最新的学习图像恢复方法相比，内存需求较低，并且从合成但逼真的数据终止学习的特征。广泛的实验证明了其出色的性能，具有最多$ \ times 4 $的超分辨率因子在野外拍摄的带有手持相机的真实照片，以及对低光条件，噪音，摄像机摇动和中等物体运动的高度鲁棒性。

translated by 谷歌翻译

FMD-cGAN: Fast Motion Deblurring using Conditional Generative Adversarial Networks

Jatin Kumar , Indra Deep Mastan , Shanmuganathan Raman

分类：计算机视觉

2021-11-30

在本文中，我们介绍了一种快速运动脱棕色条件的生成对抗网络（FMD-CGAN），其有助于单个图像的盲运动去纹理。 FMD-CGAN在去修改图像后提供令人印象深刻的结构相似性和视觉外观。与其他深度神经网络架构一样，GAN也遭受大型模型大小（参数）和计算。在诸如移动设备和机器人等资源约束设备上部署模型并不容易。借助MobileNet基于MobileNet的架构，包括深度可分离卷积，我们降低了模型大小和推理时间，而不会丢失图像的质量。更具体地说，我们将模型大小与最近的竞争对手相比将3-60倍。由此产生的压缩去掩盖CGAN比其最接近的竞争对手更快，甚至定性和定量结果优于各种最近提出的最先进的盲运动去误紧模型。我们还可以使用我们的模型进行实时映像解擦干任务。标准数据集的当前实验显示了该方法的有效性。

translated by 谷歌翻译

Enhancing Low-Light Images in Real World via Cross-Image Disentanglement

Lanqing Guo , Renjie Wan , Wenhan Yang , Alex Kot , Bihan Wen

分类：计算机视觉

2022-01-10

在低灯条件下捕获的图像遭受低可视性和各种成像伪影，例如真实噪音。现有的监督启示算法需要大量的像素对齐的训练图像对，这很难在实践中准备。虽然弱监督或无人监督的方法可以缓解这些挑战，但不使用配对的训练图像，由于缺乏相应的监督，一些现实世界的文物不可避免地被错误地放大。在本文中，而不是使用完美的对齐图像进行培训，我们创造性地使用未对准的现实世界图像作为指导，这很容易收集。具体地，我们提出了一个交叉图像解剖线程（CIDN），以分别提取来自低/常光图像的交叉图像亮度和图像特定内容特征。基于此，CIDN可以同时校正特征域中的亮度和抑制图像伪像，其在很大程度上将鲁棒性增加到像素偏移。此外，我们收集了一个新的低光图像增强数据集，包括具有现实世界腐败的未对准培训图像。实验结果表明，我们的模型在新建议的数据集和其他流行的低光数据集中实现了最先进的表演。

translated by 谷歌翻译

A Comprehensive Review of Deep Learning-based Single Image Super-resolution

Syed Muhammad Arsalan Bashir , Yi Wang , Mahrukh Khan , Yilong Niu

分类：计算机视觉 | 机器学习

2021-02-18

图像超分辨率（SR）是重要的图像处理方法之一，可改善计算机视野领域的图像分辨率。在过去的二十年中，在超级分辨率领域取得了重大进展，尤其是通过使用深度学习方法。这项调查是为了在深度学习的角度进行详细的调查，对单像超分辨率的最新进展进行详细的调查，同时还将告知图像超分辨率的初始经典方法。该调查将图像SR方法分类为四个类别，即经典方法，基于学习的方法，无监督学习的方法和特定领域的SR方法。我们还介绍了SR的问题，以提供有关图像质量指标，可用参考数据集和SR挑战的直觉。使用参考数据集评估基于深度学习的方法。一些审查的最先进的图像SR方法包括增强的深SR网络（EDSR），周期循环gan（Cincgan），多尺度残留网络（MSRN），Meta残留密度网络（META-RDN），反复反射网络（RBPN），二阶注意网络（SAN），SR反馈网络（SRFBN）和基于小波的残留注意网络（WRAN）。最后，这项调查以研究人员将解决SR的未来方向和趋势和开放问题的未来方向和趋势。

translated by 谷歌翻译

SJ-HD^2R: Selective Joint High Dynamic Range and Denoising Imaging for Dynamic Scenes

Wei Li , Shuai Xiao , Tianhong Dai , Shanxin Yuan , Tao Wang , Cheng Li , Fenglong Song

分类：计算机视觉

2022-06-20

在高光中，幽灵伪像，运动模糊和低忠诚度是来自多个低动态范围（LDR）图像的高动态范围（HDR）成像的主要挑战。这些问题来自使用中等暴露图像作为先前方法中的参考框架。为了应对它们，我们建议使用暴露不足的图像作为避免这些问题的参考。但是，暴露不足图像的黑暗区域中的沉重噪音成为一个新问题。因此，我们提出了一个关节HDR和Denoising管道，其中包含两个子网络：（i）通过利用暴露先验来适应性的denoise输入LDR；（ii）金字塔级联融合网络（PCFNET），以多尺度的方式引入了注意机制和级联结构。为了进一步利用这两个范式，我们提出了一个选择性和联合HDR和DeNoising（SJ-HD $^2 $ R）成像框架，利用特定方案的先验来进行路径选择，准确性超过93.3 $ \％$ $ 。我们创建了第一个关节HDR和Denoising基准数据集，该数据集包含各种具有挑战性的HDR和DeNoising场景，并支持参考图像的切换。广泛的实验结果表明，我们的方法实现了与以前的方法相比的卓越性能。

translated by 谷歌翻译

A Survey on Deep learning based Document Image Enhancement

Zahra Anvari , Vassilis Athitsos

分类：计算机视觉 | 机器学习

2021-12-06

如今，广泛使用了数字化文件，如科学文章，税务表，发票，合同文件和历史文本。由于各种原因，这些图像可能会劣化或损坏，包括捕获图像时的差的情况，阴影，扫描它们时，噪音和模糊，老化，墨水染色，通过，水印，印模等。文档图像增强和恢复在许多自动文档分析和识别任务中发挥至关重要的作用，例如使用光学字符识别（OCR）的内容提取。随着最近深入学习的进步，提出了许多方法来提高这些文档图像的质量。在本文中，我们审查了基于深入的学习方法，数据集和指标，用于不同的文档图像增强问题。我们提供全面概述六种不同文档图像增强任务的基于深度学习的方法，包括二值化，脱落，去噪，偏差，水印去除和暗影去除。我们总结了每个任务的主要最先进的工作，并讨论其特征，挑战和局限性。我们介绍了多个文件图像增强任务，这些任务不仅仅是注意力，包括在曝光和暴露校正和漏洞中，并识别未来研究的其他一些有前途的研究方向和机会。

translated by 谷歌翻译