智能论文笔记

Deep Neural Network for Blind Visual Quality Assessment of 4K Content

Wei Lu , Wei Sun , Xiongkuo Min , Wenhan Zhu , Quan Zhou , Jun He , Qiyuan Wang , Zicheng Zhang , Tao Wang , Guangtao Zhai

分类：计算机视觉

2022-06-09

由于空间分辨率的巨大改进，4K内容可以为消费者提供更严肃的视觉体验。但是，由于分辨率扩大和特定的扭曲，现有的盲图质量评估（BIQA）方法不适合原始和升级的4K内容物。在本文中，我们提出了一个针对4K内容的深度学习的BIQA模型，一方面可以识别True和pseudo 4K内容，另一方面可以评估其感知视觉质量。考虑到高空间分辨率可以代表更丰富的高频信息的特征，我们首先提出了基于灰色级别的共发生矩阵（GLCM）的纹理复杂度度量，以从4K图像中选择三个代表性图像贴片，这可以减少计算复杂性，被证明对通过实验的总体质量预测非常有效。然后，我们从卷积神经网络（CNN）的中间层中提取不同种类的视觉特征，并将它们集成到质量感知的特征表示中。最后，使用两个多层感知（MLP）网络用于将质量感知功能映射到类概率和每个贴片的质量分数中。总体质量指数是通过平均贴片结果汇总获得的。提出的模型通过多任务学习方式进行了训练，我们引入了不确定性原理，以平衡分类和回归任务的损失。实验结果表明，所提出的模型的表现均优于所有4K内容质量评估数据库中的BIQA指标。

translated by 谷歌翻译

Blind Surveillance Image Quality Assessment via Deep Neural Network Combined with the Visual Saliency

Wei Lu , Wei Sun , Wenhan Zhu , Xiongkuo Min , Zicheng Zhang , Tao Wang , Guangtao Zhai

分类：计算机视觉

2022-06-09

智能视频监视系统（IVSS）可以自动分析监视图像（SI）的内容并减轻体力劳动的负担。但是，SIS在获取，压缩和传播过程中可能会遭受质量下降，这使得IVSS难以理解SIS的内容。在本文中，我们首先进行了一个示例实验（即面部检测任务），以证明SIS的质量对IVSS的性能具有至关重要的影响，然后提出一个基于显着的深神经网络，以实现盲目质量评估SIS，这有助于IVSS过滤低质量的SIS并改善检测和识别性能。具体而言，我们首先计算SI的显着性图以选择最突出的局部区域，因为显着区域通常包含丰富的语义信息，以实现机器视觉，因此对SIS的整体质量产生了很大的影响。接下来，采用卷积神经网络（CNN）来提取整个图像和局部区域的质量感知功能，然后分别通过完全连接的（FC）网络映射到全球和本地质量分数中。最后，将整体质量得分计算为全球和本地质量分数的加权总和。 SI质量数据库（SIQD）的实验结果表明，所提出的方法优于所有最新的BIQA方法。

translated by 谷歌翻译

A No-Reference Deep Learning Quality Assessment Method for Super-resolution Images Based on Frequency Maps

Zicheng Zhang , Wei Sun , Xiongkuo Min , Wenhan Zhu , Tao Wang , Wei Lu , Guangtao Zhai

分类：计算机视觉

2022-06-09

为了支持迫切需要高分辨率（HR）图像的应用程序方案，开发了各种单个图像超分辨率（SISR）算法。但是，SISR是一个不良的逆问题，可能会将诸如纹理转移，模糊等的伪像到重建图像中，因此有必要评估超分辨率图像（SRIS）的质量。请注意，大多数现有的图像质量评估（IQA）方法都是用于合成扭曲的图像的，这可能对SRI不起作用，因为它们的扭曲更加多样化和复杂。因此，在本文中，我们提出了一种基于频率图的无参考图像质量评估方法，因为SISR算法引起的伪像对频率信息非常敏感。具体而言，我们首先通过使用SOBEL操作员和分段光滑的图像近似来获得SRI的高频图（HM）和低频图（LM）。然后，使用两个流网络来提取两个频率图的质量感知特征。最后，使用完全连接的图层将功能回归单个质量值。实验结果表明，我们的方法的表现均优于所有的三种超分辨率质量评估（SRQA）数据库中的IQA模型。

translated by 谷歌翻译

RAPIQUE: Rapid and Accurate Video Quality Prediction of User Generated Content

Zhengzhong Tu , Xiangxu Yu , Yilin Wang , Neil Birkbeck , Balu Adsumilli , Alan C. Bovik

分类：计算机视觉

2021-01-26

用户生成的内容（UGC）的盲或禁区视频质量评估已成为趋势，具有挑战性，迄今未解决的问题。因此，适用于该内容的准确和高效的视频质量预测因素都需要实现更智能的分析和处理UGC视频的需求。以前的研究表明，自然场景统计和深度学习特征既足以捕获空间扭曲，这有助于UGC视频质量问题的重要方面。然而，这些模型无法对实际应用中预测复杂和不同的UGC视频的质量无能为力或效率低。在这里，我们为UGC含量介绍了一种有效且高效的视频质量模型，我们将我们展示快速准确的视频质量评估员（Rapique），我们展示了与最先进的（SOTA）模型相对表现，而是具有订单-magnitude更快的运行时。 Rapique结合并利用了质量意识的现场统计特征和语义知识的深度卷积功能的优势，使我们能够设计用于视频质量建模的第一通用和有效的空间和时间（时空）带通统计模型。我们对最近的大型UGC视频质量数据库的实验结果表明，Rapique以相当更低的计算费用提供所有数据集的顶级表现。我们希望这项工作促进并激发进一步努力实现潜在的实时和低延迟应用程序的视频质量问题的实际建模。为促进公共用途，在线进行了求助的实施：\ url {https://github.com/vztu/rapique}。

translated by 谷歌翻译

Treating Point Cloud as Moving Camera Videos: A No-Reference Quality Assessment Metric

Zicheng Zhang , Wei Sun , Xiongkuo Min , Yu Fan , Guangtao Zhai

分类：计算机视觉

2022-08-30

Point Cloud是3D内容使用最广泛使用的数字表示格式之一，其视觉质量可能会在生产过程中遇到噪声和几何变化，以及在传输过程中的压缩和压缩采样。为了应对点云质量评估（PCQA）的挑战，已经提出了许多PCQA方法来评估点云的视觉质量水平，以评估渲染的静态2D投影。尽管这种基于投影的PCQA方法在成熟图像质量评估（IQA）方法的帮助下实现了竞争性能，但它们忽略了动态质量感知信息，这与观察者倾向于通过两种静态感知点云的事实完全不符和动态视图。因此，在本文中，我们将点云视为移动相机视频，并通过使用视频质量评估（VQA）方法（NR）方式探索处理PCQA任务的方式。首先，我们通过四个圆形路径将相机围绕点云旋转来生成捕获的视频。然后，我们分别使用可训练的2D-CNN和预训练的3D-CNN模型从所选的关键帧和视频剪辑中提取空间和时间质量感知功能。最后，点云的视觉质量由回归的视频质量值表示。实验结果表明，所提出的方法可有效预测点云的视觉质量水平，甚至可以使用全参考（FR）PCQA方法竞争。消融研究进一步验证了提出的框架的合理性，并确认了从动态视图中提取的质量感知特征所做的贡献。

translated by 谷歌翻译

No-Reference Image Quality Assessment by Hallucinating Pristine Features

Baoliang Chen , Lingyu Zhu , Chenqi Kong , Hanwei Zhu , Shiqi Wang , Zhu Li

分类：计算机视觉

2021-08-09

在本文中，我们提出了通过特征级伪参考（PR）幻觉提出的无引用（NR）图像质量评估（IQA）方法。提出的质量评估框架基于自然图像统计行为的先前模型，并植根于以下观点，即可以很好地利用具有感知意义的特征来表征视觉质量。本文中，通过以原始参考为监督的相互学习方案学习了扭曲的图像中的PR特征，并通过三重态约束进一步确保PR特征的区分特性。给定质量推断的扭曲图像，特征水平的分离是用可逆神经层进行最终质量预测的，导致PR和相应的失真特征以进行比较。在四个流行的IQA数据库中证明了我们提出的方法的有效性，跨数据库评估的卓越性能也揭示了我们方法的高概括能力。我们的方法的实现可在https://github.com/baoliang93/fpr上公开获得。

translated by 谷歌翻译

REQA: Coarse-to-fine Assessment of Image Quality to Alleviate the Range Effect

Bingheng Li , Fushuo Huo

分类：计算机视觉

2022-09-05

用户生成的内容（UGC）的盲图质量评估（BIQA）遭受范围效应，表明在整体质量范围，平均意见评分（MOS）和预测的MOS（PMO）（PMO）上有很好的相关性；关注特定范围，相关性较低。范围效应的原因是，在较大范围内和狭窄范围内的预测偏差破坏了MOS和PMO之间的均匀性。为了解决这个问题，提出了一种新的方法，从粗粒度度量到细粒度的预测。首先，我们为粗粒度度量设计了排名和梯度损失。损失保持了PMOS和MOS之间的顺序和毕业生一致性，从而在较大范围内减少了预测的偏差。其次，我们提出多级公差损失以进行细粒度的预测。损失受到减少阈值的限制，以限制较窄和较窄范围的预测偏差。最后，我们设计了一个反馈网络来进行粗到精细的评估。一方面，网络采用反馈块来处理多尺度的失真功能，另一方面，它将非本地上下文功能融合到每次迭代的输出中，以获取更多质量感知的功能表示。实验结果表明，与最先进的方法相比，提出的方法可以减轻范围效应。

translated by 谷歌翻译

Deep Feature Statistics Mapping for Generalized Screen Content Image Quality Assessment

Baoliang Chen , Hanwei Zhu , Lingyu Zhu , Shiqi Wang , Sam Kwong

分类：计算机视觉

2022-09-12

自然图像的统计规律（称为自然场景统计数据）在不引用图像质量评估中起重要作用。但是，人们普遍认为，通常是计算机生成的屏幕内容图像（SCI）不持有此类统计信息。在这里，我们首次尝试学习SCI的统计数据，基于可以有效确定SCI的质量。所提出的方法的基本机制是基于一个狂野的假设，即没有物理上获得的SCI仍然遵守某些可以以学习方式理解的统计数据。我们从经验上表明，在质量评估中可以有效利用统计偏差，并且在不同的环境中进行评估时，提出的方法优越。广泛的实验结果表明，与现有的NR-IQA模型相比，基于深度统计的SCI质量评估（DFSS-IQA）模型可提供有希望的性能，并在跨数据库设置中显示出很高的概括能力。我们的方法的实现可在https://github.com/baoliang93/dfss-iqa上公开获得。

translated by 谷歌翻译

Related Work on Image Quality Assessment

Dongxu Wang

分类：计算机视觉

2021-11-11

由于存在于视觉信号采集，压缩，传输和显示的各个阶段的质量降级，图像质量评估（IQA）在基于图像的应用中起着重要作用。根据参考图像是否完整且可用，图像质量评估可分为三类：全引用（FR），减少参考（RR）和非引用（NR）。本文将审查最先进的图像质量评估算法。

translated by 谷歌翻译

Deep Decomposition and Bilinear Pooling Network for Blind Night-Time Image Quality Evaluation

Qiuping Jiang , Jiawu Xu , Yudong Mao , Wei Zhou , Xiongkuo Min , Guangtao Zhai

分类：计算机视觉

2022-05-12

在过去的几十年中，盲目的图像质量评估（BIQA）旨在准确地预测图像质量而无需任何原始参考信息，但一直在广泛关注。特别是，在深层神经网络的帮助下，取得了巨大进展。但是，对于夜间图像（NTI）的BIQA的研究仍然较少，通常患有复杂的真实扭曲，例如可见性降低，低对比度，添加噪声和颜色失真。这些多样化的真实降解特别挑战了有效的深神网络的设计，用于盲目NTI质量评估（NTIQE）。在本文中，我们提出了一个新颖的深层分解和双线性池网络（DDB-NET），以更好地解决此问题。 DDB-NET包含三个模块，即图像分解模块，一个特征编码模块和双线性池模块。图像分解模块的灵感来自Itinex理论，并涉及将输入NTI解耦到负责照明信息的照明层组件和负责内容信息的反射层组件。然后，编码模块的功能涉及分别植根于两个解耦组件的降解的特征表示。最后，通过将照明相关和与内容相关的降解作为两因素变化进行建模，将两个特征集组合在一起，将双线汇总在一起以形成统一的表示，以进行质量预测。在几个基准数据集上进行了广泛的实验，已对所提出的DDB-NET的优势得到了很好的验证。源代码将很快提供。

translated by 谷歌翻译

FAVER: Blind Quality Prediction of Variable Frame Rate Videos

Qi Zheng , Zhengzhong Tu , Pavan C. Madhusudana , Xiaoyang Zeng , Alan C. Bovik , Yibo Fan

分类：计算机视觉

2022-01-05

视频质量评估（VQA）仍然是一个重要而挑战性的问题，影响了最广泛的尺度的许多应用程序。移动设备和云计算技术的最新进展使得可以捕获，处理和共度高分辨率，高分辨率（HFR）视频几乎瞬间。能够监控和控制这些流式视频的质量可以使得能够提供更令人愉快的内容和感知的优化速率控制。因此，需要一种强迫需要开发可以在巨大尺度部署的VQA模型。虽然最近的一些效果已应用于可变帧速率和HFR视频质量的全参考（FR）分析，但是没有研究帧速率变化的无引用（NR）VQA算法的开发。在这里，我们提出了一种用于评估HFR视频的一级盲VQA模型，我们将其配给了帧群感知视频评估程序W / O参考（Faver）。 Faver使用扩展模型的空间自然场景统计数据，即包括节省空间小波分解的视频信号，进行有效的帧速率敏感质量预测。我们对几个HFR视频质量数据集的广泛实验表明，PEVER以合理的计算成本优于其他盲VQA算法。为了便于可重复的研究和公共评估，在线可以在线进行狂热的实施：\ url {https://github.com/uniqzheng/hfr-bvqa}。

translated by 谷歌翻译

Quality Assessment of Image Super-Resolution: Balancing Deterministic and Statistical Fidelity

Wei Zhou , Zhou Wang

分类：计算机视觉

2022-07-15

人们对开发图像超分辨率（SR）算法的兴趣越来越大，该算法将低分辨率（LR）转换为更高分辨率的图像，但是自动评估超级分辨图像的视觉质量仍然是一个具有挑战性的问题。在这里，我们在确定性保真度（DF）与统计保真度（SF）的二维（2D）空间中查看SR图像质量评估（SR IQA）的问题。这使我们能够更好地理解现有SR算法的优势和缺点，这些算法在（DF，SF）的2D空间中在不同簇中产生图像。具体而言，我们观察到更传统的SR算法的一种有趣趋势，这些算法通常倾向于在失去SF的同时优化DF，以及最新的基于生成的对抗网络（GAN）的方法，相比之下，这些方法在实现高SF方面具有很强的优势，但有时在高SF方面表现出很强的优势维护DF。此外，我们提出了一个基于内容依赖性的清晰度和纹理评估的不确定性加权方案，将两种保真度措施合并为名为“超级分辨率图像保真度（SRIF）指数的总体质量预测”，这表明了与最新的绩效相对的卓越性能ART IQA模型对主题评级数据集进行测试。

translated by 谷歌翻译

Perceptual Quality Assessment for Fine-Grained Compressed Images

Zicheng Zhang , Wei Sun , Wei Wu , Ying Chen , Xiongkuo Min , Guangtao Zhai

分类：计算机视觉

2022-06-08

近年来，图像存储和传输系统的快速发展，其中图像压缩起着重要作用。一般而言，开发图像压缩算法是为了确保以有限的比特速率确保良好的视觉质量。但是，由于采用不同的压缩优化方法，压缩图像可能具有不同的质量水平，需要对其进行定量评估。如今，主流全参考度量（FR）指标可有效预测在粗粒水平下压缩图像的质量（压缩图像的比特速率差异很明显），但是，它们对于细粒度的压缩图像的性能可能很差比特率差异非常微妙。因此，为了更好地提高经验质量（QOE）并为压缩算法提供有用的指导，我们提出了一种全参考图像质量评估（FR-IQA）方法，以针对细粒度的压缩图像进行压缩图像。具体而言，首先将参考图像和压缩图像转换为$ ycbcr $颜色空间。梯度特征是从对压缩伪像敏感的区域中提取的。然后，我们采用对数 - 盖尔转换来进一步分析纹理差异。最后，将获得的功能融合为质量分数。提出的方法在细粒度的压缩图像质量评估（FGIQA）数据库中进行了验证，该数据库尤其是用于评估具有亲密比特率的压缩图像质量的构建。实验结果表明，我们的公制优于FGIQA数据库上的主流FR-IQA指标。我们还在其他常用的压缩IQA数据库上测试我们的方法，结果表明，我们的方法在粗粒度压缩IQA数据库上也获得了竞争性能。

translated by 谷歌翻译

Blind VQA on 360° Video via Progressively Learning from Pixels, Frames and Video

Li Yang , Mai Xu , Shengxi Li , Yichen Guo , Zulin Wang

分类：计算机视觉

2021-11-18

360 {\ TextDegree}视频的盲目视觉质量评估（BVQA）在优化沉浸式多媒体系统中起着关键作用。在评估360 {\ TextDegree}视频的质量时，人类倾向于从每个球形帧的基于视口的空间失真来识别其在相邻帧中的运动伪影，以视频级质量分数为止，即渐进性质量评估范式。然而，现有的BVQA方法对于360 {\ TextDegree}视频忽略了这条范式。在本文中，我们考虑了人类对球面视频质量的逐步范例，因此提出了一种新颖的BVQA方法（即ProvQA），通过逐步学习从像素，帧和视频中逐步学习。对应于像素，帧和视频的渐进学习，三个子网被设计为我们的PROPQA方法，即球形感知感知质量预测（SPAQ），运动感知感知质量预测（MPAQ）和多帧时间非本地（MFTN）子网。 SPAQ子网首先模拟基于人的球面感知机制的空间质量下降。然后，通过跨越相邻帧的运动提示，MPAQ子网适当地结合了在360 {\ TextDegree}视频上的质量评估的运动上下文信息。最后，MFTN子网聚集多帧质量劣化，通过探索来自多个帧的长期质量相关性来产生最终质量分数。实验验证了我们的方法在两个数据集中的360 {\ TextDegree}视频上显着提高了最先进的BVQA性能，该代码是公共\ url {https://github.com/yanglixiaoshen/的代码Provqa。}

translated by 谷歌翻译

A Comprehensive Review of Deep Learning-based Single Image Super-resolution

Syed Muhammad Arsalan Bashir , Yi Wang , Mahrukh Khan , Yilong Niu

分类：计算机视觉 | 机器学习

2021-02-18

图像超分辨率（SR）是重要的图像处理方法之一，可改善计算机视野领域的图像分辨率。在过去的二十年中，在超级分辨率领域取得了重大进展，尤其是通过使用深度学习方法。这项调查是为了在深度学习的角度进行详细的调查，对单像超分辨率的最新进展进行详细的调查，同时还将告知图像超分辨率的初始经典方法。该调查将图像SR方法分类为四个类别，即经典方法，基于学习的方法，无监督学习的方法和特定领域的SR方法。我们还介绍了SR的问题，以提供有关图像质量指标，可用参考数据集和SR挑战的直觉。使用参考数据集评估基于深度学习的方法。一些审查的最先进的图像SR方法包括增强的深SR网络（EDSR），周期循环gan（Cincgan），多尺度残留网络（MSRN），Meta残留密度网络（META-RDN），反复反射网络（RBPN），二阶注意网络（SAN），SR反馈网络（SRFBN）和基于小波的残留注意网络（WRAN）。最后，这项调查以研究人员将解决SR的未来方向和趋势和开放问题的未来方向和趋势。

translated by 谷歌翻译

No-Reference Image Quality Assessment via Transformers, Relative Ranking, and Self-Consistency

S. Alireza Golestaneh , Saba Dadsetan , Kris M. Kitani

分类：计算机视觉

2021-08-16

无参考图像质量评估（NR-IQA）的目标是根据主观评估来估计感知图像质量，由于不存在原始参考图像，它是复杂和未解决的问题。在本文中，我们提出了一种新颖的模型来解决NR-IQA任务，利用卷积神经网络（CNNS）和变压器中的自我关注机制来解决来自输入图像的本地和非局部特征的混合方法来解决NR-IQA任务。我们通过CNN捕获图像的局部结构信息，然后避免提取的CNNS特征之间的局部偏压并获得图像的非本地表示，我们利用所提取的特征上的变压器，其中我们将它们塑造为顺序输入变压器模型。此外，为了改善主观和目标分数之间的单调性相关性，我们利用每个批处理内图像之间的相对距离信息，并强制执行它们之间的相对排名。最后但并非最不重要的是，我们观察到NR-IQA模型的性能在我们应用于输入到输入时申请等级变换（例如水平翻转）。因此，我们提出了一种利用自我保持性作为自我监督来源的方法，以改善NRIQA模型的鲁棒性。具体而言，我们为每个图像的质量评估模型的输出和其转换（水平翻转）强制实施自我一致性，以利用丰富的自我监控信息，并降低模型的不确定性。为了展示我们工作的有效性，我们在七个标准IQA数据集（合成和真实）上评估它，并显示我们的模型在各种数据集上实现最先进的结果。

translated by 谷歌翻译

Quality Evaluation of Arbitrary Style Transfer: Subjective Study and Objective Metric

Hangwei Chen , Feng Shao , Xiongli Chai , Yuese Gu , Qiuping Jiang , Xiangchao Meng , Yo-Sung Ho

分类：计算机视觉

2022-08-01

任意神经风格转移是一个重要的主题，具有研究价值和工业应用前景，该主题旨在使用另一个样式呈现一个图像的结构。最近的研究已致力于任意风格转移（AST）的任务，以提高风格化质量。但是，关于AST图像的质量评估的探索很少，即使它可以指导不同算法的设计。在本文中，我们首先构建了一个新的AST图像质量评估数据库（AST-IQAD），该数据库包括150个内容样式的图像对以及由八种典型AST算法产生的相应的1200个风格化图像。然后，在我们的AST-IQAD数据库上进行了一项主观研究，该研究获得了三种主观评估（即内容保存（CP），样式相似（SR）和整体视觉（OV），该数据库获得了所有风格化图像的主观评分评分。。为了定量测量AST图像的质量，我们提出了一个新的基于稀疏表示的图像质量评估度量（SRQE），该指标（SRQE）使用稀疏特征相似性来计算质量。 AST-IQAD的实验结果证明了该方法的优越性。数据集和源代码将在https://github.com/hangwei-chen/ast-iqad-srqe上发布

translated by 谷歌翻译

Deep Laplacian Pyramid Networks for Fast and Accurate Super-Resolution

Wei-Sheng Lai , Jia-Bin Huang , Narendra Ahuja , Ming-Hsuan Yang

分类：

2017-04-12

Convolutional neural networks have recently demonstrated high-quality reconstruction for single-image superresolution. In this paper, we propose the Laplacian Pyramid Super-Resolution Network (LapSRN) to progressively reconstruct the sub-band residuals of high-resolution images. At each pyramid level, our model takes coarse-resolution feature maps as input, predicts the high-frequency residuals, and uses transposed convolutions for upsampling to the finer level. Our method does not require the bicubic interpolation as the pre-processing step and thus dramatically reduces the computational complexity. We train the proposed LapSRN with deep supervision using a robust Charbonnier loss function and achieve high-quality reconstruction. Furthermore, our network generates multi-scale predictions in one feed-forward pass through the progressive reconstruction, thereby facilitates resource-aware applications. Extensive quantitative and qualitative evaluations on benchmark datasets show that the proposed algorithm performs favorably against the state-of-the-art methods in terms of speed and accuracy.

translated by 谷歌翻译

Learning Transformer Features for Image Quality Assessment

Chao Zeng , Sam Kwong

分类：计算机视觉

2021-12-01

目标图像质量评估是一个具有挑战性的任务，旨在自动测量给定图像的质量。根据参考图像的可用性，分别存在全引用和无引用IQA任务。大多数深度学习方法使用卷积神经网络提取的深度特征的回归。对于FR任务，另一种选择是对深度特征进行统计比较。对于所有这些方法，通常忽略非本地信息。此外，探索FR和NR任务之间的关系不太探索。通过最近的变压器成功在建模上下文信息中，我们提出了一个统一的IQA框架，它利用CNN骨干和变压器编码器提取特征。所提出的框架与FR和NR模式兼容，并允许联合训练方案。评估实验在三个标准IQA数据集，即LIVE，CSIQ和TID2013和KONIQ-10K上，显示我们所提出的模型可以实现最先进的FR性能。此外，在广泛的实验中实现了相当的NR性能，结果表明，联合训练方案可以利用NR性能。

translated by 谷歌翻译

CONVIQT: Contrastive Video Quality Estimator

Pavan C. Madhusudana , Neil Birkbeck , Yilin Wang , Balu Adsumilli , Alan C. Bovik

分类：计算机视觉

2022-06-29

感知视频质量评估（VQA）是许多流和视频共享平台的组成部分。在这里，我们以自我监督的方式考虑学习具有感知相关的视频质量表示的问题。失真类型的识别和降解水平确定被用作辅助任务，以训练一个深度学习模型，该模型包含深度卷积神经网络（CNN），该模型提取了空间特征，以及捕获时间信息的复发单元。该模型是使用对比度损失训练的，因此我们将此训练框架和结果模型称为对比度质量估计器（Conviqt）。在测试过程中，训练有素的模型的权重被冷冻，并且线性回归器将学习的功能映射到No-Reference（NR）设置中的质量得分。我们通过分析模型预测与地面真相质量评级之间的相关性，并与最先进的NR-VQA模型相比，我们对多个VQA数据库进行了全面评估，并实现竞争性能在这些数据库上进行了培训。我们的消融实验表明，学到的表示形式非常强大，并且在合成和现实的扭曲中很好地概括了。我们的结果表明，可以使用自我监督的学习来获得具有感知轴承的引人注目的表示。这项工作中使用的实现已在https://github.com/pavancm/conviqt上提供。

translated by 谷歌翻译