智能论文笔记

Echocardiographic Image Quality Assessment Using Deep Neural Networks

Robert B. Labs , Massoud Zolgharni , Jonathan P. Loo

分类：计算机视觉 | 机器学习

2022-09-02

超声心动图图像质量评估不是经胸检查中的微不足道问题。随着对心脏结构的体内检查在心脏诊断方面的突出性，已经确认，准确诊断左心室功能取决于回声图像的质量。到目前为止，回声图像的视觉评估是高度主观的，需要在临床病理下进行特定的定义。尽管质量较差的图像损害了量化和诊断，但超声心动图图像质量标准的固有变化表明，在临床试验下，在临床试验下，尤其是在经验不足的心脏病学家下，在不同观察者之间面临的复杂性，并提供了明显的证据。在这项研究中，我们的目的是分析和定义专家主要讨论的特定质量属性，并提出一个完全训练的卷积神经网络模型，以客观地评估此类质量功能。

translated by 谷歌翻译

Automated Assessment of Transthoracic Echocardiogram Image Quality Using Deep Neural Networks

Robert B. Labs , Apostolos Vrettos , Jonathan Loo , Massoud Zolgharni

分类：计算机视觉 | 机器学习 | 神经与进化计算

2022-09-02

二维超声心动图中的标准视图已经建立了良好，但是获得的图像的质量高度依赖于操作员的技能，并进行了主观评估。这项研究旨在通过定义一组新的特定领域质量指标来为超声心动图图像质量提供客观评估管道。因此，可以自动化图像质量评估以增强临床测量，解释和实时优化。我们开发了深层神经网络，用于对超声心动图框架的自动评估，这些评估是从11,262名成年患者中随机采样的。私有超声心动图数据集由33,784帧组成，以前在2010年至2020年之间获得。深度学习方法被用来提取时空特征，并根据平均绝对误差评估了图像质量指标。我们的质量指标涵盖了解剖学和病理元素，以分别提供解剖学可见性，清晰度，深度增益和预先理解性的多元评估评分。

translated by 谷歌翻译

Medical Image Analysis on Left Atrial LGE MRI for Atrial Fibrillation Studies: A Review

Lei Li , Veronika A. Zimmer , Julia A. Schnabel , Xiahai Zhuang

分类：计算机视觉

2021-06-18

晚期钆增强磁共振成像（LGE MRI）通常用于可视化和量化左心房（LA）疤痕。疤痕的位置和程度提供了心理生理学和心房颤动进展的重要信息（AF）。因此，LGE MRI的La Scar分段和量化可用于AF患者的计算机辅助诊断和治疗分层。由于手动描绘可能是耗时的，并且经过专家内和专家间变异性，因此非常需要自动化这种计算，这然而仍然仍然具有挑战性和研究。本文旨在为La腔，墙壁，瘢痕和消融差距分割和LGE MRI的定量提供系统审查，以及AF研究的相关文献。具体而言，我们首先总结AF相关的成像技术，特别是LGE MRI。然后，我们详细介绍了四个计算任务的方法，并总结了每个任务中应用的验证策略。最后，概述了未来可能的未来发展，简要调查了上述方法的潜在临床应用。审查表明，该主题的研究仍处于早期阶段。虽然已经提出了几种方法，但特别是对于LA分割，由于与图像采集的高度变化相关的性能问题和图像采集差异有关的性能问题，仍有很大的算法发展。

translated by 谷歌翻译

Deep learning techniques for automatic MRI cardiac multi-structures segmentation and diagnosis: is the problem solved?

分类：

Delineation of the left ventricular cavity, myocardium and right ventricle from cardiac magnetic resonance images (multi-slice 2D cine MRI) is a common clinical task to establish diagnosis. The automation of the corresponding tasks has thus been the subject of intense research over the past decades. In this paper, we introduce the "Automatic Cardiac Diagnosis Challenge" dataset (ACDC), the largest publicly-available and fully-annotated dataset for the purpose of Cardiac MRI (CMR) assessment. The dataset contains data from 150 multi-equipments CMRI recordings with reference measurements and classification O. Bernard and F. Cervenansky are with the

translated by 谷歌翻译

Segmentation of Anatomical Layers and Artifacts in Intravascular Polarization Sensitive Optical Coherence Tomography Using Attending Physician and Boundary Cardinality Losses

Mohammad Haft-Javaherian , Martin Villiger , Kenichiro Otsuka , Joost Daemen , Peter Libby , Polina Golland , Brett E. Bouma

分类：计算机视觉

2021-05-11

血管内超声和光学相干断层扫描可广泛用于表征冠状动脉狭窄，并提供关键的血管参数以优化经皮干预。同时提供血管内极化敏感的光学相干断层扫描（PS-OCT），可提供血管结构的高分辨率横截面图像，同时还揭示了胶原蛋白和平滑肌等优惠的组织成分，从而增强了斑块表征。对这些特征的自动解释有望促进对冠状动脉瘤的自然历史和意义的客观临床研究。在这里，我们提出了一种使用新的多项损耗函数进行优化的卷积神经网络模型，除了导丝和斑块阴影外，还对管腔，内部和媒体层进行了分类。我们证明，我们的多类分类模型在检测冠状动脉解剖层方面优于最先进的方法。此外，所提出的模型将两类的常见成像伪像，并检测到增厚血管壁区域内的解剖层，这些层被其他研究排除在分析之外。源代码和受过训练的模型可在https://github.com/mhaft/octseg上公开获得

translated by 谷歌翻译

Automated cross-sectional view selection in CT angiography of aortic dissections with uncertainty awareness and retrospective clinical annotations

Antonio Pepe , Jan Egger , Marina Codari , Martin J. Willemink , Christina Gsaxner , Jianning Li , Peter M. Roth , Gabriel Mistelbauer , Dieter Schmalstieg , Dominik Fleischmann

分类：计算机视觉 | 机器学习

2021-11-22

目的：慢性主动脉疾病的监测成像，如解剖，依赖于在预定义主动脉地标随时间获得和比较预定义主动脉标志的横截面直径测量。由于缺乏鲁棒工具，横截面平面的方向由高训练的操作员手动定义。我们展示了如何有效地使用诊所中常规收集的手动注释来缓解该任务，尽管在测量中存在不可忽略的互操作器可变性。影响：通过利用不完美，回顾性的临床注释，可以缓解或自动化且重复的成像任务的弊端。方法论：在这项工作中，我们结合了卷积神经网络和不确定量化方法来预测这种横截面的取向。我们使用11个操作员随机处理的临床数据进行培训，并在3个独立运营商处理的较小集合上进行测试，以评估互通器变异性。结果：我们的分析表明，手动选择的横截面平面的特点是10.6 ^ \ CirC $ 10.6 ^ \ riC $和每角度为21.4美元的协议限额为95％我们的方法显示，静态误差减少3.57秒^ \ rIC $（$ 40.2 $％）和$ 4.11 ^ \ rIC $（$ 32.8 $％），而不是5.4 ^ \ rIC $（$ 49.0 $％）和16.0美元^ \ CIRC $（$ 74.6 $％）对手动处理。结论：这表明预先存在的注释可以是诊所的廉价资源，以便于易于提出和重复的任务，如横截面提取，以便监测主动脉夹层。

translated by 谷歌翻译

Roadmap on Signal Processing for Next Generation Measurement Systems

D. K. Iakovidis , M. Ooi , Y. C. Kuang , S. Damidenko , A. Shestakov , V. Sinistin , M. Henry , A. Sciacchitano , A. Discetti , S. Donati

分类：人工智能 | 计算机视觉

2021-11-03

信号处理是几乎任何传感器系统的基本组件，具有不同科学学科的广泛应用。时间序列数据，图像和视频序列包括可以增强和分析信息提取和量化的代表性形式的信号。人工智能和机器学习的最近进步正在转向智能，数据驱动，信号处理的研究。该路线图呈现了最先进的方法和应用程序的关键概述，旨在突出未来的挑战和对下一代测量系统的研究机会。它涵盖了广泛的主题，从基础到工业研究，以简明的主题部分组织，反映了每个研究领域的当前和未来发展的趋势和影响。此外，它为研究人员和资助机构提供了识别新前景的指导。

translated by 谷歌翻译

Knee arthritis severity measurement using deep learning: a publicly available algorithm with a multi-institutional validation showing radiologist-level performance

Hanxue Gu , Keyu Li , Roy J. Colglazier , Jichen Yang , Michael Lebhar , Jonathan O'Donnell , William A. Jiranek , Richard C. Mather , Rob J. French , Nicholas Said

分类：计算机视觉 | 机器学习

2022-03-16

膝关节X射线上的膝盖骨关节炎（KOA）的评估是使用总膝关节置换术的中心标准。但是，该评估遭受了不精确的标准，并且读取器间的可变性非常高。对KOA严重性的算法，自动评估可以通过提高其使用的适当性来改善膝盖替代程序的总体结果。我们提出了一种基于深度学习的新型五步算法，以自动从X光片后验（PA）视图对KOA进行评级：（1）图像预处理（2）使用Yolo V3-tiny模型，图像在图像中定位膝关节，（3）使用基于卷积神经网络的分类器对骨关节炎的严重程度进行初步评估，（4）关节分割和关节空间狭窄（JSN）的计算（JSN）和（5），JSN和最初的结合评估确定最终的凯尔格伦法律（KL）得分。此外，通过显示用于进行评估的分割面具，我们的算法与典型的“黑匣子”深度学习分类器相比表现出更高的透明度。我们使用我们机构的两个公共数据集和一个数据集进行了全面的评估，并表明我们的算法达到了最先进的性能。此外，我们还从机构中的多个放射科医生那里收集了评分，并表明我们的算法在放射科医生级别进行。该软件已在https://github.com/maciejmazurowowski/osteoarthitis-classification上公开提供。

translated by 谷歌翻译

Proceedings of the 3rd International Workshop on Reading Music Systems

Jorge Calvo-Zaragoza , Alexander Pacha

分类：计算机视觉 | 机器学习

2022-12-01

The International Workshop on Reading Music Systems (WoRMS) is a workshop that tries to connect researchers who develop systems for reading music, such as in the field of Optical Music Recognition, with other researchers and practitioners that could benefit from such systems, like librarians or musicologists. The relevant topics of interest for the workshop include, but are not limited to: Music reading systems; Optical music recognition; Datasets and performance evaluation; Image processing on music scores; Writer identification; Authoring, editing, storing and presentation systems for music scores; Multi-modal systems; Novel input-methods for music to produce written music; Web-based Music Information Retrieval services; Applications and projects; Use-cases related to written music. These are the proceedings of the 3rd International Workshop on Reading Music Systems, held in Alicante on the 23rd of July 2021.

translated by 谷歌翻译

A Review of Modern Approaches for Coronary Angiography Imaging Analysis

Maxim Popov , Temirgali Aimyshev , Eldar Ismailov , Ablay Bulegenov , Siamac Fazli

分类：计算机视觉

2022-09-28

冠心病（CHD）是现代世界中死亡的主要原因。用于诊断和治疗CHD的现代分析工具的开发正在从科学界受到极大的关注。基于深度学习的算法，例如分割网络和检测器，通过及时分析患者的血管造影来协助医疗专业人员，在协助医疗专业人员方面发挥着重要作用。本文着重于X射线冠状动脉造影（XCA），该血管造影被认为是CHD诊断和治疗中的“黄金标准”。首先，我们描述了XCA图像的公开可用数据集。然后，审查了图像预处理的经典和现代技术。此外，讨论了共同的框架选择技术，这是输入质量以及模型性能的重要因素。在以下两章中，我们讨论了现代血管分割和狭窄检测网络，最后是当前最新技术的开放问题和当前局限性。

translated by 谷歌翻译

Image-Guided Navigation of a Robotic Ultrasound Probe for Autonomous Spinal Sonography Using a Shadow-aware Dual-Agent Framework

Keyu Li , Yangxin Xu , Jian Wang , Dong Ni , Li Liu , Max Q. -H. Meng

分类：机器人 | 人工智能

2021-11-03

超声（US）成像通常用于协助诊断和脊柱疾病的干预，而通过手动操作探针进行标准化美国收购需要大量的经验和超声检查的培训。在这项工作中，我们提出了一种新的双代理框架，集成了强化学习（RL）代理和深度学习（DL）代理，以共同确定基于实时超声图像美国探测器的移动，以模拟专家超声检查操作者的决策过程，以实现脊柱超声自主标准视图收购。此外，通过美国传播的性质和脊柱解剖的特性的启发，我们引入一个视图特定的声影奖励利用阴影信息来隐式地引导朝向脊柱的不同标准视图探针的导航。我们的方法在从$ $ 17名志愿者获得的美国经济数据建立了一个模拟环境的定量和定性实验验证。平均导航精度朝向不同的标准视图达到$5.18毫米/ 5.25 ^ \ CIRC $ $和12.87毫米/ 17.49 ^ \ CIRC $在分子内和主体间设置，分别。结果表明，我们的方法可以有效地解释美国的图像和导航探头获取脊柱多种标准的意见。

translated by 谷歌翻译

Robust deep learning-based semantic organ segmentation in hyperspectral images

Silvia Seidlitz , Jan Sellner , Jan Odenthal , Berkin Özdemir , Alexander Studier-Fischer , Samuel Knödler , Leonardo Ayala , Tim Adler , Hannes G. Kenngott , Minu Tizabi

分类：计算机视觉 | 机器学习

2021-11-09

语义图像分割是手术中的背景知识和自治机器人的重要前提。本领域的状态专注于在微创手术期间获得的传统RGB视频数据，但基于光谱成像数据的全景语义分割并在开放手术期间获得几乎没有注意到日期。为了解决文献中的这种差距，我们正在研究基于在开放手术环境中获得的猪的高光谱成像（HSI）数据的以下研究问题：（1）基于神经网络的HSI数据的充分表示是完全自动化的器官分割，尤其是关于数据的空间粒度（像素与Superpixels与Patches与完整图像）的空间粒度？（2）在执行语义器官分割时，是否有利用HSI数据使用HSI数据，即RGB数据和处理的HSI数据（例如氧合等组织参数）？根据基于20猪的506个HSI图像的全面验证研究，共注释了19个类，基于深度的学习的分割性能 - 贯穿模态 - 与输入数据的空间上下文一致。未处理的HSI数据提供优于RGB数据或来自摄像机提供商的处理数据，其中优势随着输入到神经网络的输入的尺寸而增加。最大性能（应用于整个图像的HSI）产生了0.89（标准偏差（SD）0.04）的平均骰子相似度系数（DSC），其在帧间间变异性（DSC为0.89（SD 0.07）的范围内。我们得出结论，HSI可以成为全自动手术场景理解的强大的图像模型，其具有传统成像的许多优点，包括恢复额外功能组织信息的能力。

translated by 谷歌翻译

Placenta Segmentation in Ultrasound Imaging: Addressing Sources of Uncertainty and Limited Field-of-View

Veronika A. Zimmer , Alberto Gomez , Emily Skelton , Robert Wright , Gavin Wheeler , Shujie Deng , Nooshin Ghavami , Karen Lloyd , Jacqueline Matthew , Bernhard Kainz

分类：计算机视觉

2022-06-29

胎儿超声（US）中胎盘的自动分割由于（i）（i）胎盘外观的高度多样性而具有挑战性我们禁止在妊娠晚期进行整个胎盘评估的观点。在这项工作中，我们通过多任务学习方法解决了这三个挑战，该方法结合了单个卷积神经网络中胎盘位置（例如，前，后部）和语义胎盘分段的分类。通过分类任务，模型可以从更大，更多样化的数据集中学习，同时在有限的训练集条件下提高分割任务的准确性。通过这种方法，我们研究了多个评估者的注释的变异性，并表明我们的自动分割（前胎盘的骰子为0.86，后胎盘的骰子为0.83），与观察者内和观察者间的变异性相比，我们的自动段性能达到了人级的性能。最后，我们的方法可以使用由三个阶段组成的多视图US采集管道提供整个胎盘分割：多探针图像采集，图像融合和图像分段。这会导致对较大结构（例如胎盘中的胎盘）的高质量分割，其图像伪像降低，这超出了单个探针的视野。

translated by 谷歌翻译

Deep Learning based Automatic Quantification of Urethral Plate Quality using the Plate Objective Scoring Tool (POST)

Tariq O. Abbas , Mohamed AbdelMoniem , Ibrahim Khalil , Md Sakib Abrar Hossain , Muhammad E. H. Chowdhury

分类：计算机视觉 | 人工智能

2022-09-28

目标：探索深度学习算法进一步简化和优化尿道板（UP）质量评估的能力，使用板客观评分工具（POST），旨在提高Hypospadias修复中提高评估的客观性和可重复性。方法：五个关键的邮政地标是由专家在691图像数据集中的专家标记，该数据集接受了原发性杂质修复的青春期前男孩。然后，该数据集用于开发和验证基于深度学习的地标检测模型。提出的框架始于瞥见和检测，其中输入图像是使用预测的边界框裁剪的。接下来，使用深层卷积神经网络（CNN）体系结构来预测五个邮政标记的坐标。然后，这些预测的地标用于评估远端催化性远端的质量。结果：所提出的模型准确地定位了gan区域，平均平均精度（地图）为99.5％，总体灵敏度为99.1％。在预测地标的坐标时，达到了0.07152的归一化平均误差（NME），平均平方误差（MSE）为0.001，在0.1 nme的阈值下为20.2％的故障率。结论：此深度学习应用程序在使用邮政评估质量时表现出鲁棒性和高精度。使用国际多中心基于图像的数据库进行进一步评估。外部验证可以使深度学习算法受益，并导致更好的评估，决策和对手术结果的预测。

translated by 谷歌翻译

Towards deep observation: A systematic survey on artificial intelligence techniques to monitor fetus via Ultrasound Images

Mahmood Alzubaidi , Marco Agus , Khalid Alyafei , Khaled A Althelaya , Uzair Shah , Alaa Abd-Alrazaq , Mohammed Anbar , Michel Makhlouf , Mowafa Househ

分类：机器学习 | 计算机视觉

2022-01-17

开发旨在增强胎儿监测的创新信息学方法是生殖医学研究的新领域。已经对人工智能（AI）技术进行了几项评论，以改善妊娠结局。他们的限制是专注于特定数据，例如怀孕期间母亲的护理。这项系统的调查旨在探讨人工智能（AI）如何通过超声（US）图像帮助胎儿生长监测。我们使用了八个医学和计算机科学书目数据库，包括PubMed，Embase，Psycinfo，ScienceDirect，IEEE Explore，ACM图书馆，Google Scholar和Web of Science。我们检索了2010年至2021年之间发表的研究。从研究中提取的数据是使用叙述方法合成的。在1269项检索研究中，我们包括了107项与调查中有关该主题的查询的不同研究。我们发现，与3D和4D超声图像（n = 19）相比，2D超声图像更受欢迎（n = 88）。分类是最常用的方法（n = 42），其次是分割（n = 31），与分割（n = 16）集成的分类和其他其他杂项，例如对象检测，回归和增强学习（n = 18）。妊娠结构域中最常见的区域是胎儿头（n = 43），然后是胎儿（n = 31），胎儿心脏（n = 13），胎儿腹部（n = 10），最后是胎儿的面孔（n = 10）。在最近的研究中，深度学习技术主要使用（n = 81），其次是机器学习（n = 16），人工神经网络（n = 7）和增强学习（n = 2）。 AI技术在预测胎儿疾病和鉴定怀孕期间胎儿解剖结构中起着至关重要的作用。需要进行更多的研究来从医生的角度验证这项技术，例如试点研究和有关AI及其在医院环境中的应用的随机对照试验。

translated by 谷歌翻译

Applications of Deep Learning in Fish Habitat Monitoring: A Tutorial and Survey

Alzayat Saleh , Marcus Sheaves , Dean Jerry , Mostafa Rahimi Azghadi

分类：计算机视觉

2022-06-11

海洋生态系统及其鱼类栖息地越来越重要，因为它们在提供有价值的食物来源和保护效果方面的重要作用。由于它们的偏僻且难以接近自然，因此通常使用水下摄像头对海洋环境和鱼类栖息地进行监测。这些相机产生了大量数字数据，这些数据无法通过当前的手动处理方法有效地分析，这些方法涉及人类观察者。 DL是一种尖端的AI技术，在分析视觉数据时表现出了前所未有的性能。尽管它应用于无数领域，但仍在探索其在水下鱼类栖息地监测中的使用。在本文中，我们提供了一个涵盖DL的关键概念的教程，该教程可帮助读者了解对DL的工作原理的高级理解。该教程还解释了一个逐步的程序，讲述了如何为诸如水下鱼类监测等挑战性应用开发DL算法。此外，我们还提供了针对鱼类栖息地监测的关键深度学习技术的全面调查，包括分类，计数，定位和细分。此外，我们对水下鱼类数据集进行了公开调查，并比较水下鱼类监测域中的各种DL技术。我们还讨论了鱼类栖息地加工深度学习的新兴领域的一些挑战和机遇。本文是为了作为希望掌握对DL的高级了解，通过遵循我们的分步教程而为其应用开发的海洋科学家的教程，并了解如何发展其研究，以促进他们的研究。努力。同时，它适用于希望调查基于DL的最先进方法的计算机科学家，以进行鱼类栖息地监测。

translated by 谷歌翻译

Image quality assessment: from error visibility to structural similarity

分类：

Objective methods for assessing perceptual image quality have traditionally attempted to quantify the visibility of errors between a distorted image and a reference image using a variety of known properties of the human visual system. Under the assumption that human visual perception is highly adapted for extracting structural information from a scene, we introduce an alternative framework for quality assessment based on the degradation of structural information. As a specific example of this concept, we develop a Structural Similarity Index and demonstrate its promise through a set of intuitive examples, as well as comparison to both subjective ratings and state-of-the-art objective methods on a database of images compressed with JPEG and JPEG2000. 1

translated by 谷歌翻译

Artifact- and content-specific quality assessment for MRI with image rulers

Ke Lei , John M. Pauly , Shreyas S. Vasanawala

分类：人工智能 | 计算机视觉

2021-11-06

在临床实践中，MR图像通常首先在扫描后长期看到辐射药剂。如果图像质量不充分，则患者必须返回额外的扫描，或者呈现次优解释。自动图像质量评估（IQA）将实现实时修复。对于MRI的现有IQA工作仅提供一般的质量得分，不可知论是对低质量扫描的原因和解决方案。此外，放射科医师的图像质量要求随扫描类型和诊断任务而异。因此，相同的分数可能对不同的扫描具有不同的影响。我们提出了一个训练训练的多任务CNN模型的框架，并用校准标签推断出来。由人类投入校准的标签遵循明确明确和高效的标签任务。图像统治者解决了不同的质量标准，并提供了一种从CNN中解释原始分数的具体方法。该模型支持对MRI中两个最常见的工件的评估：噪音和运动。它达到了约90％的准确度，比以前的最佳方法更好地达到6％，比噪声评估的人类专家更好3％。我们的实验表明，标签校准，图像统治者和多任务培训提高了模型的性能和概括性。

translated by 谷歌翻译

Echocardiography Segmentation with Enforced Temporal Consistency

Nathan Painchaud , Nicolas Duchateau , Olivier Bernard , Pierre-Marc Jodoin

分类：计算机视觉 | 机器学习

2021-12-03

卷积神经网络（CNN）已经证明了它们对2D心脏超声图像进行分割的能力。然而，尽管近期取得了成功的成功，但是已经达到了端舒张和终结图像的观测器内变异性，CNNS仍然难以利用时间信息来在整个周期中提供准确和时间一致的分割图。需要这种持续性来准确描述心功能，这是诊断许多心血管疾病的必要步骤。在本文中，我们提出了一种学习2D +时间长轴心形形状的框架，使得分段序列可以受益于时间和解剖的一致性约束。我们的方法是一种后处理，其作为输入分段的超声心动图序列，其由任何最先进的方法产生，并以两个步骤来处理（i）根据心脏序列的整体动态识别时空不一致。（ii）纠正不一致。心脏不一致的识别和纠正依赖于受约束的AutoEncoder培训，以学习生理学上可解释的心形状嵌入，在那里我们都可以检测和修复异常。我们在98个来自Camus DataSet的全循环序列上测试了我们的框架，这将与本文一起播放。我们的时间正则化方法不仅可以提高整个序列的分割的准确性，而且还强制执行时间和解剖常量。

translated by 谷歌翻译

KonX: Cross-Resolution Image Quality Assessment

Oliver Wiedemann , Vlad Hosu , Shaolin Su , Dietmar Saupe

分类：计算机视觉

2022-12-12

Scale-invariance is an open problem in many computer vision subfields. For example, object labels should remain constant across scales, yet model predictions diverge in many cases. This problem gets harder for tasks where the ground-truth labels change with the presentation scale. In image quality assessment (IQA), downsampling attenuates impairments, e.g., blurs or compression artifacts, which can positively affect the impression evoked in subjective studies. To accurately predict perceptual image quality, cross-resolution IQA methods must therefore account for resolution-dependent errors induced by model inadequacies as well as for the perceptual label shifts in the ground truth. We present the first study of its kind that disentangles and examines the two issues separately via KonX, a novel, carefully crafted cross-resolution IQA database. This paper contributes the following: 1. Through KonX, we provide empirical evidence of label shifts caused by changes in the presentation resolution. 2. We show that objective IQA methods have a scale bias, which reduces their predictive performance. 3. We propose a multi-scale and multi-column DNN architecture that improves performance over previous state-of-the-art IQA models for this task, including recent transformers. We thus both raise and address a novel research problem in image quality assessment.

translated by 谷歌翻译