智能论文笔记

Learning A 3D-CNN and Transformer Prior for Hyperspectral Image Super-Resolution

Qing Ma , Junjun Jiang , Xianming Liu , Jiayi Ma

分类：计算机视觉

2021-11-27

为了解决高光谱图像超分辨率（HSISR）的不良问题，通常方法是使用高光谱图像（HSIS）的先前信息作为正则化术语来限制目标函数。使用手工制作前沿的基于模型的方法无法完全表征HSI的性质。基于学习的方法通常使用卷积神经网络（CNN）来学习HSI的隐式前导者。然而，CNN的学习能力是有限的，它仅考虑HSI的空间特性并忽略光谱特性，并且卷积对远程依赖性建模无效。还有很多改进的空间。在本文中，我们提出了一种新颖的HSISR方法，该方法使用变压器而不是CNN来学习HSI之前。具体地，我们首先使用近端梯度算法来解决HSISR模型，然后使用展开网络来模拟迭代解决方案过程。变压器的自我注意层使其具有空间全局互动的能力。此外，我们在变压器层后面添加3D-CNN，以更好地探索HSIS的时空相关性。两个广泛使用的HSI数据集和实际数据集的定量和视觉结果证明，与所有主流算法相比，所提出的方法实现了相当大的增益，包括最竞争力的传统方法和最近提出的基于深度学习的方法。

translated by 谷歌翻译

Feedback Refined Local-Global Network for Super-Resolution of Hyperspectral Imagery

Zhenjie Tang , Qing Xu , Zhenwei Shi , Bin Pan

分类：计算机视觉

2021-03-07

随着深度学习技术的发展，基于卷积神经网络的多光谱图像超分辨率方法最近取得了很大的进展。然而，由于高光谱数据的高维和复谱特性，单个高光谱图像超分辨率仍然是一个具有挑战性的问题，这使得难以同时捕获空间和光谱信息。要处理此问题，我们提出了一种新的反馈精确的本地 - 全球网络（FRLGN），用于超光谱图像的超级分辨率。具体而言，我们开发新的反馈结构和本地全局频谱块，以减轻空间和光谱特征提取的难度。反馈结构可以传输高电平信息以指导低级特征的生成过程，其通过具有有限展开的经常性结构实现。此外，为了有效地使用所传回的高电平信息，构造局部全局频谱块以处理反馈连接。本地 - 全局频谱块利用反馈高级信息来校正来自局部光谱频带的低级功能，并在全局光谱频带之间产生强大的高级表示。通过结合反馈结构和局部全局光谱块，FRLGN可以充分利用光谱带之间的空间光谱相关性，并逐渐重建高分辨率高光谱图像。 FRLGN的源代码在https://github.com/tangzhenjie/frlgn上获得。

translated by 谷歌翻译

Deep Posterior Distribution-based Embedding for Hyperspectral Image Super-resolution

Jinhui Hou , Zhiyu Zhu , Junhui Hou , Huanqiang Zeng , Jinjian Wu , Jiantao Zhou

分类：计算机视觉

2022-05-30

在本文中，我们通过深度学习研究了高光谱（HS）图像空间超分辨率的问题。特别是，我们专注于如何有效有效地嵌入HS图像的高维空间光谱信息。具体而言，与采用经验设计的网络模块的现有方法相反，我们将HS嵌入为一组精心定义的HS嵌入事件的后验分布的近似聚合。然后，我们将所提出的特征嵌入方案纳入源符合的超级分辨率框架中，该框架具有物理性开采，从而产生了轻质的PDE-NET，其中高分辨率（HR）HS图像是从输入低 - 低 - 之间的残差迭代完善的。分辨率（LR）HS图像和伪LR-HS图像通过概率启发的HS嵌入从重建的HR-HS图像中退化。在三个常见基准数据集上进行的广泛实验表明，PDE-NET比最先进的方法实现了卓越的性能。此外，这种网络的概率特征可以提供网络输出的认知不确定性，当用于其他基于HS图像的应用程序时，这可能会带来其他好处。该代码将在https://github.com/jinnh/pde-net上公开获得。

translated by 谷歌翻译

A survey on computational spectral reconstruction methods from RGB to hyperspectral imaging

Jingang Zhang , Runmu Su , Wenqi Ren , Qiang Fu , Felix Heide , Yunfeng Nie

分类：计算机视觉

2021-06-30

高光谱成像由于其在捕获丰富的空间和光谱信息的能力上提供了多功能应用，这对于识别物质至关重要。但是，获取高光谱图像的设备昂贵且复杂。因此，已经通过直接从低成本，更多可用的RGB图像重建高光谱信息来提出了许多替代光谱成像方法。我们详细研究了来自广泛的RGB图像的这些最先进的光谱重建方法。对25种方法的系统研究和比较表明，尽管速度较低，但大多数数据驱动的深度学习方法在重建精度和质量方面都优于先前的方法。这项全面的审查可以成为同伴研究人员的富有成果的参考来源，从而进一步启发了相关领域的未来发展方向。

translated by 谷歌翻译

KXNet: A Model-Driven Deep Neural Network for Blind Super-Resolution

Jiahong Fu , Hong Wang , Qi Xie , Qian Zhao , Deyu Meng , Zongben Xu

分类：计算机视觉

2022-09-21

尽管目前基于深度学习的方法在盲目的单图像超分辨率（SISR）任务中已获得了有希望的表现，但其中大多数主要集中在启发式上构建多样化的网络体系结构，并更少强调对Blur之间的物理发电机制的明确嵌入内核和高分辨率（HR）图像。为了减轻这个问题，我们提出了一个模型驱动的深神经网络，称为blind SISR。具体而言，为了解决经典的SISR模型，我们提出了一种简单的效果迭代算法。然后，通过将所涉及的迭代步骤展开到相应的网络模块中，我们自然构建了KXNET。所提出的KXNET的主要特异性是整个学习过程与此SISR任务的固有物理机制完全合理地集成在一起。因此，学习的模糊内核具有清晰的物理模式，并且模糊内核和HR图像之间的相互迭代过程可以很好地指导KXNET沿正确的方向发展。关于合成和真实数据的广泛实验很好地证明了我们方法的卓越准确性和一般性超出了当前代表性的最先进的盲目SISR方法。代码可在：\ url {https://github.com/jiahong-fu/kxnet}中获得。

translated by 谷歌翻译

Snapshot Spectral Compressive Imaging Reconstruction Using Convolution and Contextual Transformer

Lishun Wang , Zongliang Wu , Yong Zhong , Xin Yuan

分类：计算机视觉

2022-01-15

光谱压缩成像（SCI）能够将高维高光谱图像编码为2D测量，然后使用算法来重建时空光谱数据处。目前，SCI的主要瓶颈是重建算法，最新的（SOTA）重建方法通常面临长期重建时间和/或细节恢复不良的问题。在本文中，我们提出了一个新型的混合网络模块，即CCOT（卷积和上下文变压器）块，该模块可以同时获得卷积的感应偏见和强大的变压器建模能力，并有助于提高重建质量以提高重建质量还原细节。我们将提出的CCOT块集成到基于广义交替投影算法的深层展开框架中，并进一步提出GAP-CCOT网络。通过大量合成和真实数据的实验，我们提出的模型可实现更高的重建质量（$> $> $> $> $ 2db的PSNR在模拟基准数据集中）和比现有SOTA算法更短的运行时间。代码和模型可在https://github.com/ucaswangls/gap-ccot上公开获得。

translated by 谷歌翻译

Implicit Neural Representation Learning for Hyperspectral Image Super-Resolution

Kaiwei Zhang

分类：计算机视觉

2021-12-20

高光谱图像（HSI）没有额外辅助图像的超分辨率仍然是由于其高维光谱图案的恒定挑战，其中学习有效的空间和光谱表示是基本问题。最近，隐式的神经表示（INR）正在进行进步，作为新颖且有效的代表，特别是在重建任务中。因此，在这项工作中，我们提出了一种基于INR的新颖的HSI重建模型，其通过将空间坐标映射到其对应的光谱辐射值值的连续函数来表示HSI。特别地，作为INR的特定实现，参数模型的参数是通过使用卷积网络在特征提取的超通知来预测的。它使连续功能以内容感知方式将空间坐标映射到像素值。此外，周期性空间编码与重建过程深度集成，这使得我们的模型能够恢复更高的频率细节。为了验证我们模型的功效，我们在三个HSI数据集（洞穴，NUS和NTIRE2018）上进行实验。实验结果表明，与最先进的方法相比，该建议的模型可以实现竞争重建性能。此外，我们提供了对我们模型各个组件的效果的消融研究。我们希望本文可以服务器作为未来研究的效率参考。

translated by 谷歌翻译

Deep Plug-and-Play Prior for Hyperspectral Image Restoration

Zeqiang Lai , Kaixuan Wei , Ying Fu

分类：计算机视觉 | 机器学习

2022-09-17

基于深度学习的高光谱图像（HSI）恢复方法因其出色的性能而广受欢迎，但每当任务更改的细节时，通常都需要昂贵的网络再培训。在本文中，我们建议使用有效的插入方法以统一的方法恢复HSI，该方法可以共同保留基于优化方法的灵活性，并利用深神经网络的强大表示能力。具体而言，我们首先开发了一个新的深HSI DeNoiser，利用了门控复发单元，短期和长期的跳过连接以及增强的噪声水平图，以更好地利用HSIS内丰富的空间光谱信息。因此，这导致在高斯和复杂的噪声设置下，在HSI DeNosing上的最新性能。然后，在处理各种HSI恢复任务之前，将提议的DeNoiser插入即插即用的框架中。通过对HSI超分辨率，压缩感测和内部进行的广泛实验，我们证明了我们的方法经常实现卓越的性能，这与每个任务上的最先进的竞争性或甚至更好任何特定任务的培训。

translated by 谷歌翻译

Robust Hyperspectral Image Fusion with Simultaneous Guide Image Denoising via Constrained Convex Optimization

Saori Takeyama , Shunsuke Ono

分类：计算机视觉

2022-09-24

本文提出了一种基于凸优化的新型高空间分辨率高光谱（HR-HS）图像估计方法。该方法假定空间分辨率HS（LR-HS）图像和指南图像作为观测值，其中两个观察结果都被噪声污染。我们的方法同时估算了HR-HS图像和无噪声指南图像，因此该方法即使被大噪声污染了指南图像中的空间信息也可以利用空间信息。提出的估计问题通过正则化采用混合空间 - 光谱总变化，并评估HR-HS和指南图像之间的边缘相似性，以有效地在指南图像中对HR-HS图像和空间细节信息有效地使用APRIORI知识。为了有效地解决该问题，我们采用了一种原始的二重分裂方法。实验证明了我们的方法的性能以及对几种现有方法的优势。

translated by 谷歌翻译

DnSwin: Toward Real-World Denoising via Continuous Wavelet Sliding-Transformer

Hao Li , Zhijing Yang , Xiaobin Hong , Ziying Zhao , Junyang Chen , Yukai Shi , Jinshan Pan

分类：计算机视觉

2022-07-28

现实世界图像Denoising是一个实用的图像恢复问题，旨在从野外嘈杂的输入中获取干净的图像。最近，Vision Transformer（VIT）表现出强大的捕获远程依赖性的能力，许多研究人员试图将VIT应用于图像DeNosing任务。但是，现实世界的图像是一个孤立的框架，它使VIT构建了内部贴片的远程依赖性，该依赖性将图像分为贴片并混乱噪声模式和梯度连续性。在本文中，我们建议通过使用连续的小波滑动转换器来解决此问题，该小波滑动转换器在现实世界中构建频率对应关系，称为dnswin。具体而言，我们首先使用CNN编码器从嘈杂的输入图像中提取底部功能。 DNSWIN的关键是将高频和低频信息与功能和构建频率依赖性分开。为此，我们提出了小波滑动窗口变压器，该变压器利用离散的小波变换，自我注意力和逆离散小波变换来提取深度特征。最后，我们使用CNN解码器将深度特征重建为DeNo的图像。对现实世界的基准测试的定量和定性评估都表明，拟议的DNSWIN对最新方法的表现良好。

translated by 谷歌翻译

CSformer: Bridging Convolution and Transformer for Compressive Sensing

Dongjie Ye , Zhangkai Ni , Hanli Wang , Jian Zhang , Shiqi Wang , Sam Kwong

分类：计算机视觉

2021-12-31

卷积神经网络（CNNS）成功地进行了压缩图像感测。然而，由于局部性和重量共享的归纳偏差，卷积操作证明了建模远程依赖性的内在限制。变压器，最初作为序列到序列模型设计，在捕获由于基于自我关注的架构而捕获的全局背景中，即使它可以配备有限的本地化能力。本文提出了一种混合框架，一个混合框架，其集成了从CNN提供的借用的优点以及变压器提供的全局上下文，以获得增强的表示学习。所提出的方法是由自适应采样和恢复组成的端到端压缩图像感测方法。在采样模块中，通过学习的采样矩阵测量图像逐块。在重建阶段，将测量投射到双杆中。一个是用于通过卷积建模邻域关系的CNN杆，另一个是用于采用全球自我关注机制的变压器杆。双分支结构是并发，并且本地特征和全局表示在不同的分辨率下融合，以最大化功能的互补性。此外，我们探索一个渐进的战略和基于窗口的变压器块，以降低参数和计算复杂性。实验结果表明了基于专用变压器的架构进行压缩感测的有效性，与不同数据集的最先进方法相比，实现了卓越的性能。

translated by 谷歌翻译

HST: Hierarchical Swin Transformer for Compressed Image Super-resolution

Bingchen Li , Xin Li , Yiting Lu , Sen Liu , Ruoyu Feng , Zhibo Chen

分类：计算机视觉

2022-08-21

近年来，压缩图像超分辨率已引起了极大的关注，其中图像被压缩伪像和低分辨率伪影降解。由于复杂的杂化扭曲变形，因此很难通过简单的超分辨率和压缩伪像消除掉的简单合作来恢复扭曲的图像。在本文中，我们向前迈出了一步，提出了层次的SWIN变压器（HST）网络，以恢复低分辨率压缩图像，该图像共同捕获分层特征表示并分别用SWIN Transformer增强每个尺度表示。此外，我们发现具有超分辨率（SR）任务的预处理对于压缩图像超分辨率至关重要。为了探索不同的SR预审查的影响，我们将常用的SR任务（例如，比科比奇和不同的实际超分辨率仿真）作为我们的预处理任务，并揭示了SR在压缩的图像超分辨率中起不可替代的作用。随着HST和预训练的合作，我们的HST在AIM 2022挑战中获得了低质量压缩图像超分辨率轨道的第五名，PSNR为23.51db。广泛的实验和消融研究已经验证了我们提出的方法的有效性。

translated by 谷歌翻译

Model-Guided Multi-Contrast Deep Unfolding Network for MRI Super-resolution Reconstruction

Gang Yang , Li Zhang , Man Zhou , Aiping Liu , Xun Chen , Zhiwei Xiong , Feng Wu

分类：计算机视觉

2022-09-15

具有高分辨率（HR）的磁共振成像（MRI）提供了更详细的信息，以进行准确的诊断和定量图像分析。尽管取得了重大进展，但大多数现有的医学图像重建网络都有两个缺陷：1）所有这些缺陷都是在黑盒原理中设计的，因此缺乏足够的解释性并进一步限制其实际应用。可解释的神经网络模型引起了重大兴趣，因为它们在处理医学图像时增强了临床实践所需的可信赖性。 2）大多数现有的SR重建方法仅使用单个对比度或使用简单的多对比度融合机制，从而忽略了对SR改进至关重要的不同对比度之间的复杂关系。为了解决这些问题，在本文中，提出了一种新颖的模型引导的可解释的深层展开网络（MGDUN），用于医学图像SR重建。模型引导的图像SR重建方法求解手动设计的目标函数以重建HR MRI。我们通过将MRI观察矩阵和显式多对比度关系矩阵考虑到末端到端优化期间，将迭代的MGDUN算法展示为新型模型引导的深层展开网络。多对比度IXI数据集和Brats 2019数据集进行了广泛的实验，证明了我们提出的模型的优势。

translated by 谷歌翻译

HPRN: Holistic Prior-embedded Relation Network for Spectral Super-Resolution

Chaoxiong Wu , Jiaojiao Li , Rui Song , Yunsong Li , Qian Du

分类：人工智能 | 计算机视觉

2021-12-29

光谱超分辨率（SSR）是指从RGB对应物中恢复的高光谱图像（HSI）。由于SSR问题的一对多性，可以将单个RGB图像恢复到许多HSIS。解决这个暗示问题的关键是插入多源以前的信息，如自然RGB空间上下文的上下文，深度特征或固有的HSI统计事先等，以提高重建的置信度和保真度光谱。然而，大多数目前的方法只考虑设计定制的卷积神经网络（CNN）的一般和有限的前瞻，这导致无法有效地减轻不良程度。为解决有问题的问题，我们为SSR提出了一个新颖的全面的先前嵌入关系网络（HPRN）。基本上，核心框架由几个多剩余关系块（MRB）进行多种组装，其完全便于RGB信号之前的低频内容的传输和利用。创新性地，引入了RGB输入的语义之前，以识别类别属性，并且向前提出了语义驱动的空间关系模块（SSRM）以使用语义嵌入关系矩阵在聚类的类似特征之间执行特征聚合。此外，我们开发了一种基于变换器的通道关系模块（TCRM），其习惯使用标量作为先前深度特征中的频道方面关系的描述符，并用某些向量替换为变换器特征交互，支持表示更加歧视。为了保持高光谱频带之间的数学相关和光谱一致性，将二阶的先前约束（SOPC）结合到丢失功能中以引导HSI重建过程。

translated by 谷歌翻译

LDP-Net: An Unsupervised Pansharpening Network Based on Learnable Degradation Processes

Jiahui Ni , Zhimin Shao , Zhongzhou Zhang , Mingzheng Hou , Jiliu Zhou , Leyuan Fang , Yi Zhang

分类：计算机视觉

2021-11-24

遥感图像中的Pansharpening旨在通过融合具有平面（PAN）图像的低分辨率多光谱（LRMS）图像直接获取高分辨率多光谱（HRMS）图像。主要问题是如何将LRMS图像的丰富光谱信息与PAN图像的丰富空间信息有效地结合。最近，已经提出了基于深度学习的许多方法，以便泛歌舞团的任务。然而，这些方法通常具有两个主要缺点：1）需要HRMS进行监督学习; 2）简单地忽略了MS和PAN图像之间的潜在关系并直接融合它们。为了解决这些问题，我们提出了一种基于学习劣化过程的新型无监督网络，称为LDP-Net。设计用于分别用于学习相应的降级过程的重新阻挡块和灰色块。另外，提出了一种新的混合损失函数，以在不同分辨率下限制泛散形图像和平底锅和平移和LRMS图像之间的空间和光谱一致性。 WorldView2和WorldView3图像上的实验表明，我们所提出的LDP-Net可以在没有HRMS样本的帮助下有效地融合平移和LRMS图像，从而在定性视觉效果和定量度量方面实现了有希望的性能。

translated by 谷歌翻译

Hyperspectral Image Super-Resolution in Arbitrary Input-Output Band Settings

Zhongyang Zhang , Zhiyang Xu , Zia Ahmed , Asif Salekin , Tauhidur Rahman

分类：计算机视觉

2021-03-19

具有窄光谱带的高光谱图像（HSI）可以捕获丰富的光谱信息，但它在该过程中牺牲其空间分辨率。最近提出了许多基于机器学习的HSI超分辨率（SR）算法。然而，这些方法的基本限制之一是它们高度依赖于图像和相机设置，并且只能学会用另一个特定设置用一个特定的设置映射输入的HSI。然而，由于HSI相机的多样性，不同的相机捕获具有不同光谱响应函数和频带编号的图像。因此，现有的基于机器学习的方法无法学习用于各种输入输出频带设置的超声波HSIS。我们提出了一种基于元学习的超分辨率（MLSR）模型，其可以在任意数量的输入频带'峰值波长下采用HSI图像，并产生具有任意数量的输出频带'峰值波长的SR HSIS。我们利用NTIRE2020和ICVL数据集训练并验证MLSR模型的性能。结果表明，单个提出的模型可以在任意输入 - 输出频带设置下成功生成超分辨的HSI频段。结果更好或至少与在特定输入输出频带设置上单独培训的基线相当。

translated by 谷歌翻译

Swin2SR: SwinV2 Transformer for Compressed Image Super-Resolution and Restoration

Marcos V. Conde , Ui-Jin Choi , Maxime Burchi , Radu Timofte

分类：计算机视觉

2022-09-22

压缩在通过限制系统（例如流媒体服务，虚拟现实或视频游戏）等系统的有效传输和存储图像和视频中起着重要作用。但是，不可避免地会导致伪影和原始信息的丢失，这可能会严重降低视觉质量。由于这些原因，压缩图像的质量增强已成为流行的研究主题。尽管大多数最先进的图像恢复方法基于卷积神经网络，但基于Swinir等其他基于变压器的方法在这些任务上表现出令人印象深刻的性能。在本文中，我们探索了新型的Swin Transformer V2，以改善图像超分辨率的Swinir，尤其是压缩输入方案。使用这种方法，我们可以解决训练变压器视觉模型中的主要问题，例如训练不稳定性，预训练和微调之间的分辨率差距以及数据饥饿。我们对三个代表性任务进行实验：JPEG压缩伪像去除，图像超分辨率（经典和轻巧）以及压缩的图像超分辨率。实验结果表明，我们的方法SWIN2SR可以改善SWINIR的训练收敛性和性能，并且是“ AIM 2022挑战压缩图像和视频的超分辨率”的前5个解决方案。

translated by 谷歌翻译

SMDS-Net: Model Guided Spectral-Spatial Network for Hyperspectral Image Denoising

Fengchao Xiong , Shuyin Tao , Jun Zhou , Jianfeng Lu , Jiantao Zhou , Yuntao Qian

分类：计算机视觉

2020-12-03

基于深度学习（DL）的高光谱图像（HSIS）去噪方法直接学习观察到的嘈杂图像和底层清洁图像之间的非线性映射。他们通常不考虑HSIS的物理特征，因此使他们缺乏了解他们的去噪机制的关键。为了解决这个问题，我们为HSI去噪提出了一种新颖的模型指导可解释网络。具体而言，完全考虑HSI的空间冗余，光谱低秩和光谱空间特性，我们首先建立基于子空间的多维稀疏模型。该模型首先将观察到的HSIS投入到低维正交子空间，然后表示具有多维字典的投影图像。之后，该模型展开到名为SMDS-Net的端到端网络中，其基本模块与模型的去噪程序无缝连接。这使得SMDS-Net传达清晰的物理意义，即学习HSIS的低级别和稀疏性。最后，通过端到端培训获得包括词典和阈值处理的所有关键变量。广泛的实验和综合分析证实了我们对最先进的HSI去噪方法的方法的去噪能力和可解释性。

translated by 谷歌翻译

A Survey of Deep Face Restoration: Denoise, Super-Resolution, Deblur, Artifact Removal

Tao Wang , Kaihao Zhang , Xuanxi Chen , Wenhan Luo , Jiankang Deng , Tong Lu , Xiaochun Cao , Wei Liu , Hongdong Li , Stefanos Zafeiriou

分类：计算机视觉

2022-11-05

Face Restoration (FR) aims to restore High-Quality (HQ) faces from Low-Quality (LQ) input images, which is a domain-specific image restoration problem in the low-level computer vision area. The early face restoration methods mainly use statistic priors and degradation models, which are difficult to meet the requirements of real-world applications in practice. In recent years, face restoration has witnessed great progress after stepping into the deep learning era. However, there are few works to study deep learning-based face restoration methods systematically. Thus, this paper comprehensively surveys recent advances in deep learning techniques for face restoration. Specifically, we first summarize different problem formulations and analyze the characteristic of the face image. Second, we discuss the challenges of face restoration. Concerning these challenges, we present a comprehensive review of existing FR methods, including prior based methods and deep learning-based methods. Then, we explore developed techniques in the task of FR covering network architectures, loss functions, and benchmark datasets. We also conduct a systematic benchmark evaluation on representative methods. Finally, we discuss future directions, including network designs, metrics, benchmark datasets, applications,etc. We also provide an open-source repository for all the discussed methods, which is available at https://github.com/TaoWangzj/Awesome-Face-Restoration.

translated by 谷歌翻译

High-resolution Depth Maps Imaging via Attention-based Hierarchical Multi-modal Fusion

Zhiwei Zhong , Xianming Liu , Junjun Jiang , Debin Zhao , Zhiwen Chen , Xiangyang Ji

分类：计算机视觉

2021-04-04

深度映射记录场景中的视点和对象之间的距离，这在许多真实应用程序中起着关键作用。然而，消费者级RGB-D相机捕获的深度图遭受了低空间分辨率。引导深度地图超分辨率（DSR）是解决此问题的流行方法，该方法试图从输入的低分辨率（LR）深度及其耦合的HR RGB图像中恢复高分辨率（HR）深度映射和作为指引。引导DSR最具挑战性的问题是如何正确选择一致的结构并传播它们，并正确处理不一致的结构。在本文中，我们提出了一种用于引导DSR的新型关注的分层多模态融合（AHMF）网络。具体地，为了有效地提取和组合来自LR深度和HR引导的相关信息，我们提出了一种基于多模态注意力的融合（MMAF）策略，包括分层卷积层，包括特征增强块，以选择有价值的功能和特征重新校准块来统一不同外观特征的方式的相似性度量。此外，我们提出了一个双向分层特征协作（BHFC）模块，以完全利用多尺度特征之间的低级空间信息和高级结构信息。实验结果表明，在重建精度，运行速度和记忆效率方面，我们的方法优于最先进的方法。

translated by 谷歌翻译