智能论文笔记

Low-rank Tensor Assisted K-space Generative Model for Parallel Imaging Reconstruction

Wei Zhang , Zengwei Xiao , Hui Tao , Minghui Zhang , Xiaoling Xu , Qiegen Liu

分类：计算机视觉

2022-12-11

Although recent deep learning methods, especially generative models, have shown good performance in fast magnetic resonance imaging, there is still much room for improvement in high-dimensional generation. Considering that internal dimensions in score-based generative models have a critical impact on estimating the gradient of the data distribution, we present a new idea, low-rank tensor assisted k-space generative model (LR-KGM), for parallel imaging reconstruction. This means that we transform original prior information into high-dimensional prior information for learning. More specifically, the multi-channel data is constructed into a large Hankel matrix and the matrix is subsequently folded into tensor for prior learning. In the testing phase, the low-rank rotation strategy is utilized to impose low-rank constraints on tensor output of the generative network. Furthermore, we alternately use traditional generative iterations and low-rank high-dimensional tensor iterations for reconstruction. Experimental comparisons with the state-of-the-arts demonstrated that the proposed LR-KGM method achieved better performance.

translated by 谷歌翻译

PointCA: Evaluating the Robustness of 3D Point Cloud Completion Models Against Adversarial Examples

Shengshan Hu , Junwei Zhang , Wei Liu , Junhui Hou , Minghui Li , Leo Yu Zhang , Hai Jin , Lichao Sun

分类：计算机视觉

2022-11-22

Point cloud completion, as the upstream procedure of 3D recognition and segmentation, has become an essential part of many tasks such as navigation and scene understanding. While various point cloud completion models have demonstrated their powerful capabilities, their robustness against adversarial attacks, which have been proven to be fatally malicious towards deep neural networks, remains unknown. In addition, existing attack approaches towards point cloud classifiers cannot be applied to the completion models due to different output forms and attack purposes. In order to evaluate the robustness of the completion models, we propose PointCA, the first adversarial attack against 3D point cloud completion models. PointCA can generate adversarial point clouds that maintain high similarity with the original ones, while being completed as another object with totally different semantic information. Specifically, we minimize the representation discrepancy between the adversarial example and the target point set to jointly explore the adversarial point clouds in the geometry space and the feature space. Furthermore, to launch a stealthier attack, we innovatively employ the neighbourhood density information to tailor the perturbation constraint, leading to geometry-aware and distribution-adaptive modifications for each point. Extensive experiments against different premier point cloud completion networks show that PointCA can cause a performance degradation from 77.9% to 16.7%, with the structure chamfer distance kept below 0.01. We conclude that existing completion models are severely vulnerable to adversarial examples, and state-of-the-art defenses for point cloud classification will be partially invalid when applied to incomplete and uneven point cloud data.

translated by 谷歌翻译

Deep Learning-Based Rate-Splitting Multiple Access for Reconfigurable Intelligent Surface-Aided Tera-Hertz Massive MIMO

Minghui Wu , Zhen Gao , Yang Huang , Zhenyu Xiao , Derrick Wing Kwan Ng , Zhaoyang Zhang

分类：人工智能 | 机器学习

2022-09-18

可重新配置的智能表面（RIS）可以显着增强TERA-HERTZ大量多输入多输出（MIMO）通信系统的服务覆盖范围。但是，获得有限的飞行员和反馈信号开销的准确高维通道状态信息（CSI）具有挑战性，从而严重降低了常规空间分裂多次访问的性能。为了提高针对CSI缺陷的鲁棒性，本文提出了针对RIS辅助TERA-HERTZ多用户MIMO系统的基于深度学习的（DL）基于速率的多访问（RSMA）方案。具体而言，我们首先提出了基于DL的混合数据模型驱动的RSMA预编码方案，包括RIS的被动预编码以及模拟主动编码和基本站（BS）的RSMA数字活动预码。为了实现RIS的被动预码，我们提出了一个基于变压器的数据驱动的RIS反射网络（RRN）。至于BS的模拟主动编码，我们提出了一个基于匹配器的模拟预编码方案，因为BS和RIS采用了Los-Mimo天线阵列结构。至于BS的RSMA数字活动预码，我们提出了一个低复杂性近似加权的最小均方误差（AWMMSE）数字编码方案。此外，为了更好地编码性能以及较低的计算复杂性，模型驱动的深层展开的主动编码网络（DFAPN）也是通过将所提出的AWMMSE方案与DL相结合的。然后，为了在BS处获得准确的CSI，以实现提高光谱效率的RSMA预编码方案，我们提出了一个CSI采集网络（CAN），具有低飞行员和反馈信号开销，下行链接飞行员的传输，CSI在此处使用CSI的CSI反馈。（UES）和BS处的CSI重建被建模为基于变压器的端到端神经网络。

translated by 谷歌翻译

Differentiable Topology-Preserved Distance Transform for Pulmonary Airway Segmentation

Minghui Zhang , Guang-Zhong Yang , Yun Gu

分类：计算机视觉

2022-09-17

详细的肺气道分割是支撑周围肺癌病变的支撑室干预和治疗的临床重要任务。卷积神经网络（CNN）是医学图像分析的有前途的工具，但对于出现不平衡功能分布的情况，案件的性能较差，这对于气道数据是正确的，因为气管和主要支气管在大部分voxels中占主导支气管和远端节段支气管仅占用一小部分。在本文中，我们提出了一个可区分的拓扑保存距离变换（DTPDT）框架，以提高气道分割的性能。首先提出了拓扑保存的替代（TPS）学习策略，以均衡课堂分布的培训进度。此外，卷积距离变换（CDT）旨在识别具有提高灵敏度的破裂现象，从而最大程度地减少了预测和地面真实之间距离图的变化。提出的方法已通过公开可用的参考气道细分数据集进行验证。

translated by 谷歌翻译

ProtoPFormer: Concentrating on Prototypical Parts in Vision Transformers for Interpretable Image Recognition

Mengqi Xue , Qihan Huang , Haofei Zhang , Lechao Cheng , Jie Song , Minghui Wu , Mingli Song

分类：计算机视觉 | 人工智能

2022-08-22

原型零件网络（Protopnet）引起了广泛的关注，并增加了许多随访研究，因为它的自我解释特性可解释人工智能（XAI）。但是，当直接在视觉变压器（VIT）骨架上应用原始网络时，学到的原型存在“分心”问题：它们具有相对较高的可能性，即被背景激活，并且对前景的关注较少。建模长期依赖性的强大能力使得基于变压器的Protopnet难以专注于原型部分，从而严重损害了其固有的解释性。本文提出了原型零件变压器（ProtoPformer），以适当有效地应用基于原型的方法，并使用VIT进行可解释的图像识别。提出的方法介绍了根据VIT的建筑特征捕获和突出目标的代表性整体和部分特征的全局和局部原型。采用了全球原型，以提供对象的全球视图，以指导本地原型集中在前景上，同时消除背景的影响。之后，明确监督局部原型，以专注于它们各自的原型视觉部分，从而提高整体可解释性。广泛的实验表明，我们提出的全球和本地原型可以相互纠正并共同做出最终决策，这些决策分别忠实，透明地从整体和地方的角度缔合过程。此外，ProtoPformer始终取得优于基于原型的原型基线（SOTA）的卓越性能和可视化结果。我们的代码已在https://github.com/zju-vipa/protopformer上发布。

translated by 谷歌翻译

One-shot Generative Prior Learned from Hankel-k-space for Parallel Imaging Reconstruction

Hong Peng , Chen Jiang , Yu Guan , Jing Cheng , Minghui Zhang , Dong Liang , Qiegen Liu

分类：计算机视觉

2022-08-15

磁共振成像是临床诊断的重要工具。但是，它遭受了漫长的收购时间。深度学习的利用，尤其是深层生成模型，在磁共振成像中提供了积极的加速和更好的重建。然而，学习数据分布作为先验知识并从有限数据中重建图像仍然具有挑战性。在这项工作中，我们提出了一种新颖的Hankel-K空间生成模型（HKGM），该模型可以从一个k-空间数据的训练集中生成样品。在先前的学习阶段，我们首先从k空间数据构建一个大的Hankel矩阵，然后从大型Hankel矩阵中提取多个结构化的K空间贴片，以捕获不同斑块之间的内部分布。从Hankel矩阵中提取斑块使生成模型可以从冗余和低级别的数据空间中学习。在迭代重建阶段，可以观察到所需的解决方案遵守学识渊博的先验知识。通过将其作为生成模型的输入来更新中间重建解决方案。然后，通过对测量数据对其Hankel矩阵和数据一致性组合施加低排名的惩罚来替代地进行操作。实验结果证实，单个K空间数据中斑块的内部统计数据具有足够的信息来学习强大的生成模型并提供最新的重建。

translated by 谷歌翻译

Re-thinking and Re-labeling LIDC-IDRI for Robust Pulmonary Cancer Prediction

Hanxiao Zhang , Xiao Gu , Minghui Zhang , Weihao Yu , Liang Chen , Zhexin Wang , Feng Yao , Yun Gu , Guang-Zhong Yang

分类：计算机视觉

2022-07-28

LIDC-IDRI数据库是肺癌预测的最流行的基准。但是，通过放射科医生的主观评估，LIDC中的结节可能与病理基础真理具有完全不同的恶性注释，从而引入了标签分配错误，并在培训期间引起了后续的监督偏见。因此，LIDC数据库需要更多的客观标签来基于学习的癌症预测。基于一个额外的小数据集，该数据集包含通过病理检查诊断的180个结节，我们建议重新标记LIDC数据，以减轻对此强大基准测试的原始注释偏差的影响。我们在本文中证明，基于度量学习的类似结节检索提供新标签将是一种有效的重新标记策略。对这些重新标记的LIDC结节进行的培训可改善模型性能，当添加不确定的结节的新标签时，这将增强。我们进一步推断出，重新标记的LIDC是最终的良好肺癌预测的方便方法，同时构建大型病理预处理的结节数据库提供了长期解决方案。

translated by 谷歌翻译

WKGM: Weight-K-space Generative Model for Parallel Imaging Reconstruction

Zongjiang Tu , Die Liu , Xiaoqing Wang , Chen Jiang , Minghui Zhang , Shanshan Wang , Qiegen Liu , Dong Liang

分类：计算机视觉

2022-05-08

近年来，基于深度学习的平行成像（PI）取得了巨大进展，以加速磁共振成像（MRI）。然而，现有方法的性能和鲁棒性仍然可以是不受欢迎的。在这项工作中，我们建议通过柔性PI重建，创建的重量K-Space Genera-Tive模型（WKGM）来探索K空间域学习。具体而言，WKGM是一种通用的K空间域模型，在其中有效地纳入了K空间加权技术和高维空间增强设计，用于基于得分的Genererative模型训练，从而实现良好和强大的重建。此外，WKGM具有灵活性，因此可以与各种传统的K空间PI模型协同结合，从而产生基于学习的先验以产生高保真重建。在具有不同采样模式和交流电因子的数据集上进行实验性重新构建表明，WKGM可以通过先验良好的K-Space生成剂获得最新的重建结果。

translated by 谷歌翻译

Data-Driven Deep Learning Based Hybrid Beamforming for Aerial Massive MIMO-OFDM Systems with Implicit CSI

Zhen Gao , Minghui Wu , Chun Hu , Feifei Gao , Guanghui Wen , Dezhi Zheng , Jun Zhang

分类：机器学习

2022-01-18

在空中杂种大规模多输入多输出（MIMO）和正交频施加多路复用（OFDM）系统中，如何设计具有有限的飞行员和反馈开销的光谱效率宽带多用户混合波束，这是具有挑战性的。为此，通过将关键传输模块建模为端到端（E2E）神经网络，本文提出了一个数据驱动的深度学习（DL）基于时间划分双工（TDD）的基于数据驱动的深度学习（DL）的统一混合边际框架和具有隐式通道状态信息（CSI）的频分隔双链（FDD）系统。对于TDD系统，提出的基于DL的方法共同对上行链路飞行员组合和下行链路混合光束模块作为E2E神经网络。在FDD系统中，我们将下行链路飞行员传输，上行链路CSI反馈和下行链路混合光束形成模块作为E2E神经网络建模。与分别处理不同模块的常规方法不同，提出的解决方案同时以总和速率作为优化对象优化了所有模块。因此，通过感知空对地面大规模MIMO-OFDM通道样本的固有属性，基于DL的E2E神经网络可以建立从通道到波束形式的映射函数，以便可以避免使用显式通道重建，以减少飞行员和反馈开销。此外，实用的低分辨率相变（PSS）引入了量化约束，从而导致训练神经网络时棘手的梯度反向传播。为了减轻阶段量化误差引起的性能损失，我们采用转移学习策略，以基于假定理想的无限分辨率PSS的预训练网络来进一步调整E2E神经网络。数值结果表明，我们的基于DL的方案比最先进的方案具有相当大的优势。

translated by 谷歌翻译

DKPLM: Decomposable Knowledge-enhanced Pre-trained Language Model for Natural Language Understanding

Taolin Zhang , Chengyu Wang , Nan Hu , Minghui Qiu , Chengguang Tang , Xiaofeng He , Jun Huang

分类：自然语言处理

2021-12-02

知识增强的预训练预审语言模型（Keplms）是预先接受的模型，具有从知识图中注入的关系三元组，以提高语言理解能力。为了保证有效的知识注入，之前的研究将模型与知识编码器集成，以表示从知识图表中检索的知识。知识检索和编码的操作带来了重要的计算负担，限制了在需要高推理速度的现实应用程序中使用这些模型。在本文中，我们提出了一种名为DKPLM的新型KEPLM，其在预训练，微调和推理阶段进行了预先训练的语言模型的知识注射过程，这有助于KEPLMS在现实世界场景中的应用。具体而言，我们首先检测知识感知的长尾实体作为知识注射的目标，增强了Keplms的语义理解能力，避免注入冗余信息。长尾实体的嵌入式被相关知识三元组形成的“伪令牌表示”取代。我们进一步设计了用于预培训的关系知识解码任务，以强制模型通过关系三重重建来真正了解注入的知识。实验表明，我们的模型在零拍摄知识探测任务和多种知识意识语言理解任务中显着优于其他KEPLS。我们进一步表明，由于分解机制，DKPLM具有比其他竞争模型更高的推理速度。

translated by 谷歌翻译