智能论文笔记

Learn to Adapt to New Environment from Past Experience and Few Pilot

Ouya Wang , Jiabao Gao , Geoffrey Ye Li

分类：机器学习

2022-09-02

近年来，深度学习已被广泛应用于沟通，并取得了显着的绩效提高。大多数现有作品都是基于数据驱动的深度学习，该学习需要大量的通信模型培训数据，以适应新的环境，并为收集数据和重新训练模型提供庞大的计算资源。在本文中，我们将通过利用已知环境的学习经验来大大减少新环境所需的培训数据。因此，我们介绍了很少的学习学习，以使通信模型推广到新环境，这是通过基于注意力的方法实现的。随着注意网络嵌入了基于深度学习的沟通模型中，可以在培训过程中一起学习具有不同功率延迟概况的环境，这称为学习经验。通过利用学习经验，沟通模型只需要很少的飞行员块即可在新环境中表现良好。通过基于深度学习的渠道估计的示例，我们证明了这种新颖的设计方法比为少数拍摄学习设计的现有数据驱动方法的性能更好。

translated by 谷歌翻译

AI-Aided Online Adaptive OFDM Receiver: Design and Experimental Results

Peiwen Jiang , Tianqi Wang , Bin Han , Xuanxuan Gao , Jing Zhang , Chao-Kai Wen , Shi Jin , Geoffrey Ye Li

分类：机器学习 | (统计)机器学习

2018-12-17

正交频分复用（OFDM）已广泛应用于当前通信系统。人工智能（AI）addm接收器目前被带到最前沿替换和改进传统的OFDM接收器。在这项研究中，我们首先比较两个AI辅助OFDM接收器，即数据驱动的完全连接的深神经网络和模型驱动的COMNet，通过广泛的仿真和实时视频传输，使用5G快速原型制作系统进行跨越式-Air（OTA）测试。我们在离线训练和真实环境之间的频道模型之间的差异差异导致的模拟和OTA测试之间找到了性能差距。我们开发一种新颖的在线培训系统，称为SwitchNet接收器，以解决此问题。该接收器具有灵活且可扩展的架构，可以通过在线训练几个参数来适应真实频道。从OTA测试中，AI辅助OFDM接收器，尤其是SwitchNet接收器，对真实环境具有鲁棒，并且对未来的通信系统有前途。我们讨论了本文初步研究的潜在挑战和未来的研究。

translated by 谷歌翻译

Cross Attention Network for Few-shot Classification

Ruibing Hou , Hong Chang , Bingpeng Ma , Shiguang Shan , Xilin Chen

分类：

2019-10-17

Few-shot classification aims to recognize unlabeled samples from unseen classes given only few labeled samples. The unseen classes and low-data problem make few-shot classification very challenging. Many existing approaches extracted features from labeled and unlabeled samples independently, as a result, the features are not discriminative enough. In this work, we propose a novel Cross Attention Network to address the challenging problems in few-shot classification. Firstly, Cross Attention Module is introduced to deal with the problem of unseen classes. The module generates cross attention maps for each pair of class feature and query sample feature so as to highlight the target object regions, making the extracted feature more discriminative. Secondly, a transductive inference algorithm is proposed to alleviate the low-data problem, which iteratively utilizes the unlabeled query set to augment the support set, thereby making the class features more representative. Extensive experiments on two benchmarks show our method is a simple, effective and computationally efficient framework and outperforms the state-of-the-arts.

translated by 谷歌翻译

Overview of Deep Learning-based CSI Feedback in Massive MIMO Systems

Jiajia Guo , Chao-Kai Wen , Shi Jin , Geoffrey Ye Li

分类：机器学习

2022-06-29

通过大量多输入和多重输出实现的许多性能增长取决于发射机（基站）下链路通道状态信息（CSI）的准确性，这通常是通过在接收器（用户终端）估算并馈入的。到发射器。 CSI反馈的开销占据了大量的上行链路带宽资源，尤其是当传输天线数量较大时。基于深度学习（DL）的CSI反馈是指基于DL的自动编码器的CSI压缩和重建，并且可以大大减少反馈开销。在本文中，提供了有关该主题的最新研究的全面概述，首先是在CSI反馈中广泛使用的基本DL概念，然后对一些现有的基于DL的反馈作品进行分类和描述。重点是新型的神经网络体系结构和沟通专家知识的利用来提高CSI反馈准确性。还介绍了有关CSI反馈和CSI反馈与其他通信模块的联合设计的作品，并讨论了一些实际问题，包括培训数据集收集，在线培训，复杂性，概括和标准化效果。在本文的最后，确定了与未来无线通信系统中基于DL的CSI反馈相关的一些挑战和潜在的研究方向。

translated by 谷歌翻译

Enabling Deep Learning-based Physical-layer Secret Key Generation for FDD-OFDM Systems in Multi-Environments

Xinwei Zhang , Guyue Li , Junqing Zhang , Aiqun Hu , Xianbin Wang

分类：机器学习

2022-11-06

Deep learning-based physical-layer secret key generation (PKG) has been used to overcome the imperfect uplink/downlink channel reciprocity in frequency division duplexing (FDD) orthogonal frequency division multiplexing (OFDM) systems. However, existing efforts have focused on key generation for users in a specific environment where the training samples and test samples obey the same distribution, which is unrealistic for real world applications. This paper formulates the PKG problem in multiple environments as a learning-based problem by learning the knowledge such as data and models from known environments to generate keys quickly and efficiently in multiple new environments. Specifically, we propose deep transfer learning (DTL) and meta-learning-based channel feature mapping algorithms for key generation. The two algorithms use different training methods to pre-train the model in the known environments, and then quickly adapt and deploy the model to new environments. Simulation results show that compared with the methods without adaptation, the DTL and meta-learning algorithms both can improve the performance of generated keys. In addition, the complexity analysis shows that the meta-learning algorithm can achieve better performance than the DTL algorithm with less time, lower CPU and GPU resources.

translated by 谷歌翻译

Not All Instances Contribute Equally: Instance-adaptive Class Representation Learning for Few-Shot Visual Recognition

Mengya Han , Yibing Zhan , Yong Luo , Bo Du , Han Hu , Yonggang Wen , Dacheng Tao

分类：计算机视觉

2022-09-07

很少有视觉识别是指从一些标记实例中识别新颖的视觉概念。通过将查询表示形式与类表征进行比较以预测查询实例的类别，许多少数射击的视觉识别方法采用了基于公制的元学习范式。但是，当前基于度量的方法通常平等地对待所有实例，因此通常会获得有偏见的类表示，考虑到并非所有实例在总结了类级表示的实例级表示时都同样重要。例如，某些实例可能包含无代表性的信息，例如过多的背景和无关概念的信息，这使结果偏差。为了解决上述问题，我们提出了一个新型的基于公制的元学习框架，称为实例自适应类别表示网络（ICRL-net），以进行几次视觉识别。具体而言，我们开发了一个自适应实例重新平衡网络，具有在生成班级表示，通过学习和分配自适应权重的不同实例中的自适应权重时，根据其在相应类的支持集中的相对意义来解决偏见的表示问题。此外，我们设计了改进的双线性实例表示，并结合了两个新型的结构损失，即，阶层内实例聚类损失和阶层间表示区分损失，以进一步调节实例重估过程并完善类表示。我们对四个通常采用的几个基准测试：Miniimagenet，Tieredimagenet，Cifar-FS和FC100数据集进行了广泛的实验。与最先进的方法相比，实验结果证明了我们的ICRL-NET的优势。

translated by 谷歌翻译

Semantics-Empowered Communication: A Tutorial-cum-Survey

Zhilin Lu , Rongpeng Li , Kun Lu , Xianfu Chen , Ekram Hossain , Zhifeng Zhao , Honggang Zhang

分类：人工智能

2022-12-16

Along with the springing up of semantics-empowered communication (SemCom) researches, it is now witnessing an unprecedentedly growing interest towards a wide range of aspects (e.g., theories, applications, metrics and implementations) in both academia and industry. In this work, we primarily aim to provide a comprehensive survey on both the background and research taxonomy, as well as a detailed technical tutorial. Specifically, we start by reviewing the literature and answering the "what" and "why" questions in semantic transmissions. Afterwards, we present corresponding ecosystems, including theories, metrics, datasets and toolkits, on top of which the taxonomy for research directions is presented. Furthermore, we propose to categorize the critical enabling techniques by explicit and implicit reasoning-based methods, and elaborate on how they evolve and contribute to modern content \& channel semantics-empowered communications. Besides reviewing and summarizing the latest efforts in SemCom, we discuss the relations with other communication levels (e.g., reliable and goal-oriented communications) from a holistic and unified viewpoint. Subsequently, in order to facilitate the future developments and industrial applications, we also highlight advanced practical techniques for boosting semantic accuracy, robustness, and large-scale scalability, just to mention a few. Finally, we discuss the technical challenges that shed light on future research opportunities.

translated by 谷歌翻译

Learning to Compare Relation: Semantic Alignment for Few-Shot Learning

Congqi Cao , Yanning Zhang

分类：计算机视觉

2020-02-29

少量学习是一个基本和挑战性的问题，因为它需要识别只有几个例子的新型类别。识别对象具有多个变体，可以定位图像中的任何位置。直接将查询图像与示例图像进行比较无法处理内容未对准。比较的表示和度量是至关重要的，但由于在几次拍摄学习中的样本的稀缺和广泛变化而挑战。在本文中，我们提出了一种新颖的语义对齐模型来比较关系，这是对内容未对准的强大。我们建议为现有的几次射门学习框架添加两个关键成分，以获得更好的特征和度量学习能力。首先，我们介绍了语义对齐损失，以对准属于同一类别的样本的功能的关系统计。其次，引入了本地和全局互动信息，允许在图像中的结构位置包含本地一致和类别共享信息的表示。第三，我们通过考虑每个流的同性恋的不确定性来介绍一个原则的方法来称量多重损失功能。我们对几个几次拍摄的学习数据集进行了广泛的实验。实验结果表明，该方法能够比较与语义对准策略的关系，实现最先进的性能。

translated by 谷歌翻译

Robust Semantic Communications with Masked VQ-VAE Enabled Codebook

Qiyu Hu , Guangyi Zhang , Zhijin Qin , Yunlong Cai , Guanding Yu , Geoffrey Ye Li

分类：机器学习

2022-06-08

尽管语义通信对大量任务表现出令人满意的性能，但语义噪声和系统的鲁棒性的影响尚未得到很好的研究。语义噪声是指预期的语义符号和接收到的语义符号之间的误导性，从而导致任务失败。在本文中，我们首先提出了一个框架，用于稳健的端到端语义通信系统来对抗语义噪声。特别是，我们分析了样品依赖性和样本无关的语义噪声。为了打击语义噪声，开发了具有重量扰动的对抗训练，以在训练数据集中纳入带有语义噪声的样品。然后，我们建议掩盖一部分输入，在该输入中，语义噪声经常出现，并通过噪声相关的掩蔽策略设计蒙版vector量化量化的量化自动编码器（VQ-VAE）。我们使用发射器共享的离散代码簿和接收器用于编码功能表示。为了进一步提高系统鲁棒性，我们开发了一个功能重要性模块（FIM），以抑制与噪声相关和任务无关的功能。因此，发射器只需要在代码簿中传输这些重要的任务相关功能的索引即可。仿真结果表明，所提出的方法可以应用于许多下游任务，并显着提高针对语义噪声的鲁棒性，并显着减少了传输开销。

translated by 谷歌翻译

STAF: A Spatio-Temporal Attention Fusion Network for Few-shot Video Classification

Rex Liu , Huanle Zhang , Hamed Pirsiavash , Xin Liu

分类：计算机视觉 | 机器学习

2021-12-08

我们提出STAF，一种用于几次视频分类的时空关注融合网络。STAF首先通过应用3D卷积神经网络嵌入网络来提取视频的粗粒度的空间和时间特征。然后使用自我关注和跨关注网络微调提取的特征。最后，STAF应用轻量级融合网络和最近的邻邻分类器来分类每个查询视频。为了评估STAF，我们在三个基准（UCF101，HMDB51和SomeS-V2）上进行广泛的实验。实验结果表明，STAF通过大边缘提高了最先进的准确性，例如，STAF分别将五向单拍精度增加5.3％和7.0％，分别为UCF101和HMDB51增加。

translated by 谷歌翻译

Few-shot Fine-grained Image Classification via Multi-Frequency Neighborhood and Double-cross Modulation

Hegui Zhu , Zhan Gao , Jiayi Wang , Yange Zhou , Chengqing Li

分类：计算机视觉

2022-07-18

传统的细颗粒图像分类通常依赖于带注释的地面真相的大规模训练样本。但是，某些子类别在实际应用中可能几乎没有可用的样本。在本文中，我们建议使用多频邻域（MFN）和双交叉调制（DCM）提出一个新颖的几弹性细颗粒图像分类网络（FICNET）。采用模块MFN来捕获空间域和频域中的信息。然后，提取自相似性和多频成分以产生多频结构表示。 DCM使用分别考虑全球环境信息和类别之间的微妙关系来调节嵌入过程。针对两个少量任务的三个细粒基准数据集进行的综合实验验证了FICNET与最先进的方法相比具有出色的性能。特别是，在两个数据集“ Caltech-UCSD鸟”和“ Stanford Cars”上进行的实验分别可以获得分类精度93.17 \％和95.36 \％。它们甚至高于一般的细粒图像分类方法可以实现的。

translated by 谷歌翻译

A Unified Framework for Attention-Based Few-Shot Object Detection

Pierre Le Jeune , Anissa Mokraoui

分类：计算机视觉

2022-01-06

少量对象检测（FSOD）是计算机视觉中快速生长的领域。它包括查找给定的一组类的所有出现，只有每个类的少数注释的示例。已经提出了许多方法来解决这一挑战，其中大部分是基于注意机制。然而，各种经典对象检测框架和培训策略使方法之间的性能比较困难。特别是对于基于关注的FSOD方法，比较不同关注机制对性能的影响是费力的。本文旨在填补这种缺点。为此，提出了一种灵活的框架，以允许实施文献中可用的大部分注意技术。要正确介绍这样的框架，首先提供了对现有FSOD方法的详细审查。然后在框架内重新实现一些不同的关注机制，并与固定的所有其他参数进行比较。

translated by 谷歌翻译

Transformer-Empowered 6G Intelligent Networks: From Massive MIMO Processing to Semantic Communication

Yang Wang , Zhen Gao , Dezhi Zheng , Sheng Chen , Deniz Gündüz , H. Vincent Poor

分类：人工智能 | 机器学习

2022-05-08

6G无线网络可以预见，以加快物理和网络世界的融合，并以我们部署和利用通信网络的方式实现范式换档。机器学习，尤其是深度学习（DL），将通过提供具有高水平智能的网络的新范式来成为6G的关键技术推动力之一。在本文中，我们介绍了一种新兴的DL体系结构，称为Transformer，并讨论了其对6G网络设计的潜在影响。我们首先讨论变压器和经典DL体系结构之间的差异，并强调变压器的自我发挥机制和强大的代表能力，这使其在应对无线网络设计的各种挑战方面特别有吸引力。具体而言，我们提出了基于变压器的解决方案，用于大规模多输入多输出（MIMO）系统和6G网络中的各种语义通信问题。最后，我们讨论了基于变压器的解决方案中的关键挑战和开放问题，并确定未来在智能6G网络中部署的研究方向。

translated by 谷歌翻译

Efficient deep learning models for land cover image classification

Ioannis Papoutsis , Nikolaos-Ioannis Bountos , Angelos Zavras , Dimitrios Michail , Christos Tryfonopoulos

分类：计算机视觉

2021-11-18

哥内克人Sentinel Imagery的纯粹卷的可用性为使用深度学习的大尺度创造了新的土地利用陆地覆盖（Lulc）映射的机会。虽然在这种大型数据集上培训是一个非琐碎的任务。在这项工作中，我们试验Lulc Image分类和基准不同最先进模型的Bigearthnet数据集，包括卷积神经网络，多层感知，视觉变压器，高效导通和宽残余网络（WRN）架构。我们的目标是利用分类准确性，培训时间和推理率。我们提出了一种基于用于网络深度，宽度和输入数据分辨率的WRNS复合缩放的高效导通的框架，以有效地训练和测试不同的模型设置。我们设计一种新颖的缩放WRN架构，增强了有效的通道注意力机制。我们提出的轻量级模型具有较小的培训参数，实现所有19个LULC类的平均F分类准确度达到4.5％，并且验证了我们使用的resnet50最先进的模型速度快两倍作为基线。我们提供超过50种培训的型号，以及我们在多个GPU节点上分布式培训的代码。

translated by 谷歌翻译

Siamese Object Tracking for Unmanned Aerial Vehicle: A Review and Comprehensive Analysis

Changhong Fu , Kunhan Lu , Guangze Zheng , Junjie Ye , Ziang Cao , Bowen Li , Geng Lu

分类：计算机视觉

2022-05-09

基于无人机（UAV）基于无人机的视觉对象跟踪已实现了广泛的应用，并且由于其多功能性和有效性而引起了智能运输系统领域的越来越多的关注。作为深度学习革命性趋势的新兴力量，暹罗网络在基于无人机的对象跟踪中闪耀，其准确性，稳健性和速度有希望的平衡。由于开发了嵌入式处理器和深度神经网络的逐步优化，暹罗跟踪器获得了广泛的研究并实现了与无人机的初步组合。但是，由于无人机在板载计算资源和复杂的现实情况下，暹罗网络的空中跟踪仍然在许多方面都面临严重的障碍。为了进一步探索基于无人机的跟踪中暹罗网络的部署，这项工作对前沿暹罗跟踪器进行了全面的审查，以及使用典型的无人机板载处理器进行评估的详尽无人用分析。然后，进行板载测试以验证代表性暹罗跟踪器在现实世界无人机部署中的可行性和功效。此外，为了更好地促进跟踪社区的发展，这项工作分析了现有的暹罗跟踪器的局限性，并进行了以低弹片评估表示的其他实验。最后，深入讨论了基于无人机的智能运输系统的暹罗跟踪的前景。领先的暹罗跟踪器的统一框架，即代码库及其实验评估的结果，请访问https://github.com/vision4robotics/siamesetracking4uav。

translated by 谷歌翻译

Learning of Frequency-Time Attention Mechanism for Automatic Modulation Recognition

Shangao Lin , Yuan Zeng , Yi Gong

分类：计算机视觉

2021-11-05

最近的基于学习的图像分类和语音识别方法使得广泛利用注意力机制来实现最先进的识别力，这表明了注意力机制的有效性。由于调制无线电信号的频率和时间信息对调制模式识别至关重要的事实，本文提出了一种卷积神经网络（CNN）的调制识别框架的频率时间注意机制。所提出的频率 - 时间注意模块旨在了解哪些频道，频率和时间信息在CNN中更有意义，以进行调制识别。我们分析了所提出的频率时期注意机制的有效性，并比较了两个现有的基于学习的方法的提出方法。在开源调制识别数据集上的实验表明，所提出的框架的识别性能优于框架的识别性能，而无需朝向基于学习的方法。

translated by 谷歌翻译

Deep Reinforced Attention Learning for Quality-Aware Visual Recognition

Duo Li , Qifeng Chen

分类：计算机视觉

2020-07-13

在本文中，我们基于任何卷积神经网络中中间注意图的弱监督生成机制，并更加直接地披露了注意模块的有效性，以充分利用其潜力。鉴于现有的神经网络配备了任意注意模块，我们介绍了一个元评论家网络，以评估主网络中注意力图的质量。由于我们设计的奖励的离散性，提出的学习方法是在强化学习环境中安排的，在此设置中，注意力参与者和经常性的批评家交替优化，以提供临时注意力表示的即时批评和修订，因此，由于深度强化的注意力学习而引起了人们的关注。（Dreal）。它可以普遍应用于具有不同类型的注意模块的网络体系结构，并通过最大程度地提高每个单独注意模块产生的最终识别性能的相对增益来促进其表现能力，如类别和实例识别基准的广泛实验所证明的那样。

translated by 谷歌翻译

AirFi: Empowering WiFi-based Passive Human Gesture Recognition to Unseen Environment via Domain Generalization

Dazhuo Wang , Jianfei Yang , Wei Cui , Lihua Xie , Sumei Sun

分类：计算机视觉

2022-09-21

近年来，由渠道状态信息（CSI）启用了基于WiFi的智能人类传感技术（CSI）。但是，在不同的环境中部署时，基于CSI的传感系统会遭受性能降解。现有作品通过使用新环境中的大量未标记的高质量数据来通过域的适应来解决这一问题，这在实践中通常不可用。在本文中，我们提出了一种新颖的增强环境不变的鲁棒wifi wifi识别系统，名为Airfi，该系统从新的角度涉及环境依赖问题。 Airfi是一个新颖的领域泛化框架，无论环境如何，都可以学习CSI的关键部分，并将模型推广到看不见的场景，不需要收集任何数据以适应新环境。 Airfi从几个培训环境环境中提取了共同的功能，并最大程度地减少了它们之间的分布差异。该功能将进一步增强，以使环境更强大。此外，可以通过几次学习技术进一步改进该系统。与最先进的方法相比，Airfi能够在不同的环境环境中工作，而无需从新环境中获取任何CSI数据。实验结果表明，我们的系统在新环境中保持强大，并优于比较系统。

translated by 谷歌翻译

Hitchhiker's Guide to Super-Resolution: Introduction and Recent Advances

Brian Moser , Federico Raue , Stanislav Frolov , Jörn Hees , Sebastian Palacio , Andreas Dengel

分类：计算机视觉

2022-09-27

随着深度学习（DL）的出现，超分辨率（SR）也已成为一个蓬勃发展的研究领域。然而，尽管结果有希望，但该领域仍然面临需要进一步研究的挑战，例如，允许灵活地采样，更有效的损失功能和更好的评估指标。我们根据最近的进步来回顾SR的域，并检查最新模型，例如扩散（DDPM）和基于变压器的SR模型。我们对SR中使用的当代策略进行了批判性讨论，并确定了有前途但未开发的研究方向。我们通过纳入该领域的最新发展，例如不确定性驱动的损失，小波网络，神经体系结构搜索，新颖的归一化方法和最新评估技术来补充先前的调查。我们还为整章中的模型和方法提供了几种可视化，以促进对该领域趋势的全球理解。最终，这篇综述旨在帮助研究人员推动DL应用于SR的界限。

translated by 谷歌翻译

DeepTx: Deep Learning Beamforming with Channel Prediction

Janne M. J. Huttunen , Dani Korpi , Mikko Honkala

分类：机器学习

2022-02-16

最近在无线通信领域的许多任务中考虑了机器学习算法。以前，我们已经提出了使用深度卷积神经网络（CNN）进行接收器处理的使用，并证明它可以提供可观的性能提高。在这项研究中，我们专注于发射器的机器学习算法。特别是，我们考虑进行波束形成并提出一个CNN，该CNN对于给定上行链路通道估计值作为输入，输出下链路通道信息用于波束成形。考虑到基于UE接收器性能的损失函数的上行链路传输和下行链路传输，CNN以有监督的方式进行培训。神经网络的主要任务是预测上行链路和下行链路插槽之间的通道演变，但它也可以学会处理整个链中的效率低下和错误，包括实际的光束成型阶段。提供的数值实验证明了波束形成性能的改善。

translated by 谷歌翻译