智能论文笔记

Toward Data-Driven Radar STAP

Shyam Venkatasubramanian , Sandeep Gogineni , Bosung Kang , Ali Pezeshki , Muralidhar Rangaswamy , Vahid Tarokh

分类：计算机视觉

2022-09-07

在过去的十年中，由于雷达目的的现场特异性，高保真射频（RF）建模和仿真工具的催化，在过去的十年中，经典方法的数据驱动公式迅速增长。尽管有这种激增，但有限的焦点已针对这些经典方法的理论基础。在这方面，作为我们正在进行的数据驱动的雷达时空自适应处理方法（Stap）的一部分，我们在雷达目标定位的背景下分析了精选子空间分离方法的渐近性能保证，并通过拟议目标位置估计的深度学习框架。在我们的方法中，我们通过使用RFView（由ISL Inc.开发的一个特定于站点的RF建模和模拟工具）将可变强度的目标随机放置在预定的约束区域中。在范围内，方位角和归一化自适应匹配过滤器（NAMF）测试统计量以及广义Sidelobe canceller（GSC）的输出功率的高度。使用我们的深度学习框架，我们从这些热图张量估算目标位置，以证明我们数据驱动方法在匹配和不匹配的设置中提供的可行性和显着改进。

translated by 谷歌翻译

A Review of Indoor Millimeter Wave Device-based Localization and Device-free Sensing Technologies

Anish Shastri , Neharika Valecha , Enver Bashirov , Harsh Tataria , Michael Lentmaier , Fredrik Tufvesson , Michele Rossi , Paolo Casari

分类：机器学习

2021-12-10

低成本毫米波（MMWAVE）通信和雷达设备的商业可用性开始提高消费市场中这种技术的渗透，为第五代（5G）的大规模和致密的部署铺平了道路（5G） - 而且以及6G网络。同时，普遍存在MMWAVE访问将使设备定位和无设备的感测，以前所未有的精度，特别是对于Sub-6 GHz商业级设备。本文使用MMWAVE通信和雷达设备在基于设备的定位和无设备感应中进行了现有技术的调查，重点是室内部署。我们首先概述关于MMWAVE信号传播和系统设计的关键概念。然后，我们提供了MMWaves启用的本地化和感应方法和算法的详细说明。我们考虑了在我们的分析中的几个方面，包括每个工作的主要目标，技术和性能，每个研究是否达到了一定程度的实现，并且该硬件平台用于此目的。我们通过讨论消费者级设备的更好算法，密集部署的数据融合方法以及机器学习方法的受过教育应用是有前途，相关和及时的研究方向的结论。

translated by 谷歌翻译

A Comprehensive Survey on Radio Frequency (RF) Fingerprinting: Traditional Approaches, Deep Learning, and Open Challenges

Anu Jagannath , Jithin Jagannath , Prem Sagar Pattanshetty Vasanth Kumar

分类：机器学习 | 人工智能

2022-01-03

第五代（5G）网络和超越设想巨大的东西互联网（物联网）推出，以支持延长现实（XR），增强/虚拟现实（AR / VR），工业自动化，自主驾驶和智能所有带来的破坏性应用一起占用射频（RF）频谱的大规模和多样化的IOT设备。随着频谱嘎嘎和吞吐量挑战，这种大规模的无线设备暴露了前所未有的威胁表面。 RF指纹识别是预约的作为候选技术，可以与加密和零信任安全措施相结合，以确保无线网络中的数据隐私，机密性和完整性。在未来的通信网络中，在这项工作中，在未来的通信网络中的相关性，我们对RF指纹识别方法进行了全面的调查，从传统观点到最近的基于深度学习（DL）的算法。现有的调查大多专注于无线指纹方法的受限制呈现，然而，许多方面仍然是不可能的。然而，在这项工作中，我们通过解决信号智能（SIGINT），应用程序，相关DL算法，RF指纹技术的系统文献综述来缓解这一点，跨越过去二十年的RF指纹技术的系统文献综述，对数据集和潜在研究途径的讨论 - 必须以百科全书的方式阐明读者的必要条件。

translated by 谷歌翻译

Multi-task Learning Approach for Modulation and Wireless Signal Classification for 5G and Beyond: Edge Deployment via Model Compression

Anu Jagannath , Jithin Jagannath

分类：人工智能 | 机器学习

2022-02-26

未来的通信网络必须解决稀缺范围，以适应异质无线设备的广泛增长。无线信号识别对于频谱监视，频谱管理，安全通信等越来越重要。因此，对边缘的综合频谱意识有可能成为超越5G网络的新兴推动力。该领域的最新研究具有（i）仅关注单个任务 - 调制或信号（协议）分类 - 在许多情况下，该系统不足以对系统作用，（ii）考虑要么考虑雷达或通信波形（同质波形类别），（iii）在神经网络设计阶段没有解决边缘部署。在这项工作中，我们首次在无线通信域中，我们利用了基于深神经网络的多任务学习（MTL）框架的潜力，同时学习调制和信号分类任务，同时考虑异质无线信号，例如雷达和通信波形。在电磁频谱中。提出的MTL体系结构受益于两项任务之间的相互关系，以提高分类准确性以及使用轻型神经网络模型的学习效率。此外，我们还将对模型进行实验评估，并通过空中收集的样品进行了对模型压缩的第一手洞察力，以及在资源受限的边缘设备上部署的深度学习管道。我们在两个参考体系结构上展示了所提出的模型的显着计算，记忆和准确性提高。除了建模适用于资源约束的嵌入式无线电平台的轻型MTL模型外，我们还提供了一个全面的异质无线信号数据集，以供公众使用。

translated by 谷歌翻译

Millimeter Wave Wireless Assisted Robot Navigation with Link State Classification

Mingsheng Yin , Akshaj Veldanda , Amee Trivedi , Jeff Zhang , Kai Pfeiffer , Yaqi Hu , Siddharth Garg , Elza Erkip , Ludovic Righetti , Sundeep Rangan

分类：机器人

2021-10-27

由于捕获高角度和时间分辨率测量的能力，毫米波（MMWAVE）带引起了高精度定位应用的显着关注。本文探讨了基于MMWAVE的定位，用于目标本地化问题，其中固定目标广播MMWAVE信号和移动机器人代理尝试侦听信号以定位和导航到目标。提出了三个韵律过程：首先，移动代理使用张量分解方法来检测无线路径及其角度。其次，然后使用机器学习培训的分类器来预测链路状态，这意味着如果最强的路径是视线（LOS）或非LOS（NLO）。对于NLOS案例，链路状态预测器还确定最强路径是否通过一个或多个反射到达。第三，基于链路状态，代理人遵循估计的角度或探索环境。该方法在补充有线跟踪的室内环境的大型数据集上进行了演示，以模拟无线传播。路径估计和链路状态分类也集成到最先进的神经同时定位和映射（SLAM）模块中，以增强相机和基于LIDAR的导航。结果表明，链路状态分类器可以成功地推广到培训集外的完全新环境。另外，具有无线路径估计和链路状态分类器的神经基模块为目标提供快速导航，接近了解目标位置的基线。

translated by 谷歌翻译

Real-time Outdoor Localization Using Radio Maps: A Deep Learning Approach

Çağkan Yapar , Ron Levie , Gitta Kutyniok , Giuseppe Caire

分类：机器学习

2021-06-23

全球导航卫星系统通常在城市环境中表现较差，在城市环境中，设备和卫星之间的视线条件的可能性很低，因此需要替代的定位方法才能良好准确。我们提出了Locunet：用于本地化任务的卷积，端到端训练的神经网络，能够从少数基站（BSS）的接收信号强度（RSS）中估算用户的位置。在提出的方法中，要本地化的用户只需将测量的RSS报告给可能位于云中的中央处理单元。使用BSS和RSS测量值的Pathloss无线电图的估计，Locunet可以以最先进的精度定位用户，并在无线电图估计中享有高度鲁棒性。所提出的方法不需要对新环境进行预采样，并且适用于实时应用。此外，提供了两个新颖的数据集，可以在现实的城市环境中对RSS和TOA方法进行数值评估，并为研究社区公开提供。通过使用这些数据集，我们还提供了密集的城市场景中最先进的RSS和基于TOA的方法的公平比较，并以数值显示Locunet优于所有比较方法。

translated by 谷歌翻译

Interference Suppression Using Deep Learning: Current Approaches and Open Challenges

Taiwo Oyedare , Vijay K Shah , Daniel J Jakubisin , Jeff H Reed

分类：机器学习

2021-12-16

鉴于无线频谱的有限性和对无线通信最近的技术突破产生的频谱使用不断增加的需求，干扰问题仍在继续持续存在。尽管最近解决干涉问题的进步，但干扰仍然呈现出有效使用频谱的挑战。这部分是由于Wi-Fi的无许可和管理共享乐队使用的升高，长期演进（LTE）未许可（LTE-U），LTE许可辅助访问（LAA），5G NR等机会主义频谱访问解决方案。因此，需要对干扰稳健的有效频谱使用方案的需求从未如此重要。在过去，通过使用避免技术以及非AI缓解方法（例如，自适应滤波器）来解决问题的大多数解决方案。非AI技术的关键缺陷是需要提取或开发信号特征的域专业知识，例如CycrationArity，带宽和干扰信号的调制。最近，研究人员已成功探索了AI / ML的物理（PHY）层技术，尤其是深度学习，可减少或补偿干扰信号，而不是简单地避免它。 ML基于ML的方法的潜在思想是学习来自数据的干扰或干扰特性，从而使需要对抑制干扰的域专业知识进行侧联。在本文中，我们审查了广泛的技术，这些技术已经深入了解抑制干扰。我们为干扰抑制中许多不同类型的深度学习技术提供比较和指导。此外，我们突出了在干扰抑制中成功采用深度学习的挑战和潜在的未来研究方向。

translated by 谷歌翻译

DeepAoANet: Learning Angle of Arrival from Software Defined Radios with Deep Neural Networks

Zhuangzhuang Dai , Yuhang He , Tran Vu , Niki Trigoni , Andrew Markham

分类：机器学习 | 机器人

2021-12-01

基于RF信号的方向查找和定位系统因多径传播而受到显着影响，特别是在室内环境中。现有算法（例如音乐）在多径存在的情况下解决到达角度（AOA）或在弱信号方案中操作时表现不佳。我们注意到数字采样的RF前端允许轻松分析信号和延迟组件。低成本软件定义的无线电（SDR）模块使能跨宽频谱的通道状态信息（CSI）提取，激励增强的到达角度（AOA）解决方案的设计。我们提出了一种深入的学习方法，可以从SDR多通道数据的单一快照派生AOA。我们比较和对比基于深度学习的角度分类和回归模型，准确地估计最多两个AOA。我们已经在不同平台上实施了推理引擎，实时提取了AOA，展示了我们方法的计算途径。为了证明我们的方法的效用，我们在各种视角（LOS）和非线视线中收集了来自四元通用线性阵列（ULA）的IQ（同步和正交组件）样本（ NLOS）环境，并发布了数据集。我们所提出的方法在确定撞击信号的数量并实现平均值为2 ^ {\ rIC} $ 2 ^ {\ cird} $时，我们提出的方法展示了出色的可靠性。

translated by 谷歌翻译

Estimating the Magnitude and Phase of Automotive Radar Signals under Multiple Interference Sources with Fully Convolutional Networks

Nicolae-Cătălin Ristea , Andrei Anghel , Radu Tudor Ionescu

分类：计算机视觉 | 机器学习

2020-08-11

雷达传感器逐渐成为道路车辆的广泛设备，在自主驾驶和道路安全中发挥着至关重要的作用。广泛采用雷达传感器增加了不同车辆的传感器之间干扰的可能性，产生损坏的范围曲线和范围 - 多普勒地图。为了从范围 - 多普勒地图中提取多个目标的距离和速度，需要减轻影响每个范围分布的干扰。本文提出了一种全卷积神经网络，用于汽车雷达干扰缓解。为了在真实的方案中培训我们的网络，我们介绍了具有多个目标和多个干扰的新数据集的现实汽车雷达信号。为了我们的知识，我们是第一个在汽车雷达领域施加体重修剪的施加量，与广泛使用的辍学相比获得了优越的结果。虽然最先前的作品成功地估计了汽车雷达信号的大小，但我们提出了一种可以准确估计相位的深度学习模型。例如，我们的新方法将相对于普通采用的归零技术的相位估计误差从12.55度到6.58度降低了一半。考虑到缺乏汽车雷达干扰缓解数据库，我们将释放开源我们的大规模数据集，密切复制了多次干扰案例的现实世界汽车场景，允许其他人客观地比较他们在该域中的未来工作。我们的数据集可用于下载：http：//github.com/ristea/arim-v2。

translated by 谷歌翻译

Proceedings of the 3rd International Workshop on Reading Music Systems

Jorge Calvo-Zaragoza , Alexander Pacha

分类：计算机视觉 | 机器学习

2022-12-01

The International Workshop on Reading Music Systems (WoRMS) is a workshop that tries to connect researchers who develop systems for reading music, such as in the field of Optical Music Recognition, with other researchers and practitioners that could benefit from such systems, like librarians or musicologists. The relevant topics of interest for the workshop include, but are not limited to: Music reading systems; Optical music recognition; Datasets and performance evaluation; Image processing on music scores; Writer identification; Authoring, editing, storing and presentation systems for music scores; Multi-modal systems; Novel input-methods for music to produce written music; Web-based Music Information Retrieval services; Applications and projects; Use-cases related to written music. These are the proceedings of the 3rd International Workshop on Reading Music Systems, held in Alicante on the 23rd of July 2021.

translated by 谷歌翻译

Sparse Signal Models for Data Augmentation in Deep Learning ATR

Tushar Agarwal , Nithin Sugavanam , Emre Ertin

分类：计算机视觉 | 机器学习

2020-12-16

自动目标识别（ATR）算法将给定的合成孔径雷达（SAR）图像分类为已知的目标类之一，使用一组可用于每个类的训练图像。最近，如果有丰富的训练数据可用，在类中均匀地采样及其姿势，则已经显示出学习方法可以实现最先进的分类精度。在本文中，我们考虑了ATR的任务，其中一组培训图像有限。我们提出了一种数据增强方法，以结合域知识并提高数据密集型学习算法的概括能力，例如卷积神经网络（CNN）。提出的数据增强方法采用有限的持久性稀疏建模方法，利用广角合成孔径雷达（SAR）图像的普遍观察到的特征。具体而言，我们利用空间结构域中的散射中心的稀疏性以及方位角域中散射系数的平滑结构，以解决过度分析模型拟合的缺陷问题。使用此估计的模型，我们合成了给定数据中没有可用的姿势和子像素翻译的新图像来增强CNN的培训数据。实验结果表明，对于训练数据饥饿的区域，提出的方法为结果ATR算法的泛化性能提供了显着增长。

translated by 谷歌翻译

Learning to Detect Open Carry and Concealed Object with 77GHz Radar

Xiangyu Gao , Hui Liu , Sumit Roy , Guanbin Xing , Ali Alansari , Youchen Luo

分类：计算机视觉

2021-10-31

检测有害的携带物体在智能监控系统中起着关键作用，例如，在机场安全中具有广泛的应用。在本文中，我们专注于使用低成本77GHz MMWVEAVE雷达的相对未开发的区域，用于携带物体检测问题。该建议的系统能够实时检测三类对象 - 笔记本电脑，手机和刀具 - 在开放的携带和隐藏的情况下，物体隐藏着衣服或袋子。这种能力是通过用于定位的初始信号处理来实现的，用于定位和生成范围 - 方位角升降图像立方体，然后是基于深度学习的预测网络和用于检测对象的多枪后处理模块。用于验证检测开放携带和隐藏物体的系统性能的广泛实验已经提出了一种自制雷达相机测试用和数据集。此外，分析了不同输入，因素和参数对系统性能的影响，为系统提供了直观的理解。该系统是旨在使用77GHz雷达检测携带物体的其他未来作品的第一个基线。

translated by 谷歌翻译

Integrating Deep Learning and Augmented Reality to Enhance Situational Awareness in Firefighting Environments

Manish Bhattarai

分类：计算机视觉

2021-07-23

我们提出了一种新的四管齐下的方法，在文献中首次建立消防员的情境意识。我们构建了一系列深度学习框架，彼此之叠，以提高消防员在紧急首次响应设置中进行的救援任务的安全性，效率和成功完成。首先，我们使用深度卷积神经网络（CNN）系统，以实时地分类和识别来自热图像的感兴趣对象。接下来，我们将此CNN框架扩展了对象检测，跟踪，分割与掩码RCNN框架，以及具有多模级自然语言处理（NLP）框架的场景描述。第三，我们建立了一个深入的Q学习的代理，免受压力引起的迷失方向和焦虑，能够根据现场消防环境中观察和存储的事实来制定明确的导航决策。最后，我们使用了一种低计算无监督的学习技术，称为张量分解，在实时对异常检测进行有意义的特征提取。通过这些临时深度学习结构，我们建立了人工智能系统的骨干，用于消防员的情境意识。要将设计的系统带入消防员的使用，我们设计了一种物理结构，其中处理后的结果被用作创建增强现实的投入，这是一个能够建议他们所在地的消防员和周围的关键特征，这对救援操作至关重要在手头，以及路径规划功能，充当虚拟指南，以帮助迷彩的第一个响应者恢复安全。当组合时，这四种方法呈现了一种新颖的信息理解，转移和综合方法，这可能会大大提高消防员响应和功效，并降低寿命损失。

translated by 谷歌翻译

Insights into Deep Non-linear Filters for Improved Multi-channel Speech Enhancement

Kristina Tesch , Timo Gerkmann

分类：机器学习

2022-06-27

使用多个麦克风进行语音增强的主要优点是，可以使用空间滤波来补充节奏光谱处理。在传统的环境中，通常单独执行线性空间滤波（波束形成）和单通道后过滤。相比之下，采用深层神经网络（DNN）有一种趋势来学习联合空间和速度 - 光谱非线性滤波器，这意味着对线性处理模型的限制以及空间和节奏单独处理的限制光谱信息可能可以克服。但是，尚不清楚导致此类数据驱动的过滤器以良好性能进行多通道语音增强的内部机制。因此，在这项工作中，我们通过仔细控制网络可用的信息源（空间，光谱和时间）来分析由DNN实现的非线性空间滤波器的性质及其与时间和光谱处理的相互依赖性。我们确认了非线性空间处理模型的优越性，该模型在挑战性的扬声器提取方案中优于Oracle线性空间滤波器，以低于0.24的POLQA得分，较少数量的麦克风。我们的分析表明，在特定的光谱信息中应与空间信息共同处理，因为这会提高过滤器的空间选择性。然后，我们的系统评估会导致一个简单的网络体系结构，该网络体系结构在扬声器提取任务上的最先进的网络体系结构优于0.22 POLQA得分，而CHIME3数据上的POLQA得分为0.32。

translated by 谷歌翻译

Statistical Hypothesis Testing Based on Machine Learning: Large Deviations Analysis

Paolo Braca , Leonardo M. Millefiori , Augusto Aubry , Stefano Marano , Antonio De Maio , Peter Willett

分类： (统计)机器学习 | 人工智能 | 机器学习

2022-07-22

我们研究了机器学习（ML）分类技术的误差概率收敛到零的速率的性能。利用大偏差理论，我们为ML分类器提供了数学条件，以表现出误差概率，这些误差概率呈指数级消失，例如$ \ sim \ exp \ left（-n \，i + o（i + o（n）\ right）$，其中$ n $是可用于测试的信息的数量（或其他相关参数，例如图像中目标的大小），而$ i $是错误率。这样的条件取决于数据驱动的决策功能的累积生成功能的Fenchel-Legendre变换（D3F，即，在做出最终二进制决策之前的阈值）在训练阶段中学到的。因此，D3F以及相关的错误率$ $ $取决于给定的训练集，该集合假定有限。有趣的是，可以根据基础统计模型的可用信息生成的可用数据集或合成数据集对这些条件进行验证和测试。换句话说，分类误差概率收敛到零，其速率可以在可用于培训的数据集的一部分上计算。与大偏差理论一致，我们还可以以足够大的$ n $为高斯分布的归一化D3F统计量来确定收敛性。利用此属性设置所需的渐近错误警报概率，从经验上来说，即使对于$ n $的非常现实的值，该属性也是准确的。此外，提供了近似错误概率曲线$ \ sim \ sim \ sim \ sim \ exp \ left（-n \，i \ right）$，这要归功于精制的渐近导数（通常称为精确的渐近学），其中$ \ zeta_n $代表$ \ zeta_n $误差概率的大多数代表性亚指数项。

translated by 谷歌翻译

Roadmap on Signal Processing for Next Generation Measurement Systems

D. K. Iakovidis , M. Ooi , Y. C. Kuang , S. Damidenko , A. Shestakov , V. Sinistin , M. Henry , A. Sciacchitano , A. Discetti , S. Donati

分类：人工智能 | 计算机视觉

2021-11-03

信号处理是几乎任何传感器系统的基本组件，具有不同科学学科的广泛应用。时间序列数据，图像和视频序列包括可以增强和分析信息提取和量化的代表性形式的信号。人工智能和机器学习的最近进步正在转向智能，数据驱动，信号处理的研究。该路线图呈现了最先进的方法和应用程序的关键概述，旨在突出未来的挑战和对下一代测量系统的研究机会。它涵盖了广泛的主题，从基础到工业研究，以简明的主题部分组织，反映了每个研究领域的当前和未来发展的趋势和影响。此外，它为研究人员和资助机构提供了识别新前景的指导。

translated by 谷歌翻译

Advances in Multi-Variate Analysis Methods for New Physics Searches at the Large Hadron Collider

Anna Stakia , Tommaso Dorigo , Giovanni Banelli , Daniela Bortoletto , Alessandro Casa , Pablo de Castro , Christophe Delaere , Julien Donini , Livio Finos , Michele Gallinaro

分类：机器学习

2021-05-16

在2015年和2019年之间，地平线的成员2020年资助的创新培训网络名为“Amva4newphysics”，研究了高能量物理问题的先进多变量分析方法和统计学习工具的定制和应用，并开发了完全新的。其中许多方法已成功地用于提高Cern大型Hadron撞机的地图集和CMS实验所执行的数据分析的敏感性;其他几个人，仍然在测试阶段，承诺进一步提高基本物理参数测量的精确度以及新现象的搜索范围。在本文中，在研究和开发的那些中，最相关的新工具以及对其性能的评估。

translated by 谷歌翻译

MIMO Channel Estimation using Score-Based Generative Models

Marius Arvinte , Jonathan I Tamir

分类：机器学习

2022-04-14

Channel estimation is a critical task in multiple-input multiple-output (MIMO) digital communications that substantially effects end-to-end system performance. In this work, we introduce a novel approach for channel estimation using deep score-based generative models. A model is trained to estimate the gradient of the logarithm of a distribution and is used to iteratively refine estimates given measurements of a signal. We introduce a framework for training score-based generative models for wireless MIMO channels and performing channel estimation based on posterior sampling at test time. We derive theoretical robustness guarantees for channel estimation with posterior sampling in single-input single-output scenarios, and experimentally verify performance in the MIMO setting. Our results in simulated channels show competitive in-distribution performance, and robust out-of-distribution performance, with gains of up to $5$ dB in end-to-end coded communication performance compared to supervised deep learning methods. Simulations on the number of pilots show that high fidelity channel estimation with $25$% pilot density is possible for MIMO channel sizes of up to $64 \times 256$. Complexity analysis reveals that model size can efficiently trade performance for estimation latency, and that the proposed approach is competitive with compressed sensing in terms of floating-point operation (FLOP) count.

translated by 谷歌翻译

HoughNet: Integrating near and long-range evidence for visual detection

Nermin Samet , Samet Hicsonmez , Emre Akbas

分类：计算机视觉

2021-04-14

本文介绍了Houghnet，这是一种单阶段，无锚，基于投票的，自下而上的对象检测方法。受到广义的霍夫变换的启发，霍尼特通过在该位置投票的总和确定了某个位置的物体的存在。投票是根据对数极极投票领域的近距离和长距离地点收集的。由于这种投票机制，Houghnet能够整合近距离和远程的班级条件证据以进行视觉识别，从而概括和增强当前的对象检测方法，这通常仅依赖于本地证据。在可可数据集中，Houghnet的最佳型号达到$ 46.4 $ $ $ ap $（和$ 65.1 $ $ $ ap_ {50} $），与自下而上的对象检测中的最先进的作品相同，超越了最重要的一项 - 阶段和两阶段方法。我们进一步验证了提案在其他视觉检测任务中的有效性，即视频对象检测，实例分割，3D对象检测和人为姿势估计的关键点检测以及其他“图像”图像生成任务的附加“标签”，其中集成的集成在所有情况下，我们的投票模块始终提高性能。代码可在https://github.com/nerminsamet/houghnet上找到。

translated by 谷歌翻译

Efficient deep learning models for land cover image classification

Ioannis Papoutsis , Nikolaos-Ioannis Bountos , Angelos Zavras , Dimitrios Michail , Christos Tryfonopoulos

分类：计算机视觉

2021-11-18

哥内克人Sentinel Imagery的纯粹卷的可用性为使用深度学习的大尺度创造了新的土地利用陆地覆盖（Lulc）映射的机会。虽然在这种大型数据集上培训是一个非琐碎的任务。在这项工作中，我们试验Lulc Image分类和基准不同最先进模型的Bigearthnet数据集，包括卷积神经网络，多层感知，视觉变压器，高效导通和宽残余网络（WRN）架构。我们的目标是利用分类准确性，培训时间和推理率。我们提出了一种基于用于网络深度，宽度和输入数据分辨率的WRNS复合缩放的高效导通的框架，以有效地训练和测试不同的模型设置。我们设计一种新颖的缩放WRN架构，增强了有效的通道注意力机制。我们提出的轻量级模型具有较小的培训参数，实现所有19个LULC类的平均F分类准确度达到4.5％，并且验证了我们使用的resnet50最先进的模型速度快两倍作为基线。我们提供超过50种培训的型号，以及我们在多个GPU节点上分布式培训的代码。

translated by 谷歌翻译