智能论文笔记

Multimodal SuperCon: Classifier for Drivers of Deforestation in Indonesia

Bella Septina Ika Hartanti , Valentino Vito , Aniati Murni Arymurthy , Andie Setiyoko

分类：计算机视觉 | 机器学习

2022-07-29

森林砍伐是导致气候变化的因素之一。气候变化对人类的生命有严重的影响，并且由于二氧化碳等温室气体的排放到大气中而发生。重要的是要了解缓解工作的森林砍伐原因，但是缺乏数据驱动的研究来预测这些森林砍伐驱动因素。在这项工作中，我们提出了一种称为多模式SuperCon的对比学习体系结构，用于使用从Landsat 8获得的卫星图像对印度尼西亚的森林砍伐进行分类。多模式SuperCon是一种结合了对比度学习和多模式融合以处理可用的Deforestation数据集的架构。我们提出的模型优于先前的驾驶员分类工作，与同一任务的最新旋转模型相比，准确性提高了7％。

translated by 谷歌翻译

An Asymmetric Contrastive Loss for Handling Imbalanced Datasets

Valentino Vito , Lim Yohanes Stefanus

分类：机器学习 | 计算机视觉 | (统计)机器学习

2022-07-14

对比学习是一种表示方法，该方法是通过将样品与其他类似样本进行对比，以使它们紧密地将其结合在一起，从而在特征空间中形成簇。学习过程通常是使用两阶段训练架构进行的，它利用对比度损失（CL）进行功能学习。对比度学习已被证明在处理不平衡数据集方面非常成功，其中某些课程的代表性过高，而另一些类的代表性不足。但是，以前的研究并未针对数据集进行不平衡的CL进行专门修改。在这项工作中，我们引入了一个不对称版本的Cl（称为ACL），以直接解决类不平衡问题。此外，我们提出了不对称的局灶性对比损失（AFCL）作为ACL和局灶性对比损失（FCL）的进一步概括。 FMNIST和ISIC 2018不平衡数据集的结果表明，AFCL能够以加权和未加权分类精度优于CL和FCL。在附录中，我们在熵上提供完整的公理处理以及完整的证明。

translated by 谷歌翻译

Multimodal contrastive learning for remote sensing tasks

Umangi Jain , Alex Wilson , Varun Gulshan

分类：计算机视觉 | 机器学习

2022-09-06

自我监督的方法在计算机视野领域表现出巨大的成功，包括在遥感和医学成像中的应用。最流行的基于损坏的方法，例如SIMCLR，MOCO，MOCO-V2，通过在图像上应用人为的增强来创建正对并将其与负面示例进行对比，从而使用同一图像的多个视图。尽管这些技术运行良好，但大多数这些技术都在ImageNet（以及类似的计算机视觉数据集）上进行了调整。尽管有一些尝试捕获积极样本中更丰富的变形集，但在这项工作中，我们探索了一种有希望的替代方法，可以在对比度学习框架内为遥感数据生成积极的示例。可以将来自同一位置的不同传感器捕获的图像可以被认为是同一场景的强烈增强实例，从而消除了探索和调整一套手工制作的强大增强的需求。在本文中，我们提出了一个简单的双编码框架，该框架已在Sentinel-1和Sentinel-2图像对的大型未标记数据集（〜1m）上进行了预训练。我们测试了两个遥感下游任务的嵌入：洪水分割和土地覆盖映射，并从经验上表明，从该技术中学到的嵌入优于通过积极的数据增强来收集积极示例的传统技术。

translated by 谷歌翻译

Evaluating Self and Semi-Supervised Methods for Remote Sensing Segmentation Tasks

Chaitanya Patel , Shashank Sharma , Varun Gulshan

分类：计算机视觉 | 机器学习

2021-11-19

我们对最近的自我和半监督ML技术进行严格的评估，从而利用未标记的数据来改善下游任务绩效，以河床分割的三个遥感任务，陆地覆盖映射和洪水映射。这些方法对于遥感任务特别有价值，因为易于访问未标记的图像，并获得地面真理标签通常可以昂贵。当未标记的图像（标记数据集之外）提供培训时，我们量化性能改进可以对这些遥感分割任务进行期望。我们还设计实验以测试这些技术的有效性，当测试集相对于训练和验证集具有域移位时。

translated by 谷歌翻译

Deep Pneumonia: Attention-Based Contrastive Learning for Class-Imbalanced Pneumonia Lesion Recognition in Chest X-rays

Xinxu Wei , Haohan Bai , Xianshi Zhang , Yongjie Li

分类：计算机视觉

2022-07-23

计算机辅助X射线肺炎病变识别对于准确诊断肺炎很重要。随着深度学习的出现，肺炎的识别准确性得到了极大的改善，但是由于胸部X射线的模糊外观，仍然存在一些挑战。在本文中，我们提出了一个深度学习框架，称为基于注意力的对比度学习，用于治疗X射线肺炎病变识别（表示为深肺炎）。我们采用自我监督的对比学习策略来预先培训模型，而无需使用额外的肺炎数据来完全挖掘有限的可用数据集。为了利用医生精心贴出的病变区域的位置信息，我们提出了面具引导的硬注意策略和特征学习，并具有对比度调节策略，这些策略分别应用于注意力图和提取功能，以指导模型以指导模型将更多注意力集中在病变区域，其中包含更多歧视性特征以改善识别性能。此外，我们采用班级平衡的损失，而不是传统的跨凝性作为分类的损失函数，以解决数据集中不同类别肺炎之间严重类失衡的问题。实验结果表明，我们提出的框架可以用作可靠的计算机辅助肺炎诊断系统，以帮助医生更好地诊断肺炎病例。

translated by 谷歌翻译

Rotation Equivariant Deforestation Segmentation and Driver Classification

Joshua Mitton , Roderick Murray-Smith

分类：计算机视觉 | 机器学习

2021-10-25

森林砍伐已成为气候变化的重要因素，并且由于这一点，分类驱动程序和预测森林砍伐的分割地图都引起了重大兴趣。在这项工作中，我们开发了一种旋转等级卷积神经网络模型，以预测驱动程序并从Landsat 8卫星图像生成砍伐森林事件的分割地图。这优于先前的方法对驱动程序进行分类并预测砍伐森林的分割图，在分割准确度提高了9％的分类精度和7％的改进。另外，该方法预测输入图像旋转下的稳定分割图，这确保了森林砍伐的预测区域不依赖于卫星的旋转方向。

translated by 谷歌翻译

Minimum Class Confusion based Transfer for Land Cover Segmentation in Rural and Urban Regions

Metehan Yalçın , Ahmet Alp Kındıroğlu , Furkan Burak Bağcı , Ufuk Uyan , Mahiye Uluyağmur Öztürk

分类：计算机视觉

2022-12-05

Transfer Learning methods are widely used in satellite image segmentation problems and improve performance upon classical supervised learning methods. In this study, we present a semantic segmentation method that allows us to make land cover maps by using transfer learning methods. We compare models trained in low-resolution images with insufficient data for the targeted region or zoom level. In order to boost performance on target data we experiment with models trained with unsupervised, semi-supervised and supervised transfer learning approaches, including satellite images from public datasets and other unlabeled sources. According to experimental results, transfer learning improves segmentation performance 3.4% MIoU (Mean Intersection over Union) in rural regions and 12.9% MIoU in urban regions. We observed that transfer learning is more effective when two datasets share a comparable zoom level and are labeled with identical rules; otherwise, semi-supervised learning is more effective by using the data as unlabeled. In addition, experiments showed that HRNet outperformed building segmentation approaches in multi-class segmentation.

translated by 谷歌翻译

Self-supervised Learning in Remote Sensing: A Review

Yi Wang , Conrad M Albrecht , Nassim Ait Ali Braham , Lichao Mou , Xiao Xiang Zhu

分类：计算机视觉

2022-06-27

在深度学习研究中，自学学习（SSL）引起了极大的关注，引起了计算机视觉和遥感社区的兴趣。尽管计算机视觉取得了很大的成功，但SSL在地球观测领域的大部分潜力仍然锁定。在本文中，我们对在遥感的背景下为计算机视觉的SSL概念和最新发展提供了介绍，并回顾了SSL中的概念和最新发展。此外，我们在流行的遥感数据集上提供了现代SSL算法的初步基准，从而验证了SSL在遥感中的潜力，并提供了有关数据增强的扩展研究。最后，我们确定了SSL未来研究的有希望的方向的地球观察（SSL4EO），以铺平了两个领域的富有成效的相互作用。

translated by 谷歌翻译

DAHiTrA: Damage Assessment Using a Novel Hierarchical Transformer Architecture

Navjot Kaur , Cheng-Chun Lee , Ali Mostafavi , Ali Mahdavi-Amiri

分类：计算机视觉

2022-08-03

本文介绍了Dahitra，这是一种具有分层变压器的新型深度学习模型，可在飓风后根据卫星图像对建筑物的损害进行分类。自动化的建筑损害评估为决策和资源分配提供了关键信息，以快速应急响应。卫星图像提供了实时，高覆盖的信息，并提供了向大规模污点后建筑物损失评估提供信息的机会。此外，深入学习方法已证明在对建筑物的损害进行分类方面有希望。在这项工作中，提出了一个基于变压器的新型网络来评估建筑物的损失。该网络利用多个分辨率的层次空间特征，并在将变压器编码器应用于空间特征后捕获特征域的时间差异。当对大规模灾难损坏数据集（XBD）进行测试以构建本地化和损坏分类以及在Levir-CD数据集上进行更改检测任务时，该网络将实现最先进的绩效。此外，我们引入了一个新的高分辨率卫星图像数据集，IDA-BD（与2021年路易斯安那州的2021年飓风IDA有关，以便域名适应以进一步评估该模型的能力，以适用于新损坏的区域。域的适应结果表明，所提出的模型可以适应一个新事件，只有有限的微调。因此，所提出的模型通过更好的性能和域的适应来推进艺术的当前状态。此外，IDA-BD也提供了A高分辨率注释的数据集用于该领域的未来研究。

translated by 谷歌翻译

Buildings Classification using Very High Resolution Satellite Imagery

Mohammad Dimassi , Abed Ellatif Samhat , Mohammad Zaraket , Jamal Haidar , Mustafa Shukor , Ali J. Ghandour

分类：计算机视觉

2021-11-29

使用卫星图像的建筑物分类对于诸如损害评估，资源分配和人口估算的若干应用而言变得越来越重要。在这项工作中，我们专注于建筑物损伤评估（BDA）和住宅和非住宅建筑的建筑物类型分类（BTC）。我们建议仅依赖于RGB卫星图像并遵循基于2级的深度学习的方法，其中使用语义分割模型提取建筑物的足迹，然后进行裁剪图像的分类。由于缺乏住宅/非住宅建筑物分类的适当数据集，我们介绍了一个新的高分辨率卫星图像数据集。我们进行广泛的实验，选择最佳的超参数，模型架构和培训范式，我们提出了一种新的转移基于学习的方法，以优于经典方法。最后，我们验证了两种应用中提出的方法，呈现出卓越的准确性和F1分数指标。

translated by 谷歌翻译

Dam reservoir extraction from remote sensing imagery using tailored metric learning strategies

Arnout van Soesbergen , Zedong Chu , Miaojing Shi , Mark Mulligan

分类：计算机视觉

2022-07-12

大坝水库在实现可持续发展目标和全球气候目标方面发挥着重要作用。但是，特别是对于小型水坝水库，其地理位置缺乏一致的数据。为了解决此数据差距，一种有前途的方法是根据全球可用的遥感图像进行自动水坝水库提取。它可以被认为是水体提取的精细颗粒任务，涉及在图像中提取水区，然后将水坝储层与天然水体分开。我们提出了一种基于新型的深神经网络（DNN）管道，该管道将大坝水库提取到水体分割和大坝储层识别中。首先将水体与分割模型中的背景土地分开，然后将每个水体预测为大坝储层或分类模型中的天然水体。对于以前的一步，将跨图像的点级度量学习注入分段模型，以解决水域和土地区域之间的轮廓模棱两可。对于后一个步骤，将带有簇的三重态的先前引导的度量学习注入到分类模型中，以根据储层簇在细粒度中优化图像嵌入空间。为了促进未来的研究，我们建立了一个带有地球图像数据的基准数据集，并从西非和印度的河流盆地标记为人类标记的水库。在水体分割任务，水坝水库识别任务和关节坝储层提取任务中，对这个基准进行了广泛的实验。将我们的方法与艺术方法的方法进行比较时，已经在各自的任务中观察到了卓越的性能。

translated by 谷歌翻译

The Outcome of the 2022 Landslide4Sense Competition: Advanced Landslide Detection from Multi-Source Satellite Imagery

Omid Ghorbanzadeh , Yonghao Xu , Hengwei Zhao , Junjue Wang , Yanfei Zhong , Dong Zhao , Qi Zang , Shuang Wang , Fahong Zhang , Yilei Shi

分类：计算机视觉

2022-09-06

这里介绍了人工智能研究所（IARAI）组织的2022年Landslide4sense（L4S）竞赛的科学结果。竞争的目的是根据全球收集的卫星图像的大规模多个来源自动检测滑坡。 2022 L4S旨在促进有关使用卫星图像的语义分割任务的深度学习模型（DL）模型最新发展的跨学科研究。在过去的几年中，由于卷积神经网络（CNN）的发展，基于DL的模型已经达到了对图像解释的期望。本文的主要目的是介绍本次比赛中介绍的细节和表现最佳的算法。获胜的解决方案详细介绍了Swin Transformer，Segformer和U-NET等最先进的模型。还考虑了先进的机器学习技术和诸如硬采矿，自我培训和混合数据增强之类的策略。此外，我们描述了L4S基准数据集，以促进进一步的比较，并在线报告准确性评估的结果。可以在\ textIt {未来开发排行榜上访问数据，以供将来评估，\ url {https://www.iarai.ac.ac.at/landslide4sense/challenge/}，并邀请研究人员提交更多预测结果，评估准确性在他们的方法中，将它们与其他用户的方法进行比较，理想情况下，改善了本文报告的滑坡检测结果。

translated by 谷歌翻译

Supervised Contrastive Learning

Prannay Khosla , Piotr Teterwak , Chen Wang , Aaron Sarna , Yonglong Tian , Phillip Isola , Aaron Maschinot , Ce Liu , Dilip Krishnan

分类：

2020-04-23

Contrastive learning applied to self-supervised representation learning has seen a resurgence in recent years, leading to state of the art performance in the unsupervised training of deep image models. Modern batch contrastive approaches subsume or significantly outperform traditional contrastive losses such as triplet, max-margin and the N-pairs loss. In this work, we extend the self-supervised batch contrastive approach to the fully-supervised setting, allowing us to effectively leverage label information. Clusters of points belonging to the same class are pulled together in embedding space, while simultaneously pushing apart clusters of samples from different classes. We analyze two possible versions of the supervised contrastive (SupCon) loss, identifying the best-performing formulation of the loss. On ResNet-200, we achieve top-1 accuracy of 81.4% on the Ima-geNet dataset, which is 0.8% above the best number reported for this architecture. We show consistent outperformance over cross-entropy on other datasets and two ResNet variants. The loss shows benefits for robustness to natural corruptions, and is more stable to hyperparameter settings such as optimizers and data augmentations. Our loss function is simple to implement and reference TensorFlow code is released at https://t.ly/supcon 1 .

translated by 谷歌翻译

Self-Supervised Learning for Invariant Representations from Multi-Spectral and SAR Images

Pallavi Jain , Bianca Schoen-Phelan , Robert Ross

分类：计算机视觉

2022-05-04

自我监督的学习（SSL）已成为几个领域分类和分割任务中的新最先进。其中，SSL中的一个流行类别是蒸馏网络，例如BYOL。这项工作提出了RSDNET，该RSDNET在遥感（RS）域中应用蒸馏网络（BYOL），其中数据与天然RGB图像无关。由于多光谱（MS）和合成孔径雷达（SAR）传感器提供各种光谱和空间分辨率信息，因此我们将它们用作隐式增强，以学习不变特征嵌入。为了通过SSL学习基于RS的不变功能，我们通过两种方式训练了RSDNET，即单频道功能学习和三个通道功能学习。与使用三个或更多频段的常见概念相比，这项工作探讨了从随机MS和SAR频段学习的单个通道特征学习的有用性。在我们的线性评估中，这些单个通道功能在EuroSat分类任务上达到了0.92 F1分数，对于某些单个频段，DFC分割任务上达到了59.6 MIOU。我们还将我们的结果与成像网的重量进行了比较，并表明基于RS的SSL模型的表现优于基于有监督的Imagenet模型。我们进一步探讨了多模式数据与单个模态数据相比的实用性，并且表明，使用MS和SAR数据比仅利用MS数据更好地学习不变表示。

translated by 谷歌翻译

Dual Path Structural Contrastive Embeddings for Learning Novel Objects

Bingbin Li , Elvis Han Cui , Yanan Li , Donghui Wang , Weng Kee Wong

分类：计算机视觉

2021-12-23

从一个非常少数标记的样品中学习新颖的课程引起了机器学习区域的越来越高。最近关于基于元学习或转移学习的基于范例的研究表明，良好特征空间的获取信息可以是在几次拍摄任务上实现有利性能的有效解决方案。在本文中，我们提出了一种简单但有效的范式，该范式解耦了学习特征表示和分类器的任务，并且只能通过典型的传送学习培训策略从基类嵌入体系结构的特征。为了在每个类别内保持跨基地和新类别和辨别能力的泛化能力，我们提出了一种双路径特征学习方案，其有效地结合了与对比特征结构的结构相似性。以这种方式，内部级别对齐和级别的均匀性可以很好地平衡，并且导致性能提高。三个流行基准测试的实验表明，当与简单的基于原型的分类器结合起来时，我们的方法仍然可以在电感或转换推理设置中的标准和广义的几次射击问题达到有希望的结果。

translated by 谷歌翻译

Learning crop type mapping from regional label proportions in large-scale SAR and optical imagery

Laura E. C. La Rosa , Dario A. B. Oliveira , Pedram Ghamisi

分类：计算机视觉

2022-08-24

近年来，深度学习算法在地球观察（EO）中的应用使依赖远程感知数据的领域取得了重大进展。但是，鉴于EO中的数据量表，创建具有专家使用像素级注释的大型数据集是昂贵且耗时的。在这种情况下，先验被视为一种有吸引力的方法，可以减轻在训练EO的深度学习方法时手动标签的负担。对于某些应用，这些先验很容易获得。本研究以许多计算机视觉任务中的自我监督特征表示学习的对比学习方法取得了巨大成功的动机，本研究提出了一种使用作物标签比例的在线深度聚类方法，作为研究基于政府作物的样本级别的先验者 - 整个农业地区的比例数据。我们使用来自巴西两个不同农业地区的两个大数据集评估了该方法。广泛的实验表明，该方法对不同的数据类型（合成句子雷达和光学图像）具有鲁棒性，考虑到目标区域中主要的作物类型，报告了更高的精度值。因此，它可以减轻EO应用中大规模图像注释的负担。

translated by 谷歌翻译

HTML版本

GeoCLR: Georeference Contrastive Learning for Efficient Seafloor Image Interpretation

Takaki Yamada , Adam Prügel-Bennett , Stefan B. Williams , Oscar Pizarro , Blair Thornton

分类：计算机视觉

2021-08-13

本文介绍了视觉表示（GEOCLR）的地理化对比度学习，以有效地训练深度学习卷积神经网络（CNN）。该方法通过使用附近位置拍摄的图像生成相似的图像对来利用地理网络信息，并将这些图像与相距遥远的图像对进行对比。基本的假设是，在近距离内收集的图像更可能具有相似的视觉外观，在海底机器人成像应用中可以合理地满足图像，在这些应用中，图像足迹仅限于几米的边缘长度，并将其重叠以使其重叠沿着车辆的轨迹，而海底底物和栖息地的斑块大小要大得多。这种方法的一个关键优点是它是自我监督的，并且不需要任何人类的CNN培训投入。该方法在计算上是有效的，可以使用在大多数海洋现场试验中可以访问的计算资源在多天AUV任务中之间的潜水之间产生结果。我们将GEOCLR应用于数据集上的栖息地分类，该数据集由使用自动水下车辆（AUV）收集的〜86K图像组成。我们演示了GEOCLR产生的潜在表示如何有效地指导人类注释工作，而与使用相同的CNN和同一CNN和最先进的SIMCLR相比，半监督框架平均将分类精度提高了10.2％。等效的人类注释培训。

translated by 谷歌翻译

Contrastive Learning for Automotive mmWave Radar Detection Points Based Instance Segmentation

Weiyi Xiong , Jianan Liu , Yuxuan Xia , Tao Huang , Bing Zhu , Wei Xiang

分类：计算机视觉

2022-03-13

汽车MMWAVE雷达在高级驾驶员辅助系统（ADA）和自动驾驶中起关键作用。基于深度学习的实例细分可以从雷达检测点实时对象识别。在常规培训过程中，准确的注释是关键。然而，由于雷达检测点的高质量注释，由于其歧义和稀疏性，要实现挑战。为了解决这个问题，我们提出了一种实施基于雷达检测点的实例细分的对比学习方法。我们根据地面真相标签定义正面和负样品，将对比度损失首先训练模型，然后对以下下游任务进行微调。此外，可以将这两个步骤合并为一个，并且可以为未标记的数据生成伪标签，以进一步提高性能。因此，我们的方法有四种不同的培训设置。实验表明，当仅适用于一小部分培训数据时，我们的方法仍然可以与以100％基真实信息进行监督的方式实现可比的性能。

translated by 谷歌翻译

Constructing Contrastive samples via Summarization for Text Classification with limited annotations

Yangkai Du , Tengfei Ma , Lingfei Wu , Fangli Xu , Xuhong Zhang , Bo Long , Shouling Ji

分类：自然语言处理 | 机器学习

2021-04-11

对比学习被出现为强大的代表学习方法，促进各种下游任务，特别是当监督数据有限时。如何通过数据增强构建有效的对比样本是其成功的关键。与视觉任务不同，语言任务中尚未对对比学习进行对比学习的数据增强方法。在本文中，我们提出了一种使用文本摘要构建语言任务的对比样本的新方法。我们使用这些样本进行监督的对比学习，以获得更好的文本表示，这极大地利用了具有有限注释的文本分类任务。为了进一步改进该方法，除了交叉熵损失之外，我们将从不同类中的样本混合并添加一个名为MIXSUM的额外正则化。真实世界文本分类数据集（Amazon-5，Yelp-5，AG新闻和IMDB）的实验展示了基于摘要的数据增强和MIXSUM正规化的提议对比学习框架的有效性。

translated by 谷歌翻译

SiamixFormer: A Siamese Transformer Network For Building Detection And Change Detection From Bi-Temporal Remote Sensing Images

Amir mohammadian , Foad Ghaderi

分类：计算机视觉

2022-08-01

使用遥感图像进行建筑检测和变更检测可以帮助城市和救援计划。此外，它们可用于自然灾害后的建筑损害评估。当前，大多数用于建筑物检测的现有模型仅使用一个图像（预拆架图像）来检测建筑物。这是基于这样的想法：由于存在被破坏的建筑物，后沙仪图像降低了模型的性能。在本文中，我们提出了一种称为暹罗形式的暹罗模型，该模型使用前和垃圾后图像作为输入。我们的模型有两个编码器，并具有分层变压器体系结构。两个编码器中每个阶段的输出都以特征融合的方式给予特征融合，以从disasaster图像生成查询，并且（键，值）是从disasaster图像中生成的。为此，在特征融合中也考虑了时间特征。在特征融合中使用颞变压器的另一个优点是，与CNN相比，它们可以更好地维持由变压器编码器产生的大型接受场。最后，在每个阶段，将颞变压器的输出输入简单的MLP解码器。在XBD和WHU数据集上评估了暹罗形式模型，用于构建检测以及Levir-CD和CDD数据集，以进行更改检测，并可以胜过最新的。

translated by 谷歌翻译