智能论文笔记

Adversarial Feature Augmentation for Cross-domain Few-shot Classification

Yanxu Hu , Andy J. Ma

分类：计算机视觉

2022-08-23

基于元学习的现有方法通过从（源域）基础类别的培训任务中学到的元知识来预测（目标域）测试任务的新颖类标签。但是，由于范围内可能存在较大的域差异，大多数现有作品可能无法推广到新颖的类别。为了解决这个问题，我们提出了一种新颖的对抗特征增强（AFA）方法，以弥合域间隙，以几乎没有学习。该特征增强旨在通过最大化域差异来模拟分布变化。在对抗训练期间，通过将增强特征（看不见的域）与原始域（可见域）区分开来学习域歧视器，而将域差异最小化以获得最佳特征编码器。所提出的方法是一个插件模块，可以轻松地基于元学习的方式将其集成到现有的几种学习方法中。在九个数据集上进行的广泛实验证明了我们方法对跨域几乎没有射击分类的优越性，与最新技术相比。代码可从https://github.com/youthhoo/afa_for_few_shot_learning获得

translated by 谷歌翻译

TGDM: Target Guided Dynamic Mixup for Cross-Domain Few-Shot Learning

Linhai Zhuo , Yuqian Fu , Jingjing Chen , Yixin Cao , Yu-Gang Jiang

分类：计算机视觉

2022-10-11

Given sufficient training data on the source domain, cross-domain few-shot learning (CD-FSL) aims at recognizing new classes with a small number of labeled examples on the target domain. The key to addressing CD-FSL is to narrow the domain gap and transferring knowledge of a network trained on the source domain to the target domain. To help knowledge transfer, this paper introduces an intermediate domain generated by mixing images in the source and the target domain. Specifically, to generate the optimal intermediate domain for different target data, we propose a novel target guided dynamic mixup (TGDM) framework that leverages the target data to guide the generation of mixed images via dynamic mixup. The proposed TGDM framework contains a Mixup-3T network for learning classifiers and a dynamic ratio generation network (DRGN) for learning the optimal mix ratio. To better transfer the knowledge, the proposed Mixup-3T network contains three branches with shared parameters for classifying classes in the source domain, target domain, and intermediate domain. To generate the optimal intermediate domain, the DRGN learns to generate an optimal mix ratio according to the performance on auxiliary target data. Then, the whole TGDM framework is trained via bi-level meta-learning so that TGDM can rectify itself to achieve optimal performance on target data. Extensive experimental results on several benchmark datasets verify the effectiveness of our method.

translated by 谷歌翻译

A Closer Look at Few-shot Classification

Wei-Yu Chen , Yen-Cheng Liu , Zsolt Kira , Yu-Chiang Frank Wang , Jia-Bin Huang

分类：

2019-04-08

Few-shot classification aims to learn a classifier to recognize unseen classes during training with limited labeled examples. While significant progress has been made, the growing complexity of network designs, meta-learning algorithms, and differences in implementation details make a fair comparison difficult. In this paper, we present 1) a consistent comparative analysis of several representative few-shot classification algorithms, with results showing that deeper backbones significantly reduce the performance differences among methods on datasets with limited domain differences, 2) a modified baseline method that surprisingly achieves competitive performance when compared with the state-of-the-art on both the mini-ImageNet and the CUB datasets, and 3) a new experimental setting for evaluating the cross-domain generalization ability for few-shot classification algorithms. Our results reveal that reducing intra-class variation is an important factor when the feature backbone is shallow, but not as critical when using deeper backbones. In a realistic cross-domain evaluation setting, we show that a baseline method with a standard fine-tuning practice compares favorably against other state-of-the-art few-shot learning algorithms.

translated by 谷歌翻译

Few-Shot Classification in Unseen Domains by Episodic Meta-Learning Across Visual Domains

Yuan-Chia Cheng , Ci-Siang Lin , Fu-En Yang , Yu-Chiang Frank Wang

分类：计算机视觉

2021-12-27

少量分类旨在执行分类，因为只有利息类别的标记示例。尽管提出了几种方法，但大多数现有的几次射击学习（FSL）模型假设基础和新颖类是从相同的数据域中汲取的。在识别在一个看不见的域中的新型类数据方面，这成为域广义少量分类的更具挑战性的任务。在本文中，我们为域广义的少量拍摄分类提供了一个独特的学习框架，其中基类来自同质的多个源域，而要识别的新类是来自训练期间未见的目标域。通过推进元学习策略，我们的学习框架跨越多个源域利用数据来捕获域不变的功能，通过基于度量学习的机制跨越支持和查询数据来引入FSL能力。我们进行广泛的实验，以验证我们提出的学习框架和展示从小但同质源数据的效果，能够优选地对来自大规模的学习来执行。此外，我们为域广泛的少量分类提供了骨干模型的选择。

translated by 谷歌翻译

Ranking Distance Calibration for Cross-Domain Few-Shot Learning

Pan Li , Shaogang Gong , Yanwei Fu , Chengjie Wang

分类：计算机视觉 | 机器学习

2021-12-01

近期学习中的最新进展促进了一个更现实的跨域设置，其中源和目标数据集来自不同的域。由于源极和目标数据集之间的域间隙和脱节标签空间，它们的共享知识非常有限。这鼓励我们探索目标域中的更多信息，而不是在许多现有方法中探讨源域上的训练策略。因此，我们从跨熵丢失和传统的基于距离的分类器一起训练的通用表示开始，以及图像检索视图，以采用通过发现互易k校准目标距离矩阵的重新排序处理任务中的最邻居。假设预先训练的表示被偏向源，我们构建非线性子空间，以最小化其任务无关的特征，同时通过双曲线切线转换保持更可传输的判别信息。该目标感知非线性子空间中的校准距离与预训练的表示中的互补距离。为了将这种距离校准信息施加到预训练的表示上，采用Kullback-Leibler发散丢失来逐渐引导模型朝向基于校准的距离的分布。关于八个目标域的广泛评估表明，该目标排名校准过程可以在几次拍摄学习中改善基于距离的基于距离的分类器。

translated by 谷歌翻译

Out-of-Domain Generalization from a Single Source: An Uncertainty Quantification Approach

Xi Peng , Fengchun Qiao , Long Zhao

分类：计算机视觉

2021-08-05

我们关注模型概括中最坏的情况，因为一个模型旨在在许多看不见的域上表现良好，而只有一个单个域可供训练。我们提出基于元学习的对抗领域的增强，以解决此范围泛化问题。关键思想是利用对抗性训练来创建“虚构的”但“具有挑战性”的人群，模型可以从中学会通过理论保证进行概括。为了促进快速和理想的域增强，我们将模型训练施加在元学习方案中，并使用Wasserstein自动编码器放宽广泛使用的最坏情况的约束。我们通过整合有效域概括的不确定性定量来进一步改善我们的方法。在多个基准数据集上进行的广泛实验表明其在解决单个领域概括方面的出色性能。

translated by 谷歌翻译

Omni-Training: Bridging Pre-Training and Meta-Training for Few-Shot Learning

Yang Shu , Zhangjie Cao , Jinghan Gao , Jianmin Wang , Philip S. Yu , Mingsheng Long

分类：机器学习

2021-10-14

Few-shot learning aims to fast adapt a deep model from a few examples. While pre-training and meta-training can create deep models powerful for few-shot generalization, we find that pre-training and meta-training focuses respectively on cross-domain transferability and cross-task transferability, which restricts their data efficiency in the entangled settings of domain shift and task shift. We thus propose the Omni-Training framework to seamlessly bridge pre-training and meta-training for data-efficient few-shot learning. Our first contribution is a tri-flow Omni-Net architecture. Besides the joint representation flow, Omni-Net introduces two parallel flows for pre-training and meta-training, responsible for improving domain transferability and task transferability respectively. Omni-Net further coordinates the parallel flows by routing their representations via the joint-flow, enabling knowledge transfer across flows. Our second contribution is the Omni-Loss, which introduces a self-distillation strategy separately on the pre-training and meta-training objectives for boosting knowledge transfer throughout different training stages. Omni-Training is a general framework to accommodate many existing algorithms. Evaluations justify that our single framework consistently and clearly outperforms the individual state-of-the-art methods on both cross-task and cross-domain settings in a variety of classification, regression and reinforcement learning problems.

translated by 谷歌翻译

FS-BAN: Born-Again Networks for Domain Generalization Few-Shot Classification

Yunqing Zhao , Ngai-Man Cheung

分类：计算机视觉

2022-08-23

常规的几杆分类（FSC）旨在识别出有限标记的数据的新课程中的样本。最近，已经提出了域泛化FSC（DG-FSC），目的是识别来自看不见的域的新型类样品。 DG-FSC由于基础类（用于培训）和新颖类（评估中遇到）之间的域移位，对许多模型构成了巨大的挑战。在这项工作中，我们为解决DG-FSC做出了两个新颖的贡献。我们的首要贡献是提出重生网络（BAN）情节培训，并全面研究其对DG-FSC的有效性。作为一种特定的知识蒸馏形式，已证明禁令可以通过封闭式设置来改善常规监督分类的概括。这种改善的概括促使我们研究了DG-FSC的禁令，我们表明禁令有望解决DG-FSC中遇到的域转移。在令人鼓舞的发现的基础上，我们的第二个（主要）贡献是提出很少的禁令，FS-Ban，这是DG-FSC的新型禁令方法。我们提出的FS-BAN包括新颖的多任务学习目标：相互正则化，不匹配的老师和元控制温度，这些目标都是专门设计的，旨在克服DG-FSC中的中心和独特挑战，即过度拟合和领域差异。我们分析了这些技术的不同设计选择。我们使用六个数据集和三个基线模型进行全面的定量和定性分析和评估。结果表明，我们提出的FS-BAN始终提高基线模型的概括性能，并达到DG-FSC的最先进的准确性。

translated by 谷歌翻译

ReFine: Re-randomization before Fine-tuning for Cross-domain Few-shot Learning

Jaehoon Oh , Sungnyun Kim , Namgyu Ho , Jin-Hwa Kim , Hwanjun Song , Se-Young Yun

分类：计算机视觉

2022-05-11

跨域很少的学习（CD-FSL）最近几乎没有目标样本在源和目标域之间存在极端差异，最近引起了极大的关注。对于CD-FSL，最近的研究通常开发了基于转移学习的方法，该方法预先培训了受欢迎的标记源域数据集的神经网络，然后将其传输到目标域数据。尽管标记的数据集可以为目标数据提供合适的初始参数，但源和目标之间的域差异可能会阻碍目标域上的微调。本文提出了一种简单而功能强大的方法，该方法在适应目标数据之前将源域上拟合的参数重新传递。重新运行重置源预训练模型的特定于源特异性参数，从而促进了目标域上的微调，从而改善了几乎没有射击性能。

translated by 谷歌翻译

Cross-Domain Few-Shot Relation Extraction via Representation Learning and Domain Adaptation

Zhongju Yuan , Zhenkun Wang , Genghui Li

分类：自然语言处理 | 人工智能

2022-12-05

Cross-domain few-shot relation extraction poses a great challenge for the existing few-shot learning methods and domain adaptation methods when the source domain and target domain have large discrepancies. This paper proposes a method by combining the idea of few-shot learning and domain adaptation to deal with this problem. In the proposed method, an encoder, learned by optimizing a representation loss and an adversarial loss, is used to extract the relation of sentences in the source and target domain. The representation loss, including a cross-entropy loss and a contrastive loss, makes the encoder extract the relation of the source domain and keep the geometric structure of the classes in the source domain. And the adversarial loss is used to merge the source domain and target domain. The experimental results on the benchmark FewRel dataset demonstrate that the proposed method can outperform some state-of-the-art methods.

translated by 谷歌翻译

Learning to Learn Single Domain Generalization

Fengchun Qiao , Long Zhao , Xi Peng

分类：

2020-03-30

We are concerned with a worst-case scenario in model generalization, in the sense that a model aims to perform well on many unseen domains while there is only one single domain available for training. We propose a new method named adversarial domain augmentation to solve this Outof-Distribution (OOD) generalization problem. The key idea is to leverage adversarial training to create "fictitious" yet "challenging" populations, from which a model can learn to generalize with theoretical guarantees. To facilitate fast and desirable domain augmentation, we cast the model training in a meta-learning scheme and use a Wasserstein Auto-Encoder (WAE) to relax the widely used worst-case constraint. Detailed theoretical analysis is provided to testify our formulation, while extensive experiments on multiple benchmark datasets indicate its superior performance in tackling single domain generalization.

translated by 谷歌翻译

An Unsupervised Domain Adaptation Model based on Dual-module Adversarial Training

Yiju Yang , Tianxiao Zhang , Guanyu Li , Taejoon Kim , Guanghui Wang

分类：机器学习 | 计算机视觉

2021-12-31

在本文中，我们提出了一种使用域鉴别特征模块的双模块网络架构，以鼓励域不变的特征模块学习更多域不变的功能。该建议的架构可以应用于任何利用域不变功能的任何模型，用于无监督域适应，以提高其提取域不变特征的能力。我们在作为代表性算法的神经网络（DANN）模型的区域 - 对抗训练进行实验。在培训过程中，我们为两个模块提供相同的输入，然后分别提取它们的特征分布和预测结果。我们提出了差异损失，以找到预测结果的差异和两个模块之间的特征分布。通过对抗训练来最大化其特征分布和最小化其预测结果的差异，鼓励两个模块分别学习更多域歧视和域不变特征。进行了广泛的比较评估，拟议的方法在大多数无监督的域适应任务中表现出最先进的。

translated by 谷歌翻译

Adaptive Domain Generalization via Online Disagreement Minimization

Xin Zhang , Ying-Cong Chen

分类：计算机视觉 | 机器学习

2022-08-03

当部署和培训之间存在分配变化时，深层神经网络的性能恶化严重。域的概括（DG）旨在通过仅依靠一组源域来安全地传输模型以看不见目标域。尽管已经提出了各种DG方法，但最近的一项名为Domainbed的研究表明，其中大多数没有超过简单的经验风险最小化（ERM）。为此，我们提出了一个通用框架，该框架与现有的DG算法是正交的，并且可以始终如一地提高其性能。与以前的DG作品不同的是，在静态源模型上有希望成为通用的DG，我们提出的ADAODM会在测试时间适应不同目标域的源模型。具体而言，我们在共享域形式的特征提取器上创建多个域特异性分类器。特征提取器和分类器以对抗性方式进行了训练，其中特征提取器将输入样品嵌入到域不变的空间中，并且多个分类器捕获了每个分类器与特定源域有关的独特决策边界。在测试过程中，可以通过利用源分类器之间的预测分歧来有效地衡量目标和源域之间的分布差异。通过微调源模型以最大程度地减少测试时间的分歧，目标域特征与不变特征空间很好地对齐。我们验证了两种流行的DG方法，即ERM和Coral，以及四个DG基准，即VLCS，PACS，OfficeHome和TerrainCognita。结果表明，ADAODM稳定地提高了对看不见的域的概括能力，并实现了最先进的性能。

translated by 谷歌翻译

Deep Metric Learning for Few-Shot Image Classification: A Review of Recent Developments

Xiaoxu Li , Xiaochen Yang , Zhanyu Ma , Jing-Hao Xue

分类：计算机视觉 | 机器学习

2021-05-17

很少有图像分类是一个具有挑战性的问题，旨在仅基于少量培训图像来达到人类的识别水平。少数图像分类的一种主要解决方案是深度度量学习。这些方法是，通过将看不见的样本根据距离的距离进行分类，可在强大的深神经网络中学到的嵌入空间中看到的样品，可以避免以少数图像分类的少数训练图像过度拟合，并实现了最新的图像表现。在本文中，我们提供了对深度度量学习方法的最新审查，以进行2018年至2022年的少量图像分类，并根据度量学习的三个阶段将它们分为三组，即学习功能嵌入，学习课堂表示和学习距离措施。通过这种分类法，我们确定了他们面临的不同方法和问题的新颖性。我们通过讨论当前的挑战和未来趋势进行了少量图像分类的讨论。

translated by 谷歌翻译

Combat Data Shift in Few-shot Learning with Knowledge Graph

Yongchun Zhu , Fuzhen Zhuang , Xiangliang Zhang , Zhiyuan Qi , Zhiping Shi , Juan Cao , Qing He

分类：机器学习 | 人工智能

2021-01-27

在元学习框架下设计了许多射门学习方法，这些方法从各种学习任务中学习并推广到新任务。这些元学习方法在从同一分布（I.I.D.观察）中绘制的所有样本中的情况下实现了预期的性能。然而，在现实世界应用中，很少拍摄的学习范式往往遭受数据转移，即，即使在相同的任务中，也可以从各种数据分布中汲取不同任务中的示例。大多数现有的几次拍摄方法不考虑数据班次，因此在数据分布换档时显示降级性能。然而，由于每个任务中的标记样本数量有限的标记样本，因此在几次拍摄学习中解决数据转换问题是不普遍的。针对解决此问题，我们提出了一种新的基于度量的元学习框架，以便在知识图表的帮助下提取任务特定的表示和任务共享表示。因此，任务内的数据偏移可以通过任务共享和特定于任务的表示的组合来组合。拟议的模型是对流行的基准测试和两个构造的新具有挑战性的数据集。评估结果表明了其显着性能。

translated by 谷歌翻译

Cross-Domain Cross-Set Few-Shot Learning via Learning Compact and Aligned Representations

Wentao Chen , Zhang Zhang , Wei Wang , Liang Wang , Zilei Wang , Tieniu Tan

分类：计算机视觉

2022-07-16

很少有射击学习（FSL）旨在通过利用基本数据集的先验知识来识别只有几个支持样本的新奇查询。在本文中，我们考虑了FSL中的域移位问题，并旨在解决支持集和查询集之间的域间隙。不同于以前考虑基础和新颖类之间的域移位的跨域FSL工作（CD-FSL），新问题称为跨域跨集FSL（CDSC-FSL），不仅需要很少的学习者适应新的领域，但也要在每个新颖类中的不同领域之间保持一致。为此，我们提出了一种新颖的方法，即Stabpa，学习原型紧凑和跨域对准表示，以便可以同时解决域的转移和很少的学习学习。我们对分别从域和办公室数据集构建的两个新的CDCS-FSL基准进行评估。值得注意的是，我们的方法的表现优于多个详细的基线，例如，在域内，将5-shot精度提高了6.0点。代码可从https://github.com/wentaochen0813/cdcs-fsl获得

translated by 谷歌翻译

LibFewShot: A Comprehensive Library for Few-shot Learning

Wenbin Li , Chuanqi Dong , Pinzhuo Tian , Tiexin Qin , Xuesong Yang , Ziyi Wang , Jing Huo , Yinghuan Shi , Lei Wang , Yang Gao

分类：计算机视觉

2021-09-10

少量学习，特别是几秒钟的图像分类，近年来受到了越来越多的关注，并目睹了重大进展。最近的一些研究暗示表明，许多通用技术或“诀窍”，如数据增强，预训练，知识蒸馏和自我监督，可能大大提高了几次学习方法的性能。此外，不同的作品可以采用不同的软件平台，不同的训练计划，不同的骨干架构以及甚至不同的输入图像大小，使得公平的比较困难，从业者与再现性斗争。为了解决这些情况，通过在Pytorch中的同一单个代码库中重新实施17个最新的框架，提出了几次射门学习（Libfewshot）的全面图书馆。此外，基于libfewshot，我们提供多个基准数据集的全面评估，其中包含多个骨干架构，以评估不同培训技巧的常见缺陷和效果。此外，鉴于近期对必要性或未培训机制的必要性怀疑，我们的评估结果表明，特别是当与预训练相结合时，仍然需要这种机制。我们希望我们的工作不仅可以降低初学者的障碍，可以在几次学习上工作，而且还消除了非动力技巧的影响，促进了几枪学习的内在研究。源代码可从https://github.com/rl-vig/libfewshot获取。

translated by 谷歌翻译

A Survey of Unsupervised Domain Adaptation for Visual Recognition

Youshan Zhang

分类：计算机视觉

2021-12-13

虽然在许多域内生成并提供了大量的未标记数据，但对视觉数据的自动理解的需求高于以往任何时候。大多数现有机器学习模型通常依赖于大量标记的训练数据来实现高性能。不幸的是，在现实世界的应用中，不能满足这种要求。标签的数量有限，手动注释数据昂贵且耗时。通常需要将知识从现有标记域传输到新域。但是，模型性能因域之间的差异（域移位或数据集偏差）而劣化。为了克服注释的负担，域适应（DA）旨在在将知识从一个域转移到另一个类似但不同的域中时减轻域移位问题。无监督的DA（UDA）处理标记的源域和未标记的目标域。 UDA的主要目标是减少标记的源数据和未标记的目标数据之间的域差异，并在培训期间在两个域中学习域不变的表示。在本文中，我们首先定义UDA问题。其次，我们从传统方法和基于深度学习的方法中概述了不同类别的UDA的最先进的方法。最后，我们收集常用的基准数据集和UDA最先进方法的报告结果对视觉识别问题。

translated by 谷歌翻译

Learn-to-Decompose: Cascaded Decomposition Network for Cross-Domain Few-Shot Facial Expression Recognition

Xinyi Zou , Yan Yan , Jing-Hao Xue , Si Chen , Hanzi Wang

分类：计算机视觉

2022-07-16

大多数现有的复合面部表达识别（FER）方法依赖于用于训练的大型化合物表达数据。但是，收集此类数据是劳动密集型且耗时的。在本文中，我们解决了跨域少数学习（FSL）设置中的复合FER任务，该设置仅需要几个在目标域中的复合表达式样本。具体而言，我们提出了一个新型的级联分解网络（CDNET），该网络将基于顺序分解机制的几个学习到分解模块层叠，以获得可转移的特征空间。为了减轻我们任务中基本班级有限的过度拟合问题，部分正则化策略旨在有效利用情节培训和批处理培训的最佳功能。通过在多个基本表达数据集上进行类似任务的培训，CDNET了解了可以轻松适应以识别看不见的化合物表达式的学习能力。对利润和野外复合表达数据集进行的广泛实验证明了我们提出的CDNET与几种最先进的FSL方法的优越性。代码可在以下网址获得：https：//github.com/zouxinyi0625/cdnet。

translated by 谷歌翻译

Cross-Domain Few-Shot Classification via Inter-Source Stylization

Huali Xu , Li Liu

分类：计算机视觉

2022-08-17

跨域很少的射击分类（CDFSC）利用从监督的辅助数据集中学到的先验知识来解决目标任务，而有限的监督信息可用，辅助数据集和目标数据集来自不同的域。由于这些数据集之间的域移动，这是具有挑战性的。受到多源域适应性（MDA）的启发，最近的作品介绍了多个域以改善性能。但是，一方面，他们只用自然图像在基准上进行评估，另一方面，即使在源域中，它们也需要许多注释。为了解决上述问题，本文探讨了一个新的多源CDFSC设置（MCDFSC），其中只有一个源域被完全标记，而其余源域仍然没有标记。这些来源来自不同的归档，意味着它们不仅是自然图像。考虑到CNN的归纳偏置，本文建议针对这种新的MCDFSC设置拟议中源式样式网络（ISSNET）。它将未标记源的样式转移到标记的源，从而扩展了标记的源分布并进一步提高了模型的概括能力。 8个目标数据集的实验证明ISSNET有效地抑制了由不同域引起的性能降解。

translated by 谷歌翻译