智能论文笔记

On Multi-Domain Long-Tailed Recognition, Imbalanced Domain Generalization and Beyond

Yuzhe Yang , Hao Wang , Dina Katabi

分类：机器学习 | 人工智能 | 计算机视觉

2022-03-17

现实世界中的数据通常显示出不平衡的标签分布。有关数据不平衡的现有研究集中在单域设置上，即样本来自相同的数据分布。但是，自然数据可以起源于不同的领域，在一个领域中的少数族裔可以从其他域中具有丰富的实例。我们正式化了多域长尾识别（MDLT）的任务，该任务从多域不平衡数据中学习，解决了跨域的标签不平衡，域移动和不同标签分布，并将其推广到所有域级对。我们首先开发了域类的可传递性图，并表明这种可传递性决定了MDLT中学习的成功。然后，我们提出了Boda，这是一种理论上的学习策略，可以跟踪可转移性统计的上限，并确保跨域级分布之间的平衡对齐和校准。我们策划了基于广泛使用的多域数据集的五个MDLT基准测试，并将BODA与跨越不同学习策略的二十个算法进行比较。广泛而严格的实验验证了BODA的出色性能。此外，作为副产品，Boda建立了有关域泛化基准测试的新的最新最先进，强调了解决跨域数据不平衡的重要性，这对于改善概括至看不见的域可能至关重要。代码和数据可在以下网址获得：https：//github.com/yyzharry/multi-domain-mmbalance。

translated by 谷歌翻译

Class-Aware Universum Inspired Re-Balance Learning for Long-Tailed Recognition

Enhao Zhang , Chuanxing Geng , Songcan Chen

分类：计算机视觉

2022-07-26

少数族裔类的数据增强是长尾识别的有效策略，因此开发了大量方法。尽管这些方法都确保了样本数量的平衡，但是增强样品的质量并不总是令人满意的，识别且容易出现过度拟合，缺乏多样性，语义漂移等问题。对于这些问题，我们建议班级感知的大学启发了重新平衡学习（CAUIRR），以进行长尾识别，这使Universum具有班级感知的能力，可以从样本数量和质量中重新平衡个人少数族裔。特别是，我们从理论上证明，凯尔学到的分类器与从贝叶斯的角度从平衡状态下学到的那些人一致。此外，我们进一步开发了一种高阶混合方法，该方法可以自动生成类感知的Universum（CAU）数据，而无需诉诸任何外部数据。与传统的大学不同，此类产生的全球还考虑了域的相似性，阶级可分离性和样本多样性。基准数据集的广泛实验证明了我们方法的令人惊讶的优势，尤其是与最先进的方法相比，少数族裔类别的TOP1准确性提高了1.9％6％。

translated by 谷歌翻译

Improving Multi-Domain Generalization through Domain Re-labeling

Kowshik Thopalli , Sameeksha Katoch , Andreas Spanias , Pavan Turaga , Jayaraman J. Thiagarajan

分类：机器学习 | 计算机视觉

2021-12-17

域泛化（DG）方法旨在开发概括到测试分布与训练数据不同的设置的模型。在本文中，我们专注于多源零拍DG的挑战性问题，其中来自多个源域的标记训练数据可用，但无法从目标域中访问数据。虽然这个问题已成为研究的重要话题，但令人惊讶的是，将所有源数据汇集在一起和培训单个分类器的简单解决方案在标准基准中具有竞争力。更重要的是，即使在不同域中明确地优化不变性的复杂方法也不一定提供对ERM的非微不足道的增益。在本文中，我们首次研究了预先指定的域标签和泛化性能之间的重要链接。使用动机案例研究和分布稳健优化算法的新变种，我们首先演示了如何推断的自定义域组可以通过数据集的原始域标签来实现一致的改进。随后，我们介绍了一种用于多域泛化，Muldens的一般方法，它使用基于ERM的深度合并骨干，并通过元优化算法执行隐式域重标。使用对多个标准基准测试的经验研究，我们表明Muldens不需要定制增强策略或特定于数据集的培训过程，始终如一地优于ERM，通过显着的边距，即使在比较时也会产生最先进的泛化性能对于利用域标签的现有方法。

translated by 谷歌翻译

Adaptive Domain Generalization via Online Disagreement Minimization

Xin Zhang , Ying-Cong Chen

分类：计算机视觉 | 机器学习

2022-08-03

当部署和培训之间存在分配变化时，深层神经网络的性能恶化严重。域的概括（DG）旨在通过仅依靠一组源域来安全地传输模型以看不见目标域。尽管已经提出了各种DG方法，但最近的一项名为Domainbed的研究表明，其中大多数没有超过简单的经验风险最小化（ERM）。为此，我们提出了一个通用框架，该框架与现有的DG算法是正交的，并且可以始终如一地提高其性能。与以前的DG作品不同的是，在静态源模型上有希望成为通用的DG，我们提出的ADAODM会在测试时间适应不同目标域的源模型。具体而言，我们在共享域形式的特征提取器上创建多个域特异性分类器。特征提取器和分类器以对抗性方式进行了训练，其中特征提取器将输入样品嵌入到域不变的空间中，并且多个分类器捕获了每个分类器与特定源域有关的独特决策边界。在测试过程中，可以通过利用源分类器之间的预测分歧来有效地衡量目标和源域之间的分布差异。通过微调源模型以最大程度地减少测试时间的分歧，目标域特征与不变特征空间很好地对齐。我们验证了两种流行的DG方法，即ERM和Coral，以及四个DG基准，即VLCS，PACS，OfficeHome和TerrainCognita。结果表明，ADAODM稳定地提高了对看不见的域的概括能力，并实现了最先进的性能。

translated by 谷歌翻译

Learning Imbalanced Datasets with Label-Distribution-Aware Margin Loss

Kaidi Cao , Colin Wei , Adrien Gaidon , Nikos Arechiga , Tengyu Ma

分类：

2019-06-18

Deep learning algorithms can fare poorly when the training dataset suffers from heavy class-imbalance but the testing criterion requires good generalization on less frequent classes. We design two novel methods to improve performance in such scenarios. First, we propose a theoretically-principled label-distribution-aware margin (LDAM) loss motivated by minimizing a margin-based generalization bound. This loss replaces the standard cross-entropy objective during training and can be applied with prior strategies for training with class-imbalance such as re-weighting or re-sampling. Second, we propose a simple, yet effective, training schedule that defers re-weighting until after the initial stage, allowing the model to learn an initial representation while avoiding some of the complications associated with re-weighting or re-sampling. We test our methods on several benchmark vision tasks including the real-world imbalanced dataset iNaturalist 2018. Our experiments show that either of these methods alone can already improve over existing techniques and their combination achieves even better performance gains 1 .

translated by 谷歌翻译

Domain-Specific Risk Minimization

Yi-Fan Zhang , Hanlin Zhang , Jindong Wang , Zhang Zhang , Baosheng Yu , Liang Wang , Dacheng Tao , Xing Xie

分类：机器学习 | 人工智能

2022-08-18

学习域不变的表示已成为域适应/概括的最受欢迎的方法之一。在本文中，我们表明不变的表示可能不足以保证良好的概括，在考虑标签函数转移的情况下。受到这一点的启发，我们首先在经验风险上获得了新的概括上限，该概括风险明确考虑了标签函数移动。然后，我们提出了特定领域的风险最小化（DRM），该风险最小化（DRM）可以分别对不同域的分布移动进行建模，并为目标域选择最合适的域。对四个流行的域概括数据集（CMNIST，PACS，VLCS和域）进行了广泛的实验，证明了所提出的DRM对域泛化的有效性，具有以下优点：1）它的表现明显超过了竞争性盆地的表现； 2）与香草经验风险最小化（ERM）相比，所有训练领域都可以在所有训练领域中具有可比性或优越的精度； 3）在培训期间，它仍然非常简单和高效，4）与不变的学习方法是互补的。

translated by 谷歌翻译

Identifying and Compensating for Feature Deviation in Imbalanced Deep Learning

Han-Jia Ye , Hong-You Chen , De-Chuan Zhan , Wei-Lun Chao

分类：机器学习 | 计算机视觉 | (统计)机器学习

2020-01-06

已知经过类不平衡数据培训的分类器在“次要”类的测试数据上表现不佳，我们的培训数据不足。在本文中，我们调查在这种情况下学习Convnet分类器。我们发现，Convnet显着夸大了次要类别，这与通常拟合的次要类别的传统机器学习算法完全相反。我们进行了一系列分析，并发现了特征偏差现象 - 学识渊博的Convnet在次要类别的训练和测试数据之间产生了偏差的特征 - 这解释了过度拟合的情况。为了补偿特征偏差的影响，将测试数据推向低决策价值区域，我们建议将依赖类的温度（CDT）纳入训练convnet。 CDT在训练阶段模拟特征偏差，迫使Convnet扩大次级数据的决策值，从而可以在测试阶段克服实际特征偏差。我们在基准数据集上验证我们的方法并实现有希望的性能。我们希望我们的见解能够激发解决阶级失去平衡深度学习的新思维方式。

translated by 谷歌翻译

Balanced Product of Experts for Long-Tailed Recognition

Emanuel Sanchez Aimar , Arvi Jonnarth , Michael Felsberg , Marco Kuhlmann

分类：计算机视觉 | 机器学习

2022-06-10

许多现实世界的识别问题都有不平衡或长尾标签的分布。这些分布使表示形式学习更具挑战性，因为对尾巴类别的概括有限。如果测试分布与训练分布有所不同，例如统一与长尾，需要解决分配转移的问题。为此，最近的作品通过贝叶斯定理的启发，使用边缘修改扩展了SoftMax跨凝结。在本文中，我们通过专家的平衡产品（Balpoe）概括了几种方法，该方法结合了一个具有不同测试时间目标分布的模型家庭，以解决数据中的不平衡。拟议的专家在一个阶段进行培训，无论是共同还是独立的，并无缝融合到Balpoe中。我们表明，Balpoe是Fisher的一致性，可以最大程度地减少均衡误差并执行广泛的实验以验证我们的方法的有效性。最后，我们研究了在这种情况下混合的效果，发现正则化是学习校准专家的关键要素。我们的实验表明，正则化的BALPOE在测试准确性和校准指标上的表现非常出色，从而导致CIFAR-100-LT，Imagenet-LT和Inaturalist-2018数据集的最新结果。该代码将在纸质接受后公开提供。

translated by 谷歌翻译

Domain Generalization: A Survey

Kaiyang Zhou , Ziwei Liu , Yu Qiao , Tao Xiang , Chen Change Loy

分类：机器学习 | 人工智能 | 计算机视觉

2021-03-03

对分布（OOD）数据的概括是人类自然的能力，但对于机器而言挑战。这是因为大多数学习算法强烈依赖于i.i.d.〜对源/目标数据的假设，这在域转移导致的实践中通常会违反。域的概括（DG）旨在通过仅使用源数据进行模型学习来实现OOD的概括。在过去的十年中，DG的研究取得了长足的进步，导致了广泛的方法论，例如，基于域的一致性，元学习，数据增强或合奏学习的方法，仅举几例；还在各个应用领域进行了研究，包括计算机视觉，语音识别，自然语言处理，医学成像和强化学习。在本文中，首次提供了DG中的全面文献综述，以总结过去十年来的发展。具体而言，我们首先通过正式定义DG并将其与其他相关领域（如域适应和转移学习）联系起来来涵盖背景。然后，我们对现有方法和理论进行了彻底的审查。最后，我们通过有关未来研究方向的见解和讨论来总结这项调查。

translated by 谷歌翻译

Towards Calibrated Model for Long-Tailed Visual Recognition from Prior Perspective

Zhengzhuo Xu , Zenghao Chai , Chun Yuan

分类：计算机视觉 | 机器学习

2021-11-06

现实世界数据普遍面对严重的类别 - 不平衡问题，并且展示了长尾分布，即，大多数标签与有限的情况有关。由此类数据集监督的NA \“IVE模型更愿意占主导地位标签，遇到严重的普遍化挑战并变得不佳。我们从先前的角度提出了两种新的方法，以减轻这种困境。首先，我们推导了一个以平衡为导向的数据增强命名均匀的混合物（Unimix）促进长尾情景中的混合，采用先进的混合因子和采样器，支持少数民族。第二，受贝叶斯理论的动机，我们弄清了贝叶斯偏见（北美），是由此引起的固有偏见先前的不一致，并将其补偿为对标准交叉熵损失的修改。我们进一步证明了所提出的方法理论上和经验地确保分类校准。广泛的实验验证我们的策略是否有助于更好校准的模型，以及他们的策略组合在CIFAR-LT，ImageNet-LT和Inattations 2018上实现最先进的性能。

translated by 谷歌翻译

Generalizing to Unseen Domains: A Survey on Domain Generalization

Jindong Wang , Cuiling Lan , Chang Liu , Yidong Ouyang , Tao Qin , Wang Lu , Yiqiang Chen , Wenjun Zeng , Philip S. Yu

分类：机器学习 | 人工智能 | 计算机视觉

2021-03-02

机器学习系统通常假设训练和测试分布是相同的。为此，关键要求是开发可以概括到未经看不见的分布的模型。领域泛化（DG），即分销概括，近年来引起了越来越令人利益。域概括处理了一个具有挑战性的设置，其中给出了一个或几个不同但相关域，并且目标是学习可以概括到看不见的测试域的模型。多年来，域概括地区已经取得了巨大进展。本文提出了对该地区最近进步的首次审查。首先，我们提供了域泛化的正式定义，并讨论了几个相关领域。然后，我们彻底审查了与域泛化相关的理论，并仔细分析了泛化背后的理论。我们将最近的算法分为三个类：数据操作，表示学习和学习策略，并为每个类别详细介绍几种流行的算法。第三，我们介绍常用的数据集，应用程序和我们的开放源代码库进行公平评估。最后，我们总结了现有文学，并为未来提供了一些潜在的研究主题。

translated by 谷歌翻译

In Search of Lost Domain Generalization

Ishaan Gulrajani , David Lopez-Paz

分类：

2020-07-02

The goal of domain generalization algorithms is to predict well on distributions different from those seen during training. While a myriad of domain generalization algorithms exist, inconsistencies in experimental conditions-datasets, architectures, and model selection criteria-render fair and realistic comparisons difficult. In this paper, we are interested in understanding how useful domain generalization algorithms are in realistic settings. As a first step, we realize that model selection is non-trivial for domain generalization tasks. Contrary to prior work, we argue that domain generalization algorithms without a model selection strategy should be regarded as incomplete. Next, we implement DOMAINBED, a testbed for domain generalization including seven multi-domain datasets, nine baseline algorithms, and three model selection criteria. We conduct extensive experiments using DO-MAINBED and find that, when carefully implemented, empirical risk minimization shows state-of-the-art performance across all datasets. Looking forward, we hope that the release of DOMAINBED, along with contributions from fellow researchers, will streamline reproducible and rigorous research in domain generalization. * Alphabetical order, equal contribution.Preprint. Under review.

translated by 谷歌翻译

Attentional-Biased Stochastic Gradient Descent

Qi Qi , Yi Xu , Rong Jin , Wotao Yin , Tianbao Yang

分类：机器学习 | 计算机视觉 | (统计)机器学习

2020-12-13

In this paper, we present a simple yet effective method (ABSGD) for addressing the data imbalance issue in deep learning. Our method is a simple modification to momentum SGD where we leverage an attentional mechanism to assign an individual importance weight to each gradient in the mini-batch. Unlike many existing heuristic-driven methods for tackling data imbalance, our method is grounded in {\it theoretically justified distributionally robust optimization (DRO)}, which is guaranteed to converge to a stationary point of an information-regularized DRO problem. The individual-level weight of a sampled data is systematically proportional to the exponential of a scaled loss value of the data, where the scaling factor is interpreted as the regularization parameter in the framework of information-regularized DRO. Compared with existing class-level weighting schemes, our method can capture the diversity between individual examples within each class. Compared with existing individual-level weighting methods using meta-learning that require three backward propagations for computing mini-batch stochastic gradients, our method is more efficient with only one backward propagation at each iteration as in standard deep learning methods. To balance between the learning of feature extraction layers and the learning of the classifier layer, we employ a two-stage method that uses SGD for pretraining followed by ABSGD for learning a robust classifier and finetuning lower layers. Our empirical studies on several benchmark datasets demonstrate the effectiveness of the proposed method.

translated by 谷歌翻译

Quantifying and Improving Transferability in Domain Generalization

Guojun Zhang , Han Zhao , Yaoliang Yu , Pascal Poupart

分类：机器学习 | 人工智能 | (统计)机器学习

2021-06-07

分发概括是将模型从实验室转移到现实世界时的关键挑战之一。现有努力主要侧重于源和目标域之间建立不变的功能。基于不变的功能，源域上的高性能分类可以在目标域上同样良好。换句话说，不变的功能是\ emph {transcorable}。然而，在实践中，没有完全可转换的功能，并且一些算法似乎学习比其他算法更学习“更可转移”的特征。我们如何理解和量化此类\ EMPH {可转录性}？在本文中，我们正式定义了一种可以量化和计算域泛化的可转换性。我们指出了与域之间的常见差异措施的差异和连接，例如总变化和Wassersein距离。然后，我们证明我们可以使用足够的样本估计我们的可转换性，并根据我们的可转移提供目标误差的新上限。经验上，我们评估现有算法学习的特征嵌入的可转换性，以获得域泛化。令人惊讶的是，我们发现许多算法并不完全学习可转让的功能，尽管很少有人仍然可以生存。鉴于此，我们提出了一种用于学习可转移功能的新算法，并在各种基准数据集中测试，包括RotationMnist，PACS，Office和Wilds-FMOW。实验结果表明，该算法在许多最先进的算法上实现了一致的改进，证实了我们的理论发现。

translated by 谷歌翻译

Tackling Long-Tailed Category Distribution Under Domain Shifts

Xiao Gu , Yao Guo , Zeju Li , Jianing Qiu , Qi Dou , Yuxuan Liu , Benny Lo , Guang-Zhong Yang

分类：计算机视觉

2022-07-20

当1）培训数据集的类别分布P（Y）时，机器学习模型无法在现实世界应用程序上表现良好。现有方法无法处理存在两个问题的方案，但是对于现实世界应用程序来说，这很常见。在这项研究中，我们向前迈出了一步，研究了域转移下的长尾分类问题。我们设计了三个新颖的核心功能块，包括分布校准的分类损失，视觉语义映射和语义相似性引导性增强。此外，我们采用了一个元学习框架，该框架集成了这三个区块，以改善对看不见的目标域的域概括。为此问题提出了两个新的数据集，称为AWA2-LTS和Imagenet-LTS。我们在两个数据集上评估了我们的方法，并且广泛的实验结果表明，我们提出的方法可以比最新的长尾/域概括方法和组合实现优越的性能。源代码和数据集可以在我们的项目页面https://xiaogu.site/ltds上找到。

translated by 谷歌翻译

AutoBalance: Optimized Loss Functions for Imbalanced Data

Mingchen Li , Xuechen Zhang , Christos Thrampoulidis , Jiasi Chen , Samet Oymak

分类：机器学习

2022-01-04

现代机器学习问题中的不平衡数据集是司空见惯的。具有敏感属性的代表性课程或群体的存在导致关于泛化和公平性的担忧。这种担忧进一步加剧了大容量深网络可以完全适合培训数据，似乎在训练期间达到完美的准确性和公平，但在测试期间表现不佳。为了解决这些挑战，我们提出了自动化，一个自动设计培训损失功能的双层优化框架，以优化准确性和寻求公平目标的混合。具体地，较低级别的问题列举了模型权重，并且上级问题通过监视和优化通过验证数据的期望目标来调谐损耗功能。我们的损耗设计通过采用参数跨熵损失和个性化数据增强方案，可以为类/组进行个性化处理。我们评估我们对不平衡和群体敏感分类的应用方案的方法的好处和性能。广泛的经验评估表明了自动矛盾最先进的方法的益处。我们的实验结果与损耗功能设计的理论见解和培训验证分裂的好处相辅相成。所有代码都是可用的开源。

translated by 谷歌翻译

Domain Generalization via Selective Consistency Regularization for Time Series Classification

Wenyu Zhang , Mohamed Ragab , Chuan-Sheng Foo

分类：机器学习

2022-06-16

域的概括方法旨在学习使用有限数量的源域，在训练过程中无需访问目标域样本的数据，以学习强大的域移动模型。用于域概括的流行域对齐方法寻求通过最大程度地降低所有域的特征分布之间的差异来提取域不变特征，从而无视域间关系。在本文中，我们提出了一种新颖的表示学习方法，该方法有选择地强制估计密切相关的源域之间的预测一致性。具体而言，我们假设域共享不同的类信息表示形式，因此，我们仅适用于所有可能导致负转移的域，而是正规化与密切相关域之间的差异。我们将我们的方法应用于时间序列分类任务，并在三个公共现实世界数据集上进行全面的实验。与最先进的方法相比，在准确性和模型校准方面，我们的方法比基线大大改善了基线，并取得更好或竞争性的性能。

translated by 谷歌翻译

Prototype-Anchored Learning for Learning with Imperfect Annotations

Xiong Zhou , Xianming Liu , Deming Zhai , Junjun Jiang , Xin Gao , Xiangyang Ji

分类：机器学习 | 计算机视觉

2022-06-23

深度神经网络的成功在很大程度上取决于大量高质量注释的数据的可用性，但是这些数据很难或昂贵。由此产生的标签可能是类别不平衡，嘈杂或人类偏见。从不完美注释的数据集中学习无偏分类模型是一项挑战，我们通常会遭受过度拟合或不足的折磨。在这项工作中，我们彻底研究了流行的软马克斯损失和基于保证金的损失，并提供了一种可行的方法来加强通过最大化最小样本余量来限制的概括误差。我们为此目的进一步得出了最佳条件，该条件指示了类原型应锚定的方式。通过理论分析的激励，我们提出了一种简单但有效的方法，即原型锚定学习（PAL），可以轻松地将其纳入各种基于学习的分类方案中以处理不完美的注释。我们通过对合成和现实世界数据集进行广泛的实验来验证PAL对班级不平衡学习和降低噪声学习的有效性。

translated by 谷歌翻译

Improving Out-of-Distribution Robustness via Selective Augmentation

Huaxiu Yao , Yu Wang , Sai Li , Linjun Zhang , Weixin Liang , James Zou , Chelsea Finn

分类：机器学习

2022-01-02

机器学习算法通常假设培训和测试示例是从相同的分布中汲取的。然而，分发转移是现实世界应用中的常见问题，并且可以在测试时间造成模型急剧执行。在本文中，我们特别考虑域移位和亚泊素班次的问题（例如，不平衡数据）。虽然先前的作品通常会寻求明确地将模型的内部表示和预测器进行明确，以成为域不变的，但我们旨在规范整个功能而不限制模型的内部表示。这导致了一种简单的基于混合技术，它通过名为LISA的选择性增强来学习不变函数。 Lisa选择性地用相同的标签而单独地插值样本，但不同的域或具有相同的域但不同的标签。我们分析了线性设置，从理论上展示了LISA如何导致较小的最差组错误。凭经验，我们研究了LISA对从亚本化转变到域移位的九个基准的有效性，我们发现LISA一直以其他最先进的方法表达。

translated by 谷歌翻译

Class Is Invariant to Context and Vice Versa: On Learning Invariance for Out-Of-Distribution Generalization

Jiaxin Qi , Kaihua Tang , Qianru Sun , Xian-Sheng Hua , Hanwang Zhang

分类：计算机视觉

2022-08-06

分布式概括（OOD）都是关于对环境变化的学习不变性。如果每个类中的上下文分布均匀分布，则OOD将是微不足道的，因为由于基本原则，可以轻松地删除上下文：类是上下文不变的。但是，收集这种平衡的数据集是不切实际的。学习不平衡的数据使模型偏见对上下文，从而伤害了OOD。因此，OOD的关键是上下文平衡。我们认为，在先前工作中广泛采用的假设，可以直接从偏见的类预测中注释或估算上下文偏差，从而使上下文不完整甚至不正确。相比之下，我们指出了上述原则的另一面：上下文对于类也不变，这激励我们将类（已经被标记为已标记的）视为不同环境以解决上下文偏见（没有上下文标签）。我们通过最大程度地减少阶级样本相似性的对比损失，同时确保这种相似性在所有类别中不变，从而实现这一想法。在具有各种上下文偏见和域间隙的基准测试中，我们表明，配备了我们上下文估计的简单基于重新加权的分类器实现了最新的性能。我们在https://github.com/simpleshinobu/irmcon上提供了附录中的理论理由和代码。

translated by 谷歌翻译