智能论文笔记

Semantic-Discriminative Mixup for Generalizable Sensor-based Cross-domain Activity Recognition

Wang Lu , Jindong Wang , Yiqiang Chen , Sinno Jialin Pan , Chunyu Hu , Xin Qin

分类：人工智能

2022-06-14

收集足够标记的数据以建立人类活动识别（HAR）模型是昂贵且耗时的。对现有数据的培训通常会使模型偏向于培训数据的分布，因此该模型可能会在具有不同分布的测试数据上执行。尽管现有的转移学习和域适应性的努力试图解决上述问题，但他们仍然需要访问目标域上的未标记数据，这在实际情况下可能是不可能的。很少有作品注意训练一个模型，该模型可以很好地概括为HAR看不见的目标域。在本文中，我们提出了一种新的方法，称为可推广跨域HAR的语义歧视混合（SDMIX）。首先，我们介绍了语义感知的混音，该混音考虑了活动语义范围，以克服域差异带来的语义不一致。其次，我们引入了较大的利润损失，以增强混合歧视，以防止虚拟标签带来的错误分类。在五个公共数据集上进行的综合概括实验表明，我们的SDMIX基本上优于最先进的方法，其平均准确度提高了跨人员，交叉数据库和交叉位置HAR的平均准确性6％。

translated by 谷歌翻译

Towards Optimization and Model Selection for Domain Generalization: A Mixup-guided Solution

Wang Lu , Jindong Wang , Yidong Wang , Kan Ren , Yiqiang Chen , Xing Xie

分类：机器学习

2022-09-01

培训和测试数据之间的分布变化通常会破坏深度学习模型的性能。近年来，许多工作都注意存在分布转移的领域泛化（DG），而目标数据看不见。尽管算法设计取得了进展，但长期以来一直忽略了两个基础因素：1）基于正则化的目标（例如，分布对齐）的优化和2）DG的模型选择，因为无法利用有关目标域的知识。在本文中，我们提出了用于域概括的优化和选择技术的混合。为了进行优化，我们利用改编的混音来生成一个分发数据集，该数据集可以指导首选项方向并通过帕累托优化进行优化。对于模型选择，我们生成一个验证数据集，距离目标分布距离更遥远，从而可以更好地表示目标数据。我们还提出了一些理论见解。对一个视觉分类基准和三个时间序列基准的全面实验表明，我们的模型优化和选择技术可以在很大程度上可以改善现有域概括算法的性能，甚至可以取得新的最先进的结果。

translated by 谷歌翻译

Domain-invariant Feature Exploration for Domain Generalization

Wang Lu , Jindong Wang , Haoliang Li , Yiqiang Chen , Xing Xie

分类：机器学习 | 计算机视觉

2022-07-25

在过去的几年中，深度学习取得了巨大的成功。但是，面对非IID情况，深度学习的表现可能会阻碍。域的概括（DG）使模型可以概括为看不见的测试分布，即学习域不变表示。在本文中，我们认为域不变的特征应起源于内部和相互侧面。内部不变性意味着可以通过单个域学习这些功能，并且该功能捕获了数据的内在语义，即在域内的属性，这是其他域的不可知论。相互不变性意味着可以通过多个域（跨域）学习这些特征，并且功能包含常见信息，即可转移的功能W.R.T.其他域。然后，我们为域不变特征探索提出了DIFEX。 DIFEX采用知识蒸馏框架来捕获高级傅立叶相，作为内部不变的特征，并将跨域相关对准作为相互不变的特征。我们进一步设计了探索损失，以增加功能多样性以更好地概括。对时间序列和视觉基准测试的广泛实验表明，所提出的DIFEX实现了最先进的性能。

translated by 谷歌翻译

Generalized Representations Learning for Time Series Classification

Wang Lu , Jindong Wang , Xinwei Sun , Yiqiang Chen , Xing Xie

分类：机器学习 | 人工智能

2022-09-15

时间序列分类是现实世界中的重要问题。由于其非平稳属性随着时间的推移而变化，因此建立泛化模型以表现出来的分布仍然具有挑战性。在本文中，我们建议从分布的角度查看时间序列分类问题。我们认为时间复杂性归因于其中未知的潜在分布。为此，我们建议多元化学习时间序列分类的广义表示。多元化进行了一个迭代过程：它首先通过对抗训练获得了最坏情况的分布场景，然后与获得的子域的分布匹配。我们还提供了一些理论见解。我们进行有关手势识别，语音命令识别，可穿戴压力和影响检测的实验，以及基于传感器的人类活动识别，在不同的情况下总共有七个数据集。结果表明，多样化的多样化大大优于其他基线，并通过定性和定量分析有效地表征了潜在分布。

translated by 谷歌翻译

Generalizing to Unseen Domains: A Survey on Domain Generalization

Jindong Wang , Cuiling Lan , Chang Liu , Yidong Ouyang , Tao Qin , Wang Lu , Yiqiang Chen , Wenjun Zeng , Philip S. Yu

分类：机器学习 | 人工智能 | 计算机视觉

2021-03-02

机器学习系统通常假设训练和测试分布是相同的。为此，关键要求是开发可以概括到未经看不见的分布的模型。领域泛化（DG），即分销概括，近年来引起了越来越令人利益。域概括处理了一个具有挑战性的设置，其中给出了一个或几个不同但相关域，并且目标是学习可以概括到看不见的测试域的模型。多年来，域概括地区已经取得了巨大进展。本文提出了对该地区最近进步的首次审查。首先，我们提供了域泛化的正式定义，并讨论了几个相关领域。然后，我们彻底审查了与域泛化相关的理论，并仔细分析了泛化背后的理论。我们将最近的算法分为三个类：数据操作，表示学习和学习策略，并为每个类别详细介绍几种流行的算法。第三，我们介绍常用的数据集，应用程序和我们的开放源代码库进行公平评估。最后，我们总结了现有文学，并为未来提供了一些潜在的研究主题。

translated by 谷歌翻译

Adaptive Domain Generalization via Online Disagreement Minimization

Xin Zhang , Ying-Cong Chen

分类：计算机视觉 | 机器学习

2022-08-03

当部署和培训之间存在分配变化时，深层神经网络的性能恶化严重。域的概括（DG）旨在通过仅依靠一组源域来安全地传输模型以看不见目标域。尽管已经提出了各种DG方法，但最近的一项名为Domainbed的研究表明，其中大多数没有超过简单的经验风险最小化（ERM）。为此，我们提出了一个通用框架，该框架与现有的DG算法是正交的，并且可以始终如一地提高其性能。与以前的DG作品不同的是，在静态源模型上有希望成为通用的DG，我们提出的ADAODM会在测试时间适应不同目标域的源模型。具体而言，我们在共享域形式的特征提取器上创建多个域特异性分类器。特征提取器和分类器以对抗性方式进行了训练，其中特征提取器将输入样品嵌入到域不变的空间中，并且多个分类器捕获了每个分类器与特定源域有关的独特决策边界。在测试过程中，可以通过利用源分类器之间的预测分歧来有效地衡量目标和源域之间的分布差异。通过微调源模型以最大程度地减少测试时间的分歧，目标域特征与不变特征空间很好地对齐。我们验证了两种流行的DG方法，即ERM和Coral，以及四个DG基准，即VLCS，PACS，OfficeHome和TerrainCognita。结果表明，ADAODM稳定地提高了对看不见的域的概括能力，并实现了最先进的性能。

translated by 谷歌翻译

AirFi: Empowering WiFi-based Passive Human Gesture Recognition to Unseen Environment via Domain Generalization

Dazhuo Wang , Jianfei Yang , Wei Cui , Lihua Xie , Sumei Sun

分类：计算机视觉

2022-09-21

近年来，由渠道状态信息（CSI）启用了基于WiFi的智能人类传感技术（CSI）。但是，在不同的环境中部署时，基于CSI的传感系统会遭受性能降解。现有作品通过使用新环境中的大量未标记的高质量数据来通过域的适应来解决这一问题，这在实践中通常不可用。在本文中，我们提出了一种新颖的增强环境不变的鲁棒wifi wifi识别系统，名为Airfi，该系统从新的角度涉及环境依赖问题。 Airfi是一个新颖的领域泛化框架，无论环境如何，都可以学习CSI的关键部分，并将模型推广到看不见的场景，不需要收集任何数据以适应新环境。 Airfi从几个培训环境环境中提取了共同的功能，并最大程度地减少了它们之间的分布差异。该功能将进一步增强，以使环境更强大。此外，可以通过几次学习技术进一步改进该系统。与最先进的方法相比，Airfi能够在不同的环境环境中工作，而无需从新环境中获取任何CSI数据。实验结果表明，我们的系统在新环境中保持强大，并优于比较系统。

translated by 谷歌翻译

TASKED: Transformer-based Adversarial learning for human activity recognition using wearable sensors via Self-KnowledgE Distillation

Sungho Suh , Vitor Fortes Rey , Paul Lukowicz

分类：计算机视觉 | 机器学习

2022-09-14

Wearable sensor-based human activity recognition (HAR) has emerged as a principal research area and is utilized in a variety of applications. Recently, deep learning-based methods have achieved significant improvement in the HAR field with the development of human-computer interaction applications. However, they are limited to operating in a local neighborhood in the process of a standard convolution neural network, and correlations between different sensors on body positions are ignored. In addition, they still face significant challenging problems with performance degradation due to large gaps in the distribution of training and test data, and behavioral differences between subjects. In this work, we propose a novel Transformer-based Adversarial learning framework for human activity recognition using wearable sensors via Self-KnowledgE Distillation (TASKED), that accounts for individual sensor orientations and spatial and temporal features. The proposed method is capable of learning cross-domain embedding feature representations from multiple subjects datasets using adversarial learning and the maximum mean discrepancy (MMD) regularization to align the data distribution over multiple domains. In the proposed method, we adopt the teacher-free self-knowledge distillation to improve the stability of the training procedure and the performance of human activity recognition. Experimental results show that TASKED not only outperforms state-of-the-art methods on the four real-world public HAR datasets (alone or combined) but also improves the subject generalization effectively.

translated by 谷歌翻译

CoTMix: Contrastive Domain Adaptation for Time-Series via Temporal Mixup

Emadeldeen Eldele , Mohamed Ragab , Zhenghua Chen , Min Wu , Chee-Keong Kwoh , Xiaoli Li

分类：机器学习

2022-12-03

Unsupervised Domain Adaptation (UDA) has emerged as a powerful solution for the domain shift problem via transferring the knowledge from a labeled source domain to a shifted unlabeled target domain. Despite the prevalence of UDA for visual applications, it remains relatively less explored for time-series applications. In this work, we propose a novel lightweight contrastive domain adaptation framework called CoTMix for time-series data. Unlike existing approaches that either use statistical distances or adversarial techniques, we leverage contrastive learning solely to mitigate the distribution shift across the different domains. Specifically, we propose a novel temporal mixup strategy to generate two intermediate augmented views for the source and target domains. Subsequently, we leverage contrastive learning to maximize the similarity between each domain and its corresponding augmented view. The generated views consider the temporal dynamics of time-series data during the adaptation process while inheriting the semantics among the two domains. Hence, we gradually push both domains towards a common intermediate space, mitigating the distribution shift across them. Extensive experiments conducted on four real-world time-series datasets show that our approach can significantly outperform all state-of-the-art UDA methods. The implementation code of CoTMix is available at \href{https://github.com/emadeldeen24/CoTMix}{github.com/emadeldeen24/CoTMix}.

translated by 谷歌翻译

Better Pseudo-label: Joint Domain-aware Label and Dual-classifier for Semi-supervised Domain Generalization

Ruiqi Wang , Lei Qi , Yinghuan Shi , Yang Gao

分类：计算机视觉

2021-10-10

为了将训练有素的模型直接概括为看不见的目标域，域概括（DG）是一种新提出的学习范式，引起了很大的关注。以前的DG模型通常需要在训练过程中观察到的源域中的足够数量的带注释的样品。在本文中，我们放宽了有关完全注释的要求，并研究了半监督域的概括（SSDG），在训练过程中，只有一个源域与其他完全未标记的域一起完全注释。由于要解决观察到的源域之间的域间隙和预测看不见的目标域之间的挑战，我们提出了一个通过关节域吸引的标签和双分类器的新型深框架，以产生高质量的伪标记。具体来说，为了预测域移位下的准确伪标记，开发了一个域吸引的伪标记模块。此外，考虑到概括和伪标记之间的目标不一致：前者防止在所有源域上过度拟合，而后者可能过分适合未标记的源域，以高精度，我们采用双分类器来独立执行伪标记和域名，并在训练过程中执行伪造域通用化。。当为未标记的源域生成准确的伪标记时，将域混合操作应用于标记和未标记域之间的新域，这对于提高模型的通用能力是有益的。公开可用的DG基准数据集的广泛结果显示了我们提出的SSDG方法的功效。

translated by 谷歌翻译

More is Better: A Novel Multi-view Framework for Domain Generalization

Jian Zhang , Lei Qi , Yinghuan Shi , Yang Gao

分类：计算机视觉

2021-12-23

旨在概括在源域中训练的模型来看不见的目标域，域泛化（DG）最近引起了很多关注。 DG的关键问题是如何防止对观察到的源极域的过度接收，因为在培训期间目标域不可用。我们调查过度拟合不仅导致未经看不见的目标域的普遍推广能力，而且在测试阶段导致不稳定的预测。在本文中，我们观察到，在训练阶段采样多个任务并在测试阶段产生增强图像，很大程度上有利于泛化性能。因此，通过处理不同视图的任务和图像，我们提出了一种新颖的多视图DG框架。具体地，在训练阶段，为了提高泛化能力，我们开发了一种多视图正则化元学习算法，该算法采用多个任务在更新模型期间产生合适的优化方向。在测试阶段，为了减轻不稳定的预测，我们利用多个增强图像来产生多视图预测，这通过熔断测试图像的不同视图的结果显着促进了模型可靠性。三个基准数据集的广泛实验验证了我们的方法优于几种最先进的方法。

translated by 谷歌翻译

A Novel Mix-normalization Method for Generalizable Multi-source Person Re-identification

Lei Qi , Lei Wang , Yinghuan Shi , Xin Geng

分类：计算机视觉

2022-01-24

人重新识别（RE-ID）在监督场景中取得了巨大成功。但是，由于模型过于适合所见源域，因此很难将监督模型直接传输到任意看不见的域。在本文中，我们旨在从数据增强的角度来解决可推广的多源人员重新ID任务（即，在培训期间看不见测试域，并且在培训期间看不见测试域，因此我们提出了一种新颖的方法，称为Mixnorm，由域感知的混合范围（DMN）和域软件中心正则化（DCR）组成。不同于常规数据增强，提出的域吸引的混合范围化，以增强从神经网络的标准化视图中训练期间特征的多样性，这可以有效地减轻模型过度适应源域，从而提高概括性。在看不见的域中模型的能力。为了更好地学习域不变的模型，我们进一步开发了域吸引的中心正规化，以更好地将产生的各种功能映射到同一空间中。在多个基准数据集上进行的广泛实验验证了所提出的方法的有效性，并表明所提出的方法可以胜过最先进的方法。此外，进一步的分析还揭示了所提出的方法的优越性。

translated by 谷歌翻译

Implicit Semantic Augmentation for Distance Metric Learning in Domain Generalization

Meng Wang , Jianlong Yuna , Qi Qian , Zhibin Wang , Hao Li

分类：机器学习

2022-08-02

域的概括（DG）旨在在一个或多个不同但相关的源域上学习一个模型，这些模型可以推广到看不见的目标域。现有的DG方法试图提示模型的概括能力的源域的多样性，同时他们可能必须引入辅助网络或达到计算成本。相反，这项工作应用了特征空间中的隐式语义增强来捕获源域的多样性。具体来说，包括距离度量学习（DML）的附加损失函数，以优化数据分布的局部几何形状。此外，采用跨熵损失的逻辑被无限增强作为DML损失的输入特征，以代替深度特征。我们还提供了理论分析，以表明逻辑可以近似于原始特征上定义的距离。此外，我们对方法背后的机制和理性进行了深入的分析，这使我们可以更好地了解为什么要代替特征的杠杆逻辑可以帮助域的概括。拟议的DML损失与隐式增强作用纳入了最近的DG方法中，即傅立叶增强联合老师框架（FACT）。同时，我们的方法也可以轻松地插入各种DG方法中。对三个基准测试（Digits-DG，PAC和办公室家庭）进行的广泛实验表明，该建议的方法能够实现最新的性能。

translated by 谷歌翻译

Domain Generalization with MixStyle

Kaiyang Zhou , Yongxin Yang , Yu Qiao , Tao Xiang

分类：

2021-04-05

Though convolutional neural networks (CNNs) have demonstrated remarkable ability in learning discriminative features, they often generalize poorly to unseen domains. Domain generalization aims to address this problem by learning from a set of source domains a model that is generalizable to any unseen domain. In this paper, a novel approach is proposed based on probabilistically mixing instancelevel feature statistics of training samples across source domains. Our method, termed MixStyle, is motivated by the observation that visual domain is closely related to image style (e.g., photo vs. sketch images). Such style information is captured by the bottom layers of a CNN where our proposed style-mixing takes place. Mixing styles of training instances results in novel domains being synthesized implicitly, which increase the domain diversity of the source domains, and hence the generalizability of the trained model. MixStyle fits into mini-batch training perfectly and is extremely easy to implement. The effectiveness of MixStyle is demonstrated on a wide range of tasks including category classification, instance retrieval and reinforcement learning.

translated by 谷歌翻译

Style Variable and Irrelevant Learning for Generalizable Person Re-identification

Haobo Chen , Chuyang Zhao , Kai Tu , Junru Chen , Yadong Li , Boxun Li

分类：计算机视觉

2022-09-12

最近，由于受监督人员重新识别（REID）的表现不佳，域名概括（DG）人REID引起了很多关注，旨在学习一个不敏感的模型，并可以抵抗域的影响偏见。在本文中，我们首先通过实验验证样式因素是域偏差的重要组成部分。基于这个结论，我们提出了一种样式变量且无关紧要的学习方法（SVIL）方法，以消除样式因素对模型的影响。具体来说，我们在SVIL中设计了样式的抖动模块（SJM）。 SJM模块可以丰富特定源域的样式多样性，并减少各种源域的样式差异。这导致该模型重点关注与身份相关的信息，并对样式变化不敏感。此外，我们将SJM模块与元学习算法有机结合，从而最大程度地提高了好处并进一步提高模型的概括能力。请注意，我们的SJM模块是插件和推理，无需成本。广泛的实验证实了我们的SVIL的有效性，而我们的方法的表现优于DG-REID基准测试的最先进方法。

translated by 谷歌翻译

Domain Generalization: A Survey

Kaiyang Zhou , Ziwei Liu , Yu Qiao , Tao Xiang , Chen Change Loy

分类：机器学习 | 人工智能 | 计算机视觉

2021-03-03

对分布（OOD）数据的概括是人类自然的能力，但对于机器而言挑战。这是因为大多数学习算法强烈依赖于i.i.d.〜对源/目标数据的假设，这在域转移导致的实践中通常会违反。域的概括（DG）旨在通过仅使用源数据进行模型学习来实现OOD的概括。在过去的十年中，DG的研究取得了长足的进步，导致了广泛的方法论，例如，基于域的一致性，元学习，数据增强或合奏学习的方法，仅举几例；还在各个应用领域进行了研究，包括计算机视觉，语音识别，自然语言处理，医学成像和强化学习。在本文中，首次提供了DG中的全面文献综述，以总结过去十年来的发展。具体而言，我们首先通过正式定义DG并将其与其他相关领域（如域适应和转移学习）联系起来来涵盖背景。然后，我们对现有方法和理论进行了彻底的审查。最后，我们通过有关未来研究方向的见解和讨论来总结这项调查。

translated by 谷歌翻译

StyleAM: Perception-Oriented Unsupervised Domain Adaption for Non-reference Image Quality Assessment

Yiting Lu , Xin Li , Jianzhao Liu , Zhibo Chen

分类：计算机视觉

2022-07-29

深度神经网络（DNN）在非参考图像质量评估（NR-IQA）方面具有巨大潜力。但是，NR-IQA的注释是劳动密集型且耗时的，这严重限制了其对真实图像的应用。为了减轻对质量注释的依赖，一些作品已将无监督的域适应性（UDA）应用于NR-IQA。但是，上述方法忽略了分类中使用的对齐空间是最佳选择，因为该空间不是为了感知而精心设计的。为了解决这一挑战，我们提出了一个有效的面向感知的无监督域适应方法，用于NR-IQA，该方法通过富含标签的源域数据将足够的知识转移到通过样式的对齐和混合的标签目标域图像。具体而言，我们发现了一个更紧凑，更可靠的空间，即基于有趣/惊人的观察结果，以感知为导向的UDA的特征样式空间，即DNN中深层的功能样式（即平均和差异）与DNN中的深层层完全相关NR-IQA的质量得分。因此，我们建议在更面向感知的空间（即特征样式空间）中对齐源和目标域，以减少其他质量 - Irretrelevant特征因素的干预措施。此外，为了提高质量得分与其功能样式之间的一致性，我们还提出了一种新颖的功能增强策略样式混音，将DNN的最后一层之前将功能样式（即平均值和差异）混合在一起，并混合使用标签。对两个典型的跨域设置（即合成至真实性和多种变形）的广泛实验结果证明了我们提出的styleam对NR-IQA的有效性。

translated by 谷歌翻译

Generative Domain Adaptation for Face Anti-Spoofing

Qianyu Zhou , Ke-Yue Zhang , Taiping Yao , Ran Yi , Kekai Sheng , Shouhong Ding , Lizhuang Ma

分类：计算机视觉

2022-07-20

基于无监督的域适应性（UDA），由于目标情景的表现有希望的表现，面部抗散热器（FAS）方法引起了人们的注意。大多数现有的UDA FAS方法通常通过对齐语义高级功能的分布来拟合受过训练的模型。但是，对未标记的目标域的监督不足，低水平特征对齐降低了现有方法的性能。为了解决这些问题，我们提出了UDA FAS的新颖观点，该视角将目标数据直接适合于模型，即，通过图像翻译将目标数据风格化为源域样式，并进一步将风格化的数据提供给训练有素的数据分类的源模型。提出的生成域适应（GDA）框架结合了两个精心设计的一致性约束：1）域间神经统计量的一致性指导发生器缩小域间间隙。 2）双层语义一致性确保了风格化图像的语义质量。此外，我们提出了域内频谱混合物，以进一步扩大目标数据分布，以确保概括并减少域内间隙。广泛的实验和可视化证明了我们方法对最新方法的有效性。

translated by 谷歌翻译

An Unsupervised Domain Adaptation Model based on Dual-module Adversarial Training

Yiju Yang , Tianxiao Zhang , Guanyu Li , Taejoon Kim , Guanghui Wang

分类：机器学习 | 计算机视觉

2021-12-31

在本文中，我们提出了一种使用域鉴别特征模块的双模块网络架构，以鼓励域不变的特征模块学习更多域不变的功能。该建议的架构可以应用于任何利用域不变功能的任何模型，用于无监督域适应，以提高其提取域不变特征的能力。我们在作为代表性算法的神经网络（DANN）模型的区域 - 对抗训练进行实验。在培训过程中，我们为两个模块提供相同的输入，然后分别提取它们的特征分布和预测结果。我们提出了差异损失，以找到预测结果的差异和两个模块之间的特征分布。通过对抗训练来最大化其特征分布和最小化其预测结果的差异，鼓励两个模块分别学习更多域歧视和域不变特征。进行了广泛的比较评估，拟议的方法在大多数无监督的域适应任务中表现出最先进的。

translated by 谷歌翻译

Learning Domain Invariant Representations for Generalizable Person Re-Identification

Yi-Fan Zhang , Zhang Zhang , Da Li , Zhen Jia , Liang Wang , Tieniu Tan

分类：计算机视觉 | 机器学习

2021-03-29

更广泛的人重新识别（Reid）在最近的计算机视觉社区中引起了不断的关注。在这项工作中，我们在身份标签，特定特定因素（衣服/鞋子颜色等）和域特定因素（背景，观点等）之间构建结构因果模型。根据因果分析，我们提出了一种新颖的域不变表示，以获得概括的人重新识别（DIR-REID）框架。具体而言，我们首先建议解散特定于特定的和域特定的特征空间，我们提出了一种有效的算法实现，用于后台调整，基本上是朝向SCM的因果干预。已经进行了广泛的实验，表明Dir-Reid在大规模域泛化Reid基准上表现出最先进的方法。

translated by 谷歌翻译