智能论文笔记

Style-Guided Domain Adaptation for Face Presentation Attack Detection

Young-Eun Kim , Woo-Jeoung Nam , Kyungseo Min , Seong-Whan Lee

分类：计算机视觉

2022-03-28

面部表现攻击检测（PAD）的域适应性（DA）或域概括（DG）最近以其对看不见的攻击情景的鲁棒性引起了人们的注意。但是，现有的基于DA/DG的PAD方法尚未完全探索可以提供有关攻击样式知识（例如材料，背景，照明和分辨率）的知识的特定领域样式信息。在本文中，我们引入了一种新型样式引导的域适应性（SGDA）框架，用于推理时间自适应垫。具体而言，提出了样式选择性归一化（SSN），以探索高阶功能统计信息中特定领域的样式信息。提出的SSN通过减少目标域和源域之间的样式差异，使模型适应目标域。此外，我们仔细设计了风格的元学习（SAML）来增强适应能力，该能力模拟了虚拟测试域上的样式选择过程的推理时间适应。与以前的域适应方法相反，我们的方法不需要其他辅助模型（例如，域适配器）或训练过程中未标记的目标域，这使我们的方法更加实用。为了验证我们的实验，我们使用公共数据集：MSU-MFSD，CASIA-FASD，OULU-NPU和IDIAP REPLAYATTACK。在大多数评估中，与常规的基于DA/DG的PAD方法相比，结果表明性能差距显着。

translated by 谷歌翻译

Adaptive Mixture of Experts Learning for Generalizable Face Anti-Spoofing

Qianyu Zhou , Ke-Yue Zhang , Taiping Yao , Ran Yi , Shouhong Ding , Lizhuang Ma

分类：计算机视觉

2022-07-20

随着各种面部表现攻击不断出现，基于域概括（DG）的面部抗散热（FAS）方法引起了人们的注意。现有的基于DG的FAS方法始终捕获用于概括各种看不见域的域不变功能。但是，他们忽略了单个源域的歧视性特征和不同域的不同域特异性信息，并且训练有素的模型不足以适应各种看不见的域。为了解决这个问题，我们提出了专家学习（AMEL）框架的自适应混合物，该框架利用了特定于域的信息以适应性地在可见的源域和看不见的目标域之间建立链接，以进一步改善概括。具体而言，特定领域的专家（DSE）旨在研究歧视性和独特的域特异性特征，以作为对共同域不变特征的补充。此外，提出了动态专家聚合（DEA），以根据与看不见的目标域相关的域相关的每个源专家的互补信息来自适应地汇总信息。并结合元学习，这些模块合作，可适应各种看不见的目标域的有意义的特定于域特异性信息。广泛的实验和可视化证明了我们对最先进竞争者的方法的有效性。

translated by 谷歌翻译

Generative Domain Adaptation for Face Anti-Spoofing

Qianyu Zhou , Ke-Yue Zhang , Taiping Yao , Ran Yi , Kekai Sheng , Shouhong Ding , Lizhuang Ma

分类：计算机视觉

2022-07-20

基于无监督的域适应性（UDA），由于目标情景的表现有希望的表现，面部抗散热器（FAS）方法引起了人们的注意。大多数现有的UDA FAS方法通常通过对齐语义高级功能的分布来拟合受过训练的模型。但是，对未标记的目标域的监督不足，低水平特征对齐降低了现有方法的性能。为了解决这些问题，我们提出了UDA FAS的新颖观点，该视角将目标数据直接适合于模型，即，通过图像翻译将目标数据风格化为源域样式，并进一步将风格化的数据提供给训练有素的数据分类的源模型。提出的生成域适应（GDA）框架结合了两个精心设计的一致性约束：1）域间神经统计量的一致性指导发生器缩小域间间隙。 2）双层语义一致性确保了风格化图像的语义质量。此外，我们提出了域内频谱混合物，以进一步扩大目标数据分布，以确保概括并减少域内间隙。广泛的实验和可视化证明了我们方法对最新方法的有效性。

translated by 谷歌翻译

Cyclically Disentangled Feature Translation for Face Anti-spoofing

Haixiao Yue , Keyao Wang , Guosheng Zhang , Haocheng Feng , Junyu Han , Errui Ding , Jingdong Wang

分类：计算机视觉

2022-12-07

Current domain adaptation methods for face anti-spoofing leverage labeled source domain data and unlabeled target domain data to obtain a promising generalizable decision boundary. However, it is usually difficult for these methods to achieve a perfect domain-invariant liveness feature disentanglement, which may degrade the final classification performance by domain differences in illumination, face category, spoof type, etc. In this work, we tackle cross-scenario face anti-spoofing by proposing a novel domain adaptation method called cyclically disentangled feature translation network (CDFTN). Specifically, CDFTN generates pseudo-labeled samples that possess: 1) source domain-invariant liveness features and 2) target domain-specific content features, which are disentangled through domain adversarial training. A robust classifier is trained based on the synthetic pseudo-labeled images under the supervision of source domain labels. We further extend CDFTN for multi-target domain adaptation by leveraging data from more unlabeled target domains. Extensive experiments on several public datasets demonstrate that our proposed approach significantly outperforms the state of the art.

translated by 谷歌翻译

Adaptive Domain Generalization via Online Disagreement Minimization

Xin Zhang , Ying-Cong Chen

分类：计算机视觉 | 机器学习

2022-08-03

当部署和培训之间存在分配变化时，深层神经网络的性能恶化严重。域的概括（DG）旨在通过仅依靠一组源域来安全地传输模型以看不见目标域。尽管已经提出了各种DG方法，但最近的一项名为Domainbed的研究表明，其中大多数没有超过简单的经验风险最小化（ERM）。为此，我们提出了一个通用框架，该框架与现有的DG算法是正交的，并且可以始终如一地提高其性能。与以前的DG作品不同的是，在静态源模型上有希望成为通用的DG，我们提出的ADAODM会在测试时间适应不同目标域的源模型。具体而言，我们在共享域形式的特征提取器上创建多个域特异性分类器。特征提取器和分类器以对抗性方式进行了训练，其中特征提取器将输入样品嵌入到域不变的空间中，并且多个分类器捕获了每个分类器与特定源域有关的独特决策边界。在测试过程中，可以通过利用源分类器之间的预测分歧来有效地衡量目标和源域之间的分布差异。通过微调源模型以最大程度地减少测试时间的分歧，目标域特征与不变特征空间很好地对齐。我们验证了两种流行的DG方法，即ERM和Coral，以及四个DG基准，即VLCS，PACS，OfficeHome和TerrainCognita。结果表明，ADAODM稳定地提高了对看不见的域的概括能力，并实现了最先进的性能。

translated by 谷歌翻译

Deep Learning meets Liveness Detection: Recent Advancements and Challenges

Arian Sabaghi , Marzieh Oghbaie , Kooshan Hashemifard , Mohammad Akbari

分类：计算机视觉

2021-12-29

最近，面部生物识别是对传统认证系统的方便替代的巨大关注。因此，检测恶意尝试已经发现具有重要意义，导致面部抗欺骗〜（FAS），即面部呈现攻击检测。与手工制作的功能相反，深度特色学习和技术已经承诺急剧增加FAS系统的准确性，解决了实现这种系统的真实应用的关键挑战。因此，处理更广泛的发展以及准确的模型的新研究区越来越多地引起了研究界和行业的关注。在本文中，我们为自2017年以来对与基于深度特征的FAS方法相关的文献综合调查。在这一主题上阐明，基于各种特征和学习方法的语义分类。此外，我们以时间顺序排列，其进化进展和评估标准（数据集内集和数据集互联集合中集）覆盖了FAS的主要公共数据集。最后，我们讨论了开放的研究挑战和未来方向。

translated by 谷歌翻译

Generalized Face Anti-Spoofing via Multi-Task Learning and One-Side Meta Triplet Loss

Chu-Chun Chuang , Chien-Yi Wang , Shang-Hong Lai

分类：计算机视觉

2022-11-29

With the increasing variations of face presentation attacks, model generalization becomes an essential challenge for a practical face anti-spoofing system. This paper presents a generalized face anti-spoofing framework that consists of three tasks: depth estimation, face parsing, and live/spoof classification. With the pixel-wise supervision from the face parsing and depth estimation tasks, the regularized features can better distinguish spoof faces. While simulating domain shift with meta-learning techniques, the proposed one-side triplet loss can further improve the generalization capability by a large margin. Extensive experiments on four public datasets demonstrate that the proposed framework and training strategies are more effective than previous works for model generalization to unseen domains.

translated by 谷歌翻译

Generalizing to Unseen Domains: A Survey on Domain Generalization

Jindong Wang , Cuiling Lan , Chang Liu , Yidong Ouyang , Tao Qin , Wang Lu , Yiqiang Chen , Wenjun Zeng , Philip S. Yu

分类：机器学习 | 人工智能 | 计算机视觉

2021-03-02

机器学习系统通常假设训练和测试分布是相同的。为此，关键要求是开发可以概括到未经看不见的分布的模型。领域泛化（DG），即分销概括，近年来引起了越来越令人利益。域概括处理了一个具有挑战性的设置，其中给出了一个或几个不同但相关域，并且目标是学习可以概括到看不见的测试域的模型。多年来，域概括地区已经取得了巨大进展。本文提出了对该地区最近进步的首次审查。首先，我们提供了域泛化的正式定义，并讨论了几个相关领域。然后，我们彻底审查了与域泛化相关的理论，并仔细分析了泛化背后的理论。我们将最近的算法分为三个类：数据操作，表示学习和学习策略，并为每个类别详细介绍几种流行的算法。第三，我们介绍常用的数据集，应用程序和我们的开放源代码库进行公平评估。最后，我们总结了现有文学，并为未来提供了一些潜在的研究主题。

translated by 谷歌翻译

Domain-Specific Bias Filtering for Single Labeled Domain Generalization

Junkun Yuan , Xu Ma , Defang Chen , Kun Kuang , Fei Wu , Lanfen Lin

分类：计算机视觉

2021-10-02

域泛化（DG）利用多个标记的源数据集来训练未经化的目标域的概括模型。然而，由于昂贵的注释成本，在现实世界应用中难以满足标记所有源数据的要求。在本文中，我们调查单个标记的域泛化（SLDG）任务，只标有一个源域，这比传统的域泛化（CDG）更实用和具有挑战性。 SLDG任务中的主要障碍是可怜的概括偏置：标记源数据集中的鉴别信息可以包含特定于域的偏差，限制训练模型的泛化。为了解决这个具有挑战性的任务，我们提出了一种称为域特定偏置滤波（DSBF）的新方法，该方法用标记的源数据初始化识别模型，然后通过用于泛化改进的未标记的源数据来滤除其域特定的偏差。我们将过滤过程划分为（1）特征提取器扩展通过K-Means的基于聚类的语义特征重新提取和（2）分类器通过注意引导语义特征投影校准。 DSBF统一探索标签和未标记的源数据，以增强培训模型的可辨性和泛化，从而产生高度普遍的模型。我们进一步提供了理论分析，以验证所提出的域特定的偏置滤波过程。关于多个数据集的广泛实验显示了DSBF在解决具有挑战性的SLDG任务和CDG任务时的优越性。

translated by 谷歌翻译

Deep Learning for Face Anti-Spoofing: A Survey

Zitong Yu , Yunxiao Qin , Xiaobai Li , Chenxu Zhao , Zhen Lei , Guoying Zhao

分类：计算机视觉

2021-06-28

由于其在保护面部识别系统免于演示攻击（PAS）中的至关重要的作用，因此面部抗散热器（FAS）最近引起了人们的关注。随着越来越现实的PA随着新颖类型的发展，由于其表示能力有限，基于手工特征的传统FAS方法变得不可靠。随着近十年来大规模学术数据集的出现，基于深度学习的FA实现了卓越的性能并占据了这一领域。但是，该领域的现有评论主要集中在手工制作的功能上，这些功能过时，对FAS社区的进步没有任何启发。在本文中，为了刺激未来的研究，我们对基于深度学习的FAS的最新进展进行了首次全面综述。它涵盖了几个新颖且有见地的组成部分：1）除了使用二进制标签的监督（例如，``0'''for pas vs.'1'），我们还通过像素智能监督（例如，伪深度图）调查了最新方法； 2）除了传统的数据内评估外，我们还收集和分析专门为域概括和开放式FAS设计的最新方法； 3）除了商用RGB摄像机外，我们还总结了多模式（例如，深度和红外线）或专门（例如，光场和闪存）传感器下的深度学习应用程序。我们通过强调当前的开放问题并突出潜在的前景来结束这项调查。

translated by 谷歌翻译

A Survey of Unsupervised Domain Adaptation for Visual Recognition

Youshan Zhang

分类：计算机视觉

2021-12-13

虽然在许多域内生成并提供了大量的未标记数据，但对视觉数据的自动理解的需求高于以往任何时候。大多数现有机器学习模型通常依赖于大量标记的训练数据来实现高性能。不幸的是，在现实世界的应用中，不能满足这种要求。标签的数量有限，手动注释数据昂贵且耗时。通常需要将知识从现有标记域传输到新域。但是，模型性能因域之间的差异（域移位或数据集偏差）而劣化。为了克服注释的负担，域适应（DA）旨在在将知识从一个域转移到另一个类似但不同的域中时减轻域移位问题。无监督的DA（UDA）处理标记的源域和未标记的目标域。 UDA的主要目标是减少标记的源数据和未标记的目标数据之间的域差异，并在培训期间在两个域中学习域不变的表示。在本文中，我们首先定义UDA问题。其次，我们从传统方法和基于深度学习的方法中概述了不同类别的UDA的最先进的方法。最后，我们收集常用的基准数据集和UDA最先进方法的报告结果对视觉识别问题。

translated by 谷歌翻译

Aligning Domain-specific Distribution and Classifier for Cross-domain Classification from Multiple Sources

Yongchun Zhu , Fuzhen Zhuang , Deqing Wang

分类：机器学习 | 人工智能 | 计算机视觉

2022-01-04

虽然无监督的域适应（UDA）算法，即，近年来只有来自源域的标记数据，大多数算法和理论结果侧重于单源无监督域适应（SUDA）。然而，在实际情况下，标记的数据通常可以从多个不同的源收集，并且它们可能不仅不同于目标域而且彼此不同。因此，来自多个源的域适配器不应以相同的方式进行建模。最近基于深度学习的多源无监督域适应（Muda）算法专注于通过在通用特征空间中的所有源极和目标域的分布对齐来提取所有域的公共域不变表示。但是，往往很难提取Muda中所有域的相同域不变表示。此外，这些方法匹配分布而不考虑类之间的域特定的决策边界。为了解决这些问题，我们提出了一个新的框架，具有两个对准阶段的Muda，它不仅将每对源和目标域的分布对齐，而且还通过利用域特定的分类器的输出对准决策边界。广泛的实验表明，我们的方法可以对图像分类的流行基准数据集实现显着的结果。

translated by 谷歌翻译

Domain Generalization via Progressive Layer-wise and Channel-wise Dropout

Jintao Guo , Lei Qi , Yinghuan Shi , Yang Gao

分类：机器学习 | 计算机视觉

2021-12-07

通过在多个观察到的源极域上培训模型，域概括旨在概括到无需进一步培训的任意看不见的目标领域。现有的作品主要专注于学习域不变的功能，以提高泛化能力。然而，由于在训练期间不可用目标域，因此前面的方法不可避免地遭受源极域中的过度。为了解决这个问题，我们开发了一个有效的基于辍学的框架，可以扩大模型的注意力，这可以有效地减轻过度的问题。特别地，与典型的辍学方案不同，通常在固定层上进行丢失，首先，我们随机选择一层，然后我们随机选择其通道以进行丢弃。此外，我们利用进步方案增加训练期间辍学的比率，这可以逐步提高培训模型的难度，以增强模型的稳健性。此外，为了进一步缓解过度拟合问题的影响，我们利用了在图像级和特征级别的增强方案来产生强大的基线模型。我们对多个基准数据集进行广泛的实验，该数据集显示了我们的方法可以优于最先进的方法。

translated by 谷歌翻译

Domain-general Crowd Counting in Unseen Scenarios

Zhipeng Du , Jiankang Deng , Miaojing Shi

分类：计算机视觉

2022-12-05

Domain shift across crowd data severely hinders crowd counting models to generalize to unseen scenarios. Although domain adaptive crowd counting approaches close this gap to a certain extent, they are still dependent on the target domain data to adapt (e.g. finetune) their models to the specific domain. In this paper, we aim to train a model based on a single source domain which can generalize well on any unseen domain. This falls into the realm of domain generalization that remains unexplored in crowd counting. We first introduce a dynamic sub-domain division scheme which divides the source domain into multiple sub-domains such that we can initiate a meta-learning framework for domain generalization. The sub-domain division is dynamically refined during the meta-learning. Next, in order to disentangle domain-invariant information from domain-specific information in image features, we design the domain-invariant and -specific crowd memory modules to re-encode image features. Two types of losses, i.e. feature reconstruction and orthogonal losses, are devised to enable this disentanglement. Extensive experiments on several standard crowd counting benchmarks i.e. SHA, SHB, QNRF, and NWPU, show the strong generalizability of our method.

translated by 谷歌翻译

META: Mimicking Embedding via oThers' Aggregation for Generalizable Person Re-identification

Boqiang Xu , Jian Liang , Lingxiao He , Zhenan Sun

分类：计算机视觉 | 人工智能

2021-12-16

域名概括（DG）人重新识别（REID）旨在通过在培训时间进行无需目标域数据的未经访问域来测试，这是一个现实但具有挑战性的问题。与假设不同域的相同模型的方法相反，专家（MOE）的混合利用多个域特定网络来利用域之间的互补信息，获得令人印象深刻的结果。然而，基于MOE的DG REID方法随着源极域的数量的增加而遭受大型模型尺寸，而且大多数忽略了域不变特性的开发。要处理上面的两个问题，本文介绍了一种通过其他人对DG REID的聚合（META）嵌入模拟嵌入的新方法。为避免大型型号大小，元的专家对每个源域的分支网络不添加分支网络，但共享除批量归一化层外的所有参数。除了多个专家外，Meta除了实例规范化（IN）并将其介绍到全球分支中，以跨域追求不变的功能。同时，META考虑通过归一化统计数据的看不见的目标样本和源域的相关性，并开发聚合网络以自适应地集成多个专家来模仿未经调用的目标域。受益于拟议的一致性损失和episodic训练算法，我们可以预期元模仿真正看不见的目标域的嵌入。广泛的实验核实，META通过大边缘超越最先进的DG REID方法。

translated by 谷歌翻译

Better Pseudo-label: Joint Domain-aware Label and Dual-classifier for Semi-supervised Domain Generalization

Ruiqi Wang , Lei Qi , Yinghuan Shi , Yang Gao

分类：计算机视觉

2021-10-10

为了将训练有素的模型直接概括为看不见的目标域，域概括（DG）是一种新提出的学习范式，引起了很大的关注。以前的DG模型通常需要在训练过程中观察到的源域中的足够数量的带注释的样品。在本文中，我们放宽了有关完全注释的要求，并研究了半监督域的概括（SSDG），在训练过程中，只有一个源域与其他完全未标记的域一起完全注释。由于要解决观察到的源域之间的域间隙和预测看不见的目标域之间的挑战，我们提出了一个通过关节域吸引的标签和双分类器的新型深框架，以产生高质量的伪标记。具体来说，为了预测域移位下的准确伪标记，开发了一个域吸引的伪标记模块。此外，考虑到概括和伪标记之间的目标不一致：前者防止在所有源域上过度拟合，而后者可能过分适合未标记的源域，以高精度，我们采用双分类器来独立执行伪标记和域名，并在训练过程中执行伪造域通用化。。当为未标记的源域生成准确的伪标记时，将域混合操作应用于标记和未标记域之间的新域，这对于提高模型的通用能力是有益的。公开可用的DG基准数据集的广泛结果显示了我们提出的SSDG方法的功效。

translated by 谷歌翻译

Domain-invariant Feature Exploration for Domain Generalization

Wang Lu , Jindong Wang , Haoliang Li , Yiqiang Chen , Xing Xie

分类：机器学习 | 计算机视觉

2022-07-25

在过去的几年中，深度学习取得了巨大的成功。但是，面对非IID情况，深度学习的表现可能会阻碍。域的概括（DG）使模型可以概括为看不见的测试分布，即学习域不变表示。在本文中，我们认为域不变的特征应起源于内部和相互侧面。内部不变性意味着可以通过单个域学习这些功能，并且该功能捕获了数据的内在语义，即在域内的属性，这是其他域的不可知论。相互不变性意味着可以通过多个域（跨域）学习这些特征，并且功能包含常见信息，即可转移的功能W.R.T.其他域。然后，我们为域不变特征探索提出了DIFEX。 DIFEX采用知识蒸馏框架来捕获高级傅立叶相，作为内部不变的特征，并将跨域相关对准作为相互不变的特征。我们进一步设计了探索损失，以增加功能多样性以更好地概括。对时间序列和视觉基准测试的广泛实验表明，所提出的DIFEX实现了最先进的性能。

translated by 谷歌翻译

Style Interleaved Learning for Generalizable Person Re-identification

Wentao Tan , Pengfei Wang , Changxing Ding , Mingming Gong , Kui Jia

分类：计算机视觉

2022-07-07

人重新识别（REID）的域概括（DG）是一个具有挑战性的问题，因为在培训过程中无法访问允许的目标域数据。大多数现有的DG REID方法都采用相同的功能来更新功能提取器和分类器参数。这种常见的实践导致模型过度拟合了源域中的现有特征样式，即使使用元学习，也会在目标域上对目标域的概括概括能力。为了解决这个问题，我们提出了一种新型的交织方式学习框架。与传统的学习策略不同，交织的学习结合了两个远期传播和每个迭代的后退传播。我们采用交错样式的功能，使用不同的前向传播来更新功能提取器和分类器，这有助于模型避免过度适应某些域样式。为了充分探索风格交织的学习的优势，我们进一步提出了一种新颖的功能风格化方法来多样化功能样式。这种方法不仅混合了多个培训样本的功能样式，还可以从批处理级别的样式发行中示例新的和有意义的功能样式。广泛的实验结果表明，我们的模型始终优于DG REID大规模基准的最先进方法，从而在计算效率方面具有明显的优势。代码可从https://github.com/wentaotan/interleaved-learning获得。

translated by 谷歌翻译

Self-Adversarial Disentangling for Specific Domain Adaptation

Qianyu Zhou , Qiqi Gu , Jiangmiao Pang , Xuequan Lu , Lizhuang Ma

分类：计算机视觉

2021-08-08

Domain adaptation aims to bridge the domain shifts between the source and the target domain. These shifts may span different dimensions such as fog, rainfall, etc. However, recent methods typically do not consider explicit prior knowledge about the domain shifts on a specific dimension, thus leading to less desired adaptation performance. In this paper, we study a practical setting called Specific Domain Adaptation (SDA) that aligns the source and target domains in a demanded-specific dimension. Within this setting, we observe the intra-domain gap induced by different domainness (i.e., numerical magnitudes of domain shifts in this dimension) is crucial when adapting to a specific domain. To address the problem, we propose a novel Self-Adversarial Disentangling (SAD) framework. In particular, given a specific dimension, we first enrich the source domain by introducing a domainness creator with providing additional supervisory signals. Guided by the created domainness, we design a self-adversarial regularizer and two loss functions to jointly disentangle the latent representations into domainness-specific and domainness-invariant features, thus mitigating the intra-domain gap. Our method can be easily taken as a plug-and-play framework and does not introduce any extra costs in the inference time. We achieve consistent improvements over state-of-the-art methods in both object detection and semantic segmentation.

translated by 谷歌翻译

A Novel Mix-normalization Method for Generalizable Multi-source Person Re-identification

Lei Qi , Lei Wang , Yinghuan Shi , Xin Geng

分类：计算机视觉

2022-01-24

人重新识别（RE-ID）在监督场景中取得了巨大成功。但是，由于模型过于适合所见源域，因此很难将监督模型直接传输到任意看不见的域。在本文中，我们旨在从数据增强的角度来解决可推广的多源人员重新ID任务（即，在培训期间看不见测试域，并且在培训期间看不见测试域，因此我们提出了一种新颖的方法，称为Mixnorm，由域感知的混合范围（DMN）和域软件中心正则化（DCR）组成。不同于常规数据增强，提出的域吸引的混合范围化，以增强从神经网络的标准化视图中训练期间特征的多样性，这可以有效地减轻模型过度适应源域，从而提高概括性。在看不见的域中模型的能力。为了更好地学习域不变的模型，我们进一步开发了域吸引的中心正规化，以更好地将产生的各种功能映射到同一空间中。在多个基准数据集上进行的广泛实验验证了所提出的方法的有效性，并表明所提出的方法可以胜过最先进的方法。此外，进一步的分析还揭示了所提出的方法的优越性。

translated by 谷歌翻译