智能论文笔记

Generalized Face Anti-Spoofing via Multi-Task Learning and One-Side Meta Triplet Loss

Chu-Chun Chuang , Chien-Yi Wang , Shang-Hong Lai

分类：计算机视觉

2022-11-29

With the increasing variations of face presentation attacks, model generalization becomes an essential challenge for a practical face anti-spoofing system. This paper presents a generalized face anti-spoofing framework that consists of three tasks: depth estimation, face parsing, and live/spoof classification. With the pixel-wise supervision from the face parsing and depth estimation tasks, the regularized features can better distinguish spoof faces. While simulating domain shift with meta-learning techniques, the proposed one-side triplet loss can further improve the generalization capability by a large margin. Extensive experiments on four public datasets demonstrate that the proposed framework and training strategies are more effective than previous works for model generalization to unseen domains.

translated by 谷歌翻译

Adaptive Mixture of Experts Learning for Generalizable Face Anti-Spoofing

Qianyu Zhou , Ke-Yue Zhang , Taiping Yao , Ran Yi , Shouhong Ding , Lizhuang Ma

分类：计算机视觉

2022-07-20

随着各种面部表现攻击不断出现，基于域概括（DG）的面部抗散热（FAS）方法引起了人们的注意。现有的基于DG的FAS方法始终捕获用于概括各种看不见域的域不变功能。但是，他们忽略了单个源域的歧视性特征和不同域的不同域特异性信息，并且训练有素的模型不足以适应各种看不见的域。为了解决这个问题，我们提出了专家学习（AMEL）框架的自适应混合物，该框架利用了特定于域的信息以适应性地在可见的源域和看不见的目标域之间建立链接，以进一步改善概括。具体而言，特定领域的专家（DSE）旨在研究歧视性和独特的域特异性特征，以作为对共同域不变特征的补充。此外，提出了动态专家聚合（DEA），以根据与看不见的目标域相关的域相关的每个源专家的互补信息来自适应地汇总信息。并结合元学习，这些模块合作，可适应各种看不见的目标域的有意义的特定于域特异性信息。广泛的实验和可视化证明了我们对最先进竞争者的方法的有效性。

translated by 谷歌翻译

Deep Learning meets Liveness Detection: Recent Advancements and Challenges

Arian Sabaghi , Marzieh Oghbaie , Kooshan Hashemifard , Mohammad Akbari

分类：计算机视觉

2021-12-29

最近，面部生物识别是对传统认证系统的方便替代的巨大关注。因此，检测恶意尝试已经发现具有重要意义，导致面部抗欺骗〜（FAS），即面部呈现攻击检测。与手工制作的功能相反，深度特色学习和技术已经承诺急剧增加FAS系统的准确性，解决了实现这种系统的真实应用的关键挑战。因此，处理更广泛的发展以及准确的模型的新研究区越来越多地引起了研究界和行业的关注。在本文中，我们为自2017年以来对与基于深度特征的FAS方法相关的文献综合调查。在这一主题上阐明，基于各种特征和学习方法的语义分类。此外，我们以时间顺序排列，其进化进展和评估标准（数据集内集和数据集互联集合中集）覆盖了FAS的主要公共数据集。最后，我们讨论了开放的研究挑战和未来方向。

translated by 谷歌翻译

Learning Facial Liveness Representation for Domain Generalized Face Anti-spoofing

Zih-Ching Chen , Lin-Hsi Tsao , Chin-Lun Fu , Shang-Fu Chen , Yu-Chiang Frank Wang

分类：计算机视觉 | 机器学习

2022-08-16

面部抗泡沫（FAS）旨在将面部欺骗攻击与真实的攻击区分开，通常通过学习适当的模型来执行相关的分类任务。在实践中，人们期望将这种模型推广到不同图像域中的FAS。此外，假设将事先知道欺骗攻击的类型是不切实际的。在本文中，我们提出了一个深度学习模型，以解决上述域名抗繁殖任务。特别是，我们提出的网络能够将面部无性表示与无关的面部表述（即面部内容和图像域特征）相关。所产生的LIVISE表示表现出足够的域不变特性，因此可以应用于执行域将来的FAS。在我们的实验中，我们在具有各种设置的五个基准数据集上进行实验，并验证我们的模型在识别未见图像域中的新型欺骗攻击方面对最新方法的表现有利。

translated by 谷歌翻译

Deep Learning for Face Anti-Spoofing: A Survey

Zitong Yu , Yunxiao Qin , Xiaobai Li , Chenxu Zhao , Zhen Lei , Guoying Zhao

分类：计算机视觉

2021-06-28

由于其在保护面部识别系统免于演示攻击（PAS）中的至关重要的作用，因此面部抗散热器（FAS）最近引起了人们的关注。随着越来越现实的PA随着新颖类型的发展，由于其表示能力有限，基于手工特征的传统FAS方法变得不可靠。随着近十年来大规模学术数据集的出现，基于深度学习的FA实现了卓越的性能并占据了这一领域。但是，该领域的现有评论主要集中在手工制作的功能上，这些功能过时，对FAS社区的进步没有任何启发。在本文中，为了刺激未来的研究，我们对基于深度学习的FAS的最新进展进行了首次全面综述。它涵盖了几个新颖且有见地的组成部分：1）除了使用二进制标签的监督（例如，``0'''for pas vs.'1'），我们还通过像素智能监督（例如，伪深度图）调查了最新方法； 2）除了传统的数据内评估外，我们还收集和分析专门为域概括和开放式FAS设计的最新方法； 3）除了商用RGB摄像机外，我们还总结了多模式（例如，深度和红外线）或专门（例如，光场和闪存）传感器下的深度学习应用程序。我们通过强调当前的开放问题并突出潜在的前景来结束这项调查。

translated by 谷歌翻译

Cyclically Disentangled Feature Translation for Face Anti-spoofing

Haixiao Yue , Keyao Wang , Guosheng Zhang , Haocheng Feng , Junyu Han , Errui Ding , Jingdong Wang

分类：计算机视觉

2022-12-07

Current domain adaptation methods for face anti-spoofing leverage labeled source domain data and unlabeled target domain data to obtain a promising generalizable decision boundary. However, it is usually difficult for these methods to achieve a perfect domain-invariant liveness feature disentanglement, which may degrade the final classification performance by domain differences in illumination, face category, spoof type, etc. In this work, we tackle cross-scenario face anti-spoofing by proposing a novel domain adaptation method called cyclically disentangled feature translation network (CDFTN). Specifically, CDFTN generates pseudo-labeled samples that possess: 1) source domain-invariant liveness features and 2) target domain-specific content features, which are disentangled through domain adversarial training. A robust classifier is trained based on the synthetic pseudo-labeled images under the supervision of source domain labels. We further extend CDFTN for multi-target domain adaptation by leveraging data from more unlabeled target domains. Extensive experiments on several public datasets demonstrate that our proposed approach significantly outperforms the state of the art.

translated by 谷歌翻译

Style-Guided Domain Adaptation for Face Presentation Attack Detection

Young-Eun Kim , Woo-Jeoung Nam , Kyungseo Min , Seong-Whan Lee

分类：计算机视觉

2022-03-28

面部表现攻击检测（PAD）的域适应性（DA）或域概括（DG）最近以其对看不见的攻击情景的鲁棒性引起了人们的注意。但是，现有的基于DA/DG的PAD方法尚未完全探索可以提供有关攻击样式知识（例如材料，背景，照明和分辨率）的知识的特定领域样式信息。在本文中，我们引入了一种新型样式引导的域适应性（SGDA）框架，用于推理时间自适应垫。具体而言，提出了样式选择性归一化（SSN），以探索高阶功能统计信息中特定领域的样式信息。提出的SSN通过减少目标域和源域之间的样式差异，使模型适应目标域。此外，我们仔细设计了风格的元学习（SAML）来增强适应能力，该能力模拟了虚拟测试域上的样式选择过程的推理时间适应。与以前的域适应方法相反，我们的方法不需要其他辅助模型（例如，域适配器）或训练过程中未标记的目标域，这使我们的方法更加实用。为了验证我们的实验，我们使用公共数据集：MSU-MFSD，CASIA-FASD，OULU-NPU和IDIAP REPLAYATTACK。在大多数评估中，与常规的基于DA/DG的PAD方法相比，结果表明性能差距显着。

translated by 谷歌翻译

Dual Spoof Disentanglement Generation for Face Anti-spoofing with Depth Uncertainty Learning

Hangtong Wu , Dan Zen , Yibo Hu , Hailin Shi , Tao Mei

分类：计算机视觉

2021-12-01

面部反欺骗（FAS）在防止演示攻击中的人脸识别系统中起着至关重要的作用。由于身份和微不足道的方差不足，现有面部反欺骗数据集缺乏多样性，这限制了FAS模型的泛化能力。在本文中，我们提出了双重欺骗解散生成（DSDG）框架，通过“通过生成反欺骗”来解决这一挑战。根据变形AutiaceDer（VAE）中的可解释分解潜在解剖学，DSDG学习身份表示的联合分布和潜在空间中的欺骗模式表示。然后，可以从随机噪声生成大规模成对的实时和欺骗图像，以提高训练集的分集。然而，由于VAE的固有缺陷，一些产生的面部图像被部分地扭曲。这种嘈杂的样本很难预测精确的深度值，因此可能阻碍广泛使用的深度监督优化。为了解决这个问题，我们进一步引入了轻量级深度不确定性模块（DUM），减轻了噪声样本对深度不确定性学习的不利影响。 DUM在没有依赖性的情况下开发，因此可以灵活地集成与任何深度监督网络进行面部反欺骗。我们评估了提出的方法在五个流行基准上的有效性，并在测试中实现了最先进的结果。该代码可在https://github.com/jdai-cv/facex-zoo/tree/main/addition_module/dsdg中获得。

translated by 谷歌翻译

Face Presentation Attack Detection

Zitong Yu , Chenxu Zhao , Zhen Lei

分类：计算机视觉

2022-12-07

Face recognition technology has been widely used in daily interactive applications such as checking-in and mobile payment due to its convenience and high accuracy. However, its vulnerability to presentation attacks (PAs) limits its reliable use in ultra-secure applicational scenarios. A presentation attack is first defined in ISO standard as: a presentation to the biometric data capture subsystem with the goal of interfering with the operation of the biometric system. Specifically, PAs range from simple 2D print, replay and more sophisticated 3D masks and partial masks. To defend the face recognition systems against PAs, both academia and industry have paid extensive attention to developing face presentation attack detection (PAD) technology (or namely `face anti-spoofing (FAS)').

translated by 谷歌翻译

Learning Polysemantic Spoof Trace: A Multi-Modal Disentanglement Network for Face Anti-spoofing

Kaicheng Li , Hongyu Yang , Binghui Chen , Pengyu Li , Biao Wang , Di Huang

分类：计算机视觉

2022-12-07

Along with the widespread use of face recognition systems, their vulnerability has become highlighted. While existing face anti-spoofing methods can be generalized between attack types, generic solutions are still challenging due to the diversity of spoof characteristics. Recently, the spoof trace disentanglement framework has shown great potential for coping with both seen and unseen spoof scenarios, but the performance is largely restricted by the single-modal input. This paper focuses on this issue and presents a multi-modal disentanglement model which targetedly learns polysemantic spoof traces for more accurate and robust generic attack detection. In particular, based on the adversarial learning mechanism, a two-stream disentangling network is designed to estimate spoof patterns from the RGB and depth inputs, respectively. In this case, it captures complementary spoofing clues inhering in different attacks. Furthermore, a fusion module is exploited, which recalibrates both representations at multiple stages to promote the disentanglement in each individual modality. It then performs cross-modality aggregation to deliver a more comprehensive spoof trace representation for prediction. Extensive evaluations are conducted on multiple benchmarks, demonstrating that learning polysemantic spoof traces favorably contributes to anti-spoofing with more perceptible and interpretable results.

translated by 谷歌翻译

Consistency Regularization for Deep Face Anti-Spoofing

Zezheng Wang , Zitong Yu , Xun Wang , Yunxiao Qin , Jiahong Li , Chenxu Zhao , Zhen Lei , Xin Liu , Size Li , Zhongyuan Wang

分类：计算机视觉

2021-11-24

面部反欺骗（FAS）在确保人脸识别系统中起着至关重要的作用。经验上，给定图像，在该图像的不同视图上具有更一致的输出的模型通常更好地执行，如图1所示。通过这种令人兴奋的观察，我们猜想令人鼓舞的特征符合不同视图的一致性可能是提升FAS模型的有希望的方法。在本文中，我们通过增强FAS中的嵌入级和预测级别一致性正规（EPCR）来彻底探讨这种方式。具体地，在嵌入级别，我们设计了密集的相似性损失，以最大化两个中间特征映射的所有位置之间以自我监督的方式;虽然在预测级别，我们优化了两个视图的预测之间的均方误差。值得注意的是，我们的EPCR没有注释，可以直接融入半监督的学习计划。考虑到不同的应用方案，我们进一步设计了五种不同的半监督协议，以衡量半监督的FAS技术。我们进行广泛的实验表明EPCR可以显着提高基准数据集上几个监督和半监控任务的性能。代码和协议即将发布。

translated by 谷歌翻译

Multi-domain Learning for Updating Face Anti-spoofing Models

Xiao Guo , Yaojie Liu , Anil Jain , Xiaoming Liu

分类：计算机视觉

2022-08-23

在这项工作中，我们研究了面部反动体组织（MD-FAS）的多域学习，其中需要更新预训练的FAS模型，以在源和目标域上同样表现出色，而仅使用目标域数据进行更新。我们为MD-FAS提供了一个新模型，该模型在学习新域数据时解决了遗忘问题，同时拥有高水平的适应性。首先，我们设计了一个简单而有效的模块，称为Spoof区域估计量（SRE），以识别欺骗图像中的欺骗痕迹。这种欺骗痕迹反映了源预先训练的模型的响应，该响应有助于升级模型在更新过程中打击灾难性遗忘。与先前的作品估计欺骗轨迹会产生多个输出或低分辨率二进制掩码，SRE以无监督的方式产生一个单一的，详细的像素估计值。其次，我们提出了一个名为FAS-Wrapper的新型框架，该框架从预先训练的模型中转移知识，并与不同的FAS模型无缝集成。最后，为了帮助社区进一步推进MD-FAS，我们基于SIW，SIW-MV2和Oulu-NPU构建了一个新的基准测试，并引入了四个不同的评估协议，其中源和目标域在欺骗类型，类型方面是不同的，年龄，种族和照明。我们提出的方法比以前的方法在MD-FAS基准上实现了卓越的性能。我们的代码和新策划的SIW-MV2公开可用。

translated by 谷歌翻译

Face Presentation Attack Detection using Taskonomy Feature

Wentian Zhang , Haozhe Liu , Raghavendra Ramachandra , Feng Liu , Linlin Shen , Christoph Busch

分类：计算机视觉

2021-11-22

呈现攻击检测（PAD）方法的稳健性和泛化能力至关重要，以确保面部识别系统（FRSS）的安全性。但是，在真实的场景中，呈现攻击（PAS）是各种各样的且难以收集的。现有焊盘方法高度依赖于有限的训练集，并且不能概括到未知的PAS。与PAD任务不同，可以有效地采用其他与真实面（例如面部识别和属性编辑）训练的其他与面部识别和属性编辑）培训的其他相关任务。灵感来自于此，我们建议从其他与面部相关的任务应用任务（任务分类）来解决面板，以改善检测PAS的泛化能力。所提出的方法，首先从其他面部相关任务引入任务特定功能，然后，我们使用曲线图注意网络（GAT）来设计跨模型适配器来重新绘制此类功能以适应焊盘任务。最后，通过使用基于CNN的PA检测器和重新映射特征的分层特征来实现面板。实验结果表明，与最先进的方法相比，该方法可以在复杂和混合数据集中实现显着的改进。特别是，当使用Oulu-NPU，Casia-Fasd和IDIAP重放攻击训练时，我们在MSU-MFSD中获得了5.48％的HTET（半总错误率），优于基准7.39％。代码将公开可用。

translated by 谷歌翻译

Learnable Multi-level Frequency Decomposition and Hierarchical Attention Mechanism for Generalized Face Presentation Attack Detection

Meiling Fang , Naser Damer , Florian Kirchbuchner , Arjan Kuijper

分类：计算机视觉

2021-09-16

随着在我们日常生活中的面部识别系统的部署增加，面部呈现攻击检测（PAD）在保护面部识别系统中吸引了很多关注并发挥着关键作用。尽管通过在数据集中的手工制作和基于深度学习的方法方面取得了巨大表现，但在处理看不见场景时的性能下降。在这项工作中，我们提出了一种双流卷积神经网络（CNNS）框架。一个流适应四种学习频率滤波器，以学习频域中的特征，这些功能域不太受传感器/照明的变化的影响。另一个流利用RGB图像来补充频域的特征。此外，我们提出了分层关注模块集成，通过考虑CNN的不同层中的深度特征的性质，在不同阶段中加入来自两个流的信息。在数据集内和交叉数据集设置中评估所提出的方法，结果表明，我们所提出的方法在与最先进的最先进的最新的大多数实验装置中提高了最平移，包括明确为域适应设计的方法/换档问题。我们成功证明了我们提出的垫解决方案的设计，在一步的融合研究中，涉及我们所提出的学习频率分解，我们的分层注意模块设计和使用的损耗功能。培训码和预先接受训练的型号是公开发布的

translated by 谷歌翻译

A Survey of Face Recognition

Xinyi Wang , Jianteng Peng , Sufang Zhang , Bihui Chen , Yi Wang , Yandong Guo

分类：计算机视觉

2022-12-26

Recent years witnessed the breakthrough of face recognition with deep convolutional neural networks. Dozens of papers in the field of FR are published every year. Some of them were applied in the industrial community and played an important role in human life such as device unlock, mobile payment, and so on. This paper provides an introduction to face recognition, including its history, pipeline, algorithms based on conventional manually designed features or deep learning, mainstream training, evaluation datasets, and related applications. We have analyzed and compared state-of-the-art works as many as possible, and also carefully designed a set of experiments to find the effect of backbone size and data distribution. This survey is a material of the tutorial named The Practical Face Recognition Technology in the Industrial World in the FG2023.

translated by 谷歌翻译

Meta-Learned Feature Critics for Domain Generalized Semantic Segmentation

Zu-Yun Shiau , Wei-Wei Lin , Ci-Siang Lin , Yu-Chiang Frank Wang

分类：计算机视觉

2021-12-27

如何通过学习和视觉社区进行识别或分割视觉数据时处理域名转移。在本文中，我们解决了域广义语义分割，其中分割模型在多个源极域上培训，预计将概括到未操作数据域。我们提出了一种具有功能解剖能力的新型元学习方案，它可以使用域泛化保证来派生语义分段的域中的功能。特别是，我们在我们的框架中介绍了一个特定于特定的功能批评模块，强制执行域泛化保证的解除义的视觉功能。最后，我们对基准数据集的定量结果证实了我们所提出的模型的有效性和稳健性，以及在分割中的最先进的域适应和泛化方法表现。

translated by 谷歌翻译

Meta-Teacher For Face Anti-Spoofing

Yunxiao Qin , Zitong Yu , Longbin Yan , Zezheng Wang , Chenxu Zhao , Zhen Lei

分类：计算机视觉 | 人工智能

2021-11-12

面部反欺骗（FAS）保护人脸识别从演示攻击（PAS）。现有的FAS方法通常监控PA探测器，使用手工制作二进制或像素 - 明智标签。然而，手工制作的标签可能不是监督PA探测器学习足够和内在欺骗线索的最适当的方式。我们提出了一种新的元师FAS（MT-FAS）方法来培训Meta-Tears FAS（MT-FAS）方法，用于更有效地监督PA探测器。元师以双层优化方式接受培训，以了解监督PA探测器学习丰富欺骗线索的能力。双级优化包含两个关键组件：1）元教师在培训集上监督探测器的学习过程的较低级别培训; 2）通过最大限度地减少探测器的验证损失，优化了元教师教学性能的更高级别培训。我们的元老师与现有的教师学生模型有很大不同，因为元教师明确培训，以便更好地教导探测器（学生），而现有教师受过卓越的准确性忽视教学能力。在五个FAS基准上的广泛实验表明，随着拟议的MT-FA，训练有素的Meta-Buiter 1）提供比手工标签和现有教师学生模型更适合的监督; 2）显着提高了PA探测器的性能。

translated by 谷歌翻译

Style Variable and Irrelevant Learning for Generalizable Person Re-identification

Haobo Chen , Chuyang Zhao , Kai Tu , Junru Chen , Yadong Li , Boxun Li

分类：计算机视觉

2022-09-12

最近，由于受监督人员重新识别（REID）的表现不佳，域名概括（DG）人REID引起了很多关注，旨在学习一个不敏感的模型，并可以抵抗域的影响偏见。在本文中，我们首先通过实验验证样式因素是域偏差的重要组成部分。基于这个结论，我们提出了一种样式变量且无关紧要的学习方法（SVIL）方法，以消除样式因素对模型的影响。具体来说，我们在SVIL中设计了样式的抖动模块（SJM）。 SJM模块可以丰富特定源域的样式多样性，并减少各种源域的样式差异。这导致该模型重点关注与身份相关的信息，并对样式变化不敏感。此外，我们将SJM模块与元学习算法有机结合，从而最大程度地提高了好处并进一步提高模型的概括能力。请注意，我们的SJM模块是插件和推理，无需成本。广泛的实验证实了我们的SVIL的有效性，而我们的方法的表现优于DG-REID基准测试的最先进方法。

translated by 谷歌翻译

Generative Domain Adaptation for Face Anti-Spoofing

Qianyu Zhou , Ke-Yue Zhang , Taiping Yao , Ran Yi , Kekai Sheng , Shouhong Ding , Lizhuang Ma

分类：计算机视觉

2022-07-20

基于无监督的域适应性（UDA），由于目标情景的表现有希望的表现，面部抗散热器（FAS）方法引起了人们的注意。大多数现有的UDA FAS方法通常通过对齐语义高级功能的分布来拟合受过训练的模型。但是，对未标记的目标域的监督不足，低水平特征对齐降低了现有方法的性能。为了解决这些问题，我们提出了UDA FAS的新颖观点，该视角将目标数据直接适合于模型，即，通过图像翻译将目标数据风格化为源域样式，并进一步将风格化的数据提供给训练有素的数据分类的源模型。提出的生成域适应（GDA）框架结合了两个精心设计的一致性约束：1）域间神经统计量的一致性指导发生器缩小域间间隙。 2）双层语义一致性确保了风格化图像的语义质量。此外，我们提出了域内频谱混合物，以进一步扩大目标数据分布，以确保概括并减少域内间隙。广泛的实验和可视化证明了我们方法对最新方法的有效性。

translated by 谷歌翻译

Benchmarking Joint Face Spoofing and Forgery Detection with Visual and Physiological Cues

Zitong Yu , Rizhao Cai , Zhi Li , Wenhan Yang , Jingang Shi , Alex C. Kot

分类：计算机视觉

2022-08-10

面对抗泡沫（FAS）和伪造探测在保护面部生物识别系统免受演示攻击（PAS）和恶性数字操作（例如，Deepfakes）中的生物识别系统中起着至关重要的作用。尽管大规模数据和强大的深层模型有希望的表现，但现有方法的概括问题仍然是一个空旷的问题。最近的大多数方法都集中在1）单峰视觉外观或生理学（即远程光摄影学（RPPG））线索；和2）用于FAS或面部伪造检测的分离特征表示。一方面，单峰外观和RPPG功能分别容易受到高保真的面孔3D面膜和视频重播攻击的影响，从而激发了我们设计可靠的多模式融合机制，用于广义面部攻击检测。另一方面，FAS和面部伪造探测任务（例如，定期的RPPG节奏和BONAFIDE的香草外观）都有丰富的共同特征，提供了可靠的证据来设计联合FAS和面部伪造探测系统，以多任务学习方式。在本文中，我们使用视觉外观和生理RPPG提示建立了第一个关节面欺骗和伪造的检测基准。为了增强RPPG的周期性歧视，我们使用两种面部时空时代的RPPG信号图及其连续小波转换为输入的两分支生理网络。为了减轻模态偏差并提高融合功效，我们在多模式融合之前对外观和RPPG特征进行了加权批次和层归一化。我们发现，可以通过对这两个任务的联合培训来改善单峰（外观或RPPG）和多模式（外观+RPPG）模型的概括能力。我们希望这种新的基准将促进FAS和DeepFake检测社区的未来研究。

translated by 谷歌翻译