智能论文笔记

Neural Style Transfer and Unpaired Image-to-Image Translation to deal with the Domain Shift Problem on Spheroid Segmentation

Manuel García-Domínguez , César Domínguez , Jónathan Heras , Eloy Mata , Vico Pascual

分类：计算机视觉 | 机器学习

2021-12-16

背景和目标。域移位是机器学习模型的泛化问题，当训练集的数据分布与模型部署时遇到的数据分布不同时发生的机器学习模型。由于实验条件，设备和捕获设置的方差，这在生物医学图像分段的背景下是常见的。在这项工作中，通过研究肿瘤球状体分割的神经风格转移算法和未配对的图像到图像转换方法来解决这一挑战。方法。我们已经在Spheroid Semonation的上下文中展示了具有4个深入学习分段模型的域移位问题，该模型在训练分布后的图像测试时实现了超过97％的IOU，但在应用于捕获的图像时，其性能下降到84 \％在不同的条件下。为了解决这个问题，我们已经探索了3种风格传输算法（NST，深图象类比和光刻），以及6个未配对的图像到图像转换算法（Compygan，Dualgan，Forkgan，Ganilla，Cut和FastCut）。这些算法已集成到高级API中，其促进其应用于发生域移位问题的其他上下文。结果。当应用于在不同条件下捕获的图像通过使用样式传输和图像到图像转换算法时，我们大大提高了4分段模型的性能。特别是，有2个样式传输算法（NST和深图谱）和1个未配对的图像到图像转换算法（Cyclegan），可在0.24至76.07的范围内改善模型的IOO。因此，在训练分布之后应用于使用模型获得的类似的性能。

translated by 谷歌翻译

Deep learning based domain adaptation for mitochondria segmentation on EM volumes

Daniel Franco-Barranco , Julio Pastor-Tronch , Aitor Gonzalez-Marfil , Arrate Muñoz-Barrutia , Ignacio Arganda-Carreras

分类：计算机视觉

2022-02-22

对大脑的电子显微镜（EM）体积的精确分割对于表征细胞或细胞器水平的神经元结构至关重要。尽管有监督的深度学习方法在过去几年中导致了该方向的重大突破，但它们通常需要大量的带注释的数据才能接受培训，并且在类似的实验和成像条件下获得的其他数据上的表现不佳。这是一个称为域适应的问题，因为从样本分布（或源域）中学到的模型难以维持其对从不同分布或目标域提取的样品的性能。在这项工作中，我们解决了基于深度学习的域适应性的复杂案例，以跨不同组织和物种的EM数据集进行线粒体分割。我们提出了三种无监督的域适应策略，以根据（1）两个域之间的最新样式转移来改善目标域中的线粒体分割；（2）使用未标记的源和目标图像预先培训模型的自我监督学习，然后仅用源标签进行微调；（3）具有标记和未标记图像的端到端训练的多任务神经网络体系结构。此外，我们提出了基于在源域中仅获得的形态学先验的新训练停止标准。我们使用三个公开可用的EM数据集进行了所有可能的跨数据库实验。我们评估了目标数据集预测的线粒体语义标签的拟议策略。此处介绍的方法优于基线方法，并与最新的状态相比。在没有验证标签的情况下，监视我们提出的基于形态的度量是停止训练过程并在平均最佳模型中选择的直观有效的方法。

translated by 谷歌翻译

Unsupervised Domain Adaptation with Histogram-gated Image Translation for Delayered IC Image Analysis

Yee-Yang Tee , Deruo Cheng , Chye-Soon Chee , Tong Lin , Yiqiong Shi , Bah-Hwee Gwee

分类：计算机视觉

2022-09-27

通过采用卷积神经网络（CNN）进行电路结构的分割，深度学习在具有挑战性的电路注释任务中取得了巨大的成功。深度学习方法需要大量手动注释的培训数据才能实现良好的性能，如果在给定数据集上培训的深度学习模型被应用于其他数据集，则可能导致性能降解。这通常称为电路注释的域移位问题，这源于不同图像数据集的分布的较大变化。可以从单个设备中的不同设备或不同层获得不同的图像数据集。为了解决域移位问题，我们提出了直方图门控图像翻译（HGIT），这是一个无监督的域适应框架，将图像从给定的源数据集转换为目标数据集的域，并利用转换的图像来训练段网络。具体而言，我们的HGIT执行基于生成的对抗网络（GAN）的图像翻译，并利用直方图统计数据进行数据策划。实验是在适应三个不同目标数据集（无标签的单个标记源数据集上进行的，并评估了每个目标数据集的分割性能。我们已经证明，与报道的域适应技术相比，我们的方法达到了最佳性能，并且还可以合理地接近完全监督的基准。

translated by 谷歌翻译

Experiments on Anomaly Detection in Autonomous Driving by Forward-Backward Style Transfers

Daniel Bogdoll , Meng Zhang , Maximilian Nitsche , J. Marius Zöllner

分类：计算机视觉 | 机器学习

2022-07-13

在过去的几年中，自主驾驶社区取得了巨大进展。然而，作为一个关键问题的问题，异常检测是朝着现实世界中大规模部署自动驾驶汽车的巨大障碍。尽管许多方法，例如不确定性估计或基于分割的图像重新合成，这是非常有希望的，但还有更多的探索。特别受到基于图像重新合成的异常检测作品的启发，我们提出了一种通过样式转移进行异常检测的新方法。我们利用生成模型将图像从其原始风格的道路交通域映射到任意型号，然后返回以生成Pixelwise Anomaly分数。但是，我们的实验证明了我们的假设错误，我们无法产生重大结果。但是，我们想分享我们的发现，以便其他人可以从我们的实验中学习。

translated by 谷歌翻译

Unsupervised Domain Adaptation for Cross-Modality Retinal Vessel Segmentation via Disentangling Representation Style Transfer and Collaborative Consistency Learning

Linkai Peng , Li Lin , Pujin Cheng , Ziqi Huang , Xiaoying Tang

分类：计算机视觉

2022-01-13

已经开发了各种深度学习模型，以从医学图像分段解剖结构，但它们通常在具有不同数据分布的另一个目标域上测试时具有差的性能。最近，已经提出了未经监督的域适应方法来缓解这种所谓的域移位问题，但大多数都是针对具有相对较小域移位的方案设计的，并且在遇到大域间隙时可能会失败。在本文中，我们提出DCDA，一种新的跨模型无监督域适应框架，用于具有大域移位的任务，例如，来自Octa和OCT图像的分段视网膜血管。 DCDA主要包括解开表示样式转移（DRST）模块和协作一致性学习（CCL）模块。 DRST将图像分解成内容组件和样式代码，并执行样式传输和图像重建。 CCL包含两个分段模型，一个用于源域，另一个用于目标域。这两种模型使用标记的数据（与相应的传输图像一起）进行监督学习，并在未标记的数据上执行协作一致性学习。每个模型都侧重于相应的单个域，并旨在产生专用域特定的分段模型。通过对视网膜船分割的广泛实验，我们的框架从Octa到Oct和Oct到Octa的OctA到Octa的骰子分数均达到目标培训的甲骨文，显着优于其他最先进的方法。

translated by 谷歌翻译

Review Neural Networks about Image Transformation Based on IGC Learning Framework with Annotated Information

Yuanjie Yan , Suorong Yang , Yan Wang , Jian Zhao , Furao Shen

分类：计算机视觉

2022-06-21

图像转换是一类视觉和图形问题，其目标是学习输入图像和输出图像之间的映射，在深神网络的背景下迅速发展。在计算机视觉（CV）中，许多问题可以被视为图像转换任务，例如语义分割和样式转移。这些作品具有不同的主题和动机，使图像转换任务蓬勃发展。一些调查仅回顾有关样式转移或图像到图像翻译的研究，所有这些都只是图像转换的一个分支。但是，没有一项调查总结这些调查在我们最佳知识的统一框架中共同起作用。本文提出了一个新颖的学习框架，包括独立学习，指导学习和合作学习，称为IGC学习框架。我们讨论的图像转换主要涉及有关深神经网络的一般图像到图像翻译和样式转移。从这个框架的角度来看，我们回顾了这些子任务，并对各种情况进行统一的解释。我们根据相似的开发趋势对图像转换的相关子任务进行分类。此外，已经进行了实验以验证IGC学习的有效性。最后，讨论了新的研究方向和开放问题，以供将来的研究。

translated by 谷歌翻译

Edge-preserving Domain Adaptation for semantic segmentation of Medical Images

Thong Vo , Naimul Khan

分类：计算机视觉 | 机器学习

2021-11-18

域适应是一种解决未经看线环境中缺乏大量标记数据的技术。提出了无监督的域适应，以使模型适用于使用单独标记的源数据和未标记的目标域数据的新模式。虽然已经提出了许多图像空间域适配方法来捕获像素级域移位，但是这种技术可能无法维持分割任务的高电平语义信息。对于生物医学图像的情况，在域之间的图像转换操作期间，诸如血管的细细节可能会丢失。在这项工作中，我们提出了一种模型，它使用周期 - 一致丢失在域之间适应域，同时通过在适应过程中强制执行基于边缘的损耗来维持原始图像的边缘细节。我们通过将其与其他两只眼底血管分割数据集的其他方法进行比较来证明我们的算法的有效性。与SOTA和〜5.2增量相比，我们达到了1.1〜9.2递增的骰子分数。

translated by 谷歌翻译

Global and Local Alignment Networks for Unpaired Image-to-Image Translation

Guanglei Yang , Hao Tang , Humphrey Shi , Mingli Ding , Nicu Sebe , Radu Timofte , Luc Van Gool , Elisa Ricci

分类：计算机视觉

2021-11-19

未配对的图像到图像转换的目标是产生反映目标域样式的输出图像，同时保持输入源图像的不相关内容不变。但是，由于缺乏对现有方法的内容变化的关注，来自源图像的语义信息遭受翻译期间的降级。在论文中，为了解决这个问题，我们介绍了一种新颖的方法，全局和局部对齐网络（GLA-NET）。全局对齐网络旨在将输入图像从源域传输到目标域。要有效地这样做，我们通过使用MLP-MILLER基于MATY编码器将多元高斯分布的参数（均值和标准偏差）作为样式特征学习。要更准确地传输样式，我们在编码器中使用自适应实例归一化层，具有目标多功能高斯分布的参数作为输入。我们还采用正常化和可能性损失，以进一步降低领域差距并产生高质量的产出。另外，我们介绍了局部对准网络，该网络采用预磨平的自我监督模型来通过新颖的局部对准丢失来产生注意图，确保翻译网络专注于相关像素。在五个公共数据集上进行的广泛实验表明，我们的方法有效地产生比现有方法更锐利和更现实的图像。我们的代码可在https://github.com/ygjwd12345/glanet获得。

translated by 谷歌翻译

Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

Jun-Yan Zhu , Taesung Park , Phillip Isola , Alexei A. Efros

分类：

2017-03-30

translated by 谷歌翻译

Multi-Modality Microscopy Image Style Transfer for Nuclei Segmentation

Ye Liu , Sophia J. Wagner , Tingying Peng

分类：计算机视觉

2021-11-23

用于核细胞分割的注释显微镜图像是费力且耗时的。为了利用少数现有的注释，也跨越多种方式，我们提出了一种基于生成的对抗网络（GAN）的新型显微镜式增强技术。与其他风格转移方法不同，它不仅可以处理不同的细胞测定类型和照明条件，还可以与不同的成像方式，例如亮场和荧光显微镜。使用Disentangled表示的内容和风格，我们可以在增强期间改变其风格的同时保留原始图像的结构。我们在2018年数据科学碗数据集上评估我们的数据增强，包括各种细胞测定，照明条件和成像方式。凭借我们的增强，竞争中两个排名排名蒙版R-CNN的核细胞分割算法的分割精度显着增加。因此，我们的增强技术使下游任务更加强大地对测试数据异质性，并有助于抵消类别不平衡而不重新采样少数类。

translated by 谷歌翻译

Structure Unbiased Adversarial Model for Medical Image Segmentation

Tianyang Zhang , Shaoming Zheng , Jun Cheng , Xi Jia , Joseph Bartlett , Xinxing Cheng , Huazhu Fu , Zhaowen Qiu , Jiang Liu , Jinming Duan

分类：计算机视觉

2022-05-25

在图像识别中已广泛提出了生成模型，以生成更多图像，其中分布与真实图像相似。它通常会引入一个歧视网络，以区分真实数据与生成的数据。这样的模型利用了一个歧视网络，该网络负责以区分样式从目标数据集中包含的数据传输的数据。但是，这样做的网络着重于强度分布的差异，并可能忽略数据集之间的结构差异。在本文中，我们制定了一个新的图像到图像翻译问题，以确保生成的图像的结构类似于目标数据集中的图像。我们提出了一个简单但功能强大的结构不稳定的对抗（SUA）网络，该网络在执行图像分割时介绍了训练和测试集之间的强度和结构差异。它由空间变换块组成，然后是强度分布渲染模块。提出了空间变换块来减少两个图像之间的结构缝隙，还产生了一个反变形字段，以使最终的分段图像背部扭曲。然后，强度分布渲染模块将变形结构呈现到具有目标强度分布的图像。实验结果表明，所提出的SUA方法具有在多个数据集之间传递强度分布和结构含量的能力。

translated by 谷歌翻译

CyCADA: Cycle-Consistent Adversarial Domain Adaptation

Judy Hoffman , Eric Tzeng , Taesung Park , Jun-Yan Zhu , Phillip Isola , Kate Saenko , Alexei A. Efros , Trevor Darrell

分类：

2017-11-08

Domain adaptation is critical for success in new, unseen environments. Adversarial adaptation models applied in feature spaces discover domain invariant representations, but are difficult to visualize and sometimes fail to capture pixel-level and low-level domain shifts. Recent work has shown that generative adversarial networks combined with cycle-consistency constraints are surprisingly effective at mapping images between domains, even without the use of aligned image pairs. We propose a novel discriminatively-trained Cycle-Consistent Adversarial Domain Adaptation model. CyCADA adapts representations at both the pixel-level and feature-level, enforces cycle-consistency while leveraging a task loss, and does not require aligned pairs. Our model can be applied in a variety of visual recognition and prediction settings. We show new state-of-the-art results across multiple adaptation tasks, including digit classification and semantic segmentation of road scenes demonstrating transfer from synthetic to real world domains.

translated by 谷歌翻译

CrossMoDA 2021 challenge: Benchmark of Cross-Modality Domain Adaptation techniques for Vestibular Schwnannoma and Cochlea Segmentation

Reuben Dorent , Aaron Kujawa , Marina Ivory , Spyridon Bakas , Nicola Rieke , Samuel Joutard , Ben Glocker , Jorge Cardoso , Marc Modat , Kayhan Batmanghelich

分类：计算机视觉

2022-01-08

域适应（DA）最近在医学影像社区提出了强烈的兴趣。虽然已经提出了大量DA技术进行了用于图像分割，但大多数这些技术已经在私有数据集或小公共可用数据集上验证。此外，这些数据集主要解决了单级问题。为了解决这些限制，与第24届医学图像计算和计算机辅助干预（Miccai 2021）结合第24届国际会议组织交叉模态域适应（Crossmoda）挑战。 Crossmoda是无监督跨型号DA的第一个大型和多级基准。挑战的目标是分割参与前庭施瓦新瘤（VS）的后续和治疗规划的两个关键脑结构：VS和Cochleas。目前，使用对比度增强的T1（CET1）MRI进行VS患者的诊断和监测。然而，使用诸如高分辨率T2（HRT2）MRI的非对比度序列越来越感兴趣。因此，我们创建了一个无人监督的跨模型分段基准。训练集提供注释CET1（n = 105）和未配对的非注释的HRT2（n = 105）。目的是在测试集中提供的HRT2上自动对HRT2进行单侧VS和双侧耳蜗分割（n = 137）。共有16支球队提交了评估阶段的算法。顶级履行团队达成的表现水平非常高（最佳中位数骰子 - vs：88.4％; Cochleas：85.7％）并接近完全监督（中位数骰子 - vs：92.5％;耳蜗：87.7％）。所有顶级执行方法都使用图像到图像转换方法将源域图像转换为伪目标域图像。然后使用这些生成的图像和为源图像提供的手动注释进行培训分割网络。

translated by 谷歌翻译

GAN-based Virtual Re-Staining: A Promising Solution for Whole Slide Image Analysis

Zhaoyang Xu , Xingru Huang , Carlos Fernández Moro , Béla Bozóky , Qianni Zhang

分类：计算机视觉

2019-01-13

组织病理学癌症诊断是基于对染色组织载玻片的视觉检查。苏木精和曙红（H \＆E）是全球常规使用的标准污渍。它很容易获取和成本效益，但是细胞和组织成分与深蓝色和粉红色的色调相对低，从而使视觉评估，数字图像分析和定量变得困难。这些局限性可以通过IHC的靶蛋白的IHC染色来克服。 IHC提供了细胞和组织成分的选择性高对比度成像，但是它们的使用在很大程度上受到了更为复杂的实验室处理和高成本的限制。我们提出了一个条件周期（CCGAN）网络，以将H \＆E染色的图像转换为IHC染色图像，从而促进同一幻灯片上的虚拟IHC染色。这种数据驱动的方法仅需要有限的标记数据，但会生成像素级分割结果。提出的CCGAN模型通过添加类别条件并引入两个结构性损失函数，改善了原始网络\ cite {Zhu_unpaired_2017}，从而实现多重辅助翻译并提高了翻译精度。％需要在这里给出理由。实验表明，所提出的模型在不配对的图像翻译中胜过具有多材料的原始方法。我们还探索了未配对的图像对图像翻译方法的潜力，该方法应用于其他组织学图像与不同染色技术相关的任务。

translated by 谷歌翻译

Unsupervised Domain Adaptation for Semantic Image Segmentation: a Comprehensive Survey

Gabriela Csurka , Riccardo Volpi , Boris Chidlovskii

分类：计算机视觉 | 人工智能

2021-12-06

语义分割在广泛的计算机视觉应用中起着基本作用，提供了全球对图像的理解的关键信息。然而，最先进的模型依赖于大量的注释样本，其比在诸如图像分类的任务中获得更昂贵的昂贵的样本。由于未标记的数据替代地获得更便宜，因此无监督的域适应达到了语义分割社区的广泛成功并不令人惊讶。本调查致力于总结这一令人难以置信的快速增长的领域的五年，这包含了语义细分本身的重要性，以及将分段模型适应新环境的关键需求。我们提出了最重要的语义分割方法;我们对语义分割的域适应技术提供了全面的调查;我们揭示了多域学习，域泛化，测试时间适应或无源域适应等较新的趋势;我们通过描述在语义细分研究中最广泛使用的数据集和基准测试来结束本调查。我们希望本调查将在学术界和工业中提供具有全面参考指导的研究人员，并有助于他们培养现场的新研究方向。

translated by 谷歌翻译

Time-of-Day Neural Style Transfer for Architectural Photographs

Yingshu Chen , Tuan-Anh Vu , Ka-Chun Shum , Binh-Son Hua , Sai-Kit Yeung

分类：计算机视觉

2022-09-13

建筑摄影是一种摄影类型，重点是捕获前景中带有戏剧性照明的建筑物或结构。受图像到图像翻译方法的成功启发，我们旨在为建筑照片执行风格转移。但是，建筑摄影中的特殊构图对这类照片中的样式转移构成了巨大挑战。现有的神经风格转移方法将建筑图像视为单个实体，它将产生与原始建筑的几何特征，产生不切实际的照明，错误的颜色演绎以及可视化伪影，例如幽灵，外观失真或颜色不匹配。在本文中，我们专门针对建筑摄影的神经风格转移方法。我们的方法解决了两个分支神经网络中建筑照片中前景和背景的组成，该神经网络分别考虑了前景和背景的样式转移。我们的方法包括一个分割模块，基于学习的图像到图像翻译模块和图像混合优化模块。我们使用了一天中不同的魔术时代捕获的不受限制的户外建筑照片的新数据集培训了图像到图像的翻译神经网络，利用其他语义信息，以更好地匹配和几何形状保存。我们的实验表明，我们的方法可以在前景和背景上产生逼真的照明和颜色演绎，并且在定量和定性上都优于一般图像到图像转换和任意样式转移基线。我们的代码和数据可在https://github.com/hkust-vgd/architectural_style_transfer上获得。

translated by 谷歌翻译

Mind The Gap: Alleviating Local Imbalance for Unsupervised Cross-Modality Medical Image Segmentation

Zixian Su , Kai Yao , Xi Yang , Qiufeng Wang , Yuyao Yan , Jie Sun , Kaizhu Huang

分类：计算机视觉

2022-05-24

无监督的交叉模式医学图像适应旨在减轻不同成像方式之间的严重域间隙，而无需使用目标域标签。该活动的关键依赖于对齐源和目标域的分布。一种常见的尝试是强制两个域之间的全局对齐，但是，这忽略了致命的局部不平衡域间隙问题，即，一些具有较大域间隙的局部特征很难转移。最近，某些方法进行一致性，重点是地方区域，以提高模型学习的效率。尽管此操作可能会导致上下文中关键信息的缺陷。为了应对这一限制，我们提出了一种新的策略，以减轻医学图像的特征，即全球本地联盟的一致性，以减轻域间隙不平衡。具体而言，功能 - 触发样式转移模块首先合成类似目标的源包含图像，以减少全局域间隙。然后，集成了本地功能掩码，以通过优先考虑具有较大域间隙的判别特征来减少本地特征的“间隙”。全球和局部对齐的这种组合可以精确地将关键区域定位在分割目标中，同时保持整体语义一致性。我们进行了一系列具有两个跨模式适应任务的实验，i，e。心脏子结构和腹部多器官分割。实验结果表明，我们的方法在这两个任务中都达到了最新的性能。

translated by 谷歌翻译

LE-UDA: Label-efficient unsupervised domain adaptation for medical image segmentation

Ziyuan Zhao , Fangcheng Zhou , Kaixin Xu , Zeng Zeng , Cuntai Guan , S. Kevin Zhou

分类：人工智能 | 计算机视觉

2022-12-05

While deep learning methods hitherto have achieved considerable success in medical image segmentation, they are still hampered by two limitations: (i) reliance on large-scale well-labeled datasets, which are difficult to curate due to the expert-driven and time-consuming nature of pixel-level annotations in clinical practices, and (ii) failure to generalize from one domain to another, especially when the target domain is a different modality with severe domain shifts. Recent unsupervised domain adaptation~(UDA) techniques leverage abundant labeled source data together with unlabeled target data to reduce the domain gap, but these methods degrade significantly with limited source annotations. In this study, we address this underexplored UDA problem, investigating a challenging but valuable realistic scenario, where the source domain not only exhibits domain shift~w.r.t. the target domain but also suffers from label scarcity. In this regard, we propose a novel and generic framework called ``Label-Efficient Unsupervised Domain Adaptation"~(LE-UDA). In LE-UDA, we construct self-ensembling consistency for knowledge transfer between both domains, as well as a self-ensembling adversarial learning module to achieve better feature alignment for UDA. To assess the effectiveness of our method, we conduct extensive experiments on two different tasks for cross-modality segmentation between MRI and CT images. Experimental results demonstrate that the proposed LE-UDA can efficiently leverage limited source labels to improve cross-domain segmentation performance, outperforming state-of-the-art UDA approaches in the literature. Code is available at: https://github.com/jacobzhaoziyuan/LE-UDA.

translated by 谷歌翻译

Source-free unsupervised domain adaptation for cross-modality abdominal multi-organ segmentation

Jin Hong , Yu-Dong Zhang , Weitian Chen

分类：计算机视觉

2021-11-24

实现域适应是有价值的，以将学习知识从标记为CT数据集传输到腹部多器官分段的目标未标记的MR DataSet。同时，非常希望避免目标数据集的高注重成本并保护源数据集的隐私。因此，我们提出了一种有效的无核心无监督域适应方法，用于跨型号腹部多器官分段而不访问源数据集。所提出的框架的过程包括两个阶段。在第一阶段，特征映射统计损失用于对准顶部分段网络中的源和目标特征的分布，并使用熵最小化损耗来鼓励高席位细分。从顶部分段网络输出的伪标签用于指导样式补偿网络生成类似源图像。从中间分割网络输出的伪标签用于监督所需模型的学习（底部分段网络）。在第二阶段，循环学习和像素自适应掩模细化用于进一步提高所需模型的性能。通过这种方法，我们在肝脏，肾脏，左肾肾脏和脾脏的分割中实现了令人满意的性能，骰子相似系数分别为0.884,0.891,0.864和0.911。此外，当存在目标注释数据时，所提出的方法可以很容易地扩展到情况。该性能在平均骰子相似度系数的0.888至0.922增加到0.888至0.922，靠近监督学习（0.929），只有一个标记的MR卷。

translated by 谷歌翻译

DCT-Net: Domain-Calibrated Translation for Portrait Stylization

Yifang Men , Yuan Yao , Miaomiao Cui , Zhouhui Lian , Xuansong Xie

分类：计算机视觉

2022-07-06

本文介绍了DCT-NET，这是一种新颖的图像翻译体系结构，可用于几张肖像风格。给定有限的样式示例（$ \ sim $ 100），新的体系结构可以产生高质量的样式转移结果，具有先进的能力，可以合成高保真内容和强大的一般性来处理复杂的场景（例如，遮挡和配件）。此外，它可以通过一个由部分观察（即风格化的头）训练的优雅评估网络启用全身图像翻译。几乎没有基于学习的样式转移是具有挑战性的，因为由于仅由少数几个培训示例形成的偏见分布，学到的模型很容易在目标域中过度拟合。本文旨在通过采用“首先校准，稍后翻译”的关键思想来应对挑战，并以本地注重的翻译探索增强的全球结构。具体而言，所提出的DCT-NET由三个模块组成：一个内容适配器从源照片借用功能的先验来校准目标样本的内容分布；使用仿射变换来释放空间语义约束的几何扩展模块；以及通过校准分布产生的样品的质地翻译模块学习细粒的转换。实验结果证明了所提出的方法在头部风格化方面具有优势及其对具有自适应变形的完整图像翻译的有效性。

translated by 谷歌翻译