智能论文笔记

TGCF: Texture guided color fusion for impressionism oil painting style rendering

Jing Geng , Yijun Yan , Xin Zhang

分类：计算机视觉

2022-07-26

作为非遗迹渲染（NPR）的主要分支，图像样式主要使用计算机算法将照片渲染为艺术绘画。最近的工作表明，样式信息的提取，例如笔触纹理和目标样式图像的颜色是图像风格的关键。鉴于其中风质地和颜色特征，提出了一种新的中风渲染方法，该方法完全考虑了音调特征和原始油画的代表性，以便将原始油画图像的音调适应风格化的图像并制作它接近艺术家的创造性效果。实验验证了所提出模型的功效。这种方法更适合具有相对均匀的方向意识的点尔主义画家的作品，尤其是对于自然场景。当原始绘画笔触具有更清晰的方向感时，使用此方法模拟刷子纹理特征可能会不那么令人满意。

translated by 谷歌翻译

An Overview of Color Transfer and Style Transfer for Images and Videos

Shiguang Liu

分类：计算机视觉

2022-04-28

图像或视频外观特征（例如颜色，纹理，音调，照明等）反映了一个人的视觉感知和对图像或视频的直接印象。给定的源图像（视频）和目标图像（视频），图像（视频）颜色传输技术旨在处理源图像或视频的颜色（请注意，源图像或视频也引用了参考图像或一些文献中的视频）使它看起来像目标图像或视频的视频，即将目标图像或视频的外观传输到源图像或视频的外观，从而可以改变对源图像或视频的感知。作为色彩传输的扩展，样式转移是指以风格样本或通过样式传输模型的样式样本或一组图像的艺术家的样式呈现目标图像或视频的内容。作为一个新兴领域，对风格转移的研究吸引了许多研究人员的注意。经过数十年的发展，它已成为一项高度的跨学科研究，并可以实现各种艺术表达方式。本文概述了过去几年的色彩传输和样式转移方法。

translated by 谷歌翻译

Deep Facial Synthesis: A New Challenge

Deng-Ping Fan , Ziling Huang , Peng Zheng , Hong Liu , Xuebin Qin , Luc Van Gool

分类：计算机视觉

2021-12-31

本文的目标是对面部素描合成（FSS）问题进行全面的研究。然而，由于获得了手绘草图数据集的高成本，因此缺乏完整的基准，用于评估过去十年的FSS算法的开发。因此，我们首先向FSS引入高质量的数据集，名为FS2K，其中包括2,104个图像素描对，跨越三种类型的草图样式，图像背景，照明条件，肤色和面部属性。 FS2K与以前的FSS数据集不同于难度，多样性和可扩展性，因此应促进FSS研究的进展。其次，我们通过调查139种古典方法，包括34个手工特征的面部素描合成方法，37个一般的神经式传输方法，43个深映像到图像翻译方法，以及35个图像 - 素描方法。此外，我们详细说明了现有的19个尖端模型的综合实验。第三，我们为FSS提供了一个简单的基准，名为FSGAN。只有两个直截了当的组件，即面部感知屏蔽和风格矢量扩展，FSGAN将超越所提出的FS2K数据集的所有先前最先进模型的性能，通过大边距。最后，我们在过去几年中汲取的经验教训，并指出了几个未解决的挑战。我们的开源代码可在https://github.com/dengpingfan/fsgan中获得。

translated by 谷歌翻译

Review Neural Networks about Image Transformation Based on IGC Learning Framework with Annotated Information

Yuanjie Yan , Suorong Yang , Yan Wang , Jian Zhao , Furao Shen

分类：计算机视觉

2022-06-21

图像转换是一类视觉和图形问题，其目标是学习输入图像和输出图像之间的映射，在深神网络的背景下迅速发展。在计算机视觉（CV）中，许多问题可以被视为图像转换任务，例如语义分割和样式转移。这些作品具有不同的主题和动机，使图像转换任务蓬勃发展。一些调查仅回顾有关样式转移或图像到图像翻译的研究，所有这些都只是图像转换的一个分支。但是，没有一项调查总结这些调查在我们最佳知识的统一框架中共同起作用。本文提出了一个新颖的学习框架，包括独立学习，指导学习和合作学习，称为IGC学习框架。我们讨论的图像转换主要涉及有关深神经网络的一般图像到图像翻译和样式转移。从这个框架的角度来看，我们回顾了这些子任务，并对各种情况进行统一的解释。我们根据相似的开发趋势对图像转换的相关子任务进行分类。此外，已经进行了实验以验证IGC学习的有效性。最后，讨论了新的研究方向和开放问题，以供将来的研究。

translated by 谷歌翻译

Visible and Near Infrared Image Fusion Based on Texture Information

Guanyu Zhang , Beichen Sun , Yuehan Qi , Yang Liu

分类：计算机视觉

2022-07-22

多传感器融合被广泛用于自动驾驶汽车的环境感知系统。它解决了由环境变化引起的干扰，并使整个驾驶系统更安全，更可靠。在本文中，提出了一种基于纹理信息的新型可见和近红外融合方法，以增强非结构化的环境图像。它针对传统可见和近红外图像融合方法中的工件，信息丢失和噪声问题。首先，通过相对总变化（RTV）计算，可见图像（RGB）的结构信息（RGB）和近红外图像（NIR）作为融合图像的基础层；其次，建立了贝叶斯分类模型来计算噪声重量和可见图像中的噪声信息和噪声信息通过关节双侧滤波器自适应过滤；最后，融合图像是通过颜色空间转换获得的。实验结果表明，所提出的算法可以保留光谱特性和无伪影和颜色失真的可见和近红外图像的独特信息，并且具有良好的鲁棒性以及保留独特的质地。

translated by 谷歌翻译

Interactive Cartoonization with Controllable Perceptual Factors

Namhyuk Ahn , Patrick Kwon , Jihye Back , Kibeom Hong , Seungkwon Kim

分类：计算机视觉

2022-12-19

Cartoonization is a task that renders natural photos into cartoon styles. Previous deep cartoonization methods only have focused on end-to-end translation, which may hinder editability. Instead, we propose a novel solution with editing features of texture and color based on the cartoon creation process. To do that, we design a model architecture to have separate decoders, texture and color, to decouple these attributes. In the texture decoder, we propose a texture controller, which enables a user to control stroke style and abstraction to generate diverse cartoon textures. We also introduce an HSV color augmentation to induce the networks to generate diverse and controllable color translation. To the best of our knowledge, our work is the first deep approach to control the cartoonization at inference while showing profound quality improvement over to baselines.

translated by 谷歌翻译

Quality Evaluation of Arbitrary Style Transfer: Subjective Study and Objective Metric

Hangwei Chen , Feng Shao , Xiongli Chai , Yuese Gu , Qiuping Jiang , Xiangchao Meng , Yo-Sung Ho

分类：计算机视觉

2022-08-01

任意神经风格转移是一个重要的主题，具有研究价值和工业应用前景，该主题旨在使用另一个样式呈现一个图像的结构。最近的研究已致力于任意风格转移（AST）的任务，以提高风格化质量。但是，关于AST图像的质量评估的探索很少，即使它可以指导不同算法的设计。在本文中，我们首先构建了一个新的AST图像质量评估数据库（AST-IQAD），该数据库包括150个内容样式的图像对以及由八种典型AST算法产生的相应的1200个风格化图像。然后，在我们的AST-IQAD数据库上进行了一项主观研究，该研究获得了三种主观评估（即内容保存（CP），样式相似（SR）和整体视觉（OV），该数据库获得了所有风格化图像的主观评分评分。。为了定量测量AST图像的质量，我们提出了一个新的基于稀疏表示的图像质量评估度量（SRQE），该指标（SRQE）使用稀疏特征相似性来计算质量。 AST-IQAD的实验结果证明了该方法的优越性。数据集和源代码将在https://github.com/hangwei-chen/ast-iqad-srqe上发布

translated by 谷歌翻译

Style Transfer with Target Feature Palette and Attention Coloring

Suhyeon Ha , Guisik Kim , Junseok Kwon

分类：计算机视觉

2021-11-07

STYLE TRANSED引起了大量的关注，因为它可以在保留图像结构的同时将给定图像更改为一个壮观的艺术风格。然而，常规方法容易丢失图像细节，并且在风格转移期间倾向于产生令人不快的伪影。在本文中，为了解决这些问题，提出了一种具有目标特征调色板的新颖艺术程式化方法，可以准确地传递关键特征。具体而言，我们的方法包含两个模块，即特征调色板组成（FPC）和注意着色（AC）模块。 FPC模块基于K-means群集捕获代表特征，并生成特征目标调色板。以下AC模块计算内容和样式图像之间的注意力映射，并根据注意力映射和目标调色板传输颜色和模式。这些模块使提出的程式化能够专注于关键功能并生成合理的传输图像。因此，所提出的方法的贡献是提出一种新的深度学习的样式转移方法和当前目标特征调色板和注意着色模块，并通过详尽的消融研究提供对所提出的方法的深入分析和洞察。定性和定量结果表明，我们的程式化图像具有最先进的性能，具有保护核心结构和内容图像的细节。

translated by 谷歌翻译

ARF: Artistic Radiance Fields

Kai Zhang , Nick Kolkin , Sai Bi , Fujun Luan , Zexiang Xu , Eli Shechtman , Noah Snavely

分类：计算机视觉

2022-06-13

我们提出了一种将任意样式图像的艺术特征转移到3D场景的方法。在点云或网格上执行3D风格的先前方法对复杂的现实世界场景的几何重建错误敏感。取而代之的是，我们建议对更健壮的辐射场字段表示。我们发现，常用的基于克矩阵的损失倾向于在没有忠实笔触的情况下产生模糊的结果，并引入了最近的基于邻居的损失，该损失非常有效地捕获样式的细节，同时保持多视图一致性。我们还提出了一种新颖的递延后传播方法，以使用在全分辨率渲染图像上定义的样式损失来优化记忆密集型辐射场。我们广泛的评估表明，我们的方法通过产生与样式图像更相似的艺术外观来优于基线。请检查我们的项目页面以获取视频结果和开源实现：https：//www.cs.cornell.edu/projects/arf/。

translated by 谷歌翻译

Image style transfer using convolutional neural networks

分类：

Rendering the semantic content of an image in different styles is a difficult image processing task. Arguably, a major limiting factor for previous approaches has been the lack of image representations that explicitly represent semantic information and, thus, allow to separate image content from style. Here we use image representations derived from Convolutional Neural Networks optimised for object recognition, which make high level image information explicit. We introduce A Neural Algorithm of Artistic Style that can separate and recombine the image content and style of natural images. The algorithm allows us to produce new images of high perceptual quality that combine the content of an arbitrary photograph with the appearance of numerous wellknown artworks. Our results provide new insights into the deep image representations learned by Convolutional Neural Networks and demonstrate their potential for high level image synthesis and manipulation.

translated by 谷歌翻译

Generative Artisan: A Semantic-Aware and Controllable CLIPstyler

Zhenling Yang , Huacheng Song , Qiunan Wu

分类：计算机视觉 | 人工智能

2022-07-23

回想一下，大多数当前图像样式转移方法要求用户给出特定样式的图像，然后提取该样式功能和纹理以生成图像的样式，但仍然存在一些问题：用户可能没有一个参考样式图像，或者很难用一个图像总结所需的样式。最近提议的夹板解决了此问题，该问题仅根据提供的样式图像的描述来执行样式转移。尽管当景观或肖像单独出现时，ClipStyler可以取得良好的性能，但它可能会模糊人民并在人和风景共存时失去原始语义。基于这些问题，我们演示了一个新颖的框架，该框架使用了预训练的剪辑文本图像嵌入模型，并通过FCN语义分割网络指导图像样式传输。具体而言，我们解决了与人类主题相机的自拍照和现实世界的肖像过度风格的问题，增强了肖像和景观风格转移效果之间的对比，并使不同语义部分的图像风格转移程度完全可控。我们的生成工匠解决了夹具的失败案例，并产生定性和定量方法，以证明我们在自拍照和人类受试者照片中的自拍照和现实世界景观中的剪贴画的结果要好得多。这种改进使我们可以将我们的业务场景框架（例如修饰图形软件）进行商业化。

translated by 谷歌翻译

AdaCM: Adaptive ColorMLP for Real-Time Universal Photo-realistic Style Transfer

Tianwei Lin , Honglin Lin , Fu Li , Dongliang He , Wenhao Wu , Meiling Wang , Xin Li , Yong Liu

分类：计算机视觉

2022-12-03

Photo-realistic style transfer aims at migrating the artistic style from an exemplar style image to a content image, producing a result image without spatial distortions or unrealistic artifacts. Impressive results have been achieved by recent deep models. However, deep neural network based methods are too expensive to run in real-time. Meanwhile, bilateral grid based methods are much faster but still contain artifacts like overexposure. In this work, we propose the \textbf{Adaptive ColorMLP (AdaCM)}, an effective and efficient framework for universal photo-realistic style transfer. First, we find the complex non-linear color mapping between input and target domain can be efficiently modeled by a small multi-layer perceptron (ColorMLP) model. Then, in \textbf{AdaCM}, we adopt a CNN encoder to adaptively predict all parameters for the ColorMLP conditioned on each input content and style image pair. Experimental results demonstrate that AdaCM can generate vivid and high-quality stylization results. Meanwhile, our AdaCM is ultrafast and can process a 4K resolution image in 6ms on one V100 GPU.

translated by 谷歌翻译

Making Images Real Again: A Comprehensive Survey on Deep Image Composition

Li Niu , Wenyan Cong , Liu Liu , Yan Hong , Bo Zhang , Jing Liang , Liqing Zhang

分类：计算机视觉

2021-06-28

作为一个常见的图像编辑操作，图像组成旨在将前景从一个图像切割并粘贴在另一个图像上，从而产生复合图像。但是，有许多问题可能使复合图像不现实。这些问题可以总结为前景和背景之间的不一致，包括外观不一致（例如，不兼容的照明），几何不一致（例如不合理的大小）和语义不一致（例如，不匹配的语义上下文）。先前的作品将图像组成任务分为多个子任务，其中每个子任务在一个或多个问题上目标。具体而言，对象放置旨在为前景找到合理的比例，位置和形状。图像混合旨在解决前景和背景之间的不自然边界。图像协调旨在调整前景的照明统计数据。影子生成旨在为前景产生合理的阴影。通过将所有上述努力放在一起，我们可以获取现实的复合图像。据我们所知，以前没有关于图像组成的调查。在本文中，我们对图像组成的子任务进行了全面的调查。对于每个子任务，我们总结了传统方法，基于深度学习的方法，数据集和评估。我们还指出了每个子任务中现有方法的局限性以及整个图像组成任务的问题。图像组合的数据集和代码在https://github.com/bcmi/awesome-image-composition上进行了总结。

translated by 谷歌翻译

Two Decades of Colorization and Decolorization for Images and Videos

Shiguang Liu

分类：计算机视觉

2022-04-28

着色是一个计算机辅助过程，旨在为灰色图像或视频赋予色彩。它可用于增强黑白图像，包括黑白照片，老式电影和科学成像结果。相反，不着色是将颜色图像或视频转换为灰度。灰度图像或视频是指没有颜色信息的亮度信息的图像或视频。它是一些下游图像处理应用程序的基础，例如模式识别，图像分割和图像增强。与图像脱色不同，视频脱色不仅应考虑每个视频框架中的图像对比度保存，而且还应尊重视频框架之间的时间和空间一致性。研究人员致力于通过平衡时空的一致性和算法效率来开发脱色方法。随着数码相机和手机的流行，研究人员越来越关注图像和视频着色和脱色。本文概述了过去二十年来图像和视频着色和脱色方法的进度。

translated by 谷歌翻译

CLIPstyler: Image Style Transfer with a Single Text Condition

Gihyun Kwon , Jong Chul Ye

分类：计算机视觉 | 自然语言处理

2021-12-01

现有的神经样式传输方法需要参考样式图像来将样式图像的纹理信息传输到内容图像。然而，在许多实际情况中，用户可能没有参考样式图像，但仍然有兴趣通过想象它们来传输样式。为了处理此类应用程序，我们提出了一个新的框架，它可以实现样式转移`没有'风格图像，但仅使用所需风格的文本描述。使用预先训练的文本图像嵌入模型的剪辑，我们仅通过单个文本条件展示了内容图像样式的调制。具体而言，我们提出了一种针对现实纹理传输的多视图增强的修补程序文本图像匹配丢失。广泛的实验结果证实了具有反映语义查询文本的现实纹理的成功图像风格转移。

translated by 谷歌翻译

Aesthetic Attribute Assessment of Images Numerically on Mixed Multi-attribute Datasets

Xin Jin , Xinning Li , Hao Lou , Chenyu Fan , Qiang Deng , Chaoen Xiao , Shuai Cui , Amit Kumar Singh

分类：计算机视觉

2022-07-05

随着社交软件和多媒体技术的持续发展，图像已成为传播信息和社交的重要载体。如何全面评估图像已成为最近研究的重点。传统的图像美学评估方法通常采用单个数值总体评估评分，该评估具有一定的主观性，无法再满足更高的美学要求。在本文中，我们构建了一个称为Aesthetic混合数据集的新图像属性数据集，该数据集具有属性（AMD-A）和设计融合的外部属性功能。此外，我们还提出了一种有效的方法，用于在混合多属性数据集上进行图像美学属性评估，并通过使用ExtisticNet-B0作为骨干网络来构建多任务网络体系结构。我们的模型可以实现美学分类，整体评分和属性评分。在每个子网络中，我们通过ECA通道注意模块改进特征提取。至于最终的整体评分，我们采用了教师学习网络的想法，并使用分类子网络来指导美学的整体细粒回归。实验结果，使用思维螺旋式的结果表明，我们提出的方法可以有效地改善美学整体和属性评估的性能。

translated by 谷歌翻译

UPST-NeRF: Universal Photorealistic Style Transfer of Neural Radiance Fields for 3D Scene

Yaosen Chen , Qi Yuan , Zhiqiang Li , Yuegen Liu Wei Wang Chaoping Xie , Xuming Wen , Qien Yu

分类：计算机视觉

2022-08-15

3D场景感性风格化旨在根据给定的样式图像从任意新颖的视图中生成光真逼真的图像，同时在从不同观点呈现时确保一致性。一些带有神经辐射场的现有风格化方法可以通过将样式图像的特征与多视图图像结合到训练3D场景来有效地预测风格化的场景。但是，这些方法生成了包含令人反感的伪影的新型视图图像。此外，他们无法为3D场景实现普遍的影迷风格化。因此，样式图像必须根据神经辐射场重新训练3D场景表示网络。我们提出了一个新颖的3D场景，逼真的风格转移框架来解决这些问题。它可以通过2D样式图像实现感性3D场景样式转移。我们首先预先训练了2D逼真的样式传输网络，该网络可以符合任何给定内容图像和样式图像之间的影片风格转移。然后，我们使用体素特征来优化3D场景并获得场景的几何表示。最后，我们共同优化了一个超级网络，以实现场景的逼真风格传输的任意样式图像。在转移阶段，我们使用预先训练的2D影视网络来限制3D场景中不同视图和不同样式图像的感性风格。实验结果表明，我们的方法不仅实现了任意样式图像的3D影像风格转移，而且还优于视觉质量和一致性方面的现有方法。项目页面：https：//semchan.github.io/upst_nerf。

translated by 谷歌翻译

XCI-Sketch: Extraction of Color Information from Images for Generation of Colored Outlines and Sketches

V Manushree , Sameer Saxena , Parna Chowdhury , Manisimha Varma , Harsh Rathod , Ankita Ghosh , Sahil Khose

分类：计算机视觉 | 人工智能

2021-08-26

草图是一种从个人的创造性角度传达视觉场景的媒介。添加颜色基本上增强了草图的总体表征。本文提出了通过利用轮廓绘制数据集来模仿人绘制着色草图的两种方法。我们的第一个方法通过应用k-means颜色聚类辅助的图像处理技术来呈现彩色的轮廓草图。第二种方法使用生成的对抗性网络来开发一个可以从先前未观察到的图像生成彩色草图的模型。我们评估通过定量和定性评估获得的结果。

translated by 谷歌翻译

Time-of-Day Neural Style Transfer for Architectural Photographs

Yingshu Chen , Tuan-Anh Vu , Ka-Chun Shum , Binh-Son Hua , Sai-Kit Yeung

分类：计算机视觉

2022-09-13

建筑摄影是一种摄影类型，重点是捕获前景中带有戏剧性照明的建筑物或结构。受图像到图像翻译方法的成功启发，我们旨在为建筑照片执行风格转移。但是，建筑摄影中的特殊构图对这类照片中的样式转移构成了巨大挑战。现有的神经风格转移方法将建筑图像视为单个实体，它将产生与原始建筑的几何特征，产生不切实际的照明，错误的颜色演绎以及可视化伪影，例如幽灵，外观失真或颜色不匹配。在本文中，我们专门针对建筑摄影的神经风格转移方法。我们的方法解决了两个分支神经网络中建筑照片中前景和背景的组成，该神经网络分别考虑了前景和背景的样式转移。我们的方法包括一个分割模块，基于学习的图像到图像翻译模块和图像混合优化模块。我们使用了一天中不同的魔术时代捕获的不受限制的户外建筑照片的新数据集培训了图像到图像的翻译神经网络，利用其他语义信息，以更好地匹配和几何形状保存。我们的实验表明，我们的方法可以在前景和背景上产生逼真的照明和颜色演绎，并且在定量和定性上都优于一般图像到图像转换和任意样式转移基线。我们的代码和数据可在https://github.com/hkust-vgd/architectural_style_transfer上获得。

translated by 谷歌翻译

Towards Ultra-Resolution Neural Style Transfer via Thumbnail Instance Normalization

Zhe Chen , Wenhai Wang , Enze Xie , Tong Lu , Ping Luo

分类：计算机视觉

2021-03-22

我们提出了一个极其简单的超分辨率样式转移框架，称为URST，以灵活地处理任意的高分辨率图像（例如，10000x10000像素）第一次转移。由于在处理超高分辨率图像时，由于巨大的内存成本和小行程大小，大多数现有最先进的方法将降低。 URST完全避免了由超高分辨率图像引起的内存问题（1）将图像划分为小块和（2）与新颖的缩略图实例归一化（TIN）执行修补程序样式传输。具体而言，TIN可以提取缩略图功能的归一化统计信息，并将它们应用于小补丁，确保不同补丁之间的风格一致性。总的来说，与现有技术相比，URST框架有三个优点。（1）我们将输入图像分为小补丁并采用锡，成功传输图像样式，具有任意的高分辨率。（2）实验表明，我们的URST超越了现有的SOTA方法对超高分辨率图像，从提高行程大小的提出的中风感知损失的有效性中受益。（3）我们的URST可以轻松插入大多数现有的样式转移方法，即使在没有培训的情况下也直接提高他们的性能。代码可在https://git.io/urst上获得。

translated by 谷歌翻译