智能论文笔记

SynCLay: Interactive Synthesis of Histology Images from Bespoke Cellular Layouts

Srijay Deshpande , Muhammad Dawood , Fayyaz Minhas , Nasir Rajpoot

分类：计算机视觉 | 机器学习

2022-12-28

Automated synthesis of histology images has several potential applications in computational pathology. However, no existing method can generate realistic tissue images with a bespoke cellular layout or user-defined histology parameters. In this work, we propose a novel framework called SynCLay (Synthesis from Cellular Layouts) that can construct realistic and high-quality histology images from user-defined cellular layouts along with annotated cellular boundaries. Tissue image generation based on bespoke cellular layouts through the proposed framework allows users to generate different histological patterns from arbitrary topological arrangement of different types of cells. SynCLay generated synthetic images can be helpful in studying the role of different types of cells present in the tumor microenvironmet. Additionally, they can assist in balancing the distribution of cellular counts in tissue images for designing accurate cellular composition predictors by minimizing the effects of data imbalance. We train SynCLay in an adversarial manner and integrate a nuclear segmentation and classification model in its training to refine nuclear structures and generate nuclear masks in conjunction with synthetic images. During inference, we combine the model with another parametric model for generating colon images and associated cellular counts as annotations given the grade of differentiation and cell densities of different cells. We assess the generated images quantitatively and report on feedback from trained pathologists who assigned realism scores to a set of images generated by the framework. The average realism score across all pathologists for synthetic images was as high as that for the real images. We also show that augmenting limited real data with the synthetic data generated by our framework can significantly boost prediction performance of the cellular composition prediction task.

translated by 谷歌翻译

Image Generation from Scene Graphs

Justin Johnson , Agrim Gupta , Li Fei-Fei

分类：

2018-04-04

To truly understand the visual world our models should be able not only to recognize images but also generate them. To this end, there has been exciting recent progress on generating images from natural language descriptions. These methods give stunning results on limited domains such as descriptions of birds or flowers, but struggle to faithfully reproduce complex sentences with many objects and relationships. To overcome this limitation we propose a method for generating images from scene graphs, enabling explicitly reasoning about objects and their relationships. Our model uses graph convolution to process input graphs, computes a scene layout by predicting bounding boxes and segmentation masks for objects, and converts the layout to an image with a cascaded refinement network. The network is trained adversarially against a pair of discriminators to ensure realistic outputs. We validate our approach on Visual Genome and COCO-Stuff, where qualitative results, ablations, and user studies demonstrate our method's ability to generate complex images with multiple objects.

translated by 谷歌翻译

Neural Scene Decoration from a Single Photograph

Hong-Wing Pang , Yingshu Chen , Phuoc-Hieu Le , Binh-Son Hua , Duc Thanh Nguyen , Sai-Kit Yeung

分类：计算机视觉

2021-08-04

提供和渲染室内场景一直是室内设计的一项长期任务，艺术家为空间创建概念设计，建立3D模型的空间，装饰，然后执行渲染。尽管任务很重要，但它很乏味，需要巨大的努力。在本文中，我们引入了一个特定领域的室内场景图像合成的新问题，即神经场景装饰。鉴于一张空的室内空间的照片以及用户确定的布局列表，我们旨在合成具有所需的家具和装饰的相同空间的新图像。神经场景装饰可用于以简单而有效的方式创建概念室内设计。我们解决这个研究问题的尝试是一种新颖的场景生成体系结构，它将空的场景和对象布局转化为现实的场景照片。我们通过将其与有条件图像合成基线进行比较，以定性和定量的方式将其进行比较，证明了我们提出的方法的性能。我们进行广泛的实验，以进一步验证我们生成的场景的合理性和美学。我们的实现可在\ url {https://github.com/hkust-vgd/neural_scene_decoration}获得。

translated by 谷歌翻译

Deepfake histological images for enhancing digital pathology

Kianoush Falahkheirkhah , Saumya Tiwari , Kevin Yeh , Sounak Gupta , Loren Herrera-Hernandez , Michael R. McCarthy , Rafael E. Jimenez , John C. Cheville , Rohit Bhargava

分类：计算机视觉 | 机器学习

2022-06-16

对从FFPE组织块制备的载玻片上切割的染色组织的光学显微镜检查是组织诊断的金标准。此外，任何病理学家的诊断能力和专业知识都取决于他们在常见和稀有变体形态上的直接经验。最近，深度学习方法已被用来成功显示此类任务的高度准确性。但是，获得专家级注释的图像是一项昂贵且耗时的任务，人为合成的组织学图像可能会非常有益。在这里，我们提出了一种方法，不仅可以生成组织学图像，从而重现普通疾病的诊断形态特征，而且还提供了产生新的和罕见形态的用户能力。我们的方法涉及开发一种生成的对抗网络模型，该模型综合了由类标签约束的病理图像。我们研究了该框架合成现实的前列腺和结肠组织图像的能力，并评估了这些图像在增强机器学习方法的诊断能力以及通过一组经验丰富的解剖病理学家的可用性方面的实用性。我们的框架生成的合成数据在训练深度学习模型中进行了类似于实际数据进行诊断。病理学家无法区分真实图像和合成图像，并显示出相似的前列腺癌分级的观察者间一致性。我们扩展了从结肠活检中显着复杂图像的方法，并表明也可以再现了此类组织中的复杂微环境。最后，我们介绍了用户通过简单的语义标签标记来生成深层组织学图像的能力。

translated by 谷歌翻译

SIAN: Style-Guided Instance-Adaptive Normalization for Multi-Organ Histopathology Image Synthesis

Haotian Wang , Min Xian , Aleksandar Vakanski , Bryar Shareef

分类：计算机视觉 | 机器学习

2022-09-02

组织病理学图像合成的现有深网无法为聚类核生成准确的边界，并且无法输出与不同器官一致的图像样式。为了解决这些问题，我们提出了一种样式引导的实例自适应标准化（SIAN），以合成不同器官的逼真的颜色分布和纹理。 Sian包含四个阶段：语义，风格化，实例化和调制。这四个阶段共同起作用，并集成到生成网络中，以嵌入图像语义，样式和实例级级边界。实验结果证明了所有组件在Sian中的有效性，并表明所提出的方法比使用Frechet Inception Inception距离（FID），结构相似性指数（SSIM），检测质量胜过组织病理学图像合成的最新条件gan。（DQ），分割质量（SQ）和圆锥体质量（PQ）。此外，通过合并使用Sian产生的合成图像，可以显着改善分割网络的性能。

translated by 谷歌翻译

Selective Synthetic Augmentation with HistoGAN for Improved Histopathology Image Classification

Yuan Xue , Jiarong Ye , Qianying Zhou , Rodney Long , Sameer Antani , Zhiyun Xue , Carl Cornwell , Richard Zaino , Keith Cheng , Xiaolei Huang

分类：计算机视觉

2021-11-10

组织病理学分析是对癌前病变诊断的本金标准。从数字图像自动组织病理学分类的目标需要监督培训，这需要大量的专家注释，这可能是昂贵且耗时的收集。同时，精确分类从全幻灯片裁剪的图像斑块对于基于标准滑动窗口的组织病理学幻灯片分类方法是必不可少的。为了减轻这些问题，我们提出了一个精心设计的条件GaN模型，即hostogan，用于在类标签上合成现实组织病理学图像补丁。我们还研究了一种新颖的合成增强框架，可选择地添加由我们提出的HADOGAN生成的新的合成图像补丁，而不是直接扩展与合成图像的训练集。通过基于其指定标签的置信度和实际标记图像的特征相似性选择合成图像，我们的框架为合成增强提供了质量保证。我们的模型在两个数据集上进行评估：具有有限注释的宫颈组织病理学图像数据集，以及具有转移性癌症的淋巴结组织病理学图像的另一个数据集。在这里，我们表明利用具有选择性增强的组织产生的图像导致对宫颈组织病理学和转移性癌症数据集分别的分类性能（分别为6.7％和2.8％）的显着和一致性。

translated by 谷歌翻译

A Shared Representation for Photorealistic Driving Simulators

Saeed Saadatnejad , Siyuan Li , Taylor Mordan , Alexandre Alahi

分类：计算机视觉

2021-12-09

强大的模拟器高度降低了在培训和评估自动车辆时对真实测试的需求。数据驱动的模拟器蓬勃发展，最近有条件生成对冲网络（CGANS）的进步，提供高保真图像。主要挑战是在施加约束之后的同时合成光量造型图像。在这项工作中，我们建议通过重新思考鉴别者架构来提高所生成的图像的质量。重点是在给定对语义输入生成图像的问题类上，例如场景分段图或人体姿势。我们建立成功的CGAN模型，提出了一种新的语义感知鉴别器，更好地指导发电机。我们的目标是学习一个共享的潜在表示，编码足够的信息，共同进行语义分割，内容重建以及粗糙的粒度的对抗性推理。实现的改进是通用的，并且可以应用于任何条件图像合成的任何架构。我们展示了我们在场景，建筑和人类综合任务上的方法，跨越三个不同的数据集。代码可在https://github.com/vita-epfl/semdisc上获得。

translated by 谷歌翻译

BiOcularGAN: Bimodal Synthesis and Annotation of Ocular Images

Darian Tomašević , Peter Peer , Vitomir Štruc

分类：计算机视觉 | 机器学习

2022-05-03

Current state-of-the-art segmentation techniques for ocular images are critically dependent on large-scale annotated datasets, which are labor-intensive to gather and often raise privacy concerns. In this paper, we present a novel framework, called BiOcularGAN, capable of generating synthetic large-scale datasets of photorealistic (visible light and near-infrared) ocular images, together with corresponding segmentation labels to address these issues. At its core, the framework relies on a novel Dual-Branch StyleGAN2 (DB-StyleGAN2) model that facilitates bimodal image generation, and a Semantic Mask Generator (SMG) component that produces semantic annotations by exploiting latent features of the DB-StyleGAN2 model. We evaluate BiOcularGAN through extensive experiments across five diverse ocular datasets and analyze the effects of bimodal data generation on image quality and the produced annotations. Our experimental results show that BiOcularGAN is able to produce high-quality matching bimodal images and annotations (with minimal manual intervention) that can be used to train highly competitive (deep) segmentation models (in a privacy aware-manner) that perform well across multiple real-world datasets. The source code for the BiOcularGAN framework is publicly available at https://github.com/dariant/BiOcularGAN.

translated by 谷歌翻译

Nuclei & Glands Instance Segmentation in Histology Images: A Narrative Review

Esha Sadia Nasir , Arshi Perviaz , Muhammad Moazam Fraz

分类：计算机视觉

2022-08-26

组织学图像中核和腺体的实例分割是用于癌症诊断，治疗计划和生存分析的计算病理学工作流程中的重要一步。随着现代硬件的出现，大规模质量公共数据集的最新可用性以及社区组织的宏伟挑战已经看到了自动化方法的激增，重点是特定领域的挑战，这对于技术进步和临床翻译至关重要。在这项调查中，深入分析了过去五年（2017-2022）中发表的原子核和腺体实例细分的126篇论文，进行了深入分析，讨论了当前方法的局限性和公开挑战。此外，提出了潜在的未来研究方向，并总结了最先进方法的贡献。此外，还提供了有关公开可用数据集的概括摘要以及关于说明每种挑战的最佳性能方法的巨大挑战的详细见解。此外，我们旨在使读者现有研究的现状和指针在未来的发展方向上开发可用于临床实践的方法，从而可以改善诊断，分级，预后和癌症的治疗计划。据我们所知，以前没有工作回顾了朝向这一方向的组织学图像中的实例细分。

translated by 谷歌翻译

HTML版本

Comparison and Analysis of Image-to-Image Generative Adversarial Networks: A Survey

Sagar Saxena , Mohammad Nayeem Teli

分类：计算机视觉

2021-12-23

生成的对抗网络（GANS）最近引入了执行图像到图像翻译的有效方法。这些模型可以应用于图像到图像到图像转换中的各种域而不改变任何参数。在本文中，我们调查并分析了八个图像到图像生成的对策网络：PIX2PX，Cyclegan，Cogan，Stargan，Munit，Stargan2，Da-Gan，以及自我关注GaN。这些模型中的每一个都呈现了最先进的结果，并引入了构建图像到图像的新技术。除了对模型的调查外，我们还调查了他们接受培训的18个数据集，并在其上进行了评估的9个指标。最后，我们在常见的一组指标和数据集中呈现6种这些模型的受控实验的结果。结果混合并显示，在某些数据集，任务和指标上，某些型号优于其他型号。本文的最后一部分讨论了这些结果并建立了未来研究领域。由于研究人员继续创新新的图像到图像GAN，因此他们非常重要地了解现有方法，数据集和指标。本文提供了全面的概述和讨论，以帮助构建此基础。

translated by 谷歌翻译

LatentKeypointGAN: Controlling GANs via Latent Keypoints

Xingzhe He , Bastian Wandt , Helge Rhodin

分类：计算机视觉

2021-03-29

生成的对抗网络（GANS）已经实现了图像生成的照片逼真品质。但是，如何最好地控制图像内容仍然是一个开放的挑战。我们介绍了莱特基照片，这是一个两级GaN，它在古典GAN目标上训练了训练，在一组空间关键点上有内部调节。这些关键点具有相关的外观嵌入，分别控制生成对象的位置和样式及其部件。我们使用合适的网络架构和培训方案地址的一个主要困难在没有领域知识和监督信号的情况下将图像解开到空间和外观因素中。我们展示了莱特基点提供可解释的潜在空间，可用于通过重新定位和交换Keypoint Embedding来重新安排生成的图像，例如通过组合来自不同图像的眼睛，鼻子和嘴巴来产生肖像。此外，关键点和匹配图像的显式生成启用了一种用于无监督的关键点检测的新的GaN的方法。

translated by 谷歌翻译

A Morphology Focused Diffusion Probabilistic Model for Synthesis of Histopathology Images

Puria Azadi Moghadam , Sanne van Delen , Karina C. Martin , Jochen Lennerz , Stephen Yip , Hossein Farahani , Ali Bashashati

分类：计算机视觉

2022-09-27

病理学家对患病组织的视觉微观研究一直是一个多世纪以来癌症诊断和预后的基石。最近，深度学习方法在组织图像的分析和分类方面取得了重大进步。但是，关于此类模型在生成组织病理学图像的实用性方面的工作有限。这些合成图像在病理学中有多种应用，包括教育，熟练程度测试，隐私和数据共享的公用事业。最近，引入了扩散概率模型以生成高质量的图像。在这里，我们首次研究了此类模型的潜在用途以及优先的形态加权和颜色归一化，以合成脑癌的高质量组织病理学图像。我们的详细结果表明，与生成对抗网络相比，扩散概率模型能够合成各种组织病理学图像，并且具有较高的性能。

translated by 谷歌翻译

GAN-based Virtual Re-Staining: A Promising Solution for Whole Slide Image Analysis

Zhaoyang Xu , Xingru Huang , Carlos Fernández Moro , Béla Bozóky , Qianni Zhang

分类：计算机视觉

2019-01-13

组织病理学癌症诊断是基于对染色组织载玻片的视觉检查。苏木精和曙红（H \＆E）是全球常规使用的标准污渍。它很容易获取和成本效益，但是细胞和组织成分与深蓝色和粉红色的色调相对低，从而使视觉评估，数字图像分析和定量变得困难。这些局限性可以通过IHC的靶蛋白的IHC染色来克服。 IHC提供了细胞和组织成分的选择性高对比度成像，但是它们的使用在很大程度上受到了更为复杂的实验室处理和高成本的限制。我们提出了一个条件周期（CCGAN）网络，以将H \＆E染色的图像转换为IHC染色图像，从而促进同一幻灯片上的虚拟IHC染色。这种数据驱动的方法仅需要有限的标记数据，但会生成像素级分割结果。提出的CCGAN模型通过添加类别条件并引入两个结构性损失函数，改善了原始网络\ cite {Zhu_unpaired_2017}，从而实现多重辅助翻译并提高了翻译精度。％需要在这里给出理由。实验表明，所提出的模型在不配对的图像翻译中胜过具有多材料的原始方法。我们还探索了未配对的图像对图像翻译方法的潜力，该方法应用于其他组织学图像与不同染色技术相关的任务。

translated by 谷歌翻译

Semantic Image Synthesis with Spatially-Adaptive Normalization

Taesung Park , Ming-Yu Liu , Ting-Chun Wang , Jun-Yan Zhu

分类：

2019-03-18

translated by 谷歌翻译

Image Synthesis with Disentangled Attributes for Chest X-Ray Nodule Augmentation and Detection

Zhenrong Shen , Xi Ouyang , Bin Xiao , Jie-Zhi Cheng , Qian Wang , Dinggang Shen

分类：计算机视觉

2022-07-19

胸部X射线（CXR）图像中的肺结节检测是肺癌的早期筛查。基于深度学习的计算机辅助诊断（CAD）系统可以支持放射线医生在CXR中进行结节筛选。但是，它需要具有高质量注释的大规模和多样化的医学数据，以训练这种强大而准确的CAD。为了减轻此类数据集的有限可用性，为了增加数据增强而提出了肺结核合成方法。然而，以前的方法缺乏产生结节的能力，这些结节与检测器所需的大小属性相关。为了解决这个问题，我们在本文中介绍了一种新颖的肺结综合框架，该框架分别将结节属性分为三个主要方面，包括形状，大小和纹理。基于GAN的形状生成器首先通过产生各种形状掩模来建模结节形状。然后，以下大小调制可以对像素级粒度中生成的结节形状的直径进行定量控制。一条粗到细门的卷积卷积纹理发生器最终合成了以调制形状掩模为条件的视觉上合理的结节纹理。此外，我们建议通过控制数据增强的分离结节属性来合成结节CXR图像，以便更好地补偿检测任务中容易错过的结节。我们的实验证明了所提出的肺结构合成框架的图像质量，多样性和可控性的增强。我们还验证了数据增强对大大改善结节检测性能的有效性。

translated by 谷歌翻译

DoodleFormer: Creative Sketch Drawing with Transformers

Ankan Kumar Bhunia , Salman Khan , Hisham Cholakkal , Rao Muhammad Anwer , Fahad Shahbaz Khan , Jorma Laaksonen , Michael Felsberg

分类：计算机视觉

2021-12-06

创意素描或涂鸦是一种表达活动，在那里绘制了想象力和以前看不见的日常视觉物体的描述。创意草图图像生成是一个具有挑战性的视觉问题，任务是生成不同但现实的创意草图，拥有视觉世界对象的看不见的构成。在这里，我们提出了一种新颖的粗待精细的两级框架，DooDleformer，将创意草图生成问题分解成粗略草图组合物的创建，然后在草图中掺入细节。我们介绍了图形感知的变压器编码器，可有效地捕获了不同身体部位之间的全局动态以及局部静态结构关系。为确保所生成的创意草图的多样性，我们介绍了一个概率粗略草图解码器，该解码器明确地模拟了要绘制的每个草图身体部位的变化。在两个创意素描数据集上进行实验：创意鸟类和创意生物。我们的定性，定量和以人为主的评估表明，DooDleformer在两个数据集中表现出最先进的，屈服于现实和多样化的创意草图。在创意生物上，DooDleformer通过最先进的FR`chet unception距离（FID）来实现25的绝对增益。我们还展示了DoodleFormer对创意草图生成和草图完成的相关申请的有效性。

translated by 谷歌翻译

Deep Learning-based Frozen Section to FFPE Translation

Kutsev Bengisu Ozyoruk , Sermet Can , Guliz Irem Gokceler , Kayhan Basak , Derya Demir , Gurdeniz Serin , Uguray Payam Hacisalihoglu , Emirhan Kurtuluş , Berkan Darbaz , Ming Y. Lu

分类：计算机视觉

2021-07-25

冷冻切片（FS）是手术操作期间组织微观评估的制备方法。该程序的高速允许病理学医师快速评估关键的微观特征，例如肿瘤边距和恶性地位，以引导手术决策，并尽量减少对操作过程的干扰。然而，FS容易引入许多误导性的人工结构（组织学人工制品），例如核冰晶，压缩和切割人工制品，妨碍了病理学家的及时和准确的诊断判断。额外的培训和长期经验通常需要对冻结部分进行高度有效和时间关键的诊断。另一方面，福尔马林固定和石蜡嵌入（FFPE）的黄金标准组织制备技术提供了显着优越的图像质量，而是一种非常耗时的过程（12-48小时），使其不适合术语用。在本文中，我们提出了一种人工智能（AI）方法，通过在几分钟内将冻结的整个幻灯片（FS-WSIS）计算冻结的整个幻灯片（FS-WSIS）来改善FS图像质量。 AI-FFPE将FS人工制品终止了注意力机制的指导，该引导机制在利用FS输入图像和合成的FFPE样式图像之间利用建立的自正则化机制，以及综合相关特征的合成的FFPE样式图像。结果，AI-FFPE方法成功地生成了FFPE样式图像，而不会显着扩展组织处理时间，从而提高诊断准确性。我们证明了使用各种不同的定性和定量度量，包括来自20个董事会认证的病理学家的视觉图灵测试的各种不同的定性和定量度量。

translated by 谷歌翻译

Making Images Real Again: A Comprehensive Survey on Deep Image Composition

Li Niu , Wenyan Cong , Liu Liu , Yan Hong , Bo Zhang , Jing Liang , Liqing Zhang

分类：计算机视觉

2021-06-28

作为一个常见的图像编辑操作，图像组成旨在将前景从一个图像切割并粘贴在另一个图像上，从而产生复合图像。但是，有许多问题可能使复合图像不现实。这些问题可以总结为前景和背景之间的不一致，包括外观不一致（例如，不兼容的照明），几何不一致（例如不合理的大小）和语义不一致（例如，不匹配的语义上下文）。先前的作品将图像组成任务分为多个子任务，其中每个子任务在一个或多个问题上目标。具体而言，对象放置旨在为前景找到合理的比例，位置和形状。图像混合旨在解决前景和背景之间的不自然边界。图像协调旨在调整前景的照明统计数据。影子生成旨在为前景产生合理的阴影。通过将所有上述努力放在一起，我们可以获取现实的复合图像。据我们所知，以前没有关于图像组成的调查。在本文中，我们对图像组成的子任务进行了全面的调查。对于每个子任务，我们总结了传统方法，基于深度学习的方法，数据集和评估。我们还指出了每个子任务中现有方法的局限性以及整个图像组成任务的问题。图像组合的数据集和代码在https://github.com/bcmi/awesome-image-composition上进行了总结。

translated by 谷歌翻译

DisPositioNet: Disentangled Pose and Identity in Semantic Image Manipulation

Azade Farshad , Yousef Yeganeh , Helisa Dhamo , Federico Tombari , Nassir Navab

分类：计算机视觉 | 人工智能 | 机器学习

2022-11-10

Graph representation of objects and their relations in a scene, known as a scene graph, provides a precise and discernible interface to manipulate a scene by modifying the nodes or the edges in the graph. Although existing works have shown promising results in modifying the placement and pose of objects, scene manipulation often leads to losing some visual characteristics like the appearance or identity of objects. In this work, we propose DisPositioNet, a model that learns a disentangled representation for each object for the task of image manipulation using scene graphs in a self-supervised manner. Our framework enables the disentanglement of the variational latent embeddings as well as the feature representation in the graph. In addition to producing more realistic images due to the decomposition of features like pose and identity, our method takes advantage of the probabilistic sampling in the intermediate features to generate more diverse images in object replacement or addition tasks. The results of our experiments show that disentangling the feature representations in the latent manifold of the model outperforms the previous works qualitatively and quantitatively on two public benchmarks. Project Page: https://scenegenie.github.io/DispositioNet/

translated by 谷歌翻译

Improved HER2 Tumor Segmentation with Subtype Balancing using Deep Generative Networks

Mathias Öttl , Jana Mönius , Matthias Rübner , Carol I. Geppert , Jingna Qiu , Frauke Wilm , Arndt Hartmann , Matthias W. Beckmann , Peter A. Fasching , Andreas Maier

分类：计算机视觉

2022-11-11

Tumor segmentation in histopathology images is often complicated by its composition of different histological subtypes and class imbalance. Oversampling subtypes with low prevalence features is not a satisfactory solution since it eventually leads to overfitting. We propose to create synthetic images with semantically-conditioned deep generative networks and to combine subtype-balanced synthetic images with the original dataset to achieve better segmentation performance. We show the suitability of Generative Adversarial Networks (GANs) and especially diffusion models to create realistic images based on subtype-conditioning for the use case of HER2-stained histopathology. Additionally, we show the capability of diffusion models to conditionally inpaint HER2 tumor areas with modified subtypes. Combining the original dataset with the same amount of diffusion-generated images increased the tumor Dice score from 0.833 to 0.854 and almost halved the variance between the HER2 subtype recalls. These results create the basis for more reliable automatic HER2 analysis with lower performance variance between individual HER2 subtypes.

translated by 谷歌翻译