智能论文笔记

Quantifying Topology In Pancreatic Tubular Networks From Live Imaging 3D Microscopy

Kasra Arnavaz , Oswin Krause , Kilian Zepf , Jelena M. Krivokapic , Silja Heilmann , Jakob Andreas Bærentzen , Pia Nyeng , Aasa Feragen

分类：计算机视觉 | 机器学习

2021-05-20

由胰腺管网络的具有挑战性的分割任务激发，本文解决了两个通常遇到生物医学成像问题的问题：分割的拓扑一致性，以及昂贵或困难的注释。我们的贡献如下：a）我们提出了一个拓扑评分，该评分衡量了预测和地面真理分割之间的拓扑和几何一致性，应用于模型选择和验证。 b）我们在时间序列图像数据上为这一困难的嘈杂任务提供了完整的深度学习方法。在我们的方法中，我们首先使用半监管的U-NET体系结构，适用于通用分割任务，该任务共同训练自动编码器和分割网络。然后，随着时间的流逝，我们使用循环的跟踪来进一步改善预测的拓扑。这种半监督的方法使我们能够利用未经通知的数据来学习特征表示，尽管我们的带注释的培训数据的变化非常有限，但该特征表示具有较高可变性的数据。我们的贡献在具有挑战性的分割任务上得到了验证，从嘈杂的实时成像共聚焦显微镜中定位胎儿胰腺中的管状结构。我们表明，我们的半监督模型不仅优于完全监督和预训练的模型，而且还优于在训练过程中考虑拓扑一致性的方法。此外，与经过平均循环得分为0.762的CLDICE的U-NET相比，我们的方法的平均环路得分为0.808。

translated by 谷歌翻译

clDice -- A Novel Topology-Preserving Loss Function for Tubular Structure Segmentation

Suprosanna Shit , Johannes C. Paetzold , Anjany Sekuboyina , Ivan Ezhov , Alexander Unger , Andrey Zhylka , Josien P. W. Pluim , Ulrich Bauer , Bjoern H. Menze

分类：计算机视觉 | 机器学习

2020-03-16

与许多研究领域相关的管状网络样结构（例如血管，神经元或道路）的准确分割与许多研究领域有关。对于这种结构，拓扑是它们最重要的特征。特别保留连接性：在血管网络的情况下，缺少连接的容器完全改变了血液流动的动力学。我们介绍了一种新颖的相似性度量，称为Centerlinedice（短CLDICE），该度量是根据分割掩模及其（形态）骨骼的相交进行计算的。从理论上讲，我们证明，CLDICE保证拓扑保存至二进制2D和3D分割的同型等效性。扩展这一点，我们提出了一种计算高效，可区分的损失函数（软性的），用于训练任意的神经分割网络。我们在五个公共数据集上基准了软性损失，包括船只，道路和神经元（2D和3D）。对软性播放的培训可通过更准确的连通性信息，更高的图形相似性和更好的体积分数进行分割。

translated by 谷歌翻译

A Machine Learning Enhanced Approach for Automated Sunquake Detection in Acoustic Emission Maps

Vanessa Mercea , Alin Razvan Paraschiv , Daniela Adriana Lacatus , Anca Marginean , Diana Besliu-Ionescu

分类：计算机视觉 | 机器学习

2022-12-13

Sunquakes are seismic emissions visible on the solar surface, associated with some solar flares. Although discovered in 1998, they have only recently become a more commonly detected phenomenon. Despite the availability of several manual detection guidelines, to our knowledge, the astrophysical data produced for sunquakes is new to the field of Machine Learning. Detecting sunquakes is a daunting task for human operators and this work aims to ease and, if possible, to improve their detection. Thus, we introduce a dataset constructed from acoustic egression-power maps of solar active regions obtained for Solar Cycles 23 and 24 using the holography method. We then present a pedagogical approach to the application of machine learning representation methods for sunquake detection using AutoEncoders, Contrastive Learning, Object Detection and recurrent techniques, which we enhance by introducing several custom domain-specific data augmentation transformations. We address the main challenges of the automated sunquake detection task, namely the very high noise patterns in and outside the active region shadow and the extreme class imbalance given by the limited number of frames that present sunquake signatures. With our trained models, we find temporal and spatial locations of peculiar acoustic emission and qualitatively associate them to eruptive and high energy emission. While noting that these models are still in a prototype stage and there is much room for improvement in metrics and bias levels, we hypothesize that their agreement on example use cases has the potential to enable detection of weak solar acoustic manifestations.

translated by 谷歌翻译

Sparse Object-level Supervision for Instance Segmentation with Pixel Embeddings

Adrian Wolny , Qin Yu , Constantin Pape , Anna Kreshuk

分类：计算机视觉 | 机器学习

2021-03-26

必须在密集的注释图像上培训最先进的实例分段方法。虽然一般而言，这一要求对于生物医学图像尤其令人生畏，其中域专业知识通常需要注释，没有大的公共数据收集可用于预培训。我们建议通过基于非空间嵌入的非空间嵌入的联盟分割方法来解决密集的注释瓶颈，该方法利用所学习的嵌入空间的结构以可分散的方式提取单个实例。然后可以将分割损耗直接应用于实例，整体管道可以以完全或弱监督的方式培训，包括积极解贴的监管的具有挑战性的情况，其中为未标记的部分引入了一种新的自我监督的一致性损失训练数据。我们在不同显微镜模型以及城市景观和CVPPP实例分段基准中评估了对2D和3D分段问题的提出的方法，在后者上实现最先进的结果。该代码可用于：https://github.com/kreshuklab/spoco

translated by 谷歌翻译

Human Treelike Tubular Structure Segmentation: A Comprehensive Review and Future Perspectives

Hao Li , Zeyu Tang , Yang Nan , Guang Yang

分类：计算机视觉 | 机器学习

2022-07-12

人类生理学中的各种结构遵循特异性形态，通常在非常细的尺度上表达复杂性。这种结构的例子是胸前气道，视网膜血管和肝血管。可以观察到可以观察到可以观察到可以观察到可以观察到空间排列的磁共振成像（MRI），计算机断层扫描（CT），光学相干断层扫描（OCT）等医学成像模式（MRI），计算机断层扫描（CT），可以观察到空间排列的大量2D和3D图像的集合。这些结构在医学成像中的分割非常重要，因为对结构的分析提供了对疾病诊断，治疗计划和预后的见解。放射科医生手动标记广泛的数据通常是耗时且容易出错的。结果，在过去的二十年中，自动化或半自动化的计算模型已成为医学成像的流行研究领域，迄今为止，许多计算模型已经开发出来。在这项调查中，我们旨在对当前公开可用的数据集，细分算法和评估指标进行全面审查。此外，讨论了当前的挑战和未来的研究方向。

translated by 谷歌翻译

Weakly Supervised Deep Instance Nuclei Detection using Points Annotation in 3D Cardiovascular Immunofluorescent Images

Nazanin Moradinasab , Yash Sharma , Laura S. Shankman , Gary K. Owens , Donald E. Brown

分类：计算机视觉 | 人工智能

2022-07-29

美国和全球的两个主要死亡原因是中风和心肌梗塞。两者的根本原因是由破裂或侵蚀的不稳定的动脉粥样硬化斑块释放的，这些斑块阻塞了心脏（心肌梗塞）或大脑（中风）的血管。临床研究表明，在斑块破裂或侵蚀事件中，斑块组成比病变大小更重要。为了确定斑块组成，计算了3D心血管免疫荧光图像的各种细胞类型的斑块病变。但是，手动计算这些细胞是昂贵的，耗时的，并且容易发生人为错误。手动计数的这些挑战激发了对自动化方法进行定位和计算图像中细胞的需求。这项研究的目的是开发一种自动方法，以最少的注释工作在3D免疫荧光图像中准确检测和计数细胞。在这项研究中，我们使用弱监督的学习方法使用点注释来训练悬停网络分割模型，以检测荧光图像中的核。使用点注释的优点是，与像素的注释相比，它们需要更少的精力。为了使用点注释训练悬停的网络模型，我们采用了一种普遍使用的群集标记方法，将点注释转换为精确的细胞核二进制掩模。传统上，这些方法从点注释产生了二进制面具，使该物体周围的区域未标记（通常在模型训练中被忽略）。但是，这些区域可能包含重要信息，有助于确定细胞之间的边界。因此，我们在这些区域使用了熵最小化的损失函数，以鼓励模型在未标记区域上输出更自信的预测。我们的比较研究表明，使用我们的弱训练的悬停网络模型...

translated by 谷歌翻译

Automated image analysis in large-scale cellular electron microscopy: A literature survey

Anusha Aswatha , Ahmad Alsahaf , Ben N. G. Giepmans , George Azzopardi

分类：计算机视觉 | 人工智能

2022-06-14

使用（半）自动显微镜生成的大规模电子显微镜（EM）数据集已成为EM中的标准。考虑到大量数据，对所有数据的手动分析都是不可行的，因此自动分析至关重要。自动分析的主要挑战包括分析和解释生物医学图像的注释，并与实现高通量相结合。在这里，我们回顾了自动计算机技术的最新最新技术以及分析细胞EM结构的主要挑战。关于EM数据的注释，分割和可扩展性，讨论了过去五年来开发的高级计算机视觉，深度学习和软件工具。自动图像采集和分析的集成将允许用纳米分辨率对毫米范围的数据集进行高通量分析。

translated by 谷歌翻译

Common Limitations of Image Processing Metrics: A Picture Story

Annika Reinke , Minu D. Tizabi , Carole H. Sudre , Matthias Eisenmann , Tim Rädsch , Michael Baumgartner , Laura Acion , Michela Antonelli , Tal Arbel , Spyridon Bakas

分类：计算机视觉

2021-04-12

尽管自动图像分析的重要性不断增加，但最近的元研究揭示了有关算法验证的主要缺陷。性能指标对于使用的自动算法的有意义，客观和透明的性能评估和验证尤其是关键，但是在使用特定的指标进行给定的图像分析任务时，对实际陷阱的关注相对较少。这些通常与（1）无视固有的度量属性，例如在存在类不平衡或小目标结构的情况下的行为，（2）无视固有的数据集属性，例如测试的非独立性案例和（3）无视指标应反映的实际生物医学领域的兴趣。该动态文档的目的是说明图像分析领域通常应用的性能指标的重要局限性。在这种情况下，它重点介绍了可以用作图像级分类，语义分割，实例分割或对象检测任务的生物医学图像分析问题。当前版本是基于由全球60多家机构的国际图像分析专家进行的关于指标的Delphi流程。

translated by 谷歌翻译

blob loss: instance imbalance aware loss functions for semantic segmentation

Florian Kofler , Suprosanna Shit , Ivan Ezhov , Lucas Fidon , Izabela Horvath , Rami Al-Maskari , Hongwei Li , Harsharan Bhatia , Timo Loehr , Marie Piraud

分类：计算机视觉 | 机器学习

2022-05-17

事实证明，深度卷积神经网络在语义分割任务中非常有效。引入了最流行的损失功能，以提高体积分数，例如Sorensen骰子系数。根据设计，DSC可以解决类不平衡；但是，它不能识别类中的实例不平衡。结果，大型前景实例可以主导次要实例，并且仍然产生令人满意的Sorensen骰子系数。然而，错过实例将导致检测性能不佳。这代表了诸如疾病进展监测等应用中的一个关键问题。例如，必须在多发性硬化症患者的随访中定位和监视小规模病变。我们提出了一个新型的损失功能家族，绰号斑点损失，主要旨在最大化实例级检测指标，例如F1得分和灵敏度。 BLOB损失是针对语义分割问题而设计的，其中实例是类中连接的组件。我们在五个复杂的3D语义分割任务中广泛评估了基于DSC的斑点损失，这些任务具有明显的实例异质性，从纹理和形态上讲。与软骰子损失相比，我们的MS病变改善了5％，肝肿瘤改善了3％，考虑F1分数的显微镜细分任务平均提高了2％。

translated by 谷歌翻译

Unlocking large-scale crop field delineation in smallholder farming systems with transfer learning and weak supervision

Sherrie Wang , Francois Waldner , David B. Lobell

分类：计算机视觉

2022-01-13

作物现场边界有助于映射作物类型，预测产量，并向农民提供现场级分析。近年来，已经看到深深学习的成功应用于划定工业农业系统中的现场边界，但由于（1）需要高分辨率卫星图像的小型字段来解除界限和（2）缺乏（2）缺乏用于模型培训和验证的地面标签。在这项工作中，我们结合了转移学习和弱监督来克服这些挑战，我们展示了在印度的成功方法，我们有效地产生了10,000个新的场地标签。我们最好的型号使用1.5亿分辨率的空中客车现货图像作为投入，预先列进法国界限的最先进的神经网络，以及印度标签上的微调，以实现0.86的联盟（iou）中位数交叉口在印度。如果使用4.8M分辨率的行星扫描图像，最好的模型可以实现0.72的中位数。实验还表明，法国的预训练减少了所需的印度现场标签的数量，以便在数据集较小时尽可能多地实现给定的性能水平。这些发现表明我们的方法是划定当前缺乏现场边界数据集的世界区域中的裁剪领域的可扩展方法。我们公开发布了10,000个标签和描绘模型，以方便社区创建现场边界地图和新方法。

translated by 谷歌翻译

Placenta Segmentation in Ultrasound Imaging: Addressing Sources of Uncertainty and Limited Field-of-View

Veronika A. Zimmer , Alberto Gomez , Emily Skelton , Robert Wright , Gavin Wheeler , Shujie Deng , Nooshin Ghavami , Karen Lloyd , Jacqueline Matthew , Bernhard Kainz

分类：计算机视觉

2022-06-29

胎儿超声（US）中胎盘的自动分割由于（i）（i）胎盘外观的高度多样性而具有挑战性我们禁止在妊娠晚期进行整个胎盘评估的观点。在这项工作中，我们通过多任务学习方法解决了这三个挑战，该方法结合了单个卷积神经网络中胎盘位置（例如，前，后部）和语义胎盘分段的分类。通过分类任务，模型可以从更大，更多样化的数据集中学习，同时在有限的训练集条件下提高分割任务的准确性。通过这种方法，我们研究了多个评估者的注释的变异性，并表明我们的自动分割（前胎盘的骰子为0.86，后胎盘的骰子为0.83），与观察者内和观察者间的变异性相比，我们的自动段性能达到了人级的性能。最后，我们的方法可以使用由三个阶段组成的多视图US采集管道提供整个胎盘分割：多探针图像采集，图像融合和图像分段。这会导致对较大结构（例如胎盘中的胎盘）的高质量分割，其图像伪像降低，这超出了单个探针的视野。

translated by 谷歌翻译

Computer Vision on X-ray Data in Industrial Production and Security Applications: A survey

Mehdi Rafiei , Jenni Raitoharju , Alexandros Iosifidis

分类：计算机视觉

2022-11-10

X-ray imaging technology has been used for decades in clinical tasks to reveal the internal condition of different organs, and in recent years, it has become more common in other areas such as industry, security, and geography. The recent development of computer vision and machine learning techniques has also made it easier to automatically process X-ray images and several machine learning-based object (anomaly) detection, classification, and segmentation methods have been recently employed in X-ray image analysis. Due to the high potential of deep learning in related image processing applications, it has been used in most of the studies. This survey reviews the recent research on using computer vision and machine learning for X-ray analysis in industrial production and security applications and covers the applications, techniques, evaluation metrics, datasets, and performance comparison of those techniques on publicly available datasets. We also highlight some drawbacks in the published research and give recommendations for future research in computer vision-based X-ray analysis.

translated by 谷歌翻译

Methods for segmenting cracks in 3d images of concrete: A comparison based on semi-synthetic images

Tin Barisin , Christian Jung , Franziska Müsebeck , Claudia Redenbach , Katja Schladitz

分类：计算机视觉 | 机器学习

2021-12-17

混凝土是建筑，桥梁和道路的标准施工材料。由于安全在这种结构的设计，监测和维护中起着核心作用，因此了解混凝土的开裂行为非常重要。计算机断层扫描捕获建筑材料的微观结构，并允许研究裂纹启动和传播。大3D图像中的裂缝表面的手动分割是不可行的。在本文中，综述了3D图像的自动裂缝分段方法并进行了比较。经典图像处理方法（边缘检测滤波器，模板匹配，最小路径和区域生长算法）和学习方法（卷积神经网络，随机林）在半合成3D图像上进行测试和测试。它们的性能强烈依赖于参数选择，该参数选择应适应图像的灰度范围和混凝土的几何特性。通常，学习方法表现最佳，特别是对于薄裂缝和低灰度对比度。

translated by 谷歌翻译

Deep Weakly-Supervised Learning Methods for Classification and Localization in Histology Images: A Survey

Jérôme Rony , Soufiane Belharbi , Jose Dolz , Ismail Ben Ayed , Luke McCaffrey , Eric Granger

分类：计算机视觉 | 机器学习

2019-09-08

使用深度学习模型从组织学数据中诊断癌症提出了一些挑战。这些图像中关注区域（ROI）的癌症分级和定位通常依赖于图像和像素级标签，后者需要昂贵的注释过程。深度弱监督的对象定位（WSOL）方法为深度学习模型的低成本培训提供了不同的策略。仅使用图像级注释，可以训练这些方法以对图像进行分类，并为ROI定位进行分类类激活图（CAM）。本文综述了WSOL的最先进的DL方法。我们提出了一种分类法，根据模型中的信息流，将这些方法分为自下而上和自上而下的方法。尽管后者的进展有限，但最近的自下而上方法目前通过深层WSOL方法推动了很多进展。早期作品的重点是设计不同的空间合并功能。但是，这些方法达到了有限的定位准确性，并揭示了一个主要限制 - 凸轮的不足激活导致了高假阴性定位。随后的工作旨在减轻此问题并恢复完整的对象。评估和比较了两个具有挑战性的组织学数据集的分类和本地化准确性，对我们的分类学方法进行了评估和比较。总体而言，结果表明定位性能差，特别是对于最初设计用于处理自然图像的通用方法。旨在解决组织学数据挑战的方法产生了良好的结果。但是，所有方法都遭受高假阳性/阴性定位的影响。在组织学中应用深WSOL方法的应用是四个关键的挑战 - 凸轮的激活下/过度激活，对阈值的敏感性和模型选择。

translated by 谷歌翻译

BuyTheDips: PathLoss for improved topology-preserving deep learning-based image segmentation

Minh On Vu Ngoc , Yizi Chen , Nicolas Boutry , Jonathan Fabrizio , Clement Mallet

分类：计算机视觉

2022-07-23

捕获图像的全局拓扑对于提出对其域的准确分割至关重要。但是，大多数现有的分割方法都不能保留给定输入的初始拓扑，这对许多下游基于对象的任务有害。对于大多数在本地尺度上工作的深度学习模型来说，这是更真实的。在本文中，我们提出了一种新的拓扑深度图像分割方法，该方法依赖于新的泄漏损失：Pathloss。我们的方法是Baloss [1]的扩展，其中我们希望改进泄漏检测，以更好地恢复图像分割的接近度。这种损失使我们能够正确定位并修复预测中可能发生的关键点（边界中的泄漏），并基于最短路径搜索算法。这样，损失最小化仅在必要时才能强制连接，并最终提供了图像中对象边界的良好定位。此外，根据我们的研究，与无需使用拓扑损失的方法相比，我们的Pathloss学会了保持更强的细长结构。通过我们的拓扑损失函数培训，我们的方法在两个代表性数据集上优于最先进的拓扑感知方法：电子显微镜和历史图。

translated by 谷歌翻译

Robust deep learning-based semantic organ segmentation in hyperspectral images

Silvia Seidlitz , Jan Sellner , Jan Odenthal , Berkin Özdemir , Alexander Studier-Fischer , Samuel Knödler , Leonardo Ayala , Tim Adler , Hannes G. Kenngott , Minu Tizabi

分类：计算机视觉 | 机器学习

2021-11-09

语义图像分割是手术中的背景知识和自治机器人的重要前提。本领域的状态专注于在微创手术期间获得的传统RGB视频数据，但基于光谱成像数据的全景语义分割并在开放手术期间获得几乎没有注意到日期。为了解决文献中的这种差距，我们正在研究基于在开放手术环境中获得的猪的高光谱成像（HSI）数据的以下研究问题：（1）基于神经网络的HSI数据的充分表示是完全自动化的器官分割，尤其是关于数据的空间粒度（像素与Superpixels与Patches与完整图像）的空间粒度？（2）在执行语义器官分割时，是否有利用HSI数据使用HSI数据，即RGB数据和处理的HSI数据（例如氧合等组织参数）？根据基于20猪的506个HSI图像的全面验证研究，共注释了19个类，基于深度的学习的分割性能 - 贯穿模态 - 与输入数据的空间上下文一致。未处理的HSI数据提供优于RGB数据或来自摄像机提供商的处理数据，其中优势随着输入到神经网络的输入的尺寸而增加。最大性能（应用于整个图像的HSI）产生了0.89（标准偏差（SD）0.04）的平均骰子相似度系数（DSC），其在帧间间变异性（DSC为0.89（SD 0.07）的范围内。我们得出结论，HSI可以成为全自动手术场景理解的强大的图像模型，其具有传统成像的许多优点，包括恢复额外功能组织信息的能力。

translated by 谷歌翻译

Medical Image Analysis on Left Atrial LGE MRI for Atrial Fibrillation Studies: A Review

Lei Li , Veronika A. Zimmer , Julia A. Schnabel , Xiahai Zhuang

分类：计算机视觉

2021-06-18

晚期钆增强磁共振成像（LGE MRI）通常用于可视化和量化左心房（LA）疤痕。疤痕的位置和程度提供了心理生理学和心房颤动进展的重要信息（AF）。因此，LGE MRI的La Scar分段和量化可用于AF患者的计算机辅助诊断和治疗分层。由于手动描绘可能是耗时的，并且经过专家内和专家间变异性，因此非常需要自动化这种计算，这然而仍然仍然具有挑战性和研究。本文旨在为La腔，墙壁，瘢痕和消融差距分割和LGE MRI的定量提供系统审查，以及AF研究的相关文献。具体而言，我们首先总结AF相关的成像技术，特别是LGE MRI。然后，我们详细介绍了四个计算任务的方法，并总结了每个任务中应用的验证策略。最后，概述了未来可能的未来发展，简要调查了上述方法的潜在临床应用。审查表明，该主题的研究仍处于早期阶段。虽然已经提出了几种方法，但特别是对于LA分割，由于与图像采集的高度变化相关的性能问题和图像采集差异有关的性能问题，仍有很大的算法发展。

translated by 谷歌翻译

Learning with Limited Annotations: A Survey on Deep Semi-Supervised Learning for Medical Image Segmentation

Rushi Jiao , Yichi Zhang , Le Ding , Rong Cai , Jicong Zhang

分类：计算机视觉

2022-07-28

在许多图像引导的临床方法中，医学图像分割是一个基本和关键的步骤。基于深度学习的细分方法的最新成功通常取决于大量标记的数据，这特别困难且昂贵，尤其是在医学成像领域中，只有专家才能提供可靠和准确的注释。半监督学习已成为一种吸引人的策略，并广泛应用于医学图像分割任务，以训练注释有限的深层模型。在本文中，我们对最近提议的半监督学习方法进行了全面综述，并总结了技术新颖性和经验结果。此外，我们分析和讨论现有方法的局限性和几个未解决的问题。我们希望这篇评论可以激发研究界探索解决这一挑战的解决方案，并进一步促进医学图像细分领域的发展。

translated by 谷歌翻译

Automated liver tissues delineation techniques: A systematic survey on machine learning current trends and future orientations

Ayman Al-Kababji , Faycal Bensaali , Sarada Prasad Dakua , Yassine Himeur

分类：计算机视觉 | 机器学习

2021-03-10

机器学习和计算机视觉技术近年来由于其自动化，适合性和产生惊人结果的能力而迅速发展。因此，在本文中，我们调查了2014年至2022年之间发表的关键研究，展示了不同的机器学习算法研究人员用来分割肝脏，肝肿瘤和肝脉管结构的研究。我们根据感兴趣的组织（肝果，肝肿瘤或肝毒剂）对被调查的研究进行了划分，强调了同时解决多个任务的研究。此外，机器学习算法被归类为受监督或无监督的，如果属于某个方案的工作量很大，则将进一步分区。此外，对文献和包含上述组织面具的网站发现的不同数据集和挑战进行了彻底讨论，强调了组织者的原始贡献和其他研究人员的贡献。同样，在我们的评论中提到了文献中过度使用的指标，这强调了它们与手头的任务的相关性。最后，强调创新研究人员应对需要解决的差距的关键挑战和未来的方向，例如许多关于船舶分割挑战的研究的稀缺性以及为什么需要早日处理他们的缺席。

translated by 谷歌翻译

OCTA-500: A Retinal Dataset for Optical Coherence Tomography Angiography Study

Mingchao Li , Kun Huang , Qiuzhuo Xu , Jiadong Yang , Yuhan Zhang , Zexuan Ji , Keren Xie , Songtao Yuan , Qinghuai Liu , Qiang Chen

分类：计算机视觉

2020-12-14

Optical coherence tomography angiography (OCTA) is a novel imaging modality that has been widely utilized in ophthalmology and neuroscience studies to observe retinal vessels and microvascular systems. However, publicly available OCTA datasets remain scarce. In this paper, we introduce the largest and most comprehensive OCTA dataset dubbed OCTA-500, which contains OCTA imaging under two fields of view (FOVs) from 500 subjects. The dataset provides rich images and annotations including two modalities (OCT/OCTA volumes), six types of projections, four types of text labels (age / gender / eye / disease) and seven types of segmentation labels (large vessel/capillary/artery/vein/2D FAZ/3D FAZ/retinal layers). Then, we propose a multi-object segmentation task called CAVF, which integrates capillary segmentation, artery segmentation, vein segmentation, and FAZ segmentation under a unified framework. In addition, we optimize the 3D-to-2D image projection network (IPN) to IPN-V2 to serve as one of the segmentation baselines. Experimental results demonstrate that IPN-V2 achieves an ~10% mIoU improvement over IPN on CAVF task. Finally, we further study the impact of several dataset characteristics: the training set size, the model input (OCT/OCTA, 3D volume/2D projection), the baseline networks, and the diseases. The dataset and code are publicly available at: https://ieee-dataport.org/open-access/octa-500.

translated by 谷歌翻译