智能论文笔记

An annotated instance segmentation XXL-CT dataset from a historic airplane

Roland Gruber , Nils Reims , Andreas Hempfer , Stefan Gerth , Michael Salamon , Thomas Wittenberg

分类：计算机视觉

2022-12-16

The Me 163 was a Second World War fighter airplane and a result of the German air force secret developments. One of these airplanes is currently owned and displayed in the historic aircraft exhibition of the Deutsches Museum in Munich, Germany. To gain insights with respect to its history, design and state of preservation, a complete CT scan was obtained using an industrial XXL-computer tomography scanner. Using the CT data from the Me 163, all its details can visually be examined at various levels, ranging from the complete hull down to single sprockets and rivets. However, while a trained human observer can identify and interpret the volumetric data with all its parts and connections, a virtual dissection of the airplane and all its different parts would be quite desirable. Nevertheless, this means, that an instance segmentation of all components and objects of interest into disjoint entities from the CT data is necessary. As of currently, no adequate computer-assisted tools for automated or semi-automated segmentation of such XXL-airplane data are available, in a first step, an interactive data annotation and object labeling process has been established. So far, seven 512 x 512 x 512 voxel sub-volumes from the Me 163 airplane have been annotated and labeled, whose results can potentially be used for various new applications in the field of digital heritage, non-destructive testing, or machine-learning. This work describes the data acquisition process of the airplane using an industrial XXL-CT scanner, outlines the interactive segmentation and labeling scheme to annotate sub-volumes of the airplane's CT data, describes and discusses various challenges with respect to interpreting and handling the annotated and labeled data.

translated by 谷歌翻译

Guided interactive image segmentation using machine learning and color based data set clustering

Adrian Friebel , Tim Johann , Dirk Drasdo , Stefan Hoehme

分类：计算机视觉

2020-05-15

我们提出了一种新颖的方法，该方法将基于机器学习的交互式图像分割结合在一起，使用Supersoxels与聚类方法结合了用于自动识别大型数据集中类似颜色的图像的聚类方法，从而使分类器的指导重复使用。我们的方法解决了普遍的颜色可变性的问题，并且在生物学和医学图像中通常不可避免，这通常会导致分割恶化和量化精度，从而大大降低了必要的训练工作。效率的这种提高促进了大量图像的量化，从而为高通量成像中的最新技术进步提供了交互式图像分析。所呈现的方法几乎适用于任何图像类型，并代表通常用于图像分析任务的有用工具。

translated by 谷歌翻译

gACSON software for automated segmentation and morphology analyses of myelinated axons in 3D electron microscopy

Andrea Behanova , Ali Abdollahzadeh , Ilya Belevich , Eija Jokitalo , Alejandra Sierra , Jussi Tohka

分类：计算机视觉 | 机器学习

2021-12-13

背景和目的：电子显微镜（EM）的进步现在允许数百微米组织的三维（3D）成像具有纳米规模的分辨率，为研究大脑的超微结构提供新的机会。在这项工作中，我们介绍了一种可自由的GACSON软件，用于3D-EM脑组织样本中的骨髓轴突的可视化，分割，评估和形态分析。方法：Gacson软件配备了图形用户界面（GUI）。它自动分段粒细胞轴突的轴外空间及其相应的髓鞘护套，并允许手动分段，校对和分段组件的交互式校正。 GaCson分析骨髓轴突的形态，如轴突口，轴突偏心，髓鞘厚度或G比。结果：我们通过在假手术或创伤性脑损伤（TBI）之后，通过分割和分析Myelizing ansoce在大鼠躯体损伤（TBI）后的六3D-EM体积中的Myelized轴突来说明Gacson的使用。我们的研究结果表明，在损伤后五个月的TBI动物在躯体抑制皮质中近义Cortex中的近期骨髓轴突的等同直径。结论：我们的结果表明，GACSON是3D-EM卷中肢体化轴突的可视化，分割，评估和形态分析的有价值的工具。在麻省理工学院许可证下，Gacson在Https://github.com/andreabehan/g-acson免费提供。

translated by 谷歌翻译

Weakly Supervised Volumetric Image Segmentation with Deformed Templates

Udaranga Wickramasinghe , Patrick M. Jensen , Jiancheng Yang , Pascal Fua

分类：计算机视觉

2021-06-07

有许多方法可以使用弱监管来培训网络到分段2D图像。相比之下，现有的3D方法依赖于3D图像卷的2D片的子集的全监督。在本文中，我们提出了一种真正无弱监督的方法，即我们只需要在目标对象的表面上提供一组稀疏的3D点，这是一项可以快速完成的便捷任务。我们使用3D点以使3D模板变形，使其大致与目标对象轮廓匹配，并且我们介绍了利用粗略模板提供的监控以培训网络以找到准确边界的体系结构。我们评估我们在计算机断层扫描（CT），磁共振图像（MRI）和电子显微镜（EM）图像数据集中的方法的性能。我们将表明，在减少监督成本下，它始终以3D弱监管方式表现出更传统的方法。

translated by 谷歌翻译

Automated liver tissues delineation techniques: A systematic survey on machine learning current trends and future orientations

Ayman Al-Kababji , Faycal Bensaali , Sarada Prasad Dakua , Yassine Himeur

分类：计算机视觉 | 机器学习

2021-03-10

机器学习和计算机视觉技术近年来由于其自动化，适合性和产生惊人结果的能力而迅速发展。因此，在本文中，我们调查了2014年至2022年之间发表的关键研究，展示了不同的机器学习算法研究人员用来分割肝脏，肝肿瘤和肝脉管结构的研究。我们根据感兴趣的组织（肝果，肝肿瘤或肝毒剂）对被调查的研究进行了划分，强调了同时解决多个任务的研究。此外，机器学习算法被归类为受监督或无监督的，如果属于某个方案的工作量很大，则将进一步分区。此外，对文献和包含上述组织面具的网站发现的不同数据集和挑战进行了彻底讨论，强调了组织者的原始贡献和其他研究人员的贡献。同样，在我们的评论中提到了文献中过度使用的指标，这强调了它们与手头的任务的相关性。最后，强调创新研究人员应对需要解决的差距的关键挑战和未来的方向，例如许多关于船舶分割挑战的研究的稀缺性以及为什么需要早日处理他们的缺席。

translated by 谷歌翻译

EPIC-KITCHENS VISOR Benchmark: VIdeo Segmentations and Object Relations

Ahmad Darkhalil , Dandan Shan , Bin Zhu , Jian Ma , Amlan Kar , Richard Higgins , Sanja Fidler , David Fouhey , Dima Damen

分类：计算机视觉 | 人工智能 | 机器学习

2022-09-26

我们介绍了遮阳板，一个新的像素注释的新数据集和一个基准套件，用于在以自我为中心的视频中分割手和活动对象。遮阳板注释Epic-kitchens的视频，其中带有当前视频分割数据集中未遇到的新挑战。具体而言，我们需要确保像素级注释作为对象经历变革性相互作用的短期和长期一致性，例如洋葱被剥皮，切成丁和煮熟 - 我们旨在获得果皮，洋葱块，斩波板，刀，锅以及表演手的准确像素级注释。遮阳板引入了一条注释管道，以零件为ai驱动，以进行可伸缩性和质量。总共，我们公开发布257个对象类的272K手册语义面具，990万个插值密集口罩，67K手动关系，涵盖36小时的179个未修剪视频。除了注释外，我们还引入了视频对象细分，互动理解和长期推理方面的三个挑战。有关数据，代码和排行榜：http：//epic-kitchens.github.io/visor

translated by 谷歌翻译

SemanticKITTI: A Dataset for Semantic Scene Understanding of LiDAR Sequences

Jens Behley , Martin Garbade , Andres Milioto , Jan Quenzel , Sven Behnke , Cyrill Stachniss , Juergen Gall

分类：

2019-04-02

Our dataset provides dense annotations for each scan of all sequences from the KITTI Odometry Benchmark [19]. Here, we show multiple scans aggregated using pose information estimated by a SLAM approach.

translated by 谷歌翻译

ScanNet: Richly-annotated 3D Reconstructions of Indoor Scenes

Angela Dai , Angel X. Chang , Manolis Savva , Maciej Halber , Thomas Funkhouser , Matthias Nießner

分类：

2017-02-14

A key requirement for leveraging supervised deep learning methods is the availability of large, labeled datasets. Unfortunately, in the context of RGB-D scene understanding, very little data is available -current datasets cover a small range of scene views and have limited semantic annotations. To address this issue, we introduce ScanNet, an RGB-D video dataset containing 2.5M views in 1513 scenes annotated with 3D camera poses, surface reconstructions, and semantic segmentations. To collect this data, we designed an easy-to-use and scalable RGB-D capture system that includes automated surface reconstruction and crowdsourced semantic annotation. We show that using this data helps achieve state-of-the-art performance on several 3D scene understanding tasks, including 3D object classification, semantic voxel labeling, and CAD model retrieval.

translated by 谷歌翻译

Common Limitations of Image Processing Metrics: A Picture Story

Annika Reinke , Minu D. Tizabi , Carole H. Sudre , Matthias Eisenmann , Tim Rädsch , Michael Baumgartner , Laura Acion , Michela Antonelli , Tal Arbel , Spyridon Bakas

分类：计算机视觉

2021-04-12

尽管自动图像分析的重要性不断增加，但最近的元研究揭示了有关算法验证的主要缺陷。性能指标对于使用的自动算法的有意义，客观和透明的性能评估和验证尤其是关键，但是在使用特定的指标进行给定的图像分析任务时，对实际陷阱的关注相对较少。这些通常与（1）无视固有的度量属性，例如在存在类不平衡或小目标结构的情况下的行为，（2）无视固有的数据集属性，例如测试的非独立性案例和（3）无视指标应反映的实际生物医学领域的兴趣。该动态文档的目的是说明图像分析领域通常应用的性能指标的重要局限性。在这种情况下，它重点介绍了可以用作图像级分类，语义分割，实例分割或对象检测任务的生物医学图像分析问题。当前版本是基于由全球60多家机构的国际图像分析专家进行的关于指标的Delphi流程。

translated by 谷歌翻译

Human Treelike Tubular Structure Segmentation: A Comprehensive Review and Future Perspectives

Hao Li , Zeyu Tang , Yang Nan , Guang Yang

分类：计算机视觉 | 机器学习

2022-07-12

人类生理学中的各种结构遵循特异性形态，通常在非常细的尺度上表达复杂性。这种结构的例子是胸前气道，视网膜血管和肝血管。可以观察到可以观察到可以观察到可以观察到可以观察到空间排列的磁共振成像（MRI），计算机断层扫描（CT），光学相干断层扫描（OCT）等医学成像模式（MRI），计算机断层扫描（CT），可以观察到空间排列的大量2D和3D图像的集合。这些结构在医学成像中的分割非常重要，因为对结构的分析提供了对疾病诊断，治疗计划和预后的见解。放射科医生手动标记广泛的数据通常是耗时且容易出错的。结果，在过去的二十年中，自动化或半自动化的计算模型已成为医学成像的流行研究领域，迄今为止，许多计算模型已经开发出来。在这项调查中，我们旨在对当前公开可用的数据集，细分算法和评估指标进行全面审查。此外，讨论了当前的挑战和未来的研究方向。

translated by 谷歌翻译

Automated segmentation of microtomography imaging of Egyptian mummies

Marc Tanti , Camille Berruyer , Paul Tafforeau , Adrian Muscat , Reuben Farrugia , Kenneth Scerri , Gianluca Valentino , V. Armando Solé , Johann A. Briffa

分类：计算机视觉

2021-05-14

传播相位对比度同步同步rotron MicrotoMography（PPC-SR $ {\ mu} $ CT）是对考古遗骸内部结构的非侵入性和非破坏性访问的黄金标准。在该分析中，需要分割虚拟标本以分开不同的部件或材料，通常需要相当多的人力努力的过程。在MicrotoMograph成像（ASEMI）项目的自动分割中，我们开发了一种自动分割这些容量图像的工具，使用手动分段样本来调谐和培训机器学习模型。对于一套四个古埃及动物木乃伊标本，与手动细分切片相比，达到了94-98％的整体准确性，使用深度学习（97-99％）接近现货商业软件的结果较低的复杂性。对分段输出的定性分析表明，我们的结果在对来自深度学习的人的可用性方面接近，证明了这些技术的使用。

translated by 谷歌翻译

Automated image analysis in large-scale cellular electron microscopy: A literature survey

Anusha Aswatha , Ahmad Alsahaf , Ben N. G. Giepmans , George Azzopardi

分类：计算机视觉 | 人工智能

2022-06-14

使用（半）自动显微镜生成的大规模电子显微镜（EM）数据集已成为EM中的标准。考虑到大量数据，对所有数据的手动分析都是不可行的，因此自动分析至关重要。自动分析的主要挑战包括分析和解释生物医学图像的注释，并与实现高通量相结合。在这里，我们回顾了自动计算机技术的最新最新技术以及分析细胞EM结构的主要挑战。关于EM数据的注释，分割和可扩展性，讨论了过去五年来开发的高级计算机视觉，深度学习和软件工具。自动图像采集和分析的集成将允许用纳米分辨率对毫米范围的数据集进行高通量分析。

translated by 谷歌翻译

Hierarchical Random Walker Segmentation for Large Volumetric Biomedical Images

Dominik Drees , Florian Eilers , Xiaoyi Jiang

分类：计算机视觉

2021-03-17

图像分割的随机沃克方法是半自动图像分割的流行工具，尤其是在生物医学领域。但是，它的线性渐近运行时间和内存要求使应用于增加大小不切实际的3D数据集。我们提出了一个分层框架，据我们所知，这是克服这些随机沃克算法的限制并实现sublinear的运行时间和持续的内存复杂性的尝试。该框架的目的是 - 与基线方法相比，而不是改善细分质量，以使交互式分割在核心外数据集中成为可能。确认该方法的合成数据和CT-ORG数据集进行了定量评估，其中确认了算法运行时间的预期改进，同时确认了高分段质量。即使对于数百千兆字节的大小，增量（即互动更新）运行时间也已在标准PC上以秒为单位。在一个小案例研究中，证明了当前生物医学研究对大型现实世界的适用性。在广泛使用的卷渲染和处理软件Voreen（https://www.uni-muenster.de/voreen/）的5.2版5.2版中，介绍方法的实现公开可用。

translated by 谷歌翻译

Classification of FIB/SEM-tomography images for highly porous multiphase materials using random forest classifiers

Markus Osenberg , André Hilger , Matthias Neumann , Amalia Wagner , Nicole Bohn , Joachim R. Binder , Volker Schmidt , John Banhart , Ingo Manke

分类：机器学习

2022-07-28

FIB/SEM断层扫描代表了电池研究和许多其他领域中三维纳米结构表征的必不可少的工具。然而，在许多情况下，对比度和3D分类/重建问题出现，这极大地限制了该技术的适用性，尤其是在多孔材料上，例如电池或燃料电池中用于电极材料的材料。区分不同的组件（例如主动LI存储颗粒和碳/粘合剂材料）很困难，并且通常可以防止对图像数据进行可靠的定量分析，甚至可能导致关于结构 - 质地关系的错误结论。在这项贡献中，我们提出了一种新型的数据分类方法，该方法是通过FIB/SEM断层扫描获得的三维图像数据及其在NMC电池电极材料中的应用。我们使用两个不同的图像信号，即Angled SE2腔室检测器和Inlens检测器信号的信号，将信号组合在一起并训练一个随机森林，即特定的机器学习算法。我们证明，这种方法可以克服适合多相测量的现有技术的当前局限性，并且即使在当前的最新技术失败或对大型训练集的需求之后，它也可以进行定量数据重建。这种方法可能会作为使用FIB/SEM断层扫描的未来研究指南。

translated by 谷歌翻译

YOLO2U-Net: Detection-Guided 3D Instance Segmentation for Microscopy

Amirkoushyar Ziabari , Derek C. Ros , Abbas Shirinifard , David Solecki

分类：计算机视觉

2022-07-13

显微镜成像技术对生物结构的表征和分析具有重要作用。由于这些技术通常通过堆叠2D投影来使细胞的3D可视化，因此$ z $ - 轴的平面激发和低分辨率等问题可能会带来挑战（甚至对于人类专家），以检测3D体积的单个细胞作为3D体积的挑战这些非重叠的单元可能显示为重叠。在这项工作中，我们引入了一种综合方法，用于精确的3D实例分割脑组织中的细胞。提出的方法将2D Yolo检测方法与多视图融合算法结合在一起，以构建细胞的3D定位。接下来，3D边界框以及数据量将输入到一个3D U-NET网络，该网络旨在将每个3D边界框中的主要单元格分段，然后又依次进行整个卷中的单元格进行实例分割。与当前基于深度学习的3D实例分割方法相比，该方法的有希望的性能显示出来。

translated by 谷歌翻译

Proceedings of the 3rd International Workshop on Reading Music Systems

Jorge Calvo-Zaragoza , Alexander Pacha

分类：计算机视觉 | 机器学习

2022-12-01

The International Workshop on Reading Music Systems (WoRMS) is a workshop that tries to connect researchers who develop systems for reading music, such as in the field of Optical Music Recognition, with other researchers and practitioners that could benefit from such systems, like librarians or musicologists. The relevant topics of interest for the workshop include, but are not limited to: Music reading systems; Optical music recognition; Datasets and performance evaluation; Image processing on music scores; Writer identification; Authoring, editing, storing and presentation systems for music scores; Multi-modal systems; Novel input-methods for music to produce written music; Web-based Music Information Retrieval services; Applications and projects; Use-cases related to written music. These are the proceedings of the 3rd International Workshop on Reading Music Systems, held in Alicante on the 23rd of July 2021.

translated by 谷歌翻译

FAST-AID Brain: Fast and Accurate Segmentation Tool using Artificial Intelligence Developed for Brain

Mostafa Mehdipour Ghazi , Mads Nielsen

分类：计算机视觉 | 机器学习

2022-08-30

临床实践中使用的医学图像是异质的，与学术研究中研究的扫描质量不同。在解剖学，伪影或成像参数不寻常或方案不同的极端情况下，预处理会分解。最需要对这些变化的方法可靠。提出了一种新颖的深度学习方法，以将人脑快速分割为132个区域。提出的模型使用有效的U-NET型网络，并从不同视图和分层关系的交点上受益，以在端到端训练期间融合正交2D平面和脑标签。部署了弱监督的学习，以利用部分标记的数据来进行整个大脑分割和颅内体积（ICV）的估计。此外，数据增强用于通过生成具有较高的脑扫描的磁共振成像（MRI）数据来扩展模型训练，同时保持数据隐私。提出的方法可以应用于脑MRI数据，包括头骨或任何其他工件，而无需预处理图像或性能下降。与最新的一些实验相比，使用了不同的Atlases的几项实验，以评估受过训练模型的分割性能，并且与不同内部和不同内部和不同内部方法的现有方法相比，结果显示了较高的分割精度和鲁棒性。间域数据集。

translated by 谷歌翻译

HTML版本

Rethinking Interactive Image Segmentation: Feature Space Annotation

Jord{ã}o Bragantini , Alexandre Falc{ã}o , Laurent Najman

分类：计算机视觉

2021-01-12

尽管交互式图像分割方法的进展情况，但高质量的像素级注释仍然耗时和费力 - 几个深度学习应用的瓶颈。我们逐步回到由特征空间投影引导的多个图像提出的互动和同时段注释。该策略与现有的交互式分段方法呈现出与现有的交互式分段方法相比，该方法在图像域中进行注释。我们表明要素空间注释在前景分段数据集中使用最先进的方法实现了竞争结果：ICOSEG，DAVIS和屋顶。此外，在语义分割上下文中，它在CityScapes数据集中实现了91.5 \％的准确性，比原始注释程序快74.75倍.Further，我们的贡献揭示了可以与现有方法集成的新颖方向上的灯光。补充材料呈现视频演示。代码在https://github.com/lids-unicamp/rethinking-interactive-image-egation。

translated by 谷歌翻译

CTooth: A Fully Annotated 3D Dataset and Benchmark for Tooth Volume Segmentation on Cone Beam Computed Tomography Images

Weiwei Cui , Yaqi Wang , Qianni Zhang , Huiyu Zhou , Dan Song , Xingyong Zuo , Gangyong Jia , Liaoyuan Zeng

分类：计算机视觉 | 人工智能

2022-06-17

3D牙齿分割是计算机辅助牙齿诊断和治疗的先决条件。但是，将所有牙齿区域分割为主观且耗时。最近，基于深度学习的细分方法产生了令人信服的结果并减少了手动注释的工作，但是它需要大量的基础真相进行培训。据我们所知，3D分割研究几乎没有牙齿数据。在本文中，我们建立了带有牙齿金标准的完全注释的锥束计算机断层扫描数据集。该数据集包含22卷（7363片），并带有经验丰富的射线照相解释者注释的精细牙齿标签。为了确保相对的数据采样分布，数据方差包括在牙齿中，包括缺失的牙齿和牙齿修复。在此数据集上评估了几种最新的分割方法。之后，我们进一步总结并应用了一系列基于3D注意的UNET变体以分割牙齿。这项工作为牙齿体积分割任务提供了新的基准。实验证据证明，3D UNET结构的注意力模块增强了牙齿区域中的反应，并抑制背景和噪声的影响。 3D UNET使用SKNET注意模块实现了最佳性能，分别为88.04 \％骰子和78.71 \％IOU。基于注意力的UNET框架的表现优于Ctooth数据集上的其他最新方法。代码库和数据集已发布。

translated by 谷歌翻译

Proceedings of the 2nd International Workshop on Reading Music Systems

Jorge Calvo-Zaragoza , Alexander Pacha

分类：计算机视觉 | 机器学习

2022-12-01

The International Workshop on Reading Music Systems (WoRMS) is a workshop that tries to connect researchers who develop systems for reading music, such as in the field of Optical Music Recognition, with other researchers and practitioners that could benefit from such systems, like librarians or musicologists. The relevant topics of interest for the workshop include, but are not limited to: Music reading systems; Optical music recognition; Datasets and performance evaluation; Image processing on music scores; Writer identification; Authoring, editing, storing and presentation systems for music scores; Multi-modal systems; Novel input-methods for music to produce written music; Web-based Music Information Retrieval services; Applications and projects; Use-cases related to written music. These are the proceedings of the 2nd International Workshop on Reading Music Systems, held in Delft on the 2nd of November 2019.

translated by 谷歌翻译