智能论文笔记

One-Shot Medical Landmark Localization by Edge-Guided Transform and Noisy Landmark Refinement

Zihao Yin , Ping Gong , Chunyu Wang , Yizhou Yu , Yizhou Wang

分类：计算机视觉

2022-07-31

作为许多医疗应用的重要上游任务，监督的地标本地化仍然需要不可忽略的注释成本才能实现理想的绩效。此外，由于繁琐的收集程序，医疗地标数据集的规模有限，会影响大规模自我监督的预训练方法的有效性。为了应对这些挑战，我们提出了一个两阶段的单次医疗地标本地化框架，该框架首先通过无监督的注册从标记的示例中删除了地标，以便未标记的目标，然后利用这些嘈杂的伪标签来训练健壮的探测器。为了处理重要的结构变化，我们在包含边缘信息的新型损失函数的指导下学习了全球对齐和局部变形的端到端级联。在第二阶段，我们探索了选择可靠的伪标签和半监视学习的跨矛盾的自持矛盾。我们的方法在不同身体部位的公共数据集上实现了最先进的表现，这证明了其一般适用性。

translated by 谷歌翻译

Semi-supervised Anatomical Landmark Detection via Shape-regulated Self-training

Runnan Chen , Yuexin Ma , Lingjie Liu , Nenglun Chen , Zhiming Cui , Guodong Wei , Wenping Wang

分类：计算机视觉

2021-05-28

注释的医学图像昂贵，有时甚至无法在一定程度上获得地标检测精度。半监督学习通过利用未标记的数据来了解解剖标志性的人口结构来减轻对大规模注释数据的依赖。全局形状约束是解剖标识的固有属性，为更加一致的伪标签提供了有价值的指导，这些指南在先前的半监督方法中被忽略。在本文中，我们通过完全考虑全局形状约束，提出了一种用于半监控地标检测的模型 - 不可知的形状调节的自我训练框架。具体而言，为了确保伪标签是可靠且保持一致的，基于PCA的形状模型调整伪标签并消除异常。一种新的区域注意力损失，使网络自动关注伪标签周围的结构一致区域。广泛的实验表明，我们的方法优于其他半监督方法，并在三个医学图像数据集中实现了显着的改进。此外，我们的框架是灵活的，可用作集成到最具监控方法的即插即用模块，以进一步提高性能。

translated by 谷歌翻译

Feature Aggregation and Refinement Network for 2D AnatomicalLandmark Detection

Yueyuan Ao , Hong Wu

分类：计算机视觉

2021-11-01

解剖标志的本地化对于临床诊断，治疗计划和研究至关重要。在本文中，我们提出了一种新的深网络，名为特征聚合和细化网络（Farnet），用于自动检测解剖标记。为了减轻医疗领域的培训数据有限的问题，我们的网络采用了在自然图像上预先培训的深网络，因为骨干网络和几个流行的网络进行了比较。我们的FARNET还包括多尺度特征聚合模块，用于多尺度特征融合和用于高分辨率热图回归的特征精制模块。粗细的监督应用于两个模块，以方便端到端培训。我们进一步提出了一种名为指数加权中心损耗的新型损失函数，用于准确的热爱回归，这侧重于地标附近的像素的损失并抑制了远处的损失。我们的网络已经在三个公开的解剖学地标检测数据集中进行了评估，包括头部测量射线照片，手射线照片和脊柱射线照相，并在所有三个数据集上实现最先进的性能。代码可用：\ url {https://github.com/juvenileinwind/farnet}

translated by 谷歌翻译

Unsupervised Landmark Detection Based Spatiotemporal Motion Estimation for 4D Dynamic Medical Images

Yuyu Guo , Lei Bi , Dongming Wei , Liyun Chen , Zhengbin Zhu , Dagan Feng , Ruiyan Zhang , Qian Wang , Jinman Kim

分类：计算机视觉

2021-09-30

运动估计是用于评估目标器官解剖学和功能的动态医学图像处理的基本步骤。然而，通过评估局部图像相似性通过评估局部图像相似性优化运动场的基于图像的运动估计方法，易于产生令人难以置信的估计，尤其是在大运动的情况下。在这项研究中，我们提供了一种新颖的稀疏密度（DSD）的运动估计框架，其包括两个阶段。在第一阶段，我们处理原始密集图像以提取稀疏地标以表示目标器官解剖拓扑，并丢弃对运动估计不必要的冗余信息。为此目的，我们介绍一个无监督的3D地标检测网络，以提取用于目标器官运动估计的空间稀疏但代表性的地标。在第二阶段，我们从两个不同时间点的两个图像的提取稀疏地标的稀疏运动位移得出。然后，我们通过将稀疏地标位移突出回致密图像域，呈现运动重建网络来构造运动场。此外，我们从我们的两级DSD框架中使用估计的运动场作为初始化，并提高轻量级且有效的迭代优化中的运动估计质量。我们分别评估了两种动态医学成像任务的方法，分别为模型心脏运动和肺呼吸运动。与现有的比较方法相比，我们的方法产生了出色的运动估计精度。此外，广泛的实验结果表明，我们的解决方案可以提取良好代表性解剖标志，而无需手动注释。我们的代码在线公开提供。

translated by 谷歌翻译

Which images to label for few-shot medical landmark detection?

Quan Quan , Qingsong Yao , Jun Li , S. Kevin Zhou

分类：计算机视觉 | 机器学习

2021-12-07

深度学习方法的成功依赖于标记良好的大规模数据集的可用性。然而，对于医学图像，注释这种丰富的训练数据通常需要经验丰富的放射科医师并消耗他们有限的时间。开发了几次学习以缓解这种负担，这使得竞争性表现仅具有几个标记的数据。然而，在几次拍摄学习中的一个至关重要的问题是关于在学习之前为注释的模板图像的选择，这影响了最终性能。我们在本文中提出了一个新的样本选择政策（SCP），以在几次拍摄的医疗地标检测的背景下选择要注释的“最值得”的图像。 SCP由三部分组成：1）建立预训练的深度模型的自我监督培训，以提取来自放射性图像的特征，2）本地化信息贴片的关键点提案，以及3）用于搜索最具代表性的样本的代表性分数估计模板。 SCP的优点是在三个广泛使用的公共数据集上的各种实验证明。对于单次医疗地标检测，其用途将头部测量和Handxray数据集上的平均径向误差减少14.2％（从3.595mm至3.083mm）和35.5％（4.114mm至2.653mm）。

translated by 谷歌翻译

Unsupervised Local Discrimination for Medical Images

Huai Chen , Renzhen Wang , Jieyu Li , Jianhao Bai , Qing Peng , Deyu Meng , Lisheng Wang

分类：计算机视觉

2021-08-21

已经证明对比学习是有效的，可以减轻医学图像分析中昂贵注释的高需求，这可以捕获图像中的一般图案，并且自然用作各种任务的初始特征提取器。最近的作品主要基于案例明智的歧视，并学习全球歧视特征;然而，他们不能帮助临床医生处理主要由局部相似性分类的微小解剖结构，病变和组织。在这项工作中，我们提出了一般无人监督的框架，以了解来自医学图像的局部歧视特征，以进行模型的初始化。在此事实之后，相同体区域的图像应该共享类似的解剖结构，并且相同结构的像素应该具有类似的语义模式，我们设计神经网络以构建具有相似上下文的像素的局部判别嵌入空间是聚类和异种像素的分散。该网络主要包含两个分支：嵌入分支以生成像素 - WISE Embeddings，以及聚类分支以将相同结构的像素聚集在一起并生成分段。提出了一种区域辨别损失以在互利模式中优化这两个分支，使得通过聚类分支集群聚集在一起的像素共享类似的嵌入式矢量，并且训练模型可以测量像素方面的相似性。当转移到下游任务时，基于我们框架的学习特征提取器显示出更好的泛化能力，这优于来自广泛的最先进的方法，并在彩色眼底和胸部X光中的所有12个下游任务中获胜11。此外，我们利用像素 - 方面的嵌入来测量区域相似度，并提出一种形状引导的跨模块分割框架和中心敏感的单次地标定位算法。

translated by 谷歌翻译

Local contrastive loss with pseudo-label based self-training for semi-supervised medical image segmentation

Krishna Chaitanya , Ertunc Erdil , Neerav Karani , Ender Konukoglu

分类：计算机视觉 | 人工智能 | 机器学习 | (统计)机器学习

2021-12-17

监管基于深度学习的方法，产生医学图像分割的准确结果。但是，它们需要大量标记的数据集，并获得它们是一种艰苦的任务，需要临床专业知识。基于半/自我监督的学习方法通过利用未标记的数据以及有限的注释数据来解决此限制。最近的自我监督学习方法使用对比损失来从未标记的图像中学习良好的全球层面表示，并在像想象网那样的流行自然图像数据集上实现高性能。在诸如分段的像素级预测任务中，对于学习良好的本地级别表示以及全局表示来说至关重要，以实现更好的准确性。然而，现有的局部对比损失的方法的影响仍然是学习良好本地表现的限制，因为类似于随机增强和空间接近定义了类似和不同的局部区域;由于半/自我监督设置缺乏大规模专家注释，而不是基于当地地区的语义标签。在本文中，我们提出了局部对比损失，以便通过利用从未标记的图像的未标记图像的伪标签获得的语义标签信息来学习用于分割的良好像素级别特征。特别地，我们定义了建议的损失，以鼓励具有相同伪标签/标签的像素的类似表示，同时与数据集中的不同伪标签/标签的像素的表示。我们通过联合优化标记和未标记的集合和仅限于标记集的分割损失，通过联合优化拟议的对比损失来进行基于伪标签的自培训和培训网络。我们在三个公共心脏和前列腺数据集上进行了评估，并获得高分割性能。

translated by 谷歌翻译

Enhancing MR Image Segmentation with Realistic Adversarial Data Augmentation

Chen Chen , Chen Qin , Cheng Ouyang , Zeju Li , Shuo Wang , Huaqi Qiu , Liang Chen , Giacomo Tarroni , Wenjia Bai , Daniel Rueckert

分类：计算机视觉 | 机器学习

2021-08-07

神经网络在医疗图像分割任务上的成功通常依赖于大型标记的数据集用于模型培训。但是，由于数据共享和隐私问题，获取和手动标记大型医疗图像集是资源密集的，昂贵的，有时是不切实际的。为了应对这一挑战，我们提出了一个通用的对抗数据增强框架Advchain，旨在提高培训数据对医疗图像分割任务的多样性和有效性。 AdvChain通过动态数据增强来增强数据，从而产生随机链接的光线像和几何转换，以类似于现实而又具有挑战性的成像变化以扩展训练数据。通过在培训期间共同优化数据增强模型和分割网络，可以生成具有挑战性的示例，以增强下游任务的网络可推广性。所提出的对抗数据增强不依赖生成网络，可以用作通用分割网络中的插件模块。它在计算上是有效的，适用于低声监督和半监督学习。我们在两个MR图像分割任务上分析和评估该方法：心脏分割和前列腺分割具有有限的标记数据。结果表明，所提出的方法可以减轻对标记数据的需求，同时提高模型泛化能力，表明其在医学成像应用中的实际价值。

translated by 谷歌翻译

A Hybrid Deep Feature-Based Deformable Image Registration Method for Pathological Images

Chulong Zhang , Yuming Jiang , Na Li , Zhicheng Zhang , Md Tauhidul Islam , Jingjing Dai , Lin Liu , Wenfeng He , Wenjian Qin , Jing Xiong

分类：人工智能

2022-08-16

病理学家需要结合不同染色病理切片的信息，以获得准确的诊断结果。可变形图像配准是融合多模式病理切片的必要技术。本文提出了一个基于混合特征的基于特征的可变形图像登记框架，用于染色的病理样品。我们首先提取密集的特征点，并通过两个深度学习功能网络执行匹配点。然后，为了进一步减少虚假匹配，提出了一种结合隔离森林统计模型和局部仿射校正模型的异常检测方法。最后，插值方法基于上述匹配点生成用于病理图像注册的DVF。我们在非刚性组织学图像注册（ANHIR）挑战的数据集上评估了我们的方法，该挑战与IEEE ISBI 2019会议共同组织。我们的技术的表现使传统方法的平均水平注册目标误差（RTRE）达到0.0034。所提出的方法实现了最先进的性能，并在评估测试数据集时将其排名1。提出的基于特征的混合特征的注册方法可能会成为病理图像注册的可靠方法。

translated by 谷歌翻译

VertMatch: A Semi-supervised Framework for Vertebral Structure Detection in 3D Ultrasound Volume

Hongye Zeng , kang Zhou , Songhan Ge , Yuchong Gao , Jianhao Zhao , Shenghua Gao , Rui Zheng

分类：计算机视觉

2022-12-28

Three-dimensional (3D) ultrasound imaging technique has been applied for scoliosis assessment, but current assessment method only uses coronal projection image and cannot illustrate the 3D deformity and vertebra rotation. The vertebra detection is essential to reveal 3D spine information, but the detection task is challenging due to complex data and limited annotations. We propose VertMatch, a two-step framework to detect vertebral structures in 3D ultrasound volume by utilizing unlabeled data in semi-supervised manner. The first step is to detect the possible positions of structures on transverse slice globally, and then the local patches are cropped based on detected positions. The second step is to distinguish whether the patches contain real vertebral structures and screen the predicted positions from the first step. VertMatch develops three novel components for semi-supervised learning: for position detection in the first step, (1) anatomical prior is used to screen pseudo labels generated from confidence threshold method; (2) multi-slice consistency is used to utilize more unlabeled data by inputting multiple adjacent slices; (3) for patch identification in the second step, the categories are rebalanced in each batch to solve imbalance problem. Experimental results demonstrate that VertMatch can detect vertebra accurately in ultrasound volume and outperforms state-of-the-art methods. VertMatch is also validated in clinical application on forty ultrasound scans, and it can be a promising approach for 3D assessment of scoliosis.

translated by 谷歌翻译

ABN: Anti-Blur Neural Networks for Multi-Stage Deformable Image Registration

Yao Su , Xin Dai , Lifang He , Xiangnan Kong

分类：计算机视觉

2022-12-06

Deformable image registration, i.e., the task of aligning multiple images into one coordinate system by non-linear transformation, serves as an essential preprocessing step for neuroimaging data. Recent research on deformable image registration is mainly focused on improving the registration accuracy using multi-stage alignment methods, where the source image is repeatedly deformed in stages by a same neural network until it is well-aligned with the target image. Conventional methods for multi-stage registration can often blur the source image as the pixel/voxel values are repeatedly interpolated from the image generated by the previous stage. However, maintaining image quality such as sharpness during image registration is crucial to medical data analysis. In this paper, we study the problem of anti-blur deformable image registration and propose a novel solution, called Anti-Blur Network (ABN), for multi-stage image registration. Specifically, we use a pair of short-term registration and long-term memory networks to learn the nonlinear deformations at each stage, where the short-term registration network learns how to improve the registration accuracy incrementally and the long-term memory network combines all the previous deformations to allow an interpolation to perform on the raw image directly and preserve image sharpness. Extensive experiments on both natural and medical image datasets demonstrated that ABN can accurately register images while preserving their sharpness. Our code and data can be found at https://github.com/anonymous3214/ABN

translated by 谷歌翻译

Mine yOur owN Anatomy: Revisiting Medical Image Segmentation with Extremely Limited Labels

Chenyu You , Weicheng Dai , Fenglin Liu , Haoran Su , Xiaoran Zhang , Lawrence Staib , James S. Duncan

分类：人工智能 | 计算机视觉 | 机器学习

2022-09-27

关于对比学习的最新研究仅通过在医学图像分割的背景下利用很少的标签来实现出色的性能。现有方法主要关注实例歧视和不变映射。但是，他们面临三个常见的陷阱：（1）尾巴：医疗图像数据通常遵循隐式的长尾分配。盲目利用训练中的所有像素会导致数据失衡问题，并导致性能恶化；（2）一致性：尚不清楚分割模型是否由于不同解剖学特征之间的类内变化而学会了有意义但一致的解剖学特征；（3）多样性：整个数据集中的切片内相关性已得到明显降低的关注。这促使我们寻求一种有原则的方法来战略利用数据集本身，以发现不同解剖学观点的类似但不同的样本。在本文中，我们介绍了一种新型的半监督医学图像分割框架，称其为您自己的解剖结构（MONA），并做出了三个贡献。首先，先前的工作认为，每个像素对模型培训都同样重要。我们从经验上观察到，仅此单单就不太可能定义有意义的解剖特征，这主要是由于缺乏监督信号。我们通过使用更强大的数据增强和最近的邻居展示了学习不变的两个简单解决方案。其次，我们构建了一组目标，鼓励模型能够以无监督的方式将医学图像分解为解剖特征的集合。最后，我们在具有不同标记设置的三个基准数据集上的广泛结果验证了我们提出的MONA的有效性，该数据在不同的标签设置下实现了新的最新设置。

translated by 谷歌翻译

Towards Accurate Facial Landmark Detection via Cascaded Transformers

Hui Li , Zidong Guo , Seon-Min Rhee , Seungju Han , Jae-Joon Han

分类：计算机视觉

2022-08-23

准确的面部标志是许多与人面孔有关的任务的重要先决条件。在本文中，根据级联变压器提出了精确的面部标志性检测器。我们将面部标志性检测作为坐标回归任务，以便可以端对端训练该模型。通过在变压器中的自我注意力，我们的模型可以固有地利用地标之间的结构化关系，这将受益于在挑战性条件（例如大姿势和遮挡）下具有里程碑意义的检测。在级联精炼期间，我们的模型能够根据可变形的注意机制提取目标地标周围的最相关图像特征，以进行坐标预测，从而带来更准确的对齐。此外，我们提出了一个新颖的解码器，可以同时完善图像特征和地标性位置。随着参数增加，检测性能进一步提高。我们的模型在几个标准的面部标准检测基准上实现了新的最新性能，并在跨数据库评估中显示出良好的概括能力。

translated by 谷歌翻译

Learning with Limited Annotations: A Survey on Deep Semi-Supervised Learning for Medical Image Segmentation

Rushi Jiao , Yichi Zhang , Le Ding , Rong Cai , Jicong Zhang

分类：计算机视觉

2022-07-28

在许多图像引导的临床方法中，医学图像分割是一个基本和关键的步骤。基于深度学习的细分方法的最新成功通常取决于大量标记的数据，这特别困难且昂贵，尤其是在医学成像领域中，只有专家才能提供可靠和准确的注释。半监督学习已成为一种吸引人的策略，并广泛应用于医学图像分割任务，以训练注释有限的深层模型。在本文中，我们对最近提议的半监督学习方法进行了全面综述，并总结了技术新颖性和经验结果。此外，我们分析和讨论现有方法的局限性和几个未解决的问题。我们希望这篇评论可以激发研究界探索解决这一挑战的解决方案，并进一步促进医学图像细分领域的发展。

translated by 谷歌翻译

PC-SwinMorph: Patch Representation for Unsupervised Medical Image Registration and Segmentation

Lihao Liu , Zhening Huang , Pietro Liò , Carola-Bibiane Schönlieb , Angelica I. Aviles-Rivero

分类：计算机视觉

2022-03-10

医疗图像注册和细分是多种临床程序的关键任务。这些任务的手动实现是耗时的，质量高度取决于医师的专业水平。为了减轻这项费力的任务，已经开发了自动工具，其中大多数解决方案都是有监督的技术。但是，在医疗领域中，拥有代表性的基础真理的强有力假设远非现实。为了克服这一挑战，已经研究了无监督的技术。但是，它们的性能仍然有限，并且无法产生合理的结果。在这项工作中，我们提出了一个新型的统一的无监督框架，用于图像注册和分割，我们称为PC-Swinmorph。我们框架的核心是两种基于补丁的策略，我们证明补丁表示是性能增益的关键。我们首先引入了基于补丁的对比策略，该策略可执行当地条件和更丰富的特征表示。其次，我们利用一个3D窗口/移动的窗口多头自发项模块作为补丁缝制策略，以消除贴片分裂中的人工制品。我们通过一组数值和视觉结果证明，我们的技术优于当前最新的无监督技术。

translated by 谷歌翻译

Accurate Point Cloud Registration with Robust Optimal Transport

Zhengyang Shen , Jean Feydy , Peirong Liu , Ariel Hernán Curiale , Ruben San Jose Estepar , Raul San Jose Estepar , Marc Niethammer

分类：计算机视觉

2021-11-01

这项工作调查了鲁棒优化运输（OT）的形状匹配。具体而言，我们表明最近的OT溶解器改善了基于优化和深度学习方法的点云登记，以实惠的计算成本提高了准确性。此手稿从现代OT理论的实际概述开始。然后，我们为使用此框架进行形状匹配的主要困难提供解决方案。最后，我们展示了在广泛的具有挑战性任务上的运输增强的注册模型的性能：部分形状的刚性注册;基蒂数据集的场景流程估计;肺血管树的非参数和肺部血管树。我们基于OT的方法在准确性和可扩展性方面实现了基蒂的最先进的结果，并为挑战性的肺登记任务。我们还释放了PVT1010，这是一个新的公共数据集，1,010对肺血管树，具有密集的采样点。此数据集提供了具有高度复杂形状和变形的点云登记算法的具有挑战性用例。我们的工作表明，强大的OT可以为各种注册模型进行快速预订和微调，从而为计算机视觉工具箱提供新的键方法。我们的代码和数据集可在线提供：https：//github.com/uncbiag/robot。

translated by 谷歌翻译

Pseudo-label Guided Cross-video Pixel Contrast for Robotic Surgical Scene Segmentation with Limited Annotations

Yang Yu , Zixu Zhao , Yueming Jin , Guangyong Chen , Qi Dou , Pheng-Ann Heng

分类：计算机视觉

2022-07-20

手术场景细分对于促使机器人手术的认知援助至关重要。但是，以逐帧方式以像素为单位的注释视频是昂贵且耗时的。为了大大减轻标签负担，在这项工作中，我们从机器人手术视频中研究了半监督的场景细分，这实际上是必不可少的，但以前很少探索。我们考虑在等距采样下的临床上适当的注释情况。然后，我们提出了PGV-CL，这是一种新型的伪标签引导的跨视频对比学习方法，以增强场景分割。它有效地利用了未标记的数据来实现可信赖和全球模型的正则化，从而产生更具歧视性的特征表示。具体来说，对于可信赖的表示学习，我们建议合并伪标签以指导对选择，从而获得更可靠的代表对像素对比度。此外，我们将代表学习空间从以前的图像级扩展到交叉视频，该图像可以捕获全球语义以使学习过程受益。我们广泛评估了公共机器人手术数据集Edovis18和公共白内障数据集Cadis的方法。实验结果证明了我们方法的有效性，在不同的标签比下始终超过了最先进的半监督方法，甚至超过了10.1％标签的destovis18上的全面监督培训。

translated by 谷歌翻译

Medical Image Segmentation Using Deep Learning: A Survey

Risheng Wang , Tao Lei , Ruixia Cui , Bingtao Zhang , Hongying Meng , Asoke K. Nandi

分类：计算机视觉

2020-09-28

深度学习已被广泛用于医学图像分割，并且录制了录制了该领域深度学习的成功的大量论文。在本文中，我们使用深层学习技术对医学图像分割的全面主题调查。本文进行了两个原创贡献。首先，与传统调查相比，直接将深度学习的文献分成医学图像分割的文学，并为每组详细介绍了文献，我们根据从粗略到精细的多级结构分类目前流行的文献。其次，本文侧重于监督和弱监督的学习方法，而不包括无监督的方法，因为它们在许多旧调查中引入而且他们目前不受欢迎。对于监督学习方法，我们分析了三个方面的文献：骨干网络的选择，网络块的设计，以及损耗功能的改进。对于虚弱的学习方法，我们根据数据增强，转移学习和交互式分割进行调查文献。与现有调查相比，本调查将文献分类为比例不同，更方便读者了解相关理由，并将引导他们基于深度学习方法思考医学图像分割的适当改进。

translated by 谷歌翻译

One-shot Weakly-Supervised Segmentation in Medical Images

Wenhui Lei , Qi Su , Ran Gu , Na Wang , Xinglong Liu , Guotai Wang , Xiaofan Zhang , Shaoting Zhang

分类：计算机视觉

2021-11-21

深度神经网络通常需要准确和大量注释，以在医学图像分割中实现出色的性能。单次分割和弱监督学习是有前途的研究方向，即通过仅从一个注释图像学习新类并利用粗标签来降低标签努力。以前的作品通常未能利用解剖结构并遭受阶级不平衡和低对比度问题。因此，我们为3D医学图像分割的创新框架提供了一次性和弱监督的设置。首先，提出了一种传播重建网络，以基于不同人体中的解剖模式类似的假设将来自注释体积的划痕投射到未标记的3D图像。然后，双级功能去噪模块旨在基于解剖结构和像素级别来改进涂鸦。在将涂鸦扩展到伪掩码后，我们可以使用嘈杂的标签培训策略培训新课程的分段模型。一个腹部的实验和一个头部和颈部CT数据集显示所提出的方法对最先进的方法获得显着改善，即使在严重的阶级不平衡和低对比度下也能够稳健地执行。

translated by 谷歌翻译

Robust and Precise Facial Landmark Detection by Self-Calibrated Pose Attention Network

Jun Wan , Hui Xi , Jie Zhou , Zhihui Lai , Witold Pedrycz , Xu Wang , Hang Sun

分类：计算机视觉

2021-12-23

目前全面监督的面部地标检测方法迅速进行，实现了显着性能。然而，当在大型姿势和重闭合的面孔和重闭合时仍然遭受痛苦，以进行不准确的面部形状约束，并且标记的训练样本不足。在本文中，我们提出了一个半监督框架，即自我校准的姿势注意网络（SCPAN），以实现更具挑战性的情景中的更强大和精确的面部地标检测。具体地，建议通过定影边界和地标强度场信息来模拟更有效的面部形状约束的边界意识的地标强度（BALI）字段。此外，设计了一种自我校准的姿势注意力（SCPA）模型，用于提供自学习的目标函数，该功能通过引入自校准机制和姿势注意掩模而无需标签信息而无需标签信息。我们认为，通过将巴厘岛领域和SCPA模型集成到新颖的自我校准的姿势网络中，可以了解更多的面部现有知识，并且我们的面孔方法的检测精度和稳健性得到了改善。获得具有挑战性的基准数据集获得的实验结果表明，我们的方法优于文献中最先进的方法。

translated by 谷歌翻译