智能论文笔记

Deep Learning-Based Automatic Diagnosis System for Developmental Dysplasia of the Hip

Yang Li , Leo Yan Li-Han , Hua Tian

分类：人工智能 | 计算机视觉 | 机器学习

2022-09-07

作为一线诊断成像方式，射线照相在早期检测髋关节发育不良（DDH）中起着至关重要的作用。在临床上，DDH的诊断依赖于手动测量和对骨盆X光片不同解剖特征的主观评估。这个过程效率低下且容易出错，需要多年的临床经验。在这项研究中，我们提出了一个基于深度学习的系统，该系统自动从X光片中自动检测14个关键点，测量三个解剖学角度（中心边缘，T \“ Onnis和Sharp Angles），并将DDH臀部分类为I-IV级别I-IV级别此外，提出了一种新型数据驱动的评分系统，以定量地整合DDH诊断的信息。提出的键盘检测模型达到了平均值（95％置信区间[CI]）的平均精度为0.807）（0.804-0.810。）和0.953（0.947-0.960），它们明显高于经验丰富的骨科医生（p <0.0001）。此外，使用拟议的得分获得的平均（95％CI）测试诊断协议（Cohen's Kappa）系统为0.84（0.83-0.85），whi CH显着高于从诊断标准获得的单个角度（0.76 [0.75-0.77]）和骨科医生（0.71 [0.63-0.79]）的CH。据我们所知，这是通过利用深度学习关键点检测和整合不同解剖学测量值的首次进行客观DDH诊断的研究，这可以为临床决策提供可靠且可解释的支持。

translated by 谷歌翻译

SpineOne: A One-Stage Detection Framework for Degenerative Discs and Vertebrae

Jiabo He , Wei Liu , Yu Wang , Xingjun Ma , Xian-Sheng Hua

分类：计算机视觉

2021-10-28

脊柱退化困扰着许多长老，办公室工作者，甚至是年轻世代。有效的药剂或外科干预措施可以帮助缓解退行性脊柱条件。然而，传统的诊断程序往往太费力了。临床专家需要从脊柱磁共振成像（MRI）或计算机断层扫描（CT）图像中检测椎间盘和椎骨作为进行病理诊断或术前评价的初步步骤。已经开发了机器学习系统，以帮助这一程序通常在两级方法之后：首先进行解剖定位，然后进行病理分类。为了更高效和准确的诊断，我们提出了一种单阶段检测框架，称为Spineone，同时定位和分类来自MRI切片的退化椎间盘和椎骨。脊柱内置于以下三个关键技术：1）Keypoint Heatmap的新设计，以促进同时关键点本地化和分类; 2）使用注意力模块更好地区分光盘和椎骨之间的表示; 3）一种新颖的梯度引导的客观协会机制，将多个学习目标与后来的培训阶段相关联。脊髓疾病智能诊断的经验结果Tianchi竞争（SDID-TC）550考试的数据集表明，我们的方法通过大幅度超越现有方法。

translated by 谷歌翻译

PointNu-Net: Simultaneous Multi-tissue Histology Nuclei Segmentation and Classification in the Clinical Wild

Kai Yao , Kaizhu Huang , Jie Sun , Amir Hussain , Curran Jude

分类：计算机视觉

2021-11-01

自动核细胞分割和分类在数字病理学中起着至关重要的作用。但是，以前的作品主要基于具有有限的多样性和小尺寸的数据构建，使得在实际下游任务中的结果可疑或误导。在本文中，我们的目标是建立一种可靠且强大的方法，能够处理“临床野生”中的数据。具体地，我们研究和设计一种同时检测，分段和分类来自血红素和曙红（H＆E）染色的组织病理学数据的新方法，并使用最近的最大数据集评估我们的方法：Pannuke。我们以新颖的语义关键点估计问题解决每个核的检测和分类，以确定每个核的中心点。接下来，使用动态实例分段获得核心点的相应类别 - 不可止液掩模。通过解耦两个同步具有挑战性的任务，我们的方法可以从类别感知的检测和类别不可知的细分中受益，从而导致显着的性能提升。我们展示了我们提出的核细胞分割和分类方法的卓越性能，跨越19种不同的组织类型，提供了新的基准结果。

translated by 谷歌翻译

Knee arthritis severity measurement using deep learning: a publicly available algorithm with a multi-institutional validation showing radiologist-level performance

Hanxue Gu , Keyu Li , Roy J. Colglazier , Jichen Yang , Michael Lebhar , Jonathan O'Donnell , William A. Jiranek , Richard C. Mather , Rob J. French , Nicholas Said

分类：计算机视觉 | 机器学习

2022-03-16

膝关节X射线上的膝盖骨关节炎（KOA）的评估是使用总膝关节置换术的中心标准。但是，该评估遭受了不精确的标准，并且读取器间的可变性非常高。对KOA严重性的算法，自动评估可以通过提高其使用的适当性来改善膝盖替代程序的总体结果。我们提出了一种基于深度学习的新型五步算法，以自动从X光片后验（PA）视图对KOA进行评级：（1）图像预处理（2）使用Yolo V3-tiny模型，图像在图像中定位膝关节，（3）使用基于卷积神经网络的分类器对骨关节炎的严重程度进行初步评估，（4）关节分割和关节空间狭窄（JSN）的计算（JSN）和（5），JSN和最初的结合评估确定最终的凯尔格伦法律（KL）得分。此外，通过显示用于进行评估的分割面具，我们的算法与典型的“黑匣子”深度学习分类器相比表现出更高的透明度。我们使用我们机构的两个公共数据集和一个数据集进行了全面的评估，并表明我们的算法达到了最先进的性能。此外，我们还从机构中的多个放射科医生那里收集了评分，并表明我们的算法在放射科医生级别进行。该软件已在https://github.com/maciejmazurowowski/osteoarthitis-classification上公开提供。

translated by 谷歌翻译

Improved-Mask R-CNN: Towards an Accurate Generic MSK MRI instance segmentation platform (Data from the Osteoarthritis Initiative)

Banafshe Felfeliyan , Abhilash Hareendranathan , Gregor Kuntze , Jacob L. Jaremko , Janet L. Ronsky

分类：计算机视觉 | 机器学习

2021-07-27

对骨关节炎（OA）的磁共振成像（MRI）扫描的客观评估可以解决当前OA评估的局限性。 OA客观评估是必需的骨，软骨和关节液的分割。大多数提出的分割方法都不执行实例分割，并且遭受了类不平衡问题。这项研究部署了蒙版R-CNN实例分割并改进了IT（改进的面罩R-CNN（IMASKRCNN）），以获得与OA相关组织的更准确的广义分割。该方法的训练和验证是使用骨关节炎倡议（OAI）数据集的500次MRI膝盖和有症状髋关节OA患者的97次MRI扫描进行的。掩盖R-CNN的三个修改产生了iMaskRCNN：添加第二个Roialigned块，在掩码标先中添加了额外的解码器层，并通过跳过连接将它们连接起来。使用Hausdorff距离，骰子评分和变异系数（COV）评估结果。与面膜RCNN相比，iMaskRCNN导致骨骼和软骨分割的改善，这表明股骨的骰子得分从95％增加到98％，胫骨的95％到97％，股骨软骨的71％至80％，81％和81％胫骨软骨的％至82％。对于积液检测，iMaskRCNN 72％比MaskRCNN 71％改善了骰子。 Reader1和Mask R-CNN（0.33），Reader1和ImaskRCNN（0.34），Reader2和Mask R-CNN（0.22），Reader2和iMaskRCNN（0.29）之间的积液检测的COV值（0.34），读取器2和mask r-CNN（0.22）接近COV之间，表明人类读者与蒙版R-CNN和ImaskRCNN之间的一致性很高。蒙版R-CNN和ImaskRCNN可以可靠，同时提取与OA有关的不同规模的关节组织，从而为OA的自动评估构成基础。 iMaskRCNN结果表明，修改改善了边缘周围的网络性能。

translated by 谷歌翻译

Deep Learning based Automatic Quantification of Urethral Plate Quality using the Plate Objective Scoring Tool (POST)

Tariq O. Abbas , Mohamed AbdelMoniem , Ibrahim Khalil , Md Sakib Abrar Hossain , Muhammad E. H. Chowdhury

分类：计算机视觉 | 人工智能

2022-09-28

目标：探索深度学习算法进一步简化和优化尿道板（UP）质量评估的能力，使用板客观评分工具（POST），旨在提高Hypospadias修复中提高评估的客观性和可重复性。方法：五个关键的邮政地标是由专家在691图像数据集中的专家标记，该数据集接受了原发性杂质修复的青春期前男孩。然后，该数据集用于开发和验证基于深度学习的地标检测模型。提出的框架始于瞥见和检测，其中输入图像是使用预测的边界框裁剪的。接下来，使用深层卷积神经网络（CNN）体系结构来预测五个邮政标记的坐标。然后，这些预测的地标用于评估远端催化性远端的质量。结果：所提出的模型准确地定位了gan区域，平均平均精度（地图）为99.5％，总体灵敏度为99.1％。在预测地标的坐标时，达到了0.07152的归一化平均误差（NME），平均平方误差（MSE）为0.001，在0.1 nme的阈值下为20.2％的故障率。结论：此深度学习应用程序在使用邮政评估质量时表现出鲁棒性和高精度。使用国际多中心基于图像的数据库进行进一步评估。外部验证可以使深度学习算法受益，并导致更好的评估，决策和对手术结果的预测。

translated by 谷歌翻译

Retinal Structure Detection in OCTA Image via Voting-based Multi-task Learning

Jinkui Hao , Ting Shen , Xueli Zhu , Yonghuai Liu , Ardhendu Behera , Dan Zhang , Bang Chen , Jiang Liu , Jiong Zhang , Yitian Zhao

分类：计算机视觉

2022-08-23

自动检测视网膜结构，例如视网膜血管（RV），凹起的血管区（FAZ）和视网膜血管连接（RVJ），对于了解眼睛的疾病和临床决策非常重要。在本文中，我们提出了一种新型的基于投票的自适应特征融合多任务网络（VAFF-NET），用于在光学相干性层析成像（OCTA）中对RV，FAZ和RVJ进行联合分割，检测和分类。提出了一个特定于任务的投票门模块，以适应并融合两个级别的特定任务的不同功能：来自单个编码器的不同空间位置的特征，以及来自多个编码器的功能。特别是，由于八八座图像中微脉管系统的复杂性使视网膜血管连接连接到分叉/跨越具有挑战性的任务的同时定位和分类，因此我们通过结合热图回归和网格分类来专门设计任务头。我们利用来自各种视网膜层的三个不同的\ textit {en face}血管造影，而不是遵循仅使用单个\ textit {en face}的现有方法。为了促进进一步的研究，已经发布了这些数据集的部分数据集，并已发布了公共访问：https：//github.com/imed-lab/vaff-net。

translated by 谷歌翻译

HoughNet: Integrating near and long-range evidence for visual detection

Nermin Samet , Samet Hicsonmez , Emre Akbas

分类：计算机视觉

2021-04-14

本文介绍了Houghnet，这是一种单阶段，无锚，基于投票的，自下而上的对象检测方法。受到广义的霍夫变换的启发，霍尼特通过在该位置投票的总和确定了某个位置的物体的存在。投票是根据对数极极投票领域的近距离和长距离地点收集的。由于这种投票机制，Houghnet能够整合近距离和远程的班级条件证据以进行视觉识别，从而概括和增强当前的对象检测方法，这通常仅依赖于本地证据。在可可数据集中，Houghnet的最佳型号达到$ 46.4 $ $ $ ap $（和$ 65.1 $ $ $ ap_ {50} $），与自下而上的对象检测中的最先进的作品相同，超越了最重要的一项 - 阶段和两阶段方法。我们进一步验证了提案在其他视觉检测任务中的有效性，即视频对象检测，实例分割，3D对象检测和人为姿势估计的关键点检测以及其他“图像”图像生成任务的附加“标签”，其中集成的集成在所有情况下，我们的投票模块始终提高性能。代码可在https://github.com/nerminsamet/houghnet上找到。

translated by 谷歌翻译

An Accurate and Explainable Deep Learning System Improves Interobserver Agreement in the Interpretation of Chest Radiograph

Hieu H. Pham , Ha Q. Nguyen , Hieu T. Nguyen , Linh T. Le , Lam Khanh

分类：计算机视觉

2022-08-06

最近的人工智能（AI）算法已在各种医学分类任务上实现了放射科医生级的性能。但是，只有少数研究涉及CXR扫描异常发现的定位，这对于向放射学家解释图像级分类至关重要。我们在本文中介绍了一个名为Vindr-CXR的可解释的深度学习系统，该系统可以将CXR扫描分类为多种胸部疾病，同时将大多数类型的关键发现本地化在图像上。 Vindr-CXR接受了51,485次CXR扫描的培训，并通过放射科医生提供的边界盒注释进行了培训。它表现出与经验丰富的放射科医生相当的表现，可以在3,000张CXR扫描的回顾性验证集上对6种常见的胸部疾病进行分类，而在接收器操作特征曲线（AUROC）下的平均面积为0.967（95％置信区间[CI]：0.958---------0.958------- 0.975）。 VINDR-CXR在独立患者队列中也得到了外部验证，并显示出其稳健性。对于具有14种类型病变的本地化任务，我们的自由响应接收器操作特征（FROC）分析表明，VINDR-CXR以每扫描确定的1.0假阳性病变的速率达到80.2％的敏感性。还进行了一项前瞻性研究，以衡量VINDR-CXR在协助六名经验丰富的放射科医生方面的临床影响。结果表明，当用作诊断工具时，提出的系统显着改善了放射科医生本身之间的一致性，平均Fleiss的Kappa的同意增加了1.5％。我们还观察到，在放射科医生咨询了Vindr-CXR的建议之后，在平均Cohen的Kappa中，它们和系统之间的一致性显着增加了3.3％。

translated by 谷歌翻译

Computer Vision on X-ray Data in Industrial Production and Security Applications: A survey

Mehdi Rafiei , Jenni Raitoharju , Alexandros Iosifidis

分类：计算机视觉

2022-11-10

X-ray imaging technology has been used for decades in clinical tasks to reveal the internal condition of different organs, and in recent years, it has become more common in other areas such as industry, security, and geography. The recent development of computer vision and machine learning techniques has also made it easier to automatically process X-ray images and several machine learning-based object (anomaly) detection, classification, and segmentation methods have been recently employed in X-ray image analysis. Due to the high potential of deep learning in related image processing applications, it has been used in most of the studies. This survey reviews the recent research on using computer vision and machine learning for X-ray analysis in industrial production and security applications and covers the applications, techniques, evaluation metrics, datasets, and performance comparison of those techniques on publicly available datasets. We also highlight some drawbacks in the published research and give recommendations for future research in computer vision-based X-ray analysis.

translated by 谷歌翻译

Hard hat wearing detection based on head keypoint localization

Bartosz Wójcik , Mateusz Żarski , Kamil Książek , Jarosław Adam Miszczak , Mirosław Jan Skibniewski

分类：计算机视觉 | 人工智能 | 机器学习 | 神经与进化计算

2021-06-21

近年来，在基于视觉的施工站点安全系统的背景下，特别是关于个人保护设备，对深度学习方法引起了很多关注。但是，尽管有很多关注，但仍然没有可靠的方法来建立工人与硬帽之间的关系。为了回答此问题，本文提出了深入学习，对象检测和头部关键点本地化的结合以及简单的基于规则的推理。在测试中，该解决方案基于不同实例的相对边界框位置以及直接检测硬帽佩戴者和非磨损者的方法超过了先前的方法。结果表明，新颖的深度学习方法与基于人性化的规则系统的结合可能会导致一种既可靠又可以成功模仿现场监督的解决方案。这项工作是开发完全自主建筑工地安全系统的下一步，表明该领域仍有改进的余地。

translated by 谷歌翻译

2D Human Pose Estimation with Explicit Anatomical Keypoints Structure Constraints

Zhangjian Ji , Zilong Wang , Ming Zhang , Yapeng Chen , Yuhua Qian

分类：计算机视觉

2022-12-05

Recently, human pose estimation mainly focuses on how to design a more effective and better deep network structure as human features extractor, and most designed feature extraction networks only introduce the position of each anatomical keypoint to guide their training process. However, we found that some human anatomical keypoints kept their topology invariance, which can help to localize them more accurately when detecting the keypoints on the feature map. But to the best of our knowledge, there is no literature that has specifically studied it. Thus, in this paper, we present a novel 2D human pose estimation method with explicit anatomical keypoints structure constraints, which introduces the topology constraint term that consisting of the differences between the distance and direction of the keypoint-to-keypoint and their groundtruth in the loss object. More importantly, our proposed model can be plugged in the most existing bottom-up or top-down human pose estimation methods and improve their performance. The extensive experiments on the benchmark dataset: COCO keypoint dataset, show that our methods perform favorably against the most existing bottom-up and top-down human pose estimation methods, especially for Lite-HRNet, when our model is plugged into it, its AP scores separately raise by 2.9\% and 3.3\% on COCO val2017 and test-dev2017 datasets.

translated by 谷歌翻译

Real-time landmark detection for precise endoscopic submucosal dissection via shape-aware relation network

Jiacheng Wang , Yueming Jin , Shuntian Cai , Hongzhi Xu , Pheng-Ann Heng , Jing Qin , Liansheng Wang

分类：计算机视觉

2021-11-08

我们提出了一种新颖的形状意识的关系网络，用于内窥镜粘膜颌下粘膜释放（ESD）手术中的准确和实时地标检测。这项任务具有很大的临床意义，但由于复杂的手术环境中出血，照明反射和运动模糊而极其挑战。与现有解决方案相比，通过使用复杂的聚合方案忽略靶向对象之间的几何关系或捕获关系，所提出的网络能够实现令人满意的精度，同时通过充分利用地标之间的空间关系来保持实时性能。我们首先设计一种算法来自动生成关系关键点热量表，其能够直观地代表地标之间的空间关系的先验知识，而无需使用任何额外的手动注释工作。然后，我们开发两个互补正规计划，以逐步将先验知识纳入培训过程。虽然一个方案通过多任务学习引入像素级正则化，但另一个方案通过利用新设计的分组的一致性评估器来实现全局级正则化，该评估将关系约束以越野方式添加到所提出的网络。这两个方案都有利于训练模型，并且可以随时推动才能卸载，以实现实时检测。我们建立了一个大型内部数据集的ESD手术，用于食管癌，以验证我们提出的方法的有效性。广泛的实验结果表明，我们的方法在准确性和效率方面优于最先进的方法，更快地实现了更好的检测结果。在两个下游应用的有希望的结果进一步证实了我们在ESD临床实践中的方法的巨大潜力。

translated by 谷歌翻译

Automated pharyngeal phase detection and bolus localization in videofluoroscopic swallowing study: Killing two birds with one stone?

Andrea Bandini , Sana Smaoui , Catriona M. Steele

分类：计算机视觉

2021-11-08

荧光吞咽研究（VFSS）是一种用于评估吞咽的金标成像技术，但VFSS录音的分析和评级是耗时，需要专门的培训和专业知识。研究人员已经证明，可以通过计算机视觉方法自动检测吞咽的咽部阶段，并通过计算机视觉方法本地化推注中的推注，促进新颖的自动VFSS分析技术的开发。但是，培训算法以执行这些任务需要很少可用的大量注释数据。我们证明，可以使用单一方法在一起解决咽期检测和推注定位的挑战。我们提出了一个深入学习的框架，以弱监督的方式共同解决咽期检测和推注定位，只需要临时阶段的初始和最终框架作为培训的地面真理注释。我们的方法源于观察结果，即咽部中的推注存在是最突出的视觉特征，在其上推断单个VFSS帧是否属于咽部阶段。我们在来自59个健康受试者的1245 VFS剪辑的数据集中进行了大量卷积神经网络（CNNS）进行了广泛的实验。我们证明，可以检测咽部阶段，其F1分数高于0.9。此外，通过处理CNN的类激活图，我们能够通过有前途的结果本地化推注，从未获得高于0.9的地面真理轨迹的相关性，而无需用于训练目的的推注定位的任何手动注释。一旦验证了吞咽障碍的更大的参与者样本，我们的框架将为VFSS分析开发智能工具的开发，以支持临床医生吞咽评估。

translated by 谷歌翻译

CenterNet: Keypoint Triplets for Object Detection

Kaiwen Duan , Song Bai , Lingxi Xie , Honggang Qi , Qingming Huang , Qi Tian

分类：

2019-04-17

In object detection, keypoint-based approaches often suffer a large number of incorrect object bounding boxes, arguably due to the lack of an additional look into the cropped regions. This paper presents an efficient solution which explores the visual patterns within each cropped region with minimal costs. We build our framework upon a representative one-stage keypoint-based detector named Corner-Net. Our approach, named CenterNet, detects each object as a triplet, rather than a pair, of keypoints, which improves both precision and recall. Accordingly, we design two customized modules named cascade corner pooling and center pooling, which play the roles of enriching information collected by both top-left and bottom-right corners and providing more recognizable information at the central regions, respectively. On the MS-COCO dataset, CenterNet achieves an AP of 47.0%, which outperforms all existing one-stage detectors by at least 4.9%. Meanwhile, with a faster inference speed, CenterNet demonstrates quite comparable performance to the top-ranked two-stage detectors. Code is available at https://github.com/ Duankaiwen/CenterNet.

translated by 谷歌翻译

One-Stage Cascade Refinement Networks for Infrared Small Target Detection

Yimian Dai , Xiang Li , Fei Zhou , Yulei Qian , Yaohong Chen , Jian Yang

分类：计算机视觉

2022-12-16

Single-frame InfraRed Small Target (SIRST) detection has been a challenging task due to a lack of inherent characteristics, imprecise bounding box regression, a scarcity of real-world datasets, and sensitive localization evaluation. In this paper, we propose a comprehensive solution to these challenges. First, we find that the existing anchor-free label assignment method is prone to mislabeling small targets as background, leading to their omission by detectors. To overcome this issue, we propose an all-scale pseudo-box-based label assignment scheme that relaxes the constraints on scale and decouples the spatial assignment from the size of the ground-truth target. Second, motivated by the structured prior of feature pyramids, we introduce the one-stage cascade refinement network (OSCAR), which uses the high-level head as soft proposals for the low-level refinement head. This allows OSCAR to process the same target in a cascade coarse-to-fine manner. Finally, we present a new research benchmark for infrared small target detection, consisting of the SIRST-V2 dataset of real-world, high-resolution single-frame targets, the normalized contrast evaluation metric, and the DeepInfrared toolkit for detection. We conduct extensive ablation studies to evaluate the components of OSCAR and compare its performance to state-of-the-art model-driven and data-driven methods on the SIRST-V2 benchmark. Our results demonstrate that a top-down cascade refinement framework can improve the accuracy of infrared small target detection without sacrificing efficiency. The DeepInfrared toolkit, dataset, and trained models are available at https://github.com/YimianDai/open-deepinfrared to advance further research in this field.

translated by 谷歌翻译

Deep Learning based Framework for Automatic Diagnosis of Glaucoma based on analysis of Focal Notching in the Optic Nerve Head

Sneha Dasgupta , Rishav Mukherjee , Kaushik Dutta , Anindya Sen

分类：计算机视觉

2021-12-10

视网膜眼底图像的自动评估是涌现为最重要的早期检测和治疗渐进眼疾病的工具之一。青光眼导致视力的进步退化，其特征在于光学杯形状的变形和血管的变性导致沿神经垂体边缘形成凹口的形成。在本文中，我们提出了一种基于深度学习的管道，用于从数字眼底图像（DFIS）的光盘（OD）和光学杯（OC）区域的自动分割，从而提取预测青光眼所需的不同特征。该方法利用了神经古代轮辋的局灶性凹口分析以及杯盘比值值作为分类参数，以提高计算机辅助设计（CAD）系统的准确性分析青光眼。支持基于向量的机器学习算法用于分类，基于提取的功能将DFIS分类为青光眼或正常。在自由可用的DRISHTI-GS数据集上评估了所提出的管道，得到了从DFIS检测青光眼的93.33％的精度。

translated by 谷歌翻译

Rethinking Keypoint Representations: Modeling Keypoints and Poses as Objects for Multi-Person Human Pose Estimation

William McNally , Kanav Vats , Alexander Wong , John McPhee

分类：计算机视觉 | 人工智能

2021-11-16

在诸如人类姿态估计的关键点估计任务中，尽管具有显着缺点，但基于热线的回归是主要的方法：Heatmaps本质上遭受量化误差，并且需要过多的计算来产生和后处理。有动力寻找更有效的解决方案，我们提出了一种新的热映射无关声点估计方法，其中各个关键点和空间相关的关键点（即，姿势）被建模为基于密集的单级锚的检测框架内的对象。因此，我们将我们的方法Kapao（发音为“KA-Pow！”）对于关键点并作为对象构成。我们通过同时检测人姿势对象和关键点对象并融合检测来利用两个对象表示的强度来将Kapao应用于单阶段多人人类姿势估算问题。在实验中，我们观察到Kapao明显比以前的方法更快，更准确，这极大地来自热爱处理后处理。此外，在不使用测试时间增强时，精度速度折衷特别有利。我们的大型型号Kapao-L在Microsoft Coco Keypoints验证集上实现了70.6的AP，而无需测试时增强，其比下一个最佳单级模型更准确，4.0 AP更准确。此外，Kapao在重闭塞的存在下擅长。在繁荣试验套上，Kapao-L为一个单级方法实现新的最先进的准确性，AP为68.9。

translated by 谷歌翻译

REFUGE2 Challenge: A Treasure Trove for Multi-Dimension Analysis and Evaluation in Glaucoma Screening

Huihui Fang , Fei Li , Junde Wu , Huazhu Fu , Xu Sun , Jaemin Son , Shuang Yu , Menglu Zhang , Chenglang Yuan , Cheng Bian

分类：计算机视觉

2022-02-18

With the rapid development of artificial intelligence (AI) in medical image processing, deep learning in color fundus photography (CFP) analysis is also evolving. Although there are some open-source, labeled datasets of CFPs in the ophthalmology community, large-scale datasets for screening only have labels of disease categories, and datasets with annotations of fundus structures are usually small in size. In addition, labeling standards are not uniform across datasets, and there is no clear information on the acquisition device. Here we release a multi-annotation, multi-quality, and multi-device color fundus image dataset for glaucoma analysis on an original challenge -- Retinal Fundus Glaucoma Challenge 2nd Edition (REFUGE2). The REFUGE2 dataset contains 2000 color fundus images with annotations of glaucoma classification, optic disc/cup segmentation, as well as fovea localization. Meanwhile, the REFUGE2 challenge sets three sub-tasks of automatic glaucoma diagnosis and fundus structure analysis and provides an online evaluation framework. Based on the characteristics of multi-device and multi-quality data, some methods with strong generalizations are provided in the challenge to make the predictions more robust. This shows that REFUGE2 brings attention to the characteristics of real-world multi-domain data, bridging the gap between scientific research and clinical application.

translated by 谷歌翻译

AIParsing: Anchor-free Instance-level Human Parsing

Sanyi Zhang , Xiaochun Cao , Guo-Jun Qi , Zhanjie Song , Jie Zhou

分类：计算机视觉

2022-07-14

大多数最先进的实例级人类解析模型都采用了两阶段的基于锚的探测器，因此无法避免启发式锚盒设计和像素级别缺乏分析。为了解决这两个问题，我们设计了一个实例级人类解析网络，该网络在像素级别上无锚固且可解决。它由两个简单的子网络组成：一个用于边界框预测的无锚检测头和一个用于人体分割的边缘引导解析头。无锚探测器的头继承了像素样的优点，并有效地避免了对象检测应用中证明的超参数的敏感性。通过引入部分感知的边界线索，边缘引导的解析头能够将相邻的人类部分与彼此区分开，最多可在一个人类实例中，甚至重叠的实例。同时，利用了精炼的头部整合盒子级别的分数和部分分析质量，以提高解析结果的质量。在两个多个人类解析数据集（即CIHP和LV-MHP-V2.0）和一个视频实例级人类解析数据集（即VIP）上进行实验，表明我们的方法实现了超过全球级别和实例级别的性能最新的一阶段自上而下的替代方案。

translated by 谷歌翻译