T2磁共振成像(MRI)中淋巴结(LN)的鉴定是放射科在评估淋巴抑制性疾病期间的重要步骤。节点的大小在其分期中发挥着至关重要的作用,并且放射科有时有时使用额外的对比度序列,例如扩散加权成像(DWI)进行确认。然而,淋巴结在T2 MRI扫描中具有多样化的外观,使得转移的阶段难以实现。此外,放射科医师通常会在繁忙的一天中错过较小的转移性淋巴结。要处理这些问题,我们建议使用检测变压器(DETR)网络本地化可疑转移性淋巴结,用于挑战不同扫描仪和考试协议获得的T2 MRI扫描。通过边界盒融合技术降低了误报(FP),并且达到了每张图像4 FP的65.41 \%的精确度和91.66 \%。据我们所知,我们的结果改善了T2 MRI扫描中的目前的淋巴结检测最先进的淋巴结检测。
translated by 谷歌翻译
在临床实践中,在区分从非转移的中转移时,放射科学家在依赖于病变尺寸。病变尺寸的先决条件是它们的检测,因为它促进了对肿瘤的下游评估。然而,病变在CT扫描中的大小和外观变化,并且放射科医师通常会错过小型病变繁忙的临床日。为了克服这些挑战,我们提出了使用最先进的检测神经网络,以向NIH Deepleion数据集中存在的可疑病变进行尺寸。此外,我们合并了界定盒融合技术,以最大限度地减少假阳性(FP)并提高检测精度。最后,ToreSemble临床用途,我们构建了一个最佳检测模型的集合,以定位损伤,以精确度为65.17%,灵敏度为91.67%,每张图片4 fp。我们的结果改善了当前最先进方法的性能,以便在挑战CT扫描中进行病变检测。
translated by 谷歌翻译
用于视觉数据的变压器模型的最新进程导致识别和检测任务的显着改进。特别是,使用学习查询代替区域建议,这已经引起了一种新的一类单级检测模型,由检测变压器(DETR)。这种单阶段方法的变化已经主导了人对象相互作用(HOI)检测。然而,这种单阶段Hoi探测器的成功可以很大程度上被归因于变压器的表示力。我们发现,当配备相同的变压器时,他们的两级同行可以更加性能和记忆力,同时取得一小部分训练。在这项工作中,我们提出了一对成对变压器,这是一个用于HOI的一元和成对表示的两级检测器。我们观察到我们的变压器网络的一对和成对部分专门化,前者优先增加积极示例的分数,后者降低了阴性实例的分数。我们评估我们在HiCO-DET和V-Coco数据集上的方法,并显着优于最先进的方法。在推理时间内,我们使用RESET50的模型在单个GPU上接近实时性能。
translated by 谷歌翻译
检测变压器代表基于变压器编码器架构架构的端到端对象检测方法,从而利用了注意机制进行全局关系建模。尽管检测变形金刚在2D自然图像上运行的基于CNN的高度优化的对应物提供的结果与其高度优化的同行提供了结果,但它们的成功与获取大量培训数据紧密相结合。但是,这限制了在医疗领域中使用检测变压器的可行性,因为访问注释数据通常受到限制。为了解决这个问题并促进医疗检测变压器的出现,我们提出了一种新型检测变压器,用于3D解剖结构检测,称为聚焦解码器。集中的解码器利用解剖区域图集的信息同时部署查询锚点,并将跨注意的视野限制为感兴趣的区域,这使得精确地关注相关的解剖结构。我们在两个公开可用的CT数据集上评估了我们提出的方法,并证明了专注的解码器不仅提供了强大的检测结果,从而减轻了对大量注释数据的需求,而且还表现出了通过注意力重量对结果的出色和高度直观的解释。我们的医学视觉变压器库github.com/bwittmann/transoar提供了专注的解码器代码。
translated by 谷歌翻译
脊柱退化困扰着许多长老,办公室工作者,甚至是年轻世代。有效的药剂或外科干预措施可以帮助缓解退行性脊柱条件。然而,传统的诊断程序往往太费力了。临床专家需要从脊柱磁共振成像(MRI)或计算机断层扫描(CT)图像中检测椎间盘和椎骨作为进行病理诊断或术前评价的初步步骤。已经开发了机器学习系统,以帮助这一程序通常在两级方法之后:首先进行解剖定位,然后进行病理分类。为了更高效和准确的诊断,我们提出了一种单阶段检测框架,称为Spineone,同时定位和分类来自MRI切片的退化椎间盘和椎骨。脊柱内置于以下三个关键技术:1)Keypoint Heatmap的新设计,以促进同时关键点本地化和分类; 2)使用注意力模块更好地区分光盘和椎骨之间的表示; 3)一种新颖的梯度引导的客观协会机制,将多个学习目标与后来的培训阶段相关联。脊髓疾病智能诊断的经验结果Tianchi竞争(SDID-TC)550考试的数据集表明,我们的方法通过大幅度超越现有方法。
translated by 谷歌翻译
Automatic parsing of human anatomies at instance-level from 3D computed tomography (CT) scans is a prerequisite step for many clinical applications. The presence of pathologies, broken structures or limited field-of-view (FOV) all can make anatomy parsing algorithms vulnerable. In this work, we explore how to exploit and conduct the prosperous detection-then-segmentation paradigm in 3D medical data, and propose a steerable, robust, and efficient computing framework for detection, identification, and segmentation of anatomies in CT scans. Considering complicated shapes, sizes and orientations of anatomies, without lose of generality, we present the nine degrees-of-freedom (9-DoF) pose estimation solution in full 3D space using a novel single-stage, non-hierarchical forward representation. Our whole framework is executed in a steerable manner where any anatomy of interest can be directly retrieved to further boost the inference efficiency. We have validated the proposed method on three medical imaging parsing tasks of ribs, spine, and abdominal organs. For rib parsing, CT scans have been annotated at the rib instance-level for quantitative evaluation, similarly for spine vertebrae and abdominal organs. Extensive experiments on 9-DoF box detection and rib instance segmentation demonstrate the effectiveness of our framework (with the identification rate of 97.0% and the segmentation Dice score of 90.9%) in high efficiency, compared favorably against several strong baselines (e.g., CenterNet, FCOS, and nnU-Net). For spine identification and segmentation, our method achieves a new state-of-the-art result on the public CTSpine1K dataset. Last, we report highly competitive results in multi-organ segmentation at FLARE22 competition. Our annotations, code and models will be made publicly available at: https://github.com/alibaba-damo-academy/Med_Query.
translated by 谷歌翻译
Detection Transformer (DETR) directly transforms queries to unique objects by using one-to-one bipartite matching during training and enables end-to-end object detection. Recently, these models have surpassed traditional detectors on COCO with undeniable elegance. However, they differ from traditional detectors in multiple designs, including model architecture and training schedules, and thus the effectiveness of one-to-one matching is not fully understood. In this work, we conduct a strict comparison between the one-to-one Hungarian matching in DETRs and the one-to-many label assignments in traditional detectors with non-maximum supervision (NMS). Surprisingly, we observe one-to-many assignments with NMS consistently outperform standard one-to-one matching under the same setting, with a significant gain of up to 2.5 mAP. Our detector that trains Deformable-DETR with traditional IoU-based label assignment achieved 50.2 COCO mAP within 12 epochs (1x schedule) with ResNet50 backbone, outperforming all existing traditional or transformer-based detectors in this setting. On multiple datasets, schedules, and architectures, we consistently show bipartite matching is unnecessary for performant detection transformers. Furthermore, we attribute the success of detection transformers to their expressive transformer architecture. Code is available at https://github.com/jozhang97/DETA.
translated by 谷歌翻译
深度神经网络(DNN)已在脑病变检测和分割中广泛采用。但是,在2D MRI切片中定位小病变是具有挑战性的,需要在3D上下文聚集的粒度和计算复杂性之间取得平衡。在本文中,我们提出了一种新型的视角变压器,以增强MRI特征的提取,以进行更准确的肿瘤检测。首先,所提出的变压器在3D脑扫描中收获了不同位置之间的远程相关性。其次,变压器将一堆切片功能堆叠为多个2D视图,并增强这些特征的视图,该功能大致以有效的方式实现了3D相关计算。第三,我们将提出的变压器模块部署在变压器主链中,该模块可以有效地检测到脑损伤周围的2D区域。实验结果表明,我们提出的观看式变压器在具有挑战性的大脑MRI数据集上对大脑病变检测表现良好。
translated by 谷歌翻译
深神网络的对象探测器正在不断发展,并用于多种应用程序,每个应用程序都有自己的要求集。尽管关键安全应用需要高准确性和可靠性,但低延迟任务需要资源和节能网络。不断提出了实时探测器,在高影响现实世界中是必需的,但是它们过分强调了准确性和速度的提高,而其他功能(例如多功能性,鲁棒性,资源和能源效率)则被省略。现有网络的参考基准不存在,设计新网络的标准评估指南也不存在,从而导致比较模棱两可和不一致的比较。因此,我们对广泛的数据集进行了多个实时探测器(基于锚点,关键器和变压器)的全面研究,并报告了一系列广泛指标的结果。我们还研究了变量,例如图像大小,锚固尺寸,置信阈值和架构层对整体性能的影响。我们分析了检测网络的鲁棒性,以防止分配变化,自然腐败和对抗性攻击。此外,我们提供了校准分析来评估预测的可靠性。最后,为了强调现实世界的影响,我们对自动驾驶和医疗保健应用进行了两个独特的案例研究。为了进一步衡量关键实时应用程序中网络的能力,我们报告了在Edge设备上部署检测网络后的性能。我们广泛的实证研究可以作为工业界对现有网络做出明智选择的指南。我们还希望激发研究社区的设计和评估网络的新方向,该网络着重于更大而整体的概述,以实现深远的影响。
translated by 谷歌翻译
3D计算机断层扫描扫描的肺结核检测在高效的肺癌筛查中起着至关重要的作用。尽管使用CNNS的基于锚的探测器获得的SOTA性能,但是它们需要预定的锚定参数,例如锚点的尺寸,数量和纵横比,并且在处理具有大量尺寸的肺结节时具有有限的鲁棒性。为了克服这些问题,我们提出了一种基于3D球体表示的中心点匹配的检测网络,该检测网络是无锚的,并且自动预测结节的位置,半径和偏移,而无需手动设计结节/锚参数。 SCPM-Net由两种新颖组件组成:球体表示和中心点匹配。首先,为了匹配临床实践中的结节注释,我们用所提出的边界球体替换常用的边界框,以表示具有质心,半径和3D空间局部偏移的结节。引入兼容的基于球体的交叉口损耗功能,以稳定且有效地培训肺结核检测网络。其次,我们通过设计正中心点选择和匹配过程来赋予网络锚定,自然地丢弃预定的锚箱。在线硬示例挖掘和重新聚焦损失随后使CPM过程能够更加强大,导致更准确的点分配和级别不平衡的缓解。此外,为了更好地捕获用于检测的空间信息和3D上下文,我们建议熔化具有特征提取器的多级空间坐标映射,并将它们与3D挤压和激励的关注模块相结合。 Luna16数据集上的实验结果表明,与肺结核检测的现有锚和锚定方法相比,我们所提出的框架达到卓越的性能。
translated by 谷歌翻译
虽然用变压器(DETR)的检测越来越受欢迎,但其全球注意力建模需要极其长的培训期,以优化和实现有前途的检测性能。现有研究的替代方案主要开发先进的特征或嵌入设计来解决培训问题,指出,基于地区的兴趣区域(ROI)的检测细化可以很容易地帮助减轻DETR方法培训的难度。基于此,我们在本文中介绍了一种新型的经常性闪闪发光的解码器(Rego)。特别是,REGO采用多级复发处理结构,以帮助更准确地逐渐关注前景物体。在每个处理阶段,从ROI的闪烁特征提取视觉特征,其中来自上阶段的检测结果的放大边界框区域。然后,引入了基于一瞥的解码器,以提供基于前一级的瞥见特征和注意力建模输出的精细检测结果。在实践中,Refo可以很容易地嵌入代表性的DETR变体,同时保持其完全端到端的训练和推理管道。特别地,Refo帮助可变形的DETR在MSCOCO数据集上实现44.8AP,只有36个训练时期,与需要500和50时期的第一DETR和可变形的DETR相比,分别可以分别实现相当的性能。实验还表明,Rego始终如一地提升不同DETR探测器的性能高达7%的相对增益,在相同的50次训练时期。代码可通过https://github.com/zhechen/deformable-detr-rego获得。
translated by 谷歌翻译
本文提出了一种基于变压器的新型模型架构,用于涉及椎骨分析的医学成像问题。它考虑了此类模型在MR图像中的两种应用:(a)脊柱转移的检测以及椎骨骨折和转移索压缩的相关条件,(b)椎间盘上常见变性变化的放射学分级。我们的贡献如下:(i)我们提出了一个脊柱上下文变压器(SCT),这是一种适合分析椎体(VBS)等医学成像中重复解剖结构的深度学习结构。与以前的相关方法不同,SCT考虑了所有可用图像模式中观看的所有VBS,从而根据脊柱的其余部分和所有可用成像方式对每种图像进行了预测。 (ii)我们将体系结构应用于新颖而重要的任务:检测脊柱转移以及绳索压缩和椎骨骨折的相关条件/多系列脊柱MR扫描中的崩溃。这是使用从自由文本放射学报告中提取的注释而不是定制注释来完成的。然而,最终的模型表现出与测试集上椎骨级别放射科医师注释的强烈一致性。 (iii)我们还将SCT应用于现有问题:腰椎MR扫描中脊椎间盘(IVD)的放射学分级以进行常见的退化性变化。我们表明,通过考虑图像中椎体的背景,SCT提高了SCT的上下文,提高了SCT的准确性与先前发布的模型相比,几个等级。
translated by 谷歌翻译
The DETR object detection approach applies the transformer encoder and decoder architecture to detect objects and achieves promising performance. In this paper, we present a simple approach to address the main problem of DETR, the slow convergence, by using representation learning technique. In this approach, we detect an object bounding box as a pair of keypoints, the top-left corner and the center, using two decoders. By detecting objects as paired keypoints, the model builds up a joint classification and pair association on the output queries from two decoders. For the pair association we propose utilizing contrastive self-supervised learning algorithm without requiring specialized architecture. Experimental results on MS COCO dataset show that Pair DETR can converge at least 10x faster than original DETR and 1.5x faster than Conditional DETR during training, while having consistently higher Average Precision scores.
translated by 谷歌翻译
现有语言接地模型通常使用对象提案瓶颈:预先训练的探测器提出了场景中的对象,模型学会从这些框提案中选择答案,而不会参加原始图像或3D点云。对象探测器通常在固定词汇上培训,其对象和属性通常过于限制开放域语言接地,其中话语可以指在各种抽象层面的视觉实体,例如椅子,椅子的椅子,或椅子前腿的尖端。我们为3D场景提出了一个用于接地语言的模型,绕过具有三个主要创新的盒子提案瓶颈:i)横跨语言流的迭代注意,点云特征流和3D框提案。 ii)具有非参数实体查询的变压器解码器,用于对对象和部分参考进行解码3D框。 iii)通过将物体检测视为由候选类别标签列表的参考词汇的接地为基础,从3D对象注释和语言接地注释的联合监督。这些创新在流行的3D语言接地基准上之前的方法上产生了显着的定量收益(对SR3D基准测试的绝对改善)。我们消除了我们的每一个创新,向模型表现出贡献。当在具有次要变化的2D图像上应用于语言接地时,它会与最先进的,同时收敛于GPU时间的一半。代码和检查点将在https://github.com/nickgkan/beaut_detr中提供
translated by 谷歌翻译
脑转移经常发生在转移性癌症的患者中。早期和准确地检测脑转移对于放射治疗的治疗计划和预后至关重要。为了提高深入学习的脑转移检测性能,提出了一种称为体积级灵敏度特异性(VSS)的定制检测损失,该损失是单个转移检测灵敏度和(子)体积水平的特异性。作为敏感性和精度始终在转移水平中始终是折射率,可以通过调节VSS损耗中的重量而无需骰子分数系数进行分段转移来实现高精度或高精度。为了减少被检测为假阳性转移的转移样结构,提出了一种时间的现有量作为神经网络的额外输入。我们提出的VSS损失提高了脑转移检测的敏感性,将灵敏度提高了86.7%至95.5%。或者,它将精度提高了68.8%至97.8%。随着额外的时间现有量,在高灵敏度模型中,约45%的假阳性转移减少,高特异性模型的精度达到99.6%。所有转移的平均骰子系数约为0.81。随着高灵敏度和高特异性模型的集合,平均每位患者的1.5个假阳性转移需要进一步检查,而大多数真正的阳性转移确认。该集合学习能够区分从需要特殊专家审查或进一步跟进的转移候选人的高信心真正的阳性转移,特别适合实际临床实践中专家支持的要求。
translated by 谷歌翻译
Passive millimeter-wave (PMMW) is a significant potential technique for human security screening. Several popular object detection networks have been used for PMMW images. However, restricted by the low resolution and high noise of PMMW images, PMMW hidden object detection based on deep learning usually suffers from low accuracy and low classification confidence. To tackle the above problems, this paper proposes a Task-Aligned Detection Transformer network, named PMMW-DETR. In the first stage, a Denoising Coarse-to-Fine Transformer (DCFT) backbone is designed to extract long- and short-range features in the different scales. In the second stage, we propose the Query Selection module to introduce learned spatial features into the network as prior knowledge, which enhances the semantic perception capability of the network. In the third stage, aiming to improve the classification performance, we perform a Task-Aligned Dual-Head block to decouple the classification and regression tasks. Based on our self-developed PMMW security screening dataset, experimental results including comparison with State-Of-The-Art (SOTA) methods and ablation study demonstrate that the PMMW-DETR obtains higher accuracy and classification confidence than previous works, and exhibits robustness to the PMMW images of low quality.
translated by 谷歌翻译
用于检测CT肺血管造影(CTPA)图像上的肺栓塞(PES)的自动化方法是高需求。现有方法通常采用单独的步骤进行PE候选检测和假阳性去除,而不考虑另一步骤的能力。结果,大多数现有方法通常遭受高误率,以达到可接受的敏感性。本研究介绍了一个端到端的培训卷积神经网络(CNN),其中两个步骤共同优化。所提出的CNN由三个连接子网组成:1)一种用于检测包含可疑PES的多维数据集的新型3D候选提案网络,2)用于生成用于候选的固定血管对齐图像表示的3D空间转换子网,以及3)2D分类网络将转换立方体的三个横截面作为输入,消除了误报。我们使用PE挑战的20个CTPA测试数据集评估了我们的方法,在0mm,2mm和5mm定位误差下,实现了78.9%,80.7%和80.7%的灵敏度,2mm和5mm定位误差,其优于状态 - 最新方法。我们进一步在我们自己的数据集中进一步评估了我们的系统,该数据集由129个CTPA数据组成,共269个栓子。我们的系统在0mm,2mm和5mm定位误差下每卷的2个假阳性达到63.2%,78.9%和86.8%的灵敏度。
translated by 谷歌翻译
DETR has been recently proposed to eliminate the need for many hand-designed components in object detection while demonstrating good performance. However, it suffers from slow convergence and limited feature spatial resolution, due to the limitation of Transformer attention modules in processing image feature maps. To mitigate these issues, we proposed Deformable DETR, whose attention modules only attend to a small set of key sampling points around a reference. Deformable DETR can achieve better performance than DETR (especially on small objects) with 10× less training epochs. Extensive experiments on the COCO benchmark demonstrate the effectiveness of our approach. Code is released at https:// github.com/fundamentalvision/Deformable-DETR.
translated by 谷歌翻译
腕骨骨折是医院的常见情况,特别是在紧急服务中。医生需要来自各种医疗设备的图像,以及患者的病史和身体检查,正确诊断这些骨折并采用适当的治疗。本研究旨在使用腕X射线图像的深度学习进行骨折检测,以帮助专门在现场专门的医生,特别是在骨折的诊断中工作。为此目的,使用从Gazi大学医院获得的腕X射线图像数据集的基于深度学习的物体检测模型来执行20个不同的检测程序。这里使用了DCN,动态R_CNN,更快的R_CNN,FSAF,Libra R_CNN,PAA,RetinAnet,Regnet和具有各种骨架的基于SABL深度学习的物体检测模型。为了进一步改进研究中的检测程序,开发了5种不同的集合模型,后来用于改革集合模型,为我们的研究开发一个独一无二的检测模型,标题为腕骨骨折检测组合(WFD_C)。根据检测到总共26种不同的骨折,检测结果的最高结果是WFD_C模型中的0.8639平均精度(AP50)。本研究支持华为土耳其研发中心,范围在持续的合作项目编码071813中,华为大学,华为和Medskor。
translated by 谷歌翻译
对骨关节炎(OA)的磁共振成像(MRI)扫描的客观评估可以解决当前OA评估的局限性。 OA客观评估是必需的骨,软骨和关节液的分割。大多数提出的分割方法都不执行实例分割,并且遭受了类不平衡问题。这项研究部署了蒙版R-CNN实例分割并改进了IT(改进的面罩R-CNN(IMASKRCNN)),以获得与OA相关组织的更准确的广义分割。该方法的训练和验证是使用骨关节炎倡议(OAI)数据集的500次MRI膝盖和有症状髋关节OA患者的97次MRI扫描进行的。掩盖R-CNN的三个修改产生了iMaskRCNN:添加第二个Roialigned块,在掩码标先中添加了额外的解码器层,并通过跳过连接将它们连接起来。使用Hausdorff距离,骰子评分和变异系数(COV)评估结果。与面膜RCNN相比,iMaskRCNN导致骨骼和软骨分割的改善,这表明股骨的骰子得分从95%增加到98%,胫骨的95%到97%,股骨软骨的71%至80%,81%和81%胫骨软骨的%至82%。对于积液检测,iMaskRCNN 72%比MaskRCNN 71%改善了骰子。 Reader1和Mask R-CNN(0.33),Reader1和ImaskRCNN(0.34),Reader2和Mask R-CNN(0.22),Reader2和iMaskRCNN(0.29)之间的积液检测的COV值(0.34),读取器2和mask r-CNN(0.22)接近COV之间,表明人类读者与蒙版R-CNN和ImaskRCNN之间的一致性很高。蒙版R-CNN和ImaskRCNN可以可靠,同时提取与OA有关的不同规模的关节组织,从而为OA的自动评估构成基础。 iMaskRCNN结果表明,修改改善了边缘周围的网络性能。
translated by 谷歌翻译