在MR容积中准确地分割左心房可有益于心房颤动的消融过程。传统的自动化解决方案通常会使劳动密集型手动标签的专家失败。在本文中,我们提出了一种基于深度神经网络的解决方案,用于钆增强MR容量的自动左心房分割,具有良好的性能。我们首先认为,对于这种体积分割任务,2Dfashion中的网络在时间效率和分割准确性方面比具有3D时尚的网络具有很大的优势。考虑到高度变化的心房形状和相关肺静脉的分支结构,我们建议采用金字塔模块来收集多尺度特征图中的语义线索,以进行细粒度分割。此外,为了促进我们的网络对硬性示例进行分类,我们提出了一种在线硬性负面示例挖掘策略,用于识别具有低分类能力的切片中的体素并惩罚对它们的错误预测。最后,我们设计了竞争性培训方案,以进一步提高网络的泛化能力。经过20个测试量的广泛验证,我们提出的框架在分割左心房和肺静脉时平均骰子为92.83%。
translated by 谷歌翻译
特征匹配是计算机视觉领域最基础,最活跃的研究领域之一。对特征匹配器的全面评估是必要的,因为它将推动该领域的发展以及诸如Motion-from-Motion或Visual SLAM之类的高级应用。然而,据我们所知,之前的工作没有针对特征匹配器的评估,而他们只专注于评估特征检测器和描述符。这导致该领域的关键缺席,即没有标准数据集和评估指标来公平地评估不同的特征匹配器。为此,我们提出了第一个统一特征匹配基准,以便于评估特征匹配器。在提议的基准测试中,匹配器在不同方面进行评估,涉及匹配能力,通信效率和效率。此外,他们的表演被调查不同的场景和不同的匹配类型。随后,我们对基准测试中不同的最新匹配器进行了广泛的评估,并根据报告的结果进行深入分析。这可以用于在实际应用中设计实际匹配系统,并且还提倡在特征匹配领域中潜在的未来研究方向。
translated by 谷歌翻译
Semantic edge detection (SED), which aims at jointly extracting edges as well as their category information, has far-reaching applications in domains such as semantic segmentation, object proposal generation, and object recognition. SED naturally requires achieving two distinct supervision targets: locating fine detailed edges and identifying high-level semantics. We shed light on how such distracted supervision targets prevent state-of-the-art SED methods from effectively using deep supervision to improve results. In this paper, we propose a novel fully convolutional neural network architecture using diverse deep supervision (DDS) within a multi-task framework where lower layers aim at generating category-agnostic edges, while higher layers are responsible for the detection of category-aware semantic edges. To overcome the distracted supervision challenge, a novel information converter unit is introduced, whose effectiveness has been extensively evaluated in several popular benchmark datasets, including SBD, Cityscapes, and PASCAL VOC2012. Source code will be released upon paper acceptance.
translated by 谷歌翻译
对于感兴趣的产品,我们提出了一种表示一组参考产品的搜索方法。参考产品可用作支持下游建模任务和业务应用程序的候选者。搜索方法包括产品表示学习和指纹型矢量搜索。通过新颖的注意自动编码器神经网络将产品目录信息转换为高质量的低维度嵌入,并且嵌入还与二进制编码向量相结合以便快速检索。我们通过大量实验来评估所提出的方法,并将其与同行服务进行比较,以证明其在搜索返回率和精度方面的优势。
translated by 谷歌翻译
深度神经网络是根据许多交替排列的线性和非线性变换的信号的多层映射的参数化。线性变换通常用于连接层和卷积层,包含大多数训练和存储的变分参数。压缩深度神经网络以减少其变化参数的数量而不是其预测能力是一个重要但具有挑战性的问题,即在有效地训练这些参数和降低过度拟合的风险方面建立优化方案。在这里,我们表明通过使用矩阵乘积算子(MPO)表示线性变换可以有效地解决这个问题。我们在五个主要的神经网络中测试了这种方法,包括FC2,LeNet-5,VGG,ResNet和DenseNet两个广泛使用的数据集,即MNIST和CIFAR-10,并且发现这个MPO表示确实在输入之间建立了忠实和有效的映射。和输出信号,可以显着减少参数数量,从而保持甚至提高预测精度。
translated by 谷歌翻译
注意机制已成为深度神经网络中的一个流行组件,但很少有人研究不同的影响因素和计算这些因素引起注意的方法如何影响性能。为了更好地理解注意机制,我们提出了一个经验研究,消除了广义注意力公式中的各种空间注意元素,包括主要的变形金刚注意以及普遍的可变形卷积和动态卷积模块。在各种应用中,该研究产生显着性深层网络中的空间关注结果,其中一些与传统理解相反。例如,我们发现Transformer关注的查询和关键内容比较对于自我关注是微不足道的,但对编码器 - 解码器的关注至关重要。可变形卷积与关键内容的适当组合仅显着性实现了自我关注的最佳准确性 - 效率权衡。我们的研究结果表明,注意机制的设计存在很大的改进空间。
translated by 谷歌翻译
我们提出RNN序列模型适应文本的多标签分类问题,其中目标是一组标签,而不是序列。以前这样的RNN模型定义序列的概率而不是集合的概率;尝试获得集合概率是网络设计的后续想法,包括预先指定标签顺序,或以特定方式将序列概率与设定概率相关联。我们的公式来源于集合概率的原则概念,作为集合的相应排列序列的概率之和。我们提供了一个新的培训目标,可以最大化这个集合概率,以及一个新的预测目标,可以在测试文档中找到最可能的集合。这些新目标在理论上具有吸引力,因为它们使RNN模式自由发现最佳标签顺序,这通常是自然的(但不同于文档)。我们开发有效的程序来解决培训和预测中涉及的计算困难。对基准数据集的实验表明,我们在这项任务中的表现优于最先进的方法。
translated by 谷歌翻译
桥面板的分层评估对桥梁健康监测起着至关重要的作用。作为用于分层检测的非破坏性技术之一的热成像具有有效数据采集的优点。但是对于准确的分层形状分析的数据解释存在挑战。由于环境的变化以及分层尺寸和深度的不规则存在,基于温度对比度的传统处理方法在分层的准确分割方面存在不足。在最近开发的用于图像分割的深度学习架构的启发下,基于卷积神经网络(CNN)的框架进行了研究。适用于温度对比和形状扩散的分层变形分布。该模型基于密集卷积网络(DenseNet)进行开发,并在实验装置下训练了在不同深度的混凝土板中模拟分层所收集的热图像。结果表明,对分层形状的精确分析表现令人满意。
translated by 谷歌翻译
近年来见证了高光谱图像(HSI)分类的快速进展。大多数现有研究或者严重依赖于使用监督学习的昂贵标签信息,或者很难利用从相关领域借来的判别信息。为了解决这个问题,在本文中,我们展示了一个基于领域适应(DA)和主动学习(AL)的HSI分类的新框架。我们的方法的主要思想是通过利用来自源域的可用标记样本重新训练多内核分类器,并在目标域中添加具有活动查询的最少数量的最具信息样本。所提出的方法自适应地组合多个核,形成DA分类器,其最小化源域和目标域之间的偏差。进一步配备嵌套主动更新过程,它顺序扩展训练setand逐渐收敛到令人满意的分类性能水平。 Westudy这个积极的适应框架,在HSI分类任务中采用保证金抽样(MS)策略。我们对两种流行的HSI数据集的实验结果证明了它的有效性。
translated by 谷歌翻译
高分辨率表示学习在许多视觉问题中起着重要作用,例如姿势估计和语义分割。最近开发用于人工估计的高分辨率网络(HRNet)〜\ _引用{SunXLW19}通过在\ emph {parallel}中连接高到低分辨率的卷积来维持整个过程的高分辨率表示,并产生强大的高分辨率表示通过反复进行平行卷积的融合。在本文中,我们通过引入简单而有效的修改对高分辨率表示进行了进一步的研究,并将其应用于广泛的视觉任务。我们通过聚合来自所有并行卷积的(上采样的)表示来增强高分辨率表示,而不是仅仅是高分辨率卷积中的表示,如在{SunXLW19}中所做的那样。这种简单的修改可以产生更强的表现形式,并且可以通过卓越的结我们展示了在城市景观,LIP和PASCAL背景下的语义分割以及AFLW,COFW,$ 300 $ W和WFLW的面部地标检测的最佳结果。此外,我们从高分辨率表示构建多级表示,并将其应用于更快的R-CNN对象检测框架和扩展框架。所提出的方法在现有的COCO对象检测单模型网络上取得了优异的成果。代码和模型已在\ url {https://github.com/HRNet}上公开。
translated by 谷歌翻译