作为计算机视觉中的一个重要研究课题,旨在识别下属级别的细粒度分类引起了人们的极大关注。我们提出了一种新的基于区域的综合学习网络,用于细粒度分类。我们的方法包含检测模块和分类模块。检测模块基于更快的R-CNN框架来定位对象的语义区域。该分类模块使用集合学习方法,该方法为不同的语义区域训练一组子分类器并将它们组合在一起以获得更强的分类器。在评估中,我们对CUB-2011数据集进行了实验,实验结果证明了我们的方法对于细粒度分类是有效的。我们还扩展了远程场景识别的方法,并在NWPU-RESISC45数据集上进行评估。
translated by 谷歌翻译
在现实生活中的环境中,由于窗户,灯光和物体突然出现阻挡光源,视觉SLAM系统可以很容易地捕捉由过度曝光或过度黑暗引起的低对比度图像。此时,基于像素亮度信息估计相机运动的直接方法是不可行的,并且通常很难在没有图像处理的情况下找到足够的有效特征点。本文提出了HE-SLAM,一种结合直方图均衡和ORB特征提取的新方法,可以在更多场景中稳健,特别是在具有低对比度图像的阶段。由于HE-SLAM使用直方图均衡来改善图像的对比度,因此它可以在低对比度中提取足够的有效特征点,用于后续特征匹配,关键帧选择,束调整和循环闭包检测。所提出的HE-SLAM已经在流行数据集(例如KITTI和EuRoc)上进行了测试,并且通过比较系统运行时和绝对轨迹误差(ATE)的主题平方根误差(RMSE)来证明系统的实时性能和鲁棒性。使用ORB-SLAM2等最先进的方法。
translated by 谷歌翻译
离线手写数学表达式识别是一项具有挑战性的任务,因为手写数学表达式在识别过程中主要存在两个问题。一方面,它是如何正确识别不同的数学符号。另一方面,它是如何正确识别数学表达式中存在的二维结构。最近的深度学习工作启发了一种新的神经网络模型,它将多尺度卷积神经网络(CNN)与注意力恢复神经网络相结合(提出RNN)将二维手写数学表达式识别为一维LaTeX序列。结果表明,目前工作中提出的模型的WER误差为25.715%,ExpRate为28.216%。
translated by 谷歌翻译
传输控制协议(TCP)拥塞控制是提高网络性能的关键技术之一。 TCP拥塞控制算法识别(TCP识别)可用于显着提高网络效率。现有的TCP识别方法只能应用于有限数量的TCP拥塞控制算法,并专注于有线网络。在本文中,我们提出了一种基于机器学习的有线和无线网络被动TCP识别方法。通过比较三种典型的机器学习模型,我们得出结论,4层LongShort术语记忆(LSTM)模型实现了最佳的识别精度。对于新提出的TCP拥塞控制算法,Ourapproach在有线和无线网络和工作中的准确度达到了98%以上。
translated by 谷歌翻译
使用无干3D超声(US)进行心导管检查的快速准确的导管检测可以提高干预的效率和结果。然而,美国的低图像质量需要额外的训练forsonographers定位导管。在本文中,我们提出了一种基于预先训练的VGG网络的导管检测方法,该方法通过重新组织的横截面利用3D信息通过共同完全卷积网络(FCN)对导管进行分割,FCN称为方向融合FCN( DF-FCN)。基于DF-FCN的分割图像,可以通过模型拟合来定位导管。我们的实验表明,所提出的方法可以成功地在具有挑战性的离体3D USdataset中检测消融导管,该数据在猪心脏上收集。大量分析表明,与最先进的仪器检测方法相比,所提方法的Dice得分为57.7%,至少提高了11.8%。由于DF-FCN的分割性能得到改善,导管可以定位,误差仅为1.4 mm。
translated by 谷歌翻译
最近,深度学习已经改变了许多领域,包括医学成像。受生物神经元多样性的启发,我们小组提出了二次神经元,其中当前人工神经元中的内积被替换为输入的二次运算,从而增强了单个神经元的能力。沿着这个方向,我们有动力去评估代表性网络架构中的二次神经元的功率,以及基于二次神经元的深度学习。在这方面,我们先前的理论研究已经显示出二次神经元和网络的重要优点。在本文中,我们使用二次神经元构造编码器 - 解码器结构,称为二次自动编码器,并将其应用于低剂量CT噪声。然后,我们对Mayo低剂量CT数据集进行实验,以证明二次自动编码器产生更好的去噪性能。
translated by 谷歌翻译
本文提出了一个用于故事完整性测试的蒸馏 - 博览会增强匹配网络(DEMN),这在故事理解中仍然是一项具有挑战性的任务。我们将一个完整的故事分为三个叙事片段:一个\ textit {exposition},一个\ textit { climax}和\ textit {ending}。该模型由三个模块组成:输入模块,匹配模块和蒸馏模块。输入模块为三个段提供语义表示,然后将它们提供给另外两个模块。匹配模块化收集结尾和高潮之间的交互特征。蒸馏模块在展示中提取关键的语义信息,并以两种不同的方式将其注入匹配模块。我们在ROCStories Corpus \ cite {Mostafazadeh2016ACA}上评估我们的单一和集合模型,分别在测试集上达到80.1 \%和81.2 \%的准确度。实验结果表明,我们的DEMN模型实现了最先进的性能。
translated by 谷歌翻译
自然语言推理(NLI)是自然语言处理(NLP)中的一项基本且具有挑战性的任务。大多数现有方法仅对混合匹配特征应用单通道参考过程,该特征是前提和假设之间的不同匹配特征的串联。在本文中,我们提出了一种称为多匝推理匹配网络(MIMN)的新模型,以便对不同的匹配特征进行多匝推理。在每个回合中,模型都关注一个特定的匹配特征而不是混合匹配特征。为了增强不同匹配特征之间的交互,使用存储器组件来存储历史推断信息。每个回合的推理是在当前匹配特征和主题上进行的。我们在三个不同的NLI数据集上进行实验。实验结果表明,我们的模型在所有三个数据集上都优于或达到了最先进的性能。
translated by 谷歌翻译
大多数现有的房地产评估方法都侧重于从给定数据集建立准确性和可靠模型,但很少关注其训练模型的可扩展性。由于不同的城市通常包含不同的地理位置特征(地区名称,公寓名称),因此必须在不同的城市或地区从头开始训练新的模型。因此,这些方法需要对每个城市进行大量的数据收集,并且多城市房地产评估系统的总培训时间将非常长。此外,一些小城市可能没有足够的数据来培养强大的评估模型。为了克服这些限制,我们开发了一种新颖的同质特征转移和异构位置微调(HFT + HLF)跨城市财产评估框架。通过从源城市转移部分神经网络学习并微调目标城市的少量位置信息,与完全监督的人工神经网络(ANN)方法相比,oursemi监督模型可以实现类似甚至更好的性能。
translated by 谷歌翻译
归属网络通过将广泛可访问的节点辅助信息的一部分编码为节点属性来丰富纯网络。通过考虑结构和属性信息来学习用于这种分析网络的每个节点(即网络嵌入(NE)的向量表示最近引起了相当大的关注,因为每个节点嵌入仅仅是统一的低维向量表示,使得下游任务例如链路预测更有效且更多更容易实现。大多数先前的工作没有考虑具有不完整结构信息的网络的重要情况,然而,这通常会出现在我们的现实世界中。社交网络中的异常用户故意隐藏他们的友谊。不同的网络显然具有不同层次的不完整结构信息,这对平衡资源的双重来源提出了更多的挑战。为了解决这个问题,我们提出了一种称为分布式偏差随机游走(ABRW)的鲁棒NE方法,以利用属性信息通过使用转移矩阵来补偿不完整的结构信息。实际世界中链路预测和节点分类任务的实验证实了我们的方法对不完整结构信息的不同水平的鲁棒性和有效性。
translated by 谷歌翻译