作为计算机视觉中的一个重要研究课题,旨在识别下属级别的细粒度分类引起了人们的极大关注。我们提出了一种新的基于区域的综合学习网络,用于细粒度分类。我们的方法包含检测模块和分类模块。检测模块基于更快的R-CNN框架来定位对象的语义区域。该分类模块使用集合学习方法,该方法为不同的语义区域训练一组子分类器并将它们组合在一起以获得更强的分类器。在评估中,我们对CUB-2011数据集进行了实验,实验结果证明了我们的方法对于细粒度分类是有效的。我们还扩展了远程场景识别的方法,并在NWPU-RESISC45数据集上进行评估。
translated by 谷歌翻译
在现实生活中的环境中,由于窗户,灯光和物体突然出现阻挡光源,视觉SLAM系统可以很容易地捕捉由过度曝光或过度黑暗引起的低对比度图像。此时,基于像素亮度信息估计相机运动的直接方法是不可行的,并且通常很难在没有图像处理的情况下找到足够的有效特征点。本文提出了HE-SLAM,一种结合直方图均衡和ORB特征提取的新方法,可以在更多场景中稳健,特别是在具有低对比度图像的阶段。由于HE-SLAM使用直方图均衡来改善图像的对比度,因此它可以在低对比度中提取足够的有效特征点,用于后续特征匹配,关键帧选择,束调整和循环闭包检测。所提出的HE-SLAM已经在流行数据集(例如KITTI和EuRoc)上进行了测试,并且通过比较系统运行时和绝对轨迹误差(ATE)的主题平方根误差(RMSE)来证明系统的实时性能和鲁棒性。使用ORB-SLAM2等最先进的方法。
translated by 谷歌翻译
我们在这项工作中引入了一种新的随机推理过程,用于基于有限状态机(FSM)的场景注释和对象类分割。我们框架的设计原则是生成性的,基于构建,对于给定场景,编码注释格的有限状态机,推理包括在这些格中查找和评分最佳配置。使用我们的FSM框架定义了不同的新颖操作,包括重新排序,分割,视觉转换和标签依赖性建模。将所有这些操作组合在一起以便实现注释以及对象类分割。
translated by 谷歌翻译
典型相关分析(CCA)是一种统计学习方法,旨在从多视图数据中构建与视图无关的潜在表示。该方法已成功应用于多种模式分析任务,如图像到文本的映射和视图不变的对象/动作然而,这种成功在很大程度上取决于数据配对的质量(即比对),而错配会对所得到的CCA表示的泛化能力产生不利影响。在本文中,我们使用称为对齐 - 不可知(AA)CCA的典型相关分析的新变体来解决对齐错误的问题。从不同视图中的错误配对数据开始,该CCA通过优化将数据相关项与上下文正则化混合的约束最大化问题来找到变换矩阵;在学习CCA变换时,这两个术语的特定设计减轻了对齐误差的影响。在多视图任务上进行的实验,包括多时相卫星图像变化检测,表明我们的AA CCA方法是高效且有弹性的分配错误。
translated by 谷歌翻译
如今,深度网络在许多计算机视觉和模式识别任务中变得流行。在这些网络中,深度内核特别有趣且有效,但是,它们的计算复杂性是一个主要问题,尤其是在廉价的硬件资源上。在本文中,我们解决了深度核心网络中高效计算的问题。我们提出了一种新颖的框架,可以显着降低评估这些深层内核的复杂性。我们的方法基于粗略到精细的级联网络,旨在实现高效计算;级联的早期阶段是有效且有效的拒绝模式,而深度阶段更昂贵和准确。这些复杂度降低的网络的设计原则基于交叉熵标准的变体,该标准降低了级联中的网络的复杂性,同时保留了所有原始核心网络的积极响应。在非常大的卫星图像上进行的实验 - 在具有挑战性和时间要求的变化检测任务上 - 表明我们提出的从精细到精细的方法是有效且高效的。
translated by 谷歌翻译
Graph-based methods are known to be successful in many machine learning and pattern classification tasks. These methods consider semi-structured data as graphs where nodes correspond to primitives (parts, interest points, segments, etc.) and edges characterize the relationships between these primitives. However, these non-vectorial graph data cannot be straightforwardly plugged into off-the-shelf machine learning algorithms without a preliminary step of-explicit/implicit-graph vectorization and embedding. This embedding process should be resilient to intra-class graph variations while being highly discriminant. In this paper, we propose a novel high-order stochastic graphlet embedding (SGE) that maps graphs into vector spaces. Our main contribution includes a new stochastic search procedure that efficiently parses a given graph and extracts/samples unlimitedly high-order graphlets. We consider these graphlets, with increasing orders, to model local primitives as well as their increasingly complex interactions. In order to build our graph representation, we measure the distribution of these graphlets into a given graph, using particular hash functions that efficiently assign sampled graphlets into isomorphic sets with a very low probability of collision. When combined with maximum margin classifiers, these graphlet-based representations have positive impact on the performance of pattern comparison and recognition as corroborated through extensive experiments using standard benchmark databases.
translated by 谷歌翻译