在本文中,我们提出了一种通过无序的固定长度位串来表示指纹图像的方法,该方法提供了改进的精度性能,更快的匹配时间和可压缩性。首先,我们设计了一个新的基于minutia的局部结构,该结构由像素空间中的2D椭圆高斯函数的混合建模。通过将局部结构与与其相关联的细节数进行归一化,将每个局部结构映射到欧几里德空间。这个简单但至关重要的关键点可以实现两个局部结构的快速相异性计算,其中欧氏距离无失真。还引入了基于细节的局部结构的基于纹理的互补局部结构,其中两者都可以通过主成分分析进行压缩并且在欧几里德空间中容易融合。然后通过K均值聚类算法将融合的局部结构转换为K位有序串。仅使用欧几里德距离的这种计算链对于快速和有区别的位串转换是至关重要的。通过手指特定的比特训练算法可以进一步提高准确度,其中利用两个标准来选择有用的比特位置以进行匹配。在指纹验证竞赛(FVC)数据库上进行实验,以与现有技术进行比较,以显示所提出的方法的优越性。
translated by 谷歌翻译
一般来说,面部年龄变化会严重影响性别分类,因为面部形状和皮肤纹理随着年龄的增长而变化。这需要重新检查性别分类系统以考虑面部年龄信息。在本文中,我们提出了关于年龄组的多专家性别分类(MGA),一种端到端的多任务学习方案,包括估计和性别分类。首先,使用两种类型的深度神经网络;用于面部特征的卷积外观网络(CAN)和用于面部几何特征的深度几何网络(DGN)。然后,CAN和DGN通过所提出的模型集成策略进行整合并进行微调,以改善年龄和性别分类的准确性。根据他们的估计年龄,将面部图像分为三个年龄组(年轻人,成年人和老年人组)中的一个,并且系统根据三个性别分类专家的平均融合策略进行性别预测,这些专家被训练以适应eachage的性别特征。组。在具有挑战性的数据库上进行了严格的实验结果表明,所提出的MGA优于具有较小计算成本的几项最新研究。
translated by 谷歌翻译
Heterogeneous network embedding (HNE) is a challenging task due to the diverse node types and/or diverse relationships between nodes. Existing HNE methods are typically unsupervised. To maximize the profit of utilizing the rare and valuable supervised information in HNEs, we develop a novel Active Heterogeneous Network Embedding (Ac-tiveHNE) framework, which includes two components: Discriminative Heterogeneous Network Embedding (DHNE) and Active Query in Heterogeneous Networks (AQHN). In DHNE, we introduce a novel semi-supervised heterogeneous network embedding method based on graph convolutional neu-ral network. In AQHN, we first introduce three active selection strategies based on uncertainty and representativeness, and then derive a batch selection method that assembles these strategies using a multi-armed bandit mechanism. ActiveHNE aims at improving the performance of HNE by feeding the most valuable supervision obtained by AQHN into DHNE. Experiments on public datasets demonstrate the effectiveness of ActiveHNE and its advantage on reducing the query cost.
translated by 谷歌翻译
Multi-view Multi-instance Multi-label Learning(M3L) deals with complex objects encompassing diverse instances, represented with different feature views, and annotated with multiple labels. Existing M3L solutions only partially explore the inter or intra relations between objects (or bags), instances, and labels, which can convey important contextual information for M3L. As such, they may have a compromised performance. In this paper, we propose a collaborative matrix factorization based solution called M3Lcmf. M3Lcmf first uses a heterogeneous network composed of nodes of bags, instances, and labels, to encode different types of relations via multiple rela-tional data matrices. To preserve the intrinsic structure of the data matrices, M3Lcmf collaboratively factorizes them into low-rank matrices, explores the latent relationships between bags, instances, and labels, and selectively merges the data matrices. An aggregation scheme is further introduced to aggregate the instance-level labels into bag-level and to guide the factorization. An empirical study on benchmark datasets show that M3Lcmf outperforms other related competitive solutions both in the instance-level and bag-level prediction.
translated by 谷歌翻译
多聚类旨在探索替代聚类,从不同角度将数据组织成有意义的组。现有的多聚类算法是针对单视图数据而设计的。我们假设可以利用多视图数据的个性和通用性来生成高质量和多样化的聚类。为此,我们提出了一种新的多视图多聚类(MVMC)算法。 MVMC首先采用多视图自身表示学习来探索个性化编码矩阵和多视图数据的共享通用矩阵。它还使用希尔伯特 - 施密特独立准则(HSIC)减少了矩阵之间的冗余(即,增强个性),并通过强制共享矩阵在所有视图中平滑来收集共享信息。然后,它使用单个矩阵的矩阵因子以及共享矩阵,生成高质量的多样化聚类。我们进一步扩展了多视图数据的多聚类,并提出了一种称为多视图多聚共聚(MVMCC)的解决方案。我们的实证研究表明,MVMC(MVMCC)canexploit多视图数据可以生成多个高质量和多样化的聚类(共聚类),具有优于最先进方法的性能。
translated by 谷歌翻译
一次性神经结构搜索(NAS)是一种很有前途的方法,可以在不进行任何单独培训的情况下显着缩短搜索时间。它可以作为来自过度参数化网络的体系结构参数的网络压缩问题。但是,大多数一次性NAS方法存在两个问题。首先,节点与其前身和后继者之间的依赖关系经常被忽视,这导致对零操作的不当处理。其次,基于他们的高度修剪架构参数是值得怀疑的。在本文中,我们采用经典的贝叶斯学习方法,通过使用分层自动相关性确定(HARD)先验建模体系结构参数来缓解这两个问题。与其他NAS方法不同,我们仅为一个训练过度参数化网络,然后更新体系结构。令人印象深刻的是,这使我们能够在使用单个GPU的0.2个GPUdays内在CIFAR-10上的代理和无代理任务中找到架构。作为副产品,我们的方法可以直接转移到压缩卷积神经网络,通过强制执行结构稀疏性,实现极其稀疏的网络而不会出现准确的恶化。
translated by 谷歌翻译
计算颜色恒定性是指场景照明的估计并且使得感知的颜色在变化照明下相对稳定。在过去几年中,深度卷积神经网络(CNN)在光源估计方面提供了卓越的性能。通过使用CNN学习图像块的局部外观,几种表示方法将其表示为多标签预测问题。然而,这些方法不可避免地对受其邻域背景影响的模糊斑块进行不正确的估计。当结合到全局预测中时,不准确的局部估计可能会导致性能下降。针对上述问题,我们提出了一种基于补丁的光源估计的上下文深度网络,该网络具有细化性。首先,具有中心环绕架构的上下文网络从图像补丁中提取局部上下文特征,并生成初始光源估计和相应的颜色校正补丁。基于观察到具有大的色差的像素良好地描述照明,对斑块进行采样。然后,细节网将输入的补丁与校正的补丁集成,并与中间特征的使用相结合,以提高性能。为了训练这样一个具有众多参数的网络,我们提出了一种阶段性的训练策略,其中特征和预测的光源是相当的。提供给下一个学习阶段的阶段,恢复更精细的评估。实验表明,我们的方法在两个光源估算基准上获得了竞争性能。
translated by 谷歌翻译
基于深度的人体活动分析研究取得了突出的成绩,并证明了3D表示在行动识别中的有效性。现有的基于深度和基于RGB + D的动作识别基准具有许多局限性,包括缺乏大规模训练样本,不同类别的实际数量,多样化的内部视图,不同的环境条件以及各种人类主体。在这项工作中,我们引入了一个用于RGB + D人类行为识别的大规模数据集,该数据集来自106个不同的主题,包含超过114,000个视频样本和800万帧。该数据集包含120种不同的动作类,包括日常,相互和健康相关的活动。我们评估了该数据集上一系列现有3D活动分析方法的性能,并展示了将deeplearning方法应用于基于3D的人类行为识别的优势。此外,我们在数据集上研究了一种新的一次性三维活动识别问题,并为此任务提出了一种简单而有效的动作部分语义相关性(APSR)框架,为新型动作类的识别提供了有希望的结果。我们相信,引入这个大规模数据集将使社区能够应用,调整和开发各种渴望数据的学习技术,以实现基于深度和基于RGB + D的人类活动理解。 [数据集可在以下网址获得:http://rose1.ntu.edu.sg/Datasets/actionRecognition.asp]
translated by 谷歌翻译
深度生成模型是数据建模的有效方法。然而,单个生成模型并不容易忠实地捕获诸如图像之类的复杂数据的分布。在本文中,我们提出了一种促进生成模型的方法,它将元模型级联在一起以产生更强的模型。可以利用支持可能性评估的任何隐藏变量元模型(例如,RBM和VAE)。我们推导出增强模型的可分解变分下界,它允许每个元模型分别和贪婪地训练。此外,我们的框架可以扩展为tosemi-supervised boosting,其中增强模型学习数据和标签的联合分布。最后,我们将增强框架与多重增强框架相结合,进一步提高了生成模型的学习能力。
translated by 谷歌翻译
距离度量学习在发现内在关系方面是成功的。然而,当问题变大时,大多数算法都在计算上要求很高。在本文中,我们提出了一种判别性度量学习算法,并在中等大小的数据子集上开发分布式方案学习度量,并将结果聚合到一个全局解决方案中。该技术利用并行计算的强大功能。聚合距离度量学习(ADML)算法与数据大小成比例,并且可以由分区控制。我们从理论上分析并提供了分布式处理引起的误差的界限。我们对ADML进行了实验性评估,包括专门设计的测试和实际的图像标注任务。这些测试表明,ADML只能通过mostexisting方法所产生的成本的一小部分来实现最先进的性能。
translated by 谷歌翻译