在本文中,我们提出了一种通过无序的固定长度位串来表示指纹图像的方法,该方法提供了改进的精度性能,更快的匹配时间和可压缩性。首先,我们设计了一个新的基于minutia的局部结构,该结构由像素空间中的2D椭圆高斯函数的混合建模。通过将局部结构与与其相关联的细节数进行归一化,将每个局部结构映射到欧几里德空间。这个简单但至关重要的关键点可以实现两个局部结构的快速相异性计算,其中欧氏距离无失真。还引入了基于细节的局部结构的基于纹理的互补局部结构,其中两者都可以通过主成分分析进行压缩并且在欧几里德空间中容易融合。然后通过K均值聚类算法将融合的局部结构转换为K位有序串。仅使用欧几里德距离的这种计算链对于快速和有区别的位串转换是至关重要的。通过手指特定的比特训练算法可以进一步提高准确度,其中利用两个标准来选择有用的比特位置以进行匹配。在指纹验证竞赛(FVC)数据库上进行实验,以与现有技术进行比较,以显示所提出的方法的优越性。
translated by 谷歌翻译
一般来说,面部年龄变化会严重影响性别分类,因为面部形状和皮肤纹理随着年龄的增长而变化。这需要重新检查性别分类系统以考虑面部年龄信息。在本文中,我们提出了关于年龄组的多专家性别分类(MGA),一种端到端的多任务学习方案,包括估计和性别分类。首先,使用两种类型的深度神经网络;用于面部特征的卷积外观网络(CAN)和用于面部几何特征的深度几何网络(DGN)。然后,CAN和DGN通过所提出的模型集成策略进行整合并进行微调,以改善年龄和性别分类的准确性。根据他们的估计年龄,将面部图像分为三个年龄组(年轻人,成年人和老年人组)中的一个,并且系统根据三个性别分类专家的平均融合策略进行性别预测,这些专家被训练以适应eachage的性别特征。组。在具有挑战性的数据库上进行了严格的实验结果表明,所提出的MGA优于具有较小计算成本的几项最新研究。
translated by 谷歌翻译
由于深度卷积神经网络(CNN)的巨大改进,近年来人脸识别取得了显着进展。然而,deepCNN很容易受到对抗性的例子的影响,这些例子可能会在具有安全敏感性目的的真实世界人脸识别应用程序中造成致命的后果。对抗性攻击被广泛研究,因为它们可以在部署之前识别模型的脆弱性。在本文中,我们评估了基于决策的黑盒攻击设置中最先进的人脸识别模型的稳健性,其中攻击者无法访问模型参数和梯度,但只能通过发送查询来获取硬标签预测到目标模型。这种攻击设置在现实世界的人脸识别系统中更为实用。为了提高上述方法的效率,我们提出了一种进化攻击算法,该算法可以对搜索方向的局部几何进行建模,并减小这些空间的维数。大量实验证明了所提出的方法的有效性,该方法通过较少的查询引起对输入面部图像的最小扰动。我们还应用所提出的方法成功地攻击真实世界的人脸识别系统。
translated by 谷歌翻译
在本文中,我们报告了一种并行的freeviewpoint视频合成算法,它可以有效地重建体育场景的高质量3D场景表示。所提出的方法关注于由具有宽基线的多个同步相机捕获的场景。为了加速视觉质量的提高,引入了以下策略来加速自由视点视频的制作:(1)使用体积视觉船体方法重建稀疏点云,并使用一个对象找到每个对象的精确3D ROI。高效连通组件标记算法。接下来,通过仅在ROI中实现视觉外壳来加速密集点云的重建; (2)通过估计格栅单元与视觉外壳之间的精确交点,建立精确的多面体网格; (3)以视图相关的方式再现重建表示的外观,其分别用最近的相机及其相邻的相机呈现非遮挡和遮挡区域。排球和柔道序列的制作证明了我们的方法在执行时间和视觉质量方面的有效性。
translated by 谷歌翻译
最近对图像检索任务的研究表明,集合不同的模型并结合多个全局描述符可以提高性能。然而,训练不同的合奏模型不仅困难,而且在时间或记忆方面效率低下。在本文中,我们提出了一个新的框架,它利用多个全局描述符来获得类似集合的效果,同时它可以以端到端的方式进行训练。所提出的框架是灵活的,可通过全局描述符,CNNbackbone,丢失和数据集进行扩展。此外,我们研究了将多个全局描述符与定量和定性分析相结合的有效性。我们的大量实验表明,组合描述符优先于单个全局描述符,因为它可以使用不同类型的特征属性。在基准评估中,与竞争方法相比,拟议的框架在图像检索任务上实现了CARS196,CUB200-2011,车间服装和斯坦福在线产品的最先进性能。
translated by 谷歌翻译
最近的许多镜头学习方法都集中在设计新型模式架构上。在本文中,我们反而表明,通过简单的骨干卷积网络,我们甚至可以超越最先进的分类准确度。有助于实现这种卓越性能的关键部分是对抗性特征学习策略,它可以改善我们模型的泛化能力。在这项工作中,对抗性特征是那些可能导致分类器对其预测不确定的特征。为了生成对抗特征,我们首先基于熵的导数相对于平均掩模来定位对抗区域。然后我们使用对抗区域注意聚合特征图来获得对抗特征。通过这种方式,我们可以探索和利用特征图的空间区域来挖掘更多不同的判别知识。我们对miniImageNet和TieredImageNet数据集进行了大量的模型评估和分析,证明了该方法的有效性。
translated by 谷歌翻译
深度学习方法已经在无监督域适应中显示出希望,其旨在利用标记的源域来学习具有不同分布的未标记目标域的分类器。但是,这种方法通常会学习一个域不变的表示空间来匹配源域和目标域的边缘分布,同时忽略它们的精细层次结构。在本文中,我们提出了与教师(CAT)的群集对齐,用于无监督的域适应,它可以有效地将两个域中的差异聚类结构合并到更好的适应中。技术上,CAT利用隐含的集合教师模型来可靠地发现类条件结构。未标记的目标域的特征空间。然后,CAT强制源和目标域的特征形成有区别的类条件集群,并跨域对齐相应的集群。实证结果表明,在几个无监督的领域适应情景中,CAT可以获得最先进的结果。
translated by 谷歌翻译
与可以由人类容易地标记的图像或视频数据不同,传感器数据注释是耗时的过程。然而,传统的人类活动识别方法需要大量这种严格标记的数据用于训练分类器。在本文中,我们提出了基于基于训练的卷积神经网络,用于从弱标记数据中识别人类。所提出的关注模型可以关注长序列传感器数据中的标记活动,并且滤除大量背景噪声信号。在弱标记数据集的实验中,我们表明我们的注意力模型优于传统的深度学习方法的不准确性。此外,我们通过将从注意模型生成的兼容性分数转换为兼容性密度来确定长序列的弱标记数据中的标记活动的特定位置。我们的方法大大简化了传感器数据注释的过程,使数据收集更加容易。
translated by 谷歌翻译
众所周知的人类感知公式之一是基于概念知识与来自部分可观察环境的感觉刺激之间的相互作用的等级参考模型。该模型通过最大限度地减少观察结果来帮助人们学习归纳偏差并指导他们的行为。然而,大多数基于模型的强化学习仍然缺乏基于对象的物理推理的支持。在本文中,我们提出了基于对象的感知控制(OPC)。它结合了通过自由能原理学习来自场景的感知对象和对感知环境中的对象的控制。在高维像素环境上的广泛实验表明,OPC在累积奖励和感知分组的质量方面优于几个强基线。
translated by 谷歌翻译
我们提出了批量虚拟对抗训练(BVAT),这是一种用于图卷积网络(GCN)的新型正则化方法。 BVAT解决了GCN的缺点,这些GCN不考虑模型输出分布的平滑性,而不考虑输入周围的局部扰动。我们提出了两种算法,基于样本的BVAT和基于优化的BVAT,它们适用于通过发现远离彼此的节点子集的虚拟对抗扰动或为所有节点生成虚拟对抗扰动来促进图形结构数据模型的平滑性。使用优化过程。对三个引文网络数据集Cora,Citeseer和Pubmed以及知识图数据集Nell的广泛实验验证了所提方法的有效性,该方法在半监督节点分类任务中建立了最先进的结果。
translated by 谷歌翻译