神经网络很容易受到对抗性攻击 - 视觉上不易察觉的小噪声,当加到输入端时会大大改变输出。防御这些敌对攻击的最有效方法是使用对抗性训练的方法。我们分析了经过对侧训练的强大模型,以研究它们在潜层层面对抗对抗性攻击的脆弱性。我们的分析揭示了与对抗性攻击具有鲁棒性的输入层相反,这些鲁棒模型的特征层非常容易受到小幅度的对抗性扰动。利用这些信息,我们引入了一种新技术潜在对抗训练(LAT),其中包括对经过对侧训练的模型进行微调,以确保在特征层中的稳健性。我们还提出潜在攻击(LA),一种用于构建对抗性示例的新算法。 LAT导致测试精度的微小改进,并导致针对MNIST,CIFAR-10,CIFAR-100数据集显示的通用一阶对抗性PGD攻击的最新对抗精度。
translated by 谷歌翻译
在道路交通中对车辆进行分类和计数在运输工程领域中具有许多应用。然而,各种各样的车辆(两轮车,三轮车,汽车,公共汽车,卡车等)在没有任何车道纪律的情况下在发展区域的道路上行驶,使得车辆分类和计数成为自动化的难题。在本文中,我们使用最先进的基于卷积神经网络(CNN)的物体检测模型,并使用来自德里道路的数据对多个车辆类进行训练。我们使用来自四个不同位置的5562个视频帧获得高达75%的MAPon 80-20列车测试分割。由于发展中地区的强大网络连接在从道路到云服务器的连续视频传输中很少,我们还评估了基于CNN模型的嵌入式实现的延迟,能量和硬件成本。
translated by 谷歌翻译
辍学通常用于深度神经网络以防止过度拟合。通常,辍学训练从神经网络的隐藏层调用节点的{textit {随机丢弃}。我们的假设是,与传统的辍学相比,智能辍学节点的引导选择可以带来更好的泛化。在这项研究中,我们提出了“引导辍学”来训练深度神经网络,它通过测量每个节点的强度来丢弃节点。我们还证明了常规丢失是所提出的引导丢失的特定情况。对包括MNIST,CIFAR10,CIFAR100,SVHN和Tiny ImageNet在内的多个数据集的实验评估证明了所提出的引导辍学的功效。
translated by 谷歌翻译
在实际应用中,商业现成系统用于执行自动面部分析,包括面部识别,情绪识别和属性预测。然而,由于模型参数的不可访问性,这些商业系统中的大多数都充当黑盒子,这使得针对特定应用微调模型具有挑战性。受到对抗性扰动的推进的刺激,本研究提出了数据微调的概念。在不改变模型参数的情况下提高agiven模型的分类精度。这是通过将其建模为数据(图像)扰动问题来实现的。在输入中添加少量“噪声”,目的是最小化分类损失而不影响(视觉)外观。在三个公开可用的数据集LFW,CelebA和MUCT上进行的实验证明了所提出的概念的有效性。
translated by 谷歌翻译
人脸识别研究在过去几十年中取得了巨大的发展。从能够执行识别无约束环境的算法开始,当前的人脸识别系统在大规模无约束人脸数据集上实现了非常高的精度。虽然即将到来的算法继续实现改进的性能,但大多数面部识别系统容易在伪装变化下失败,这是人脸识别中最具挑战性的协变量之一。大多数现有的伪装数据集包含变化有限的图像,通常捕获不受控制的设置。这并不模拟现实世界的场景,其中面部识别系统遇到有意和无意的无约束伪装。在本文中,提出了一种新的伪装伪装面孔(DFW)数据集,其中包含超过11000个1000个身份的图像,具有不同类型的伪装配件。从互联网收集数据集,产生类似于真实世界设置的无约束面部图像。这是第一个数据集,具有每个主题的版面模糊和真实混淆的面部图像。已经根据三个难度级别分析了所提出的数据集:(i)容易,(ii)中等,以及(iii)难以展示问题的挑战性质。我们认为,研究界可以从DFW数据集中大大受益于开发对这些对手有效的算法。该提议的数据集是作为2018年CVPR的野外变相面孔第一届国际研讨会和竞赛的一部分发布的。本文介绍DFW数据集详细,包括评估协议,基线结果,作为竞争的一部分收到的提交的性能分析,以及DFW挑战数据集的三个难度级别。
translated by 谷歌翻译
整形手术和伪装变化是面部识别中最具挑战性的两种变形。由于有限的训练样本,最先进的深度学习模型不能充分成功。在本文中,提出了一种新的框架,其传递从一般图像数据集学习的基本视觉特征,以补充监督的面部识别模型。所提出的算法结合了现成的监督分类器和通用的,独立于任务的网络,其编码与基本视觉提示(例如颜色,形状和纹理)相关的信息。在IIITD整形手术面部数据集和野外伪装面部(DFW)数据集中进行实验。结果表明,所提出的算法在两个数据集上都达到了最先进的结果。特别是在DFW数据库上,所提出的算法在1%误接受率下产生超过87%的验证准确度,比使用VGGFace计算的基线结果好53.8%。
translated by 谷歌翻译
移动生物识别方法通过无所不在的技术提供安全认证的便利性。然而,这带来了在无约束环境中识别生物特征模式的额外挑战,包括移动相机传感器,照明条件和捕获距离的变化。为了解决异质性挑战,本研究在深度学习框架内提出了新的异质性感知损失函数。使用CSIP,IMP和VISOB移动眼周数据库评估所提出的损失函数的有效性的眼周生物特征。结果表明,该算法在异构环境中产生了最先进的结果,并提高了跨数据库实验的普遍性。
translated by 谷歌翻译
自动编码器是用于学习表示的无监督深度学习模型。在文献中,自动编码器已经证明在跨多个领域的各种任务上表现良好,从而建立了广泛的适用性。通常,训练自动编码器以生成模型,该模型使得根据欧几里德距离计算的输入和构造输出之间的重建误差最小化。虽然这对于与无监督重建相关的应用是有用的,但它可能不是分类的最佳选择。在本文中,我们提出了一种新颖的SupervisedCOSMOS自动编码器,它利用多目标损失函数来学习同时编码(i)输入和重建矢量之间的“相似性”方向的表示,(ii)像素值的“分布”。关于输入样本的重建,同时还在特征学习管道中包含(iii)“可区分性”。所提出的自动编码器模型结合了基于Cosinesimilarity和Mahalanobis距离的损失函数,以及基于互信息的监督。对所提出的模型的每个组成部分的详细分析激发了其在不同分类任务中对特征学习的适用性。通过对不同图像数据集的广泛实验评估,证明了监督COSMOS自动编码器的功效。所提出的模型优于MNIST,CIFAR-10和SVHN数据库上的现有算法。它还分别在用于属性预测和面部识别的CelebA,LFWA,Adience和IJB-A数据库中产生最先进的结果。
translated by 谷歌翻译
我们尝试使用简单的算法解决文档布局理解的问题,该算法在多个域中进行概括,同时针对每个域的仅仅示例进行训练。我们通过监督对象检测方法来解决这个问题,并提出一种方法来克服大数据集的需求。我们通过在简单的人工(源)数据集上预训练我们的对象检测器并在微小的特定领域上微调它来使用传递学习的概念。 (目标)数据集。我们证明这种方法适用于多发性人类,训练样本少于10个文档。我们在最终结果中证明了该方法的每个组成部分的效果,并表明该方法优于简单的物体探测器。
translated by 谷歌翻译
人类头颅识别是一项艰巨的任务,传统上需要法医艺术家和人类学家的专业知识。本文致力于将头骨图像与数字人脸图像匹配的过程自动化,从而建立骨骼遗骸的身份。为了实现这一点,提出了一种共享变换模型用于学习判别表示。该模型学习了强大的功能,同时减少了头骨和数字人脸图像之间的一系列差异。这种模式可以通过加快头颅识别过程和减少手动负荷来协助执法机构。在公开可用的IdentifyMe数据集的两个预定义协议上进行的实验评估证明了所提出的模型的功效。
translated by 谷歌翻译