在本文中,我们提出了一种通过无序的固定长度位串来表示指纹图像的方法,该方法提供了改进的精度性能,更快的匹配时间和可压缩性。首先,我们设计了一个新的基于minutia的局部结构,该结构由像素空间中的2D椭圆高斯函数的混合建模。通过将局部结构与与其相关联的细节数进行归一化,将每个局部结构映射到欧几里德空间。这个简单但至关重要的关键点可以实现两个局部结构的快速相异性计算,其中欧氏距离无失真。还引入了基于细节的局部结构的基于纹理的互补局部结构,其中两者都可以通过主成分分析进行压缩并且在欧几里德空间中容易融合。然后通过K均值聚类算法将融合的局部结构转换为K位有序串。仅使用欧几里德距离的这种计算链对于快速和有区别的位串转换是至关重要的。通过手指特定的比特训练算法可以进一步提高准确度,其中利用两个标准来选择有用的比特位置以进行匹配。在指纹验证竞赛(FVC)数据库上进行实验,以与现有技术进行比较,以显示所提出的方法的优越性。
translated by 谷歌翻译
一般来说,面部年龄变化会严重影响性别分类,因为面部形状和皮肤纹理随着年龄的增长而变化。这需要重新检查性别分类系统以考虑面部年龄信息。在本文中,我们提出了关于年龄组的多专家性别分类(MGA),一种端到端的多任务学习方案,包括估计和性别分类。首先,使用两种类型的深度神经网络;用于面部特征的卷积外观网络(CAN)和用于面部几何特征的深度几何网络(DGN)。然后,CAN和DGN通过所提出的模型集成策略进行整合并进行微调,以改善年龄和性别分类的准确性。根据他们的估计年龄,将面部图像分为三个年龄组(年轻人,成年人和老年人组)中的一个,并且系统根据三个性别分类专家的平均融合策略进行性别预测,这些专家被训练以适应eachage的性别特征。组。在具有挑战性的数据库上进行了严格的实验结果表明,所提出的MGA优于具有较小计算成本的几项最新研究。
translated by 谷歌翻译
在本文中,我们提出了一种新的甲状腺细胞病理学WSIs高效滤泡分离方法。首先,我们提出了一种混合分段架构,它通过添加分支将分类器集成到Deeplab V3中。通过使用分类分支来浏览不相关区域,节省了大量的WSI分段时间。其次,将Deeplab V3中的低尺度精细特征融入到原始的空间金字塔空间(ASPP)中,以准确地表示细胞病理图像。第三,我们的混合模型采用面向准则的自适应损失函数进行训练,使模型收敛速度更快。对甲状腺贴片的实验结果表明,所提出的模型在分割精度上达到80.9%。此外,采用我们提出的方法,WSI分割的时间减少了93%,WSI水平精度达到53.4%。
translated by 谷歌翻译
变分推理(VI)是贝叶斯估计中广泛使用的框架。对于大多数非高斯统计模型,找到一个可分析的解决方案来估计参数的后验分布是不可行的。最近,通过对变分目标函数采用下界近似,引入并应用改进的框架,即扩展变分参考(EVI),并应用于推导分析上可解决的解决方案。本文讨论并比较了EVI实施所需的两个条件,即弱条件和强条件。在实际实现中,EVI的收敛取决于下界近似的选择,无论弱条件还是强条件。通常,可以应用两种近似策略,即单一下界(SLB)近似和多次下界(MLB)近似,以执行下界近似。我们将讨论SLB和MLB之间的差异,我们还将讨论上述两个近似的收敛性质。基于一些现有的基于EVI的非高斯统计模型进行广泛的比较。进行理论分析以证明弱势和强势条件之间的差异。给出了定性和定量实验结果,以显示SLB近似的优点。
translated by 谷歌翻译
为了扩大其可访问性并增加其实用性,智能代理必须能够学习(非专家)人类用户指定的复杂行为。此外,他们需要在合理的时间内学习这些行为,同时有效地利用人类学员能够提供的稀疏反馈。最近的研究表明,人类反馈可以被描述为对代理人当前行为的批判,而不是作为最大化的替代奖励信号,最终由人类反馈的COnvergentActor-Critic(COACH)算法根据人类反馈进行直接的政策更新。我们的工作建立在COACH的基础上,转移到一个环境,其中theagent的政策由深层神经网络代表。我们在原始COACH算法之上采用了一系列修改,这些修改对于从高维观察中学习行为至关重要,同时也满足了获得降低的样本复杂度的约束。我们展示了我们的Deep COACH算法在Minecraft丰富的3D世界中的有效性,该代理通过在10-15分钟的交互中仅使用实时人工反馈从原始像素映射到动作来学习完成任务。
translated by 谷歌翻译
我们提出了一种压缩深卷积神经网络(CNN)的新方法。所提出的方法通过学习称为滤波器摘要(FS)的3D张量来减少每个卷积层的参数数量。卷积滤波器从FS中提取为重叠的3D块,并且在FS中的滤波器在自然路径中的重叠区域中共享权重。基于这种权重共享方案的所得神经网络,称为过滤概要CNN或FSNet,在每个卷积层中具有FS而不是传统卷积层中的独立滤波器的集合。 FSNet具有与要压缩的基线CNN相同的架构,并且FSNet的每个卷积层在FS中生成与前向过程中的基线CNN相同数量的过滤器。在不损害推理速度的情况下,FSNet的参数空间远小于基线CNN的参数空间。此外,FSNet与权重量化兼容,当与权重量化相结合时,导致更高的压缩比。实验证明了FSNet在压缩CNN中的有效性,可用于计算机视觉任务,包括图像分类和目标检测。对于分类任务,0.22M有效参数的FSNet在CIFAR-10数据集上的预测精度为93.91%,精度下降小于0.3%,使用11.11M参数的ResNet-18作为基线。此外,具有2.75M有效参数的FSNet版本的ResNet-50在ILSVRC-12基准测试中分别达到63.80%和85.72%的前1和前5精度。对于对象检测任务,FSNet用于压缩26.32M参数的单次多盒检测器(SSD300)。 0.425M有效参数的FSNet对VOC2007测试数据进行权重量化时的mAP为67.63%,0.68M参数的FSNet在同一测试数据上实现了权重量化的mAP为70.00%。
translated by 谷歌翻译
深度神经网络(DNN)的正则化以提高其广泛化能力是重要且具有挑战性的。这一发展有利于DNN的理论基础,并促进其可用性与人工智能无关。在本文中,我们研究了Rademacher在改进DNN泛化方面的复杂性,并提出了根据局部Rademacher复杂性(LRC)的新的正则化器。虽然Rademachercomplexity作为功能类的无分布复杂性度量而众所周知,它有助于推动统计学习方法的泛化,但广泛的研究表明,LRC,其对应于受限制的函数类,在给定的训练样本的情况下导致更高的收敛速度和更好的泛化。我们基于LRC的正则化器是通过估计以DNN经验损失的最小化为中心的函数类的复杂性而开发的。对各种网络体系结构的实验证明了LRC正则化在改进泛化中的有效性。此外,我们的方法在CIFAR- $ 10 $数据集上具有最先进的结果,具有通过神经架构搜索找到的网络架构。
translated by 谷歌翻译
奖励塑造是解决强化学习(RL)中信用分配的关键但具有挑战性的问题的最有效方法之一。然而,设计整形函数通常需要很多专业知识和手工工程,并且考虑到多个相似的任务需要解决困难。 。在本文中,我们考虑奖励塑造任务的分配,并提出一个通用的元学习框架,以自动学习新采样任务的有效奖励塑造,假设只有共享的状态空间,但不一定是动作空间。我们首先在无模型RL的信用分配方面推动理论上最优的奖励形成。然后,我们提出一种基于价值的元学习算法,以提取有效的先验优于最优的奖励形成。先验可以直接应用于新任务,或者可以在几个梯度更新中解决任务时可证明适应任务后验。我们通过显着提高学习效率和各种设置的可解释可视化来展示我们塑造的有效性,包括从DQN到DDPG的成功转移。
translated by 谷歌翻译
通过使用非常大的数据集(例如ImageNet)微调预先训练的神经网络来传递学习可以显着加速训练,同时准确性经常受到新目标任务的有限数据集的瓶颈。为了解决该问题,已经研究了一些正则化方法,其使用起始点作为参考(SPAR)来约束目标网络的外层权重。在本文中,我们提出了新的正则化转移学习框架DELTA,即使用注意特征图的DEep LearningTransfer。 DELTA旨在保留目标网络的外层输出,而不是约束神经网络的权重。具体地,除了最小化经验损失之外,DELTAintends还通过约束已经以监督学习方式学习的注意精确选择的特征图的子集来对齐两个网络的外层输出。我们使用最先进的算法评估DELTA,包括L2和L2-SP。实验结果表明,我们提出的方法在新任务中具有更高的准确性,优于这些基线。
translated by 谷歌翻译
我们提出了一种称为广义递归推理(GR2)的新推理协议,并将其嵌入到多智能体强化学习(MARL)框架中。 GR2模型定义了推理类别:level- $ 0 $ agent随机行为,而level-$ k $ agent对分布在$ 0 $到$ k-1 $之间的混合类型的代理采取最佳响应。 GR2学习者可以考虑到有限理性,并且不需要假设多代理在所有阶段游戏中都使用Nash策略,这是许多MARL算法所需要的。我们证明,当$ k $水平较大时,GR2学习者将收敛到至少一个纳什均衡(NE)。此外,如果较低级别的代理人玩NE,那么高级代理也一定会跟随。我们在一系列游戏和高维环境中评估GR2 Soft Actor-Critic算法;结果表明,GR2方法比强MARL基线具有更快的收敛速度。
translated by 谷歌翻译