在本文中,我们提出了一种通过无序的固定长度位串来表示指纹图像的方法,该方法提供了改进的精度性能,更快的匹配时间和可压缩性。首先,我们设计了一个新的基于minutia的局部结构,该结构由像素空间中的2D椭圆高斯函数的混合建模。通过将局部结构与与其相关联的细节数进行归一化,将每个局部结构映射到欧几里德空间。这个简单但至关重要的关键点可以实现两个局部结构的快速相异性计算,其中欧氏距离无失真。还引入了基于细节的局部结构的基于纹理的互补局部结构,其中两者都可以通过主成分分析进行压缩并且在欧几里德空间中容易融合。然后通过K均值聚类算法将融合的局部结构转换为K位有序串。仅使用欧几里德距离的这种计算链对于快速和有区别的位串转换是至关重要的。通过手指特定的比特训练算法可以进一步提高准确度,其中利用两个标准来选择有用的比特位置以进行匹配。在指纹验证竞赛(FVC)数据库上进行实验,以与现有技术进行比较,以显示所提出的方法的优越性。
translated by 谷歌翻译
本文提出了一种新的分类问题集成学习方法,即投影寻踪随机森林(PPF)。 PPF使用Lee等人引入的PPtreealgorithm。 (2013年)。在PPF中,通过分割随机选择的变量的线性组合来构造树。 Projectionpursuit用于选择最佳分类的变量投影。利用变量的线性组合来分离类,需要考虑变量之间的相关性,这允许PPF在组之间的分离发生变量组合时优于传统的随机森林。此处介绍的方法可用于多类问题,并实现为R(R Core Team,2018)软件包,PPforest,可在CRAN上获得,开发版本位于https://github.com/natydasilva/PPforest。
translated by 谷歌翻译
Shi,Huang和Lee(2017)通过将基于传输的依赖解析器的动态编程实现与最小的双向LSTMfeature集合相结合,获得了英语和中文依赖解析的最新结果。但是,他们的结果仅限于投影解析。在本文中,我们通过提供MH_4算法的第一个实际实现来扩展他们的方法以支持非投射性,这是一种$ O(n ^ 4)$轻度非投射动态编程解析器,在非投影树库上具有非常高的覆盖率。为了使MH_4与最小的基于转换的特征集兼容,我们引入了基于转换的解释,其中将较小的项映射到转换序列。因此,我们获得了基于非投影过渡的解析的全局解码的第一次实现,并且凭经验证明它在解析许多高度非投射语言时比它的投射对象更有效。
translated by 谷歌翻译
深度学习研究的长期目标是精确地描述培训和概括。然而,神经网络经常复杂的损失景观使学习动力学理论变得难以捉摸。在这项工作中,我们表明,对于广泛的神经网络,学习动力学显着简化,并且在无限宽度限制中,它们由一个线性模型控制。网络初始参数的一阶泰勒展开式。此外,镜像宽贝叶斯神经网络和高斯过程之间的对应关系,具有平方损失的宽神经网络的基于梯度的训练产生了从具有特定组成核的高斯过程绘制的测试集预测。虽然这些理论结果仅在无限宽度限制中是精确的,但我们仍然发现原始网络的预测与线性化版本的预测之间存在极好的经验一致性,即使对于有限的实际大小的网络也是如此。该协议在不同的体系结构,优化方法和损失函数方面都很强大。
translated by 谷歌翻译
在本文中,我们研究了在线识别平台,Amazon Rekognition和Microsoft Azure在背景,采集设备和面向对象方面的变化的可靠性。我们专注于公众常用的平台,以更好地了解他们的真实世界的表现。为了评估识别性能的变化,我们通过一次改变一个采集条件来执行控制实验。我们使用三个智能手机,一个数码单反相机和一个网络摄像头来捕捉客厅,办公室和摄影棚设置中的对象的侧视图和头顶视图。此外,我们引入了一个框架来估计与背景和方向相关的识别性能。在此框架中,我们利用基于颜色,纹理和形状特征的两种手工制作的特征以及从深度神经网络获得的数据驱动特征。实验结果表明,在多种采集条件下,基于深度学习的图像表示可以估计出Spearman的秩序相关性为0.94的认知性能变化。
translated by 谷歌翻译
本研究提出了一种新的深度学习模型,称为IITNet,用于从原始单通道脑电图(EEG)中学习时间和时间间隔的时间背景,用于自动睡眠阶段评分。当睡眠专家识别出称为时代的30秒PSG数据的睡眠阶段时,他们会调查睡眠相关事件,例如睡眠轴,K-复合体和来自时代(子时期)的局部片段的频率成分,并考虑睡眠之间的关系连续时期的相关事件遵循过渡规则。受此启发,IITNet学习如何通过深度残留网络对子时代的代表性特征进行编码,然后通过BiLSTM捕获代表性特征序列中的上下文信息。因此,IITNetcan在子历元级别中提取特征并且不仅在时期之间而且在时期中考虑时间上下文。 IITNet是一种端到端架构,不需要任何预处理,手工制作的功能设计,平衡采样,预训练或微调。我们的模型在Sleep-EDF和MASS数据集中进行了训练和评估,并且在两个数据集上均优于其他最先进的结果,总体准确度(ACC)分别为84.0%和86.6%,宏观F1分数(MF1)为77.7和80.8,Cohen的kappa分别为0.78和0.80,分别为Sleep-EDF和MASS。
translated by 谷歌翻译
尽管在眼周识别方面取得了进步,但野外的数据和眼周识别仍然是一个挑战。在本文中,我们通过一对共享参数(双流)卷积神经网络提出了一种多层融合方法,其中每个网络接受RGB数据和一种新颖的基于颜色的纹理描述符,即OrthogonalCombination-Local Binary Coded Pattern(OC-LBCP) )用于野外的眼周识别。具体地,在双流网络中引入两个不同的后期融合层以聚合RGB数据和OC-LBCP。因此,网络有利于后期融合层的这一新特征,以获得准确性。我们还介绍并共享一个新的野外眼周数据集,即用于基准测试的Ethnic-ocular数据集。建议的网络也在两个公开可用的数据集上进行了评估,即CASIA-irisdistance和UBIPr。建议的网络优于这些数据集上的几个竞争方法。
translated by 谷歌翻译
本文基于一种新的力估计方案(称为传动力观测器(TFOB)),开发了一种精确的系数弹性致动器(SEA)力控制算法。所提出的方法旨在改善由弹性传递的非线性和测量噪声以及其变形传感器的误差引起的SEA的较低的力测量。本文首先分析了传统SEA传动力传感方法的局限性,然后研究了它的随机特性,这确实为实现与TFOB结合的精确力控制性能奠定了基础。特别地,从频域中的整体闭环系统分析引入了调整参数。这为实现强制控制的SEA系统的最佳性能提供了指导。所提出的算法在实际SEA硬件设置中通过实验验证。
translated by 谷歌翻译
为了扩大其可访问性并增加其实用性,智能代理必须能够学习(非专家)人类用户指定的复杂行为。此外,他们需要在合理的时间内学习这些行为,同时有效地利用人类学员能够提供的稀疏反馈。最近的研究表明,人类反馈可以被描述为对代理人当前行为的批判,而不是作为最大化的替代奖励信号,最终由人类反馈的COnvergentActor-Critic(COACH)算法根据人类反馈进行直接的政策更新。我们的工作建立在COACH的基础上,转移到一个环境,其中theagent的政策由深层神经网络代表。我们在原始COACH算法之上采用了一系列修改,这些修改对于从高维观察中学习行为至关重要,同时也满足了获得降低的样本复杂度的约束。我们展示了我们的Deep COACH算法在Minecraft丰富的3D世界中的有效性,该代理通过在10-15分钟的交互中仅使用实时人工反馈从原始像素映射到动作来学习完成任务。
translated by 谷歌翻译
许多视觉和语言模型都受到视觉基础差的影响 - 往往是简单易学的语言先验,而不是将语言与视觉概念联系起来。在这项工作中,我们提出了一个通用框架,它呼吁人类重要性感知网络调整(HINT),有效地利用人工监督来改善视觉基础。提示限制深度网络对与人类相同的输入区域敏感。至关重要的是,我们的方法优化了人类注意力图和基于梯度的网络重要性之间的一致性 - 确保模型不仅要学习,而且还要依赖人类在进行预测时发现与任务相关的视觉概念。我们展示了我们对视觉问题回答和Image Captioningtasks,实现VQA-CP数据集的最新技术,该数据集惩罚过度依赖语言先验。
translated by 谷歌翻译