步态,个体的行走模式,是最重要的生物识别方式之一。大多数现有的步态识别方法将轮廓或铰接的身体模型作为步态特征。这些方法在处理诸如衣服,携带和视角等混杂变量时不会降低识别性能。为了解决这个问题,我们提出了一种新颖的AutoEncoder框架,用于明确地解开RGB图像中的姿势和外观特征,并且随着时间的推移,基于LSTM的姿势特征的整合产生步态特征。此外,我们收集了一个前视图步态(FVG)数据集,专注于从正面视图行走的步态识别,这是一个具有挑战性的问题,因为它包含与其他视图相比最小的步态提示。 FVG还包括其他重要的变化,例如步行速度,携带和衣服。通过对CASIA-B,USF和FVG数据集的大量实验,我们的方法在数量上表现出优于现有技术的性能,定性地表征特征解缠结的能力,以及有前途的计算效率。
translated by 谷歌翻译
人类的识别能力是以渐进的方式发展的。通常,儿童学会在有限的监督下区分各种物体与粗粒子。受此学习过程的启发,我们为少数精细粒度(FSFG)识别提供了一个简单而有效的模型,该模型尝试使用元学习来解决具有挑战性的细粒度识别任务。所提出的方法,名为Pairwise AlignmentBilinear Network(PABN),是一种端到端的深度神经网络。用于细粒度分类的非传统深双线性网络,采用自双线性池来捕捉图像的细微特征,所提出的模型使用新的成对双线性池来比较基本图像和查询图像之间的细微差别来学习深度距离度量。为了使基本图像特征与查询图像特征相匹配,我们在提出的成对双线性池化之前设计了特征对齐损失。对四个细粒度分类数据集和一个通用射击数据集的实验结果表明,所提出的模型优于现有技术状态。几枪细粒度和一般的几杆法。
translated by 谷歌翻译
移动平台上的实时通用对象检测是一项至关重要但具有挑战性的计算机视觉任务。然而,先前基于CNN的检测器遭受巨大的计算成本,这阻碍了它们在计算受限的情况下的实时推理。在本文中,我们研究了两级探测器在实时通用检测中的有效性,并提出了一种名为ThunderNet的轻型两级探测器。在骨干部分,我们分析了以前轻量级骨干的缺点,并提出了用于物体检测的轻量级骨干。在检测部分,我们开发了极其高效的RPN和检测头设计。为了生成更具有严格意义的特征表示,我们设计了两个高效的体系结构块,上下文增强模块和空间注意模块。最后,我们研究了输入分辨率,骨干和检测头之间的平衡。与轻量级单级探测器相比,ThunderB在PASCALVOC和COCO基准测试中仅具有40%的计算成本,具有卓越的性能。没有花里胡哨,我们的模型以24.1 fpson的速度运行在基于ARM的设备上。据我们所知,这是ARM平台上报告的第一个实时检测器。代码将发布以进行纸质再版。
translated by 谷歌翻译
物体检测器通常配备有用于图像分类的网络作为主干,例如ResNet。尽管众所周知在图像分类和物体检测的任务之间存在差距,但设计合适的检测器骨架仍然是手动穷举的。在本文中,我们建议DetNAS自动搜索神经架构以寻找物体探测器的背板。在DetNAS中,搜索空间被制定为asupernet,搜索方法依赖于进化算法(EA)。实验中,我们展示了DetNAS在各种探测器,一级探测器,RetinaNet和两级探测器FPN上的有效性。对于每种情况,我们都在从头开始训练和ImageNet预训练方案中进行搜索。与在ImageNet分类上搜索的架构相比,具有一致的优势。我们的主要结果架构在使用FPN检测器的COCO上实现了比ResNet-101更好的性能。此外,我们还演示了DetNAS搜索的架构,并找到了一些有意义的模式。
translated by 谷歌翻译
在本文中,我们提出了一种新的元学习方法,用于深度神经网络的自动修剪。我们首先训练一个PruningNet,一个元网络,它能够为给定目标网络的任何结构生成权重参数。我们使用简单的随机结构采样方法来训练PruningNet。然后,我们应用演化过程来搜索性能良好的修剪网络。搜索效率很高,因为权重是由经过培训的PruningNet直接生成的,我们不需要任何微调。通过为目标网络培训的单个PruningNet,我们可以在不受人类参与的情况下搜索不同约束下的各种修剪网络。我们已经在MobileNet V1 / V2网络上展示了竞争性能,ImageNetaccuracy比V1 / V2高出9.0 / 9.9。与之前最先进的基于AutoML的修剪方法(如AMC和NetAdapt)相比,我们在各种条件下都达到了更高或更高的准确度。
translated by 谷歌翻译
在许多实际的转移学习场景中,特征分布在源域和目标域之间是不同的(即非i.i.d。)。作为域差异度量的最大meandisppancy(MMD)已经在无监督域自适应(DA)中实现了有希望的性能。我们认为基于MMD的DA方法忽略了数据局部性结构,这在某种程度上会导致负面转移效应。该局部在最小化边际分布背后的非线性局部域差异方面起着重要作用。为了更好地利用域局部性,本文提出了一种新的基于局部生成差异度量(LGDM)的中间域生成学习,称为Manifold Criterion指导传递学习(MCTL)。所提出的MCTL的优点有四个:1)首先提出了流形标准(MC)的概念作为验证跨域的分布匹配的度量,并且如果满足MC则实现域自适应; 2)提出的MC可以很好地指导与目标域共享类似分布的中间域的生成,最小化本地域差异; 3)提出了全球生成差异度量(GGDM),以便可以有效和积极地减少全局和局部差异; 4)MCTL的简化版本称为MCTL-S,是针对更通用学习场景的完美域生成假设。通过与其他最先进的方法进行比较,对许多基准视觉转换实验的实验证明了所提出的流形标准引导生成转移方法的优越性。源代码可在https://github.com/wangshanshanCQU/MCTL获得。 。
translated by 谷歌翻译
基于电子健康记录(EHR)的临床结果预测在提高医疗质量方面起着至关重要的作用。传统的深序列模型无法捕获在长期和不规则临床事件序列中编码的丰富时间模式。我们观察到,长时间的临床事件表现出强烈的时间模式,而短时间内的事件往往是无序的共现。因此,我们提出了不同的机制来模拟不同时间尺度的临床事件。我们的模型学习事件序列的层次表示,以适应性地区分短程和远程事件,并准确地捕获核心时间依赖性。真实临床数据的实验结果表明,我们的模型比先前的模型有了很大的改进,分别在预测死亡和ICU入院时获得了0.94和0.90的AUC评分。我们的模型也成功地识别了不同临床结果预测任务的重要事件
translated by 谷歌翻译
Cross-domain Chinese Word Segmentation (CWS) remains a challenge despite recent progress in neural-based CWS. The limited amount of annotated data in the target domain has been the key obstacle to a satisfactory performance. In this paper, we propose a semi-supervised word-based approach to improving cross-domain CWS given a baseline segmenter. Particularly, our model only deploys word embeddings trained on raw text in the target domain, discarding complex hand-crafted features and domain-specific dictionaries. Innovative subsampling and negative sampling methods are proposed to derive word embeddings optimized for CWS. We conduct experiments on five datasets in special domains , covering domains in novels, medicine, and patent. Results show that our model can obviously improve cross-domain CWS, especially in the segmentation of domain-specific noun entities. The word F-measure increases by over 3.0% on four datasets, outperform-ing state-of-the-art semi-supervised and unsu-pervised cross-domain CWS approaches with a large margin. We make our code and data available on Github.
translated by 谷歌翻译
我们工作的目标是在不使用任何注释的情况下发现主要对象。我们专注于在严格的一般设置中执行无监督的对象发现和本地化,其中仅给出单个图像。这比典型的共定位或弱监督本地化任务更具挑战性。为了解决这个问题,我们提出了一种简单但有效的基于模式挖掘的方法,称为对象挖掘(OM),它利用了数据挖掘的优势和预先训练的卷积神经网络(CNN)的特征表示。具体而言,对象挖掘首先将特征映射从预先训练的CNN模型转换为一组事务,然后通过模式挖掘技术从事务数据库中发现频繁模式。我们观察到那些发现的模式,即共现突出区域,通常具有外观和空间一致性。受此观察的启发,我们可以通过以无人监督的方式合并相关的有意义的模式,轻松地发现和本地化可能的对象。对各种基准测试的广泛实验表明,与最先进的方法相比,Object Mining实现了竞争性能。
translated by 谷歌翻译
实际上,我们常常处于两难境地,即手头的标记数据不足以培养可靠的分类器,更严重的是,由于各种人为因素,这些标记的数据中的一些可能被错误地标记。因此,本文提出了一种新的半监督学习范式可以处理标签不足和标签不准确。为了解决标签效率问题,我们使用图形来桥接数据点,以便标签信息可以从稀缺的标记示例传播到沿图形边缘的非特征样本。为了解决标签不准确问题,采用Graph TrendFiltering(GTF)和Smooth Eigenbase Pursuit(SEP)来过滤掉最初的噪声标签。 GTF惩罚图中连接示例之间标签差异的l_0范数,并且表现出比传统的基于l_2范数的拉普拉斯平滑器更好的局部自适应性。 SEP通过强调与小特征值相关联的拉普拉斯矩阵的前导特征向量来重建正确的标签,因为这些特征向量反映了真实的标签平滑并且携带了丰富的类别分离线索。我们将我们的算法称为“在不充分和不正确的监督下进行半监督学习”(SIIS)。在图像分类,文本分类和语音识别方面的实验结果表明我们的SIIS在标签错误校正方面是有效的,从而导致对状态的优越性能 - 存在标签噪音和标签稀缺性的最先进方法。
translated by 谷歌翻译