智能论文笔记

Taxonomy and evolution predicting using deep learning in images

Jiewen Xiao , Wenbin Liao , Ming Zhang , Jing Wang , Jianxin Wang , Yihua Yang

分类：计算机视觉

2022-06-28

分子和形态特征是生物分类学的重要部分，是矛盾的，但需要整合。如今，有机体的图像识别和生物信息学正在出现和热门问题，但它们之间存在差距。在这项工作中，由遗传信息介导的一个多分支识别框架桥接了这个障碍，该障碍建立了宏观形态学和蘑菇的微分子信息之间的联系。提出了新型的多角度结构来融合三个分支模型的特征图像，从而显着提高了识别的准确性约10％，高达90％以上。此外，通过使用遗传距离嵌入作为预测图像距离和物种识别的表示空间，将遗传信息实现到蘑菇图像识别任务中。还首次深入讨论了传统分类任务的语义过度拟合和细粒图像识别的粒度。使用零拍学习任务在细粒度的情况下研究了该模型的普遍性，这可以预测看不见样本的分类和进化信息。我们提出了第一种将图像映射到DNA的方法，即使用编码器映射图像来遗传距离，然后通过预先训练的解码器解码DNA，其中37种DNA预测的总检验准确性为87.45％。这项研究通过系统地研究蘑菇图像识别问题，弥合宏观生物学信息和微观分子信息之间的差距，从而创建一个新颖的识别框架，这将为未来的智能生物识别技术提供新的参考。

translated by 谷歌翻译

Mushroom image recognition and distance generation based on attention-mechanism model and genetic information

Wenbin Liao , Jiewen Xiao , Chengbo Zhao , Yonggong Han , ZhiJie Geng , Jianxin Wang , Yihua Yang

分类：计算机视觉

2022-06-27

大芬基的物种鉴定，即蘑菇，一直是一项具有挑战性的任务。仍然有大量有毒的蘑菇，这对人们的生命构成了风险。但是，传统的识别方法需要大量在手动识别的分类学领域具有知识的专家，而且不仅效率低下，而且消耗了大量的人力和资本成本。在本文中，我们提出了一个基于注意力机构的新模型，Mushroomnet，该模型将轻型网络MobilenetV3应用于骨干模型，并结合了我们提出的注意力结构，并在蘑菇识别任务中实现了出色的性能。在公共数据集上，Mushroomnet模型的测试准确性已达到83.9％，在本地数据集上，测试精度已达到77.4％。提出的注意机制很好地将注意力集中在蘑菇图像的身体上，以进行混合通道注意力，并通过GRAD-CAM可视化的注意热图。此外，在这项研究中，将遗传距离添加到蘑菇图像识别任务中，将遗传距离用作表示空间，并且数据集中每对蘑菇物种之间的遗传距离被用作遗传距离表示的嵌入空间，以预测图像距离和物种。确认。我们发现，使用MES激活函数可以很好地预测蘑菇的遗传距离，但精度低于软疗法。拟议的蘑菇网已被证明，它显示出自动和在线蘑菇图像的巨大潜力，拟议的自动程序将有助于并参考传统的蘑菇分类。

translated by 谷歌翻译

Deep metric learning improves lab of origin prediction of genetically engineered plasmids

Igor M. Soares , Fernando H. F. Camargo , Adriano Marques , Oliver M. Crook

分类：机器学习 | 人工智能 | 神经与进化计算

2021-11-24

基因组工程正在进行前所未有的发展，现在已广泛可用。为确保负责任的生物技术创新并减少滥用工程DNA序列，为识别工程型质粒的起源实验室来说是至关重要的。基因工程归因（GEA），制定序列实验室协会的能力将支持这一过程中的法医专家。在这里，我们提出了一种基于度量学习的方法，该方法将最可能的原产实验室排名，同时为质粒序列和实验室产生嵌入。这些嵌入物可用于执行各种下游任务，例如聚类DNA序列和实验室，以及在机器学习模型中使用它们作为特征。我们的方法采用了循环转移增强方法，能够在前10个预测中正确地将原产于原产的90亿美元的时间排列 - 优于所有最新的最先进的方法。我们还证明我们可以使用只需10次\％$ 10 \％$ of序列进行几次拍摄学习并获得76±10美元的准确性。这意味着，我们仅使用第十个数据表达先前的CNN方法。我们还证明我们能够在特定实验室中提取质粒序列中的关键签名，允许对模型的产出进行可解释的检查。

translated by 谷歌翻译

Few-shot Fine-grained Image Classification via Multi-Frequency Neighborhood and Double-cross Modulation

Hegui Zhu , Zhan Gao , Jiayi Wang , Yange Zhou , Chengqing Li

分类：计算机视觉

2022-07-18

传统的细颗粒图像分类通常依赖于带注释的地面真相的大规模训练样本。但是，某些子类别在实际应用中可能几乎没有可用的样本。在本文中，我们建议使用多频邻域（MFN）和双交叉调制（DCM）提出一个新颖的几弹性细颗粒图像分类网络（FICNET）。采用模块MFN来捕获空间域和频域中的信息。然后，提取自相似性和多频成分以产生多频结构表示。 DCM使用分别考虑全球环境信息和类别之间的微妙关系来调节嵌入过程。针对两个少量任务的三个细粒基准数据集进行的综合实验验证了FICNET与最先进的方法相比具有出色的性能。特别是，在两个数据集“ Caltech-UCSD鸟”和“ Stanford Cars”上进行的实验分别可以获得分类精度93.17 \％和95.36 \％。它们甚至高于一般的细粒图像分类方法可以实现的。

translated by 谷歌翻译

CHERRY: a Computational metHod for accuratE pRediction of virus-pRokarYotic interactions using a graph encoder-decoder model

Jiayu Shang , Yanni Sun

分类：机器学习

2022-01-04

一种感染细菌和古代的原核病毒是微生物社区的关键球员。预测原核病毒的宿主有助于破译微生物之间的动态关系。虽然存在用于宿主鉴定的实验方法，但它们是劳动密集型或需要培养宿主细胞，从而产生对计算宿主预测的需求。尽管结果有一些有希望的结果，但计算宿主预测仍然是挑战，因为通过高通量测序技术通过有限的已知的相互作用和纯粹的测序量。最先进的方法只能在物种级别达到43％的精度。这项工作呈现樱桃，该工具配制主机预测作为知识图中的链路预测。作为病毒原核相互作用预测工具，可以应用樱桃以预测新发现病毒的宿主以及感染抗生素抗菌细菌的病毒。我们展示了樱桃对既有应用的效用，并将其性能与不同情景中的最先进的方法进行了比较。为了我们最好的知识，樱桃在识别病毒 - 原核互动方面具有最高的准确性。它优于物种水平的所有现有方法，精度增加37％。此外，樱桃的性能比其他工具更短的Contig。

translated by 谷歌翻译

Using Deep Learning Sequence Models to Identify SARS-CoV-2 Divergence

Yanyi Ding , Zhiyi Kuang , Yuxin Pei , Jeff Tan , Ziyu Zhang , Joseph Konan

分类：机器学习

2021-11-12

SARS-COV-2是一种上呼吸系统的RNA病毒，截至2021年5月，在全球范围内引起超过300万人死亡，截至5月201日。迄今为止，SARS-COV-2突变对科学家造成重大挑战跟上疫苗开发和公共卫生措施的步伐。因此，鉴定来自患者的实验室样本分歧的有效方法非常有助于SARS-COV-2基因组学的文件。在这项研究中，我们提出了一种神经网络模型，可利用复发性和卷积单元直接参与尖峰蛋白的氨基酸序列并分类相应的片状。我们还将我们的模型的性能与来自蛋白质数据库预先培训的变压器（BERT）的双向编码器表示。我们的方法具有基于基于物种内分化的当前同源性提供了更加计算上的替代方案。

translated by 谷歌翻译

Genetic Programming-Based Evolutionary Deep Learning for Data-Efficient Image Classification

Ying Bi , Bing Xue , Mengjie Zhang

分类：神经与进化计算 | 人工智能 | 计算机视觉 | 机器学习

2022-09-27

数据有效的图像分类是一项具有挑战性的任务，旨在使用小型培训数据来解决图像分类。基于神经网络的深度学习方法对于图像分类很有效，但是它们通常需要大规模的培训数据，并且具有重大局限性，例如需要专业知识来设计网络架构和具有差的可解释性。进化深度学习是一个最近的热门话题，将进化计算与深度学习结合在一起。但是，大多数进化的深度学习方法都集中在神经网络的架构上，这些方法仍然遭受诸如不良解释性之类的局限性。为了解决这个问题，本文提出了一种新的基于基因编程的进化深度学习方法，以进行数据有效的图像分类。新方法可以使用来自图像和分类域的许多重要运算符自动发展可变长度模型。它可以从颜色或灰度图像中学习不同类型的图像特征，并构建有效而多样的合奏以进行图像分类。灵活的多层表示可以使新方法自动构建浅层或深模型/树以进行不同的任务，并通过多个内部节点对输入数据进行有效的转换。新方法用于解决具有不同训练集大小的五个图像分类任务。结果表明，在大多数情况下，它比深度学习方法的图像分类更好。深入的分析表明，新方法具有良好的收敛性，并演变具有高解释性，不同长度/尺寸/形状以及良好可传递性的模型。

translated by 谷歌翻译

A Survey: Deep Learning for Hyperspectral Image Classification with Few Labeled Samples

Sen Jia , Shuguo Jiang , Zhijie Lin , Nanying Li , Meng Xu , Shiqi Yu

分类：计算机视觉 | 人工智能

2021-12-03

随着深度学习技术的快速发展和计算能力的提高，深度学习已广泛应用于高光谱图像（HSI）分类领域。通常，深度学习模型通常包含许多可训练参数，并且需要大量标记的样品来实现最佳性能。然而，关于HSI分类，由于手动标记的难度和耗时的性质，大量标记的样本通常难以获取。因此，许多研究工作侧重于建立一个少数标记样本的HSI分类的深层学习模型。在本文中，我们专注于这一主题，并对相关文献提供系统审查。具体而言，本文的贡献是双重的。首先，相关方法的研究进展根据学习范式分类，包括转移学习，积极学习和少量学习。其次，已经进行了许多具有各种最先进的方法的实验，总结了结果以揭示潜在的研究方向。更重要的是，虽然深度学习模型（通常需要足够的标记样本）和具有少量标记样本的HSI场景之间存在巨大差距，但是通过深度学习融合，可以很好地表征小样本集的问题方法和相关技术，如转移学习和轻量级模型。为了再现性，可以在HTTPS://github.com/shuguoj/hsi-classification中找到纸张中评估的方法的源代码.git。

translated by 谷歌翻译

Learning to Compare Relation: Semantic Alignment for Few-Shot Learning

Congqi Cao , Yanning Zhang

分类：计算机视觉

2020-02-29

少量学习是一个基本和挑战性的问题，因为它需要识别只有几个例子的新型类别。识别对象具有多个变体，可以定位图像中的任何位置。直接将查询图像与示例图像进行比较无法处理内容未对准。比较的表示和度量是至关重要的，但由于在几次拍摄学习中的样本的稀缺和广泛变化而挑战。在本文中，我们提出了一种新颖的语义对齐模型来比较关系，这是对内容未对准的强大。我们建议为现有的几次射门学习框架添加两个关键成分，以获得更好的特征和度量学习能力。首先，我们介绍了语义对齐损失，以对准属于同一类别的样本的功能的关系统计。其次，引入了本地和全局互动信息，允许在图像中的结构位置包含本地一致和类别共享信息的表示。第三，我们通过考虑每个流的同性恋的不确定性来介绍一个原则的方法来称量多重损失功能。我们对几个几次拍摄的学习数据集进行了广泛的实验。实验结果表明，该方法能够比较与语义对准策略的关系，实现最先进的性能。

translated by 谷歌翻译

Aerial Scene Parsing: From Tile-level Scene Classification to Pixel-wise Semantic Labeling

Yang Long , Gui-Song Xia , Liangpei Zhang , Gong Cheng , Deren Li

分类：计算机视觉

2022-01-06

给定空中图像，空中场景解析（ASP）目标，以解释图像内容的语义结构，例如，通过将语义标签分配给图像的每个像素来解释图像内容的语义结构。随着数据驱动方法的推广，过去几十年通过在使用高分辨率航空图像时，通过接近基于瓦片级场景分类或分段的图像分析的方案来解决了对ASP的有希望的进展。然而，前者的方案通常会产生瓷砖技术边界的结果，而后者需要处理从像素到语义的复杂建模过程，这通常需要具有像素 - 明智语义标签的大规模和良好的图像样本。在本文中，我们在ASP中解决了这些问题，从瓷砖级场景分类到像素明智语义标签的透视图。具体而言，我们首先通过文献综述重新审视空中图像解释。然后，我们提出了一个大规模的场景分类数据集，其中包含一百万个空中图像被称为百万援助。使用所提出的数据集，我们还通过经典卷积神经网络（CNN）报告基准测试实验。最后，我们通过统一瓦片级场景分类和基于对象的图像分析来实现ASP，以实现像素明智的语义标记。密集实验表明，百万援助是一个具有挑战性但有用的数据集，可以作为评估新开发的算法的基准。当从百万辅助救援方面传输知识时，百万辅助的微调CNN模型始终如一，而不是那些用于空中场景分类的预磨料想象。此外，我们设计的分层多任务学习方法实现了对挑战GID的最先进的像素 - 明智的分类，拓宽了用于航空图像解释的像素明智语义标记的瓦片级场景分类。

translated by 谷歌翻译

Computer Vision on X-ray Data in Industrial Production and Security Applications: A survey

Mehdi Rafiei , Jenni Raitoharju , Alexandros Iosifidis

分类：计算机视觉

2022-11-10

X-ray imaging technology has been used for decades in clinical tasks to reveal the internal condition of different organs, and in recent years, it has become more common in other areas such as industry, security, and geography. The recent development of computer vision and machine learning techniques has also made it easier to automatically process X-ray images and several machine learning-based object (anomaly) detection, classification, and segmentation methods have been recently employed in X-ray image analysis. Due to the high potential of deep learning in related image processing applications, it has been used in most of the studies. This survey reviews the recent research on using computer vision and machine learning for X-ray analysis in industrial production and security applications and covers the applications, techniques, evaluation metrics, datasets, and performance comparison of those techniques on publicly available datasets. We also highlight some drawbacks in the published research and give recommendations for future research in computer vision-based X-ray analysis.

translated by 谷歌翻译

Applications of Deep Learning in Fish Habitat Monitoring: A Tutorial and Survey

Alzayat Saleh , Marcus Sheaves , Dean Jerry , Mostafa Rahimi Azghadi

分类：计算机视觉

2022-06-11

海洋生态系统及其鱼类栖息地越来越重要，因为它们在提供有价值的食物来源和保护效果方面的重要作用。由于它们的偏僻且难以接近自然，因此通常使用水下摄像头对海洋环境和鱼类栖息地进行监测。这些相机产生了大量数字数据，这些数据无法通过当前的手动处理方法有效地分析，这些方法涉及人类观察者。 DL是一种尖端的AI技术，在分析视觉数据时表现出了前所未有的性能。尽管它应用于无数领域，但仍在探索其在水下鱼类栖息地监测中的使用。在本文中，我们提供了一个涵盖DL的关键概念的教程，该教程可帮助读者了解对DL的工作原理的高级理解。该教程还解释了一个逐步的程序，讲述了如何为诸如水下鱼类监测等挑战性应用开发DL算法。此外，我们还提供了针对鱼类栖息地监测的关键深度学习技术的全面调查，包括分类，计数，定位和细分。此外，我们对水下鱼类数据集进行了公开调查，并比较水下鱼类监测域中的各种DL技术。我们还讨论了鱼类栖息地加工深度学习的新兴领域的一些挑战和机遇。本文是为了作为希望掌握对DL的高级了解，通过遵循我们的分步教程而为其应用开发的海洋科学家的教程，并了解如何发展其研究，以促进他们的研究。努力。同时，它适用于希望调查基于DL的最先进方法的计算机科学家，以进行鱼类栖息地监测。

translated by 谷歌翻译

Weed Recognition using Deep Learning Techniques on Class-imbalanced Imagery

A S M Mahmudul Hasan , Ferdous Sohel , Dean Diepeveen , Hamid Laga , Michael G. K. Jones

分类：计算机视觉 | 人工智能

2021-12-15

大多数杂草物种都会通过竞争高价值作物所需的营养而产生对农业生产力的不利影响。手动除草对于大型种植区不实用。已经开展了许多研究，为农业作物制定了自动杂草管理系统。在这个过程中，其中一个主要任务是识别图像中的杂草。但是，杂草的认可是一个具有挑战性的任务。它是因为杂草和作物植物的颜色，纹理和形状类似，可以通过成像条件，当记录图像时的成像条件，地理或天气条件进一步加剧。先进的机器学习技术可用于从图像中识别杂草。在本文中，我们调查了五个最先进的深神经网络，即VGG16，Reset-50，Inception-V3，Inception-Resnet-V2和MobileNetv2，并评估其杂草识别的性能。我们使用了多种实验设置和多个数据集合组合。特别是，我们通过组合几个较小的数据集，通过数据增强构成了一个大型DataSet，缓解了类别不平衡，并在基于深度神经网络的基准测试中使用此数据集。我们通过保留预先训练的权重来调查使用转移学习技术来利用作物和杂草数据集的图像提取特征和微调它们。我们发现VGG16比小规模数据集更好地执行，而ResET-50比其他大型数据集上的其他深网络更好地执行。

translated by 谷歌翻译

Multi-view Multi-label Anomaly Network Traffic Classification based on MLP-Mixer Neural Network

Yu Zheng , Zhangxuan Dang , Chunlei Peng , Chao Yang , Xinbo Gao

分类：机器学习 | 人工智能 | 计算机视觉

2022-10-30

Network traffic classification is the basis of many network security applications and has attracted enough attention in the field of cyberspace security. Existing network traffic classification based on convolutional neural networks (CNNs) often emphasizes local patterns of traffic data while ignoring global information associations. In this paper, we propose a MLP-Mixer based multi-view multi-label neural network for network traffic classification. Compared with the existing CNN-based methods, our method adopts the MLP-Mixer structure, which is more in line with the structure of the packet than the conventional convolution operation. In our method, the packet is divided into the packet header and the packet body, together with the flow features of the packet as input from different views. We utilize a multi-label setting to learn different scenarios simultaneously to improve the classification performance by exploiting the correlations between different scenarios. Taking advantage of the above characteristics, we propose an end-to-end network traffic classification method. We conduct experiments on three public datasets, and the experimental results show that our method can achieve superior performance.

translated by 谷歌翻译

Fine-Grained Image Analysis with Deep Learning: A Survey

Xiu-Shen Wei , Yi-Zhe Song , Oisin Mac Aodha , Jianxin Wu , Yuxin Peng , Jinhui Tang , Jian Yang , Serge Belongie

分类：计算机视觉 | 机器学习

2021-11-11

细粒度的图像分析（FGIA）是计算机视觉和模式识别中的长期和基本问题，并为一组多种现实世界应用提供了基础。 FGIA的任务是从属类别分析视觉物体，例如汽车或汽车型号的种类。细粒度分析中固有的小阶级和阶级阶级内变异使其成为一个具有挑战性的问题。利用深度学习的进步，近年来，我们在深入学习动力的FGIA中见证了显着进展。在本文中，我们对这些进展的系统进行了系统的调查，我们试图通过巩固两个基本的细粒度研究领域 - 细粒度的图像识别和细粒度的图像检索来重新定义和扩大FGIA领域。此外，我们还审查了FGIA的其他关键问题，例如公开可用的基准数据集和相关域的特定于应用程序。我们通过突出几个研究方向和开放问题，从社区中突出了几个研究方向和开放问题。

translated by 谷歌翻译

Detecting the hosts of bacteriophages using GCN-based semi-supervised learning

Jiayu Shang , Yanni Sun

分类：机器学习

2021-05-28

背景：感染细菌和古代的原核病毒是生物圈中最丰富和多样化的生物实体。要了解各种生态系统中的监管作用，并利用治疗中使用的噬菌体的潜力，需要了解有病毒宿主关系的知识。高通量测序及其对微生物组的应用已经为预测宿主特定病毒可能感染的预测提供了新的机会。但是，计算宿主预测存在两个主要挑战。首先，经验上已知的病毒 - 宿主关系非常有限。其次，虽然病毒与其原核寄存器之间的序列相似度被用作宿主预测的主要特征，但在许多情况下，对齐在丢失或含糊不清。因此，仍然需要提高宿主预测的准确性。结果：在这项工作中，我们提出了一个半监督的学习模型，名为Hostg，为新颖病毒进行主机预测。我们通过利用病毒病毒蛋白质相似性和病毒宿主DNA序列相似性构建知识图。然后采用图形卷积网络（GCN）来利用或没有已知主机在培训中进行病毒来提高学习能力。在GCN培训期间，我们最小化预期的校准错误（ECE），以确保预测的信心。我们在模拟和实际测序数据上测试了HostG，并将其性能与其他用于病毒主机分类（VHM-Net，Wish，PHP，Hophage，Rafah，VHulk和VPF-Class）设计的最先进的方法。结论：Hostg优于其他流行的方法，展示了使用基于GCN的半监督学习方法的功效。 Hostg的特殊优势是它能够从新的分类群中预测主机。

translated by 谷歌翻译

Hierarchical Image Classification with A Literally Toy Dataset

Long He , Dandan Song , Liang Zheng

分类：计算机视觉

2021-11-01

Image Classification中的无监督域适应（UDA）仍然是一个很大的挑战。在现有的UDA图像数据集中，通常以扁平的方式组织类，其中可以训练普通分类器。然而在某些情况下，平面类来自一些基本类。例如，Buggies属于类鸟。我们定义类别的分类任务，其中类具有上述特征，并且平面类和基类被分级地组织为分层图像分类。直观地，利用这种分层结构将受益分层图像分类，例如，两个容易混淆的类可以属于完全不同的基类。在本文中，我们通过从标签层次结构中学到的融合功能来改善分类的性能。具体而言，我们训练由分层标签和UDA技术监督的特征提取器，它将输出输入图像的多个功能。随后将该特征连接以预测最优质的粒度。本研究与名为Lego-15的新数据集进行。由乐高砖的合成图像和真实图像组成，乐高 - 15数据集包含15级砖块。每个类源自粗级标签和中级标签。例如，类别“85080”与砖（粗略）和砖（中间）相关联。在此数据集中，我们证明我们的方法在分层图像分类中对UDA的基线进行了一致的改进。广泛的消融和变体研究提供了进入新数据集的见解和研究算法。

translated by 谷歌翻译

Label Hierarchy Transition: Modeling Class Hierarchies to Enhance Deep Classifiers

Renzhen Wang , De cai , Kaiwen Xiao , Xixi Jia , Xiao Han , Deyu Meng

分类：计算机视觉 | 机器学习

2021-12-04

分层分类旨在将对象对类别的层次进行。例如，可以根据订单，家庭和物种的三级层次分类来分类鸟类。现有方法通过将其解耦为几个多级分类任务来常见地解决分层分类。但是，这种多任务学习策略未能充分利用不同层次结构的各种类别之间的相关性。在本文中，我们提出了基于深度学习的统一概率框架的标签层次转换，以解决层次分类。具体地，我们明确地学习标签层次转换矩阵，其列向量表示两个相邻层次结构之间的类的条件标签分布，并且可以能够编码嵌入类层次结构中的相关性。我们进一步提出了混淆损失，这鼓励分类网络在训练期间学习不同标签层次结构的相关性。所提出的框架可以适用于任何现有的深网络，只有轻微的修改。我们尝试具有各种层次结构的三个公共基准数据集，结果证明了我们的方法超出现有技术的优势。源代码将公开可用。

translated by 谷歌翻译

Applications of Machine Learning in Chemical and Biological Oceanography

Balamurugan Sadaiappan , Preethiya Balakrishnan , Vishal CR , Neethu T Vijayan , Mahendran Subramanian , Mangesh U Gauns

分类：机器学习

2022-09-23

机器学习（ML）是指根据大量数据预测有意义的输出或对复杂系统进行分类的计算机算法。 ML应用于各个领域，包括自然科学，工程，太空探索甚至游戏开发。本文的重点是在化学和生物海洋学领域使用机器学习。在预测全球固定氮水平，部分二氧化碳压力和其他化学特性时，ML的应用是一种有前途的工具。机器学习还用于生物海洋学领域，可从各种图像（即显微镜，流车和视频记录器），光谱仪和其他信号处理技术中检测浮游形式。此外，ML使用其声学成功地对哺乳动物进行了分类，在特定的环境中检测到濒临灭绝的哺乳动物和鱼类。最重要的是，使用环境数据，ML被证明是预测缺氧条件和有害藻华事件的有效方法，这是对环境监测的重要测量。此外，机器学习被用来为各种物种构建许多对其他研究人员有用的数据库，而创建新算法将帮助海洋研究界更好地理解海洋的化学和生物学。

translated by 谷歌翻译

Palm Vein Recognition via Multi-task Loss Function and Attention Layer

Jiashu Lou , Jie zou , Baohua Wang

分类：计算机视觉 | 机器学习

2022-11-11

With the improvement of arithmetic power and algorithm accuracy of personal devices, biological features are increasingly widely used in personal identification, and palm vein recognition has rich extractable features and has been widely studied in recent years. However, traditional recognition methods are poorly robust and susceptible to environmental influences such as reflections and noise. In this paper, a convolutional neural network based on VGG-16 transfer learning fused attention mechanism is used as the feature extraction network on the infrared palm vein dataset. The palm vein classification task is first trained using palmprint classification methods, followed by matching using a similarity function, in which we propose the multi-task loss function to improve the accuracy of the matching task. In order to verify the robustness of the model, some experiments were carried out on datasets from different sources. Then, we used K-means clustering to determine the adaptive matching threshold and finally achieved an accuracy rate of 98.89% on prediction set. At the same time, the matching is with high efficiency which takes an average of 0.13 seconds per palm vein pair, and that means our method can be adopted in practice.

translated by 谷歌翻译