智能论文笔记

Indian Licence Plate Dataset in the wild

Sanchit Tanwar , Ayush Tiwari , Ritesh Chowdhry

分类：计算机视觉

2021-11-11

印度车牌检测是一个问题，它在开源级别尚未探讨。可以使用专有解决方案，但没有大的开源数据集可用于执行实验并测试不同的方法。可用的大型数据集是中国，巴西等国家，但在这些数据集上培训的模型对印度板块表现不佳，因为字体样式和板材设计从国家到国家差异很大。这篇论文介绍了印度车牌数据集使用16192图像和21683板板用每个板的4个点注释，并且相应的板中的每个字符.WE呈现了一种使用语义分割来解决数字板检测的基准模型。我们提出了一种两级方法，其中第一阶段是用于本地化板，第二阶段是读取裁剪板图像中的文本.WE测试的基准对象检测和语义分段模型，用于第二阶段，我们使用了LPRNET基于OCR。

translated by 谷歌翻译

Towards End-to-end Car License Plate Location and Recognition in Unconstrained Scenarios

Shuxin Qin , Sijiang Liu

分类：计算机视觉 | 人工智能 | 机器学习

2020-08-25

从卷积神经网络的快速发展中受益，汽车牌照检测和识别的性能得到了很大的改善。但是，大多数现有方法分别解决了检测和识别问题，并专注于特定方案，这阻碍了现实世界应用的部署。为了克服这些挑战，我们提出了一个有效而准确的框架，以同时解决车牌检测和识别任务。这是一个轻巧且统一的深神经网络，可以实时优化端到端。具体而言，对于不受约束的场景，采用了无锚方法来有效检测车牌的边界框和四个角，这些框用于提取和纠正目标区域特征。然后，新型的卷积神经网络分支旨在进一步提取角色的特征而不分割。最后，将识别任务视为序列标记问题，这些问题通过连接派时间分类（CTC）解决。选择了几个公共数据集，包括在各种条件下从不同方案中收集的图像进行评估。实验结果表明，所提出的方法在速度和精度上都显着优于先前的最新方法。

translated by 谷歌翻译

Real-time Bangla License Plate Recognition System for Low Resource Video-based Applications

Alif Ashrafee , Akib Mohammed Khan , Mohammad Sabik Irbaz , MD Abdullah Al Nasim

分类：计算机视觉 | 人工智能

2021-08-18

自动许可板识别系统旨在提供从视频帧中出现的车辆检测，本地化和识别车牌字符的解决方案。但是，在现实世界中部署此类系统需要在低资源环境中实时性能。在我们的论文中，我们提出了一种双级检测管线与视觉API配对，提供实时推理速度以及始终如一的准确检测和识别性能。我们使用Haar-Cascade分类器作为骨干MobileNet SSDv2检测模型顶部的过滤器。这仅通过专注于高置信度检测并使用它们来识别来减少推理时间。我们还施加了一个时间帧分离策略，以区分同一夹子中的多个车辆牌照。此外，没有公开的Bangla许可证板数据集，我们创建了一个图像数据集和野外包含许可板的视频数据集。我们在图像数据集上培训了模型，并达到了86％的AP（0.5）得分，并在视频数据集上测试了我们的管道，并观察到合理的检测和识别性能（82.7％的检测率，60.8％OCR F1得分）具有真实 - 时间处理速度（每秒27.2帧）。

translated by 谷歌翻译

IR-LPR: Large Scale of Iranian License Plate Recognition Dataset

Mahdi Rahmani , Melika Sabaghian , Seyyede Mahila Moghadami , Mohammad Mohsen Talaie , Mahdi Naghibi , Mohammad Ali Keyvanrad

分类：计算机视觉

2022-09-10

对象检测一直是实用的。我们世界上有很多事情，以至于认识到它们不仅可以增加我们对周围环境的自动知识，而且对于有兴趣开展新业务的人来说也可以很有利润。这些有吸引力的物体之一是车牌（LP）。除了可以使用车牌检测的安全用途外，它还可以用于创建创意业务。随着基于深度学习模型的对象检测方法的开发，适当且全面的数据集变得双重重要。但是，由于频繁使用车牌数据集的商业使用，不仅在伊朗而且在世界范围内也有限。用于检测车牌的最大伊朗数据集具有1,466张图像。此外，识别车牌角色的最大伊朗数据集具有5,000张图像。我们已经准备了一个完整的数据集，其中包括20,967辆汽车图像，以及对整个车牌及其字符的所有检测注释，这对于各种目的都是有用的。此外，字符识别应用程序的车牌图像总数为27,745张图像。

translated by 谷歌翻译

Exploration of an End-to-End Automatic Number-plate Recognition neural network for Indian datasets

Sai Sirisha Nadiminti , Pranav Kant Gaur , Abhilash Bhardwaj

分类：计算机视觉

2022-07-14

印度车辆板在尺寸，字体，脚本和形状方面的种类繁多。因此，自动数板识别（ANPR）解决方案的开发是具有挑战性的，因此需要一个多样化的数据集作为示例集合。但是，缺少印度情景的全面数据集，从而阻碍了在公开可用和可重现的ANPR解决方案方面的进展。许多国家已经投入了努力，为中国和面向应用程序的车牌（AOLP）数据集开发诸如中国城市停车数据集（CCPD）等全面的ANPR数据集为我们提供了努力。在这项工作中，我们发布了一个扩展的数据集，该数据集目前由1.5K图像组成，以及可扩展且可重复的程序，以增强该数据集以开发印度条件的ANPR解决方案。我们利用此数据集探索了印度场景的端到端（E2E）ANPR体系结构，该架构最初是根据CCPD数据集为中国车辆号码板识别的。当我们为数据集定制体系结构时，我们遇到了见解，我们在本文中讨论了这一点。我们报告了CCPD作者提供的模型直接可重复使用性的障碍，因为印度数字板的极端多样性以及相对于CCPD数据集的分布差异。在将印度数据集的特性与中国数据集对齐后，在LP检测中观察到了42.86％的改善。在这项工作中，我们还将E2E数板检测模型的性能与Yolov5模型进行了比较，并在可可数据集上进行了预训练，并在印度车辆图像上进行了微调。鉴于用于微调检测模块和Yolov5的数量印度车辆图像是相同的，我们得出的结论是，基于COCO数据集而不是CCPD数据集开发针对印度条件的ANPR解决方案更有效。

translated by 谷歌翻译

An advanced combination of semi-supervised Normalizing Flow & Yolo (YoloNF) to detect and recognize vehicle license plates

Khalid Oublal , Xinyi Dai

分类：计算机视觉 | 人工智能

2022-07-21

由于多个实际应用，全自动车牌识别（ALPR）一直是一个经常研究的主题。但是，在实际情况下，许多当前的解决方案仍然不够强大，通常取决于许多限制。本文提出了一个基于最先进的Yolo对象检测器和标准化流量的强大而有效的ALPR系统。该模型使用两种新策略。首先，使用YOLO的两阶段网络和基于标准化的基于归一化的模型来检测许可板（LP）并识别具有数字和阿拉伯字符的LP。其次，实施了多尺度图像转换，以解决Yolo裁剪LP检测问题的问题，包括明显的背景噪声。此外，在具有现实情况的新数据集中，我们引入了一个更大的公共注释数据集，该数据集从摩洛哥板上收集到了更大的公共注释数据集。我们证明我们提出的模型可以在没有单个或多个字符的少数样品上学习。该数据集还将公开使用，以鼓励对板检测和识别进行进一步的研究和研究。

translated by 谷歌翻译

Road Rutting Detection using Deep Learning on Images

Poonam Kumari Saha , Deeksha Arya , Ashutosh Kumar , Hiroya Maeda , Yoshihide Sekimoto

分类：计算机视觉

2022-09-28

道路车辙是严重的道路障碍，可能导致早期和昂贵的维护成本的道路过早失败。在过去的几年中，正在积极进行使用图像处理技术和深度学习的道路损害检测研究。但是，这些研究主要集中在检测裂缝，坑洼及其变体上。很少有关于探测道路的研究。本文提出了一个新颖的道路车辙数据集，其中包括949张图像，并提供对象级别和像素级注释。部署了对象检测模型和语义分割模型，以检测所提出的数据集上的道路插道，并对模型预测进行了定量和定性分析，以评估模型性能并确定使用拟议方法检测道路插道时面临的挑战。对象检测模型Yolox-S实现了61.6％的Map@iou = 0.5，语义分割模型PSPNET（RESNET-50）达到54.69，精度为72.67，从而为将来的类似工作提供了基准的准确性。拟议的道路车辙数据集和我们的研究结果将有助于加速使用深度学习发现道路车辙的研究。

translated by 谷歌翻译

On the Cross-dataset Generalization for License Plate Recognition

Rayson Laroca , Everton V. Cardoso , Diego R. Lucio , Valter Estevam , David Menotti

分类：计算机视觉

2022-01-02

由于深度学习的进步和数据集的增加，自动许可证板识别（ALPR）系统对来自多个区域的牌照（LPS）的表现显着。对深度ALPR系统的评估通常在每个数据集内完成;因此，如果这种结果是泛化能力的可靠指标，则是可疑的。在本文中，我们提出了一种传统分配的与休假 - 单数据集实验设置，以统一地评估12个光学字符识别（OCR）模型的交叉数据集泛化，其在九个公共数据集上应用于LP识别，具有良好的品种在若干方面（例如，获取设置，图像分辨率和LP布局）。我们还介绍了一个用于端到端ALPR的公共数据集，这是第一个包含带有Mercosur LP的车辆的图像和摩托车图像数量最多的图像。实验结果揭示了传统分离协议的局限性，用于评估ALPR上下文中的方法，因为在训练和测试休假时，大多数数据集在大多数数据集中的性能显着下降。

translated by 谷歌翻译

Indian Commercial Truck License Plate Detection and Recognition for Weighbridge Automation

Siddharth Agrawal , Keyur D. Joshi

分类：计算机视觉

2022-11-23

Detection and recognition of a licence plate is important when automating weighbridge services. While many large databases are available for Latin and Chinese alphanumeric license plates, data for Indian License Plates is inadequate. In particular, databases of Indian commercial truck license plates are inadequate, despite the fact that commercial vehicle license plate recognition plays a profound role in terms of logistics management and weighbridge automation. Moreover, models to recognise license plates are not effectively able to generalise to such data due to its challenging nature, and due to the abundant frequency of handwritten license plates, leading to the usage of diverse font styles. Thus, a database and effective models to recognise and detect such license plates are crucial. This paper provides a database on commercial truck license plates, and using state-of-the-art models in real-time object Detection: You Only Look Once Version 7, and SceneText Recognition: Permuted Autoregressive Sequence Models, our method outperforms the other cited references where the maximum accuracy obtained was less than 90%, while we have achieved 95.82% accuracy in our algorithm implementation on the presented challenging license plate dataset. Index Terms- Automatic License Plate Recognition, character recognition, license plate detection, vision transformer.

translated by 谷歌翻译

Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes

Pengyuan Lyu , Minghui Liao , Cong Yao , Wenhao Wu , Xiang Bai

分类：

2018-07-06

Recently, models based on deep neural networks have dominated the fields of scene text detection and recognition. In this paper, we investigate the problem of scene text spotting, which aims at simultaneous text detection and recognition in natural images. An end-to-end trainable neural network model for scene text spotting is proposed. The proposed model, named as Mask TextSpotter, is inspired by the newly published work Mask R-CNN. Different from previous methods that also accomplish text spotting with end-to-end trainable deep neural networks, Mask TextSpotter takes advantage of simple and smooth end-to-end learning procedure, in which precise text detection and recognition are acquired via semantic segmentation. Moreover, it is superior to previous methods in handling text instances of irregular shapes, for example, curved text. Experiments on ICDAR2013, ICDAR2015 and Total-Text demonstrate that the proposed method achieves state-of-the-art results in both scene text detection and end-to-end text recognition tasks.

translated by 谷歌翻译

YOLO and Mask R-CNN for Vehicle Number Plate Identification

Siddharth Ganjoo

分类：计算机视觉

2022-07-26

在过去的几年中，车牌扫描仪在停车场的流行增长。为了快速识别车牌，停车场使用的传统板识别设备采用了固定的光和射击角度来源。对于偏斜的角度，例如用超宽角或鱼眼镜镜拍摄的车牌图像，车牌识别板的变形也可能很严重，从而损害了标准车牌识别系统识别板的能力。蒙版RCNN小工具可以用于倾斜图片和各种拍摄角度。实验的结果表明，建议的设计将能够对大于0/60的斜角角度进行分类。使用建议的蒙版R-CNN方法的角色识别也已显着提高。所提出的蒙版R-CNN方法也在字符识别方面取得了重大进展，与采用Yolov2模型的策略相比，该方法的倾斜度超过45度。实验结果还表明，在开放数据板收集中介绍的方法比其他技术（称为AOLP数据集）更好。

translated by 谷歌翻译

OCR-RTPS: An OCR-based real-time positioning system for the valet parking

Zizhang Wu , Xinyuan Chen , Jizheng Wang , Xiaoquan Wang , Yuanzhu Gan , Muqing Fang , Tianhao Xu

分类：计算机视觉 | 机器人

2022-12-08

Obtaining the position of ego-vehicle is a crucial prerequisite for automatic control and path planning in the field of autonomous driving. Most existing positioning systems rely on GPS, RTK, or wireless signals, which are arduous to provide effective localization under weak signal conditions. This paper proposes a real-time positioning system based on the detection of the parking numbers as they are unique positioning marks in the parking lot scene. It does not only can help with the positioning with open area, but also run independently under isolation environment. The result tested on both public datasets and self-collected dataset show that the system outperforms others in both performances and applies in practice. In addition, the code and dataset will release later.

translated by 谷歌翻译

On the Design of Privacy-Aware Cameras: a Study on Deep Neural Networks

Marcela Carvalho , Oussama Ennaffi , Sylvain Chateau , Samy Ait Bachir

分类：计算机视觉

2022-08-24

尽管个人数据保护方面有法律进展，但未经授权实体滥用的私人数据问题仍然至关重要。为了防止这种情况，通常建议通过设计隐私作为数据保护解决方案。在本文中，使用通常用于提取敏感数据的深度学习技术研究了摄像机失真的效果。为此，我们模拟了对应于具有固定焦距，光圈和焦点的现实摄像机以及来自单色摄像机的灰度图像的现实摄像头的焦点外图像。然后，我们通过一项实验研究证明，我们可以构建一个无法提取个人信息（例如车牌编号）的隐私相机。同时，我们确保仍然可以从变形的图像中提取有用的非敏感数据。代码可在https://github.com/upciti/privacy-by-design-semseg上找到。

translated by 谷歌翻译

HTML版本

Real-time smart vehicle surveillance system

Shantha Kumar S , Vykunth P , Jayanthi D

分类：计算机视觉

2021-11-24

在过去十年中，全球各地的犯罪活动飙升。据印度警察局介绍，车辆盗窃是最不解决的犯罪之一，近19％的录制案件涉及机动车盗窃。为了克服这些对手，我们提出了一个实时车辆监控系统，它使用CCTV视频饲料检测和跟踪可疑车辆。所提出的系统提取车辆的各种属性，例如制作，模型，颜色，牌照号码和牌照的类型。采用各种图像处理和深度学习算法来满足所提出的系统的目标。提取的特征可用作报告违法行为的证据。虽然系统使用更多参数，但它仍然能够以最小的延迟和精度丢失进行实时预测。

translated by 谷歌翻译

Orientation Aware Weapons Detection In Visual Data : A Benchmark Dataset

Nazeef Ul Haq , Muhammad Moazam Fraz , Tufail Sajjad Shah Hashmi , Muhammad Shahzad

分类：计算机视觉

2021-12-04

自动检测武器对于改善个人的安全性和福祉是重要的，仍然是由于各种尺寸，武器形状和外观，这是一项艰巨的任务。查看点变化和遮挡也是使这项任务更加困难的原因。此外，目前的物体检测算法处理矩形区域，但是一个细长和长的步枪可以真正地覆盖区域的一部分区域，其余部分可能包含未经紧的细节。为了克服这些问题，我们提出了一种用于定向意识武器检测的CNN架构，其提供具有改进的武器检测性能的面向边界框。所提出的模型不仅通过将角度作为分类问题的角度分成8个类而且提供方向，而是作为回归问题。对于培训我们的武器检测模型，包括总6400件武器图像的新数据集从网上收集，然后用面向定向的边界框手动注释。我们的数据集不仅提供导向的边界框作为地面真相，还提供了水平边界框。我们还以多种现代对象探测器提供我们的数据集，用于在该领域进一步研究。所提出的模型在该数据集上进行评估，并且与搁板对象检测器的比较分析产生了卓越的拟议模型的性能，以标准评估策略测量。数据集和模型实现在此链接上公开可用：https://bit.ly/2tyzicf。

translated by 谷歌翻译

GLARE: A Dataset for Traffic Sign Detection in Sun Glare

Nicholas Gray , Megan Moraes , Jiang Bian , Allen Tian , Alex Wang , Haoyi Xiong , Zhishan Guo

分类：计算机视觉 | 机器学习

2022-09-19

实时机器学习检测算法通常在自动驾驶汽车技术中发现，并依赖优质数据集。这些算法在日常条件以及强烈的阳光下都能正常工作。报告表明，眩光是撞车事故最突出的两个最突出的原因之一。但是，现有的数据集，例如LISA和德国交通标志识别基准，根本不反映Sun Glare的存在。本文介绍了眩光交通标志数据集：在阳光下重大视觉干扰下，具有基于美国的交通标志的图像集合。眩光包含2,157张带有阳光眩光的交通标志图像，从33个美国道路录像带中拉出。它为广泛使用的Lisa流量标志数据集提供了必不可少的丰富。我们的实验研究表明，尽管几种最先进的基线方法在没有太阳眩光的情况下对交通符号数据集进行了训练和测试，但在对眩光进行测试时，它们遭受了极大的痛苦（例如，9％至21％的平均图范围为9％至21％。，它明显低于LISA数据集上的性能）。我们还注意到，当对Sun Glare中的交通标志图像进行培训时，当前的架构具有更好的检测准确性（例如，主流算法平均42％的平均地图增益）。

translated by 谷歌翻译

Data generation using simulation technology to improve perception mechanism of autonomous vehicles

Minh Cao , Ramin Ramezani

分类：计算机视觉

2022-07-01

计算机图形技术的最新进展可以使汽车驾驶环境更现实。它们使自动驾驶汽车模拟器（例如DeepGTA-V和Carla（学习采取行动））能够生成大量的合成数据，这些数据可以补充现有的现实世界数据集中，以培训自动驾驶汽车感知。此外，由于自动驾驶汽车模拟器可以完全控制环境，因此它们可以产生危险的驾驶场景，而现实世界中数据集缺乏恶劣天气和事故情况。在本文中，我们将证明将从现实世界收集的数据与模拟世界中生成的数据相结合的有效性，以训练对象检测和本地化任务的感知系统。我们还将提出一个多层次的深度学习感知框架，旨在效仿人类的学习经验，其中在某个领域中学习了一系列从简单到更困难的任务。自动驾驶汽车感知器可以从易于驱动的方案中学习，以通过模拟软件定制的更具挑战性的方案。

translated by 谷歌翻译

Bounding Box-Free Instance Segmentation Using Semi-Supervised Learning for Generating a City-Scale Vehicle Dataset

Osmar Luiz Ferreira de Carvalho , Osmar Abílio de Carvalho Júnior , Anesmar Olino de Albuquerque , Nickolas Castro Santana , Dibio Leandro Borges , Roberto Arnaldo Trancoso Gomes , Renato Fontes Guimarães

分类：计算机视觉 | 人工智能

2021-11-23

车辆分类是一台热电电脑视觉主题，研究从地面查看到顶视图。在遥感中，顶视图的使用允许了解城市模式，车辆集中，交通管理等。但是，在瞄准像素方面的分类时存在一些困难：（a）大多数车辆分类研究使用对象检测方法，并且最公开的数据集设计用于此任务，（b）创建实例分段数据集是费力的，并且（C ）传统的实例分段方法由于对象很小，因此在此任务上执行此任务。因此，本研究目标是：（1）提出使用GIS软件的新型半监督迭代学习方法，（2）提出一种自由盒实例分割方法，（3）提供城市规模的车辆数据集。考虑的迭代学习程序：（1）标记少数车辆，（2）在这些样本上列车，（3）使用模型对整个图像进行分类，（4）将图像预测转换为多边形shapefile，（5 ）纠正有错误的一些区域，并将其包含在培训数据中，（6）重复，直到结果令人满意。为了单独的情况，我们考虑了车辆内部和车辆边界，DL模型是U-Net，具有高效网络B7骨架。当移除边框时，车辆内部变为隔离，允许唯一的对象识别。要恢复已删除的1像素边框，我们提出了一种扩展每个预测的简单方法。结果显示与掩模-RCNN（IOU中67％的82％）相比的更好的像素 - 明智的指标。关于每个对象分析，整体准确性，精度和召回大于90％。该管道适用于任何遥感目标，对分段和生成数据集非常有效。

translated by 谷歌翻译

1st Workshop on Maritime Computer Vision (MaCVi) 2023: Challenge Results

Benjamin Kiefer , Matej Kristan , Janez Perš , Lojze Žust , Fabio Poiesi , Fabio Augusto de Alcantara Andrade , Alexandre Bernardino , Matthew Dawkins , Jenni Raitoharju , Yitong Quan

分类：计算机视觉 | 人工智能 | 机器学习 | 机器人

2022-11-24

The 1$^{\text{st}}$ Workshop on Maritime Computer Vision (MaCVi) 2023 focused on maritime computer vision for Unmanned Aerial Vehicles (UAV) and Unmanned Surface Vehicle (USV), and organized several subchallenges in this domain: (i) UAV-based Maritime Object Detection, (ii) UAV-based Maritime Object Tracking, (iii) USV-based Maritime Obstacle Segmentation and (iv) USV-based Maritime Obstacle Detection. The subchallenges were based on the SeaDronesSee and MODS benchmarks. This report summarizes the main findings of the individual subchallenges and introduces a new benchmark, called SeaDronesSee Object Detection v2, which extends the previous benchmark by including more classes and footage. We provide statistical and qualitative analyses, and assess trends in the best-performing methodologies of over 130 submissions. The methods are summarized in the appendix. The datasets, evaluation code and the leaderboard are publicly available at https://seadronessee.cs.uni-tuebingen.de/macvi.

translated by 谷歌翻译

Recognizing License Plates in Real-Time

Michael Yang , Xin Wang

分类：计算机视觉

2019-06-11

车牌检测和认可（LPDR）对于实现智能运输并确保城市的安全性和安全性越来越重要。但是，LPDR在实用环境中面临巨大的挑战。车牌的尺寸，字体和颜色可能非常多样化，板图像通常是由于倾斜的捕获角度，不均匀的照明，遮挡和模糊而引起的质量差。在诸如监视之类的应用中，通常需要快速处理。为了实现实时和准确的车牌识别，在这项工作中，我们提出了一组技术：1）一种轮廓重建方法以及边缘检测，以快速检测候选板； 2）一种简单的零偏置方案，可有效删除板周围的假上和底部边界，以方便更准确地对板上的字符进行分割； 3）一组技术来增强培训数据，将SIFT功能纳入CNN网络，并利用转移学习以获得更有效的培训的初始参数； 4）一个两阶段验证程序，以低成本确定正确的板，在板检测阶段进行统计过滤，以快速去除不需要的候选者，以及在CR过程后的准确CR结果，以执行进一步的板验证而无需进行其他处理。我们根据算法实现完整的LPDR系统。实验结果表明，我们的系统可以实时准确识别车牌。此外，它在各个级别的照明和噪声下以及在有汽车运动的情况下稳健地工作。与同行方案相比，我们的系统不仅属于最准确的系统，而且也是最快的系统，并且可以轻松地应用于其他情况。

translated by 谷歌翻译