智能论文笔记

Color Image Edge Detection using Multi-scale and Multi-directional Gabor filter

Yunhong Li , Yuandong Bi , Weichuan Zhang , Jie Ren , Jinni Chen

分类：计算机视觉

2022-08-16

在本文中，提出了一种颜色边缘检测方法，其中使用多尺度Gabor滤波器从输入颜色图像获得边缘。该方法的主要优点是在保持良好的噪声稳健性的同时，达到了高边缘检测精度。提出的方法包括三个方面：首先，RGB颜色图像由于其宽阔的着色区域和均匀的颜色分布而转换为CIE L*A*B*空间。其次，使用一组Gabor过滤器来平滑输入图像，并提取了色边缘强度图，并将其融合到具有噪声稳健性和准确边缘提取的新ESM中。第三，将熔融ESM嵌入精美探测器的途径中会产生噪声颜色边缘检测器。结果表明，所提出的检测器在检测准确性和噪声过程中具有更好的经验。

translated by 谷歌翻译

Image Feature Information Extraction for Interest Point Detection: A Review

Junfeng Jing , Tian Gao , Weichuan Zhang , Yongsheng Gao , Changming Sun

分类：计算机视觉

2021-06-15

兴趣点检测是计算机视觉和图像处理中最根本，最关键的问题之一。在本文中，我们对图像特征信息（IFI）提取技术进行了全面综述，以进行利益点检测。为了系统地介绍现有的兴趣点检测方法如何从输入图像中提取IFI，我们提出了IFI提取技术的分类学检测。根据该分类法，我们讨论了不同类型的IFI提取技术以进行兴趣点检测。此外，我们确定了与现有的IFI提取技术有关的主要未解决的问题，以及以前尚未讨论过的任何兴趣点检测方法。提供了现有的流行数据集和评估标准，并评估和讨论了18种最先进方法的性能。此外，还详细阐述了有关IFI提取技术的未来研究方向。

translated by 谷歌翻译

Visible and Near Infrared Image Fusion Based on Texture Information

Guanyu Zhang , Beichen Sun , Yuehan Qi , Yang Liu

分类：计算机视觉

2022-07-22

多传感器融合被广泛用于自动驾驶汽车的环境感知系统。它解决了由环境变化引起的干扰，并使整个驾驶系统更安全，更可靠。在本文中，提出了一种基于纹理信息的新型可见和近红外融合方法，以增强非结构化的环境图像。它针对传统可见和近红外图像融合方法中的工件，信息丢失和噪声问题。首先，通过相对总变化（RTV）计算，可见图像（RGB）的结构信息（RGB）和近红外图像（NIR）作为融合图像的基础层；其次，建立了贝叶斯分类模型来计算噪声重量和可见图像中的噪声信息和噪声信息通过关节双侧滤波器自适应过滤；最后，融合图像是通过颜色空间转换获得的。实验结果表明，所提出的算法可以保留光谱特性和无伪影和颜色失真的可见和近红外图像的独特信息，并且具有良好的鲁棒性以及保留独特的质地。

translated by 谷歌翻译

Single image deep defocus estimation and its applications

Fernando J. Galetto , Guang Deng

分类：计算机视觉

2021-07-30

深度信息在许多图像处理应用程序中是有用的。然而，由于拍摄图像是在2D成像传感器上投射3D场景的过程，因此深度信息嵌入图像中。从图像中提取深度信息是一个具有挑战性的任务。引导原理是由于散焦引起的蓝色水平与物体和焦平面之间的距离有关。基于该原理和广泛使用的假设，即高斯模糊是散焦模糊的良好模型，我们制定了作为高斯模糊分类问题的空间变化散焦模糊的问题。我们通过培训深度神经网络来解决图像补丁中的20级蓝色蓝色之一来解决问题。我们创建了一个超过500000美元的尺寸为32 \ times32 $的数据集，用于培训和测试几种知名网络模型。我们发现MobileNetv2由于其较低的内存要求和高精度而适用于此应用。训练模型用于确定通过施加迭代加权引导滤波器来改进的贴剂模糊。结果是散焦图，其携带每个像素的模糊度的信息。我们将提出的方法与最先进的技术进行比较，我们展示了其在自适应图像增强，散焦倍率和多聚焦图像融合中的成功应用。

translated by 谷歌翻译

Copy-Move Image Forgery Detection Based on Evolving Circular Domains Coverage

Shilin Lu , Xinghong Hu , Chengyou Wang , Lu Chen , Shulu Han , Yuejia Han

分类：计算机视觉

2021-09-09

本文的目的是通过提出一种新颖的方案，提高图像取证中复制伪造检测（CMFD）的准确性，主要贡献正在不断发展循环域覆盖（ECDC）算法。该方案集成了基于块和基于关键点的伪造检测方法。首先，从整个图像中提取逻辑极性空间和比例不变特征变换（SIFT）中的加速强大功能（SURF）。其次，采用广义2最近邻（G2NN）来获得大规模匹配的对。然后，采用随机样本共识（RANSAC）算法来滤除不匹配的对，从而允许粗略地位伪造区域。要更准确地展示这些伪造地区，我们提出了高效准确的ECDC算法呈现它们。该算法可以通过从联合演化的圆形域中提取块特征来找到满意的阈值区域，这些域在匹配对上以匹配的对。最后，应用形态学操作来优化检测到的伪造区域。实验结果表明，与其他最先进的CMFD方案相比，所提出的CMFD方案可以在各种攻击下实现更好的检测性能。

translated by 谷歌翻译

Gradient Domain Weighted Guided Image Filtering

Bo Wang

分类：计算机视觉

2022-11-30

As an excellent local filter, guided image filters are subject to halo artifacts. In this paper, the algorithm uses gradient information to accurately determine the edge of the image, and uses the weighted information to further accurately distinguish the flat area and edge area of the image. As a result, the edges of the image are sharper and the level of blur in flat areas is reduced, avoiding halo artifacts caused by excessive blurring near edges. Experiments show that the proposed algorithm can better suppress halo artifacts at the edges. The proposed algorithm has good performance in both image denoising and image detail enhancement.

translated by 谷歌翻译

Touchless Palmprint Recognition based on 3D Gabor Template and Block Feature Refinement

Zhaoqun Li , Xu Liang , Dandan Fan , Jinxing Li , Wei Jia , David Zhang

分类：计算机视觉 | 人工智能

2021-03-03

随着对手工卫生的需求不断增长和使用的便利性，掌上识别最近具有淡淡的发展，为人识别提供了有效的解决方案。尽管已经致力于该地区的许多努力，但仍然不确定无接触棕榈污染的辨别能力，特别是对于大规模数据集。为了解决问题，在本文中，我们构建了一个大型无尺寸的棕榈纹数据集，其中包含了来自1167人的2334个棕榈手机。为了我们的最佳知识，它是有史以来最大的非接触式手掌形象基准，而是关于个人和棕榈树的数量收集。此外，我们提出了一个名为3DCPN（3D卷积棕榈识别网络）的无棕榈识别的新型深度学习框架，它利用3D卷积来动态地集成多个Gabor功能。在3DCPN中，嵌入到第一层中的新颖变体以增强曲线特征提取。通过精心设计的集合方案，然后将低级别的3D功能卷积以提取高级功能。最后在顶部，我们设置了基于地区的损失功能，以加强全局和本地描述符的辨别能力。为了展示我们方法的优越性，在我们的数据集和其他流行数据库同济和IITD上进行了广泛的实验，其中结果显示了所提出的3DCPN实现最先进的或可比性的性能。

translated by 谷歌翻译

R2FD2: Fast and Robust Matching of Multimodal Remote Sensing Image via Repeatable Feature Detector and Rotation-invariant Feature Descriptor

Bai Zhu , Chao Yang , Jinkun Dai , Jianwei Fan , Yuanxin Ye

分类：计算机视觉

2022-12-05

Automatically identifying feature correspondences between multimodal images is facing enormous challenges because of the significant differences both in radiation and geometry. To address these problems, we propose a novel feature matching method, named R2FD2, that is robust to radiation and rotation differences.Our R2FD2 is conducted in two critical contributions, consisting of a repeatable feature detector and a rotation-invariant feature descriptor. In the first stage, a repeatable feature detector called the Multi-channel Auto-correlation of the Log-Gabor is presented for feature detection, which combines the multi-channel auto-correlation strategy with the Log-Gabor wavelets to detect interest points with high repeatability and uniform distribution. In the second stage, a rotation-invariant feature descriptor is constructed, named the Rotation-invariant Maximum index map of the Log-Gabor, which consists of two components: fast assignment of dominant orientation and construction of feature representation. In the process of fast assignment of dominant orientation, a Rotation-invariant Maximum Index Map is built to address rotation deformations. Then, the proposed RMLG incorporates the rotation-invariant RMIM with the spatial configuration of DAISY to depict a more discriminative feature representation, which improves RMLGs resistance to radiation and rotation variances.

translated by 谷歌翻译

Radio-Assisted Human Detection

Chengrun Qiu , Dongheng Zhang , Yang Hu , Houqiang Li , Qibin Sun , Yan Chen

分类：计算机视觉

2021-12-16

在本文中，我们通过将无线电信息结合到最先进的检测方法中提出了一种无线电辅助人类检测框架，包括基于锚的oneStage检测器和两级检测器。我们从无线电信号中提取无线电定位和标识符信息以帮助人类检测，由于哪种错误阳性和假否定的问题可能会大大缓解。对于两个探测器，我们使用基于无线电定位的置信度评分修订来提高检测性能。对于两级检测方法，我们建议利用无线电定位产生的区域提案，而不是依赖于区域提案网络（RPN）。此外，利用无线电标识符信息，还提出了具有无线电定位约束的非最大抑制方法，以进一步抑制假检测并减少错过的检测。模拟Microsoft Coco DataSet和CALTECH步行数据集的实验表明，借助无线电信息可以改善平均平均精度（地图）和最先进的检测方法的错过率。最后，我们在现实世界的情况下进行实验，以展示我们在实践中的提出方法的可行性。

translated by 谷歌翻译

Near-infrared and visible-light periocular recognition with Gabor features using frequency-adaptive automatic eye detection

Fernando Alonso-Fernandez , Josef Bigun

分类：计算机视觉

2022-11-10

Periocular recognition has gained attention recently due to demands of increased robustness of face or iris in less controlled scenarios. We present a new system for eye detection based on complex symmetry filters, which has the advantage of not needing training. Also, separability of the filters allows faster detection via one-dimensional convolutions. This system is used as input to a periocular algorithm based on retinotopic sampling grids and Gabor spectrum decomposition. The evaluation framework is composed of six databases acquired both with near-infrared and visible sensors. The experimental setup is complemented with four iris matchers, used for fusion experiments. The eye detection system presented shows very high accuracy with near-infrared data, and a reasonable good accuracy with one visible database. Regarding the periocular system, it exhibits great robustness to small errors in locating the eye centre, as well as to scale changes of the input image. The density of the sampling grid can also be reduced without sacrificing accuracy. Lastly, despite the poorer performance of the iris matchers with visible data, fusion with the periocular system can provide an improvement of more than 20%. The six databases used have been manually annotated, with the annotation made publicly available.

translated by 谷歌翻译

AGPCNet: Attention-Guided Pyramid Context Networks for Infrared Small Target Detection

Tianfang Zhang , Siying Cao , Tian Pu , Zhenming Peng

分类：计算机视觉

2021-11-05

红外小目标检测是在地球观测，军事侦察，救灾等许多领域的重要问题，最近受到了广泛的关注。本文介绍了注意引导金字塔上下文网络（AGPCNET）算法。其主要组件是注意引导的上下文块（AGCB），上下文金字塔模块（CPM）和非对称融合模块（AFM）。AGCB将特征映射分为修补程序以计算本地关联，并使用全局上下文注意（GCA）来计算语义之间的全局关联，CPM集成来自多尺度AGCB的功能，AFM从功能集成了低级和深级语义集成 - 融合视角，增强了特征的利用。实验结果表明，AGPCNET在两个可用的红外小目标数据集上实现了新的最先进的性能。源代码可在https://github.com/tianfang-zhang/agpcnet上获得。

translated by 谷歌翻译

Noise and Edge Based Dual Branch Image Manipulation Detection

Zhongyuan Zhang , Yi Qian , Yanxiang Zhao , Lin Zhu , Jinjin Wang

分类：计算机视觉

2022-07-02

与普通的计算机视觉任务不同，将图像操作检测任务更多地关注图像的语义内容，更关注图像操纵的微妙信息。在本文中，通过改进的约束卷积提取的噪声图像用作模型的输入，而不是原始图像，以获得更微妙的操纵痕迹。同时，由高分辨率分支和上下文分支组成的双分支网络被用来尽可能捕获伪像的痕迹。通常，大多数操纵将操纵伪像在操纵边缘上。专门设计的操纵边缘检测模块是基于双分支网络构建的，以更好地识别这些工件。图像中像素之间的相关性与它们的距离密切相关。两个像素越远，相关性越弱。我们为自我发场模块添加了一个距离因子，以更好地描述像素之间的相关性。四个公开图像操作数据集的实验结果证明了我们模型的有效性。

translated by 谷歌翻译

Multispectral image fusion by super pixel statistics

Nati Ofir

分类：计算机视觉

2021-12-21

多光谱图像融合是遥感和图像处理的基本问题。经典和深度学习方法解决了这个问题。本文专注于经典的解决方案，并向这个家庭引入新的新方法。该方法基于融合图像的内容进行多光谱图像融合。它依赖于分析基于融合输入中分段超像素的信息水平。具体而言，我解决了可见颜色RGB的任务到近红外（NIR）融合。 RGB图像捕获场景的颜色，而NIR捕获细节并看到过度的阴霾和云。由于每个通道都感应了场景的不同信息，因此它们的融合是挑战性和有趣的。该方法设计用于产生包含每个光谱的两个优点的融合。该稿件实验表明，该方法对于其他经典融合方法，可以在视觉上提供信息，这些方法可以在嵌入式设备上速架速度运行，不需要重型计算资源。

translated by 谷歌翻译

Multi-Scale Single Image Dehazing Using Laplacian and Gaussian Pyramids

Zhengguo Li , Haiyan Shu , Chaobing Zheng

分类：计算机视觉

2021-11-10

由于其广泛的应用，模型驱动的单幅图像脱色在不同的前方之上被广泛研究。天空区域的物体光线和雾度与噪声放大之间的模糊性是模型驱动的单图像脱水的两个固有问题。在本文中，提出了先前（DDAP）的黑暗直接衰减，以解决前一个问题。提出了一种新的阴霾线平均来减少由DDAP引起的形态学伪像，其使加权引导图像过滤器能够进一步减少形态伪像，同时保留图像中的细结构。然后提出了一种通过采用拉普拉斯和瓜山金字塔将朦胧图像分解成不同水平并应用不同的雾度去除和降噪方法来解决后一种问题，以解决金字塔的不同级别的场景辐射。将得到的金字塔折叠以恢复无雾图像。实验结果表明，所提出的算法优于艺术脱水算法的状态，并且确实防止了噪声在天空区域中被放大。

translated by 谷歌翻译

Deep Multi-Scale Feature Learning for Defocus Blur Estimation

Ali Karaali , Naomi Harte , Claudio Rosito Jung

分类：计算机视觉 | 机器学习

2020-09-24

本文介绍了一种来自单个离焦图像的边缘散焦模糊估计方法。我们首先将位于深度不连续（称为深度边缘的边缘）的边缘区分从近似恒定的深度区域（称为模糊估计的被称为模糊估计的图案边缘）的边缘中的深度不连续性（含义模糊估计是模糊的）。然后，我们仅估计图案边缘的散焦模糊量，并探索基于引导滤波器的内插方案，该导向滤波器防止检测到的深度边缘的数据传播，以获得具有明确定义的对象边界的密集模糊图。两个任务（边缘分类和模糊估计）由深度卷积神经网络（CNNS）执行，该网络（CNN）共享权重以从边缘位置为中心的多尺度补丁学习有意义的本地特征。在自然散焦的图像上的实验表明，该方法提出了优异的最先进（SOTA）方法的定性和定量结果，在运行时间和准确度之间具有良好的折衷。

translated by 谷歌翻译

Surf: Speeded up robust features

分类：

In this paper, we present a novel scale-and rotation-invariant interest point detector and descriptor, coined SURF (Speeded Up Robust Features). It approximates or even outperforms previously proposed schemes with respect to repeatability, distinctiveness, and robustness, yet can be computed and compared much faster.This is achieved by relying on integral images for image convolutions; by building on the strengths of the leading existing detectors and descriptors (in casu, using a Hessian matrix-based measure for the detector, and a distribution-based descriptor); and by simplifying these methods to the essential. This leads to a combination of novel detection, description, and matching steps. The paper presents experimental results on a standard evaluation set, as well as on imagery obtained in the context of a real-life object recognition application. Both show SURF's strong performance.

translated by 谷歌翻译

Gaussian Fourier Pyramid for Local Laplacian Filter

Yuto Sumiya , Tomoki Otsuka , Yoshihiro Maeda , Norishige Fukushima

分类：计算机视觉

2022-06-08

多尺度处理对于图像处理和计算机图形至关重要。光环是多尺度处理中的核心问题。通过扩展Laplacian金字塔以具有边缘保留特性，几种边缘保护分解可以解决局部拉普拉斯滤波（LLF）。它的处理成本很高；因此，提出了快速LLF的近似加速度，以线性插值多个拉普拉斯金字塔。本文通过傅立叶系列扩展进一步提高了精度，称为傅立叶LLF。我们的结果表明，对于相同数量的金字塔，傅立叶LLF具有更高的精度。此外，傅立叶LLF表现出用于内容自适应过滤的参数自适应性能。该代码可在以下网址获得：https：//norishigefukushima.github.io/gaussianfourierpyramid/。

translated by 谷歌翻译

A comprehensive survey on computer-aided diagnostic systems in diabetic retinopathy screening

Meysam Tavakoli , Patrick Kelley

分类：计算机视觉

2022-08-03

糖尿病（DM）可导致严重的微脉管破坏，最终导致糖尿病性视网膜病变（DR）或由于糖尿病引起的眼睛并发症。如果不受组织的检查，这种疾病会随着时间的流逝而增加，并最终导致完全视力丧失。检测到这种光学发展的一般方法是通过检查视网膜图像的血管，视神经头，微型毛发，出血，渗出液等。最终，这受到经验丰富的眼科医生和大量DM案例的数量的限制。为了启用早期有效的DR诊断，眼科领域需要强大的计算机辅助诊断（CAD）系统。我们的审查旨在为从学生到成熟的研究人员提供给任何人，他们想了解CAD系统及其算法可以完成的工作，再到建模以及计算机视觉和模式识别中的视网膜图像处理领域的发展方向。对于刚开始的人来说，我们特别强调了不同数据库和算法框架的逻辑，优势和缺点，重点是最近的方法。

translated by 谷歌翻译

Mushrooms Detection, Localization and 3D Pose Estimation using RGB-D Sensor for Robotic-picking Applications

Nathanael L. Baisa , Bashir Al-Diri

分类：计算机视觉

2022-01-08

在本文中，我们使用从低成本消费者RGB-D传感器获取的RGB-D数据提出蘑菇检测，定位和3D姿势估计算法。我们使用RGB和深度信息进行不同的目的。从RGB颜色，我们首先提取蘑菇的初始轮廓位置，然后将初始轮廓位置和原始图像提供给蘑菇分割的活动轮廓。然后将这些分段蘑菇用作每个蘑菇检测的圆形Hough变换的输入，包括其中心和半径。一旦RGB图像中的每个蘑菇的中心位置都是已知的，我们就会使用深度信息在3D空间中定位它，即在世界坐标系中。在每个蘑菇的检测到的中心缺少深度信息的情况下，我们从每个蘑菇的半径内的最近可用深度信息估计。我们还使用预先准备的直立蘑菇模型来估计每个蘑菇的3D姿势。我们使用全球注册，然后是本地精炼登记方法进行此3D姿势估计。从估计的3D姿势，我们仅使用四元素表示的旋转部分作为每个蘑菇的方向。这些估计（X，Y，Z）位置，直径和蘑菇的方向用于机器人拣选应用。我们对3D印刷和真正的蘑菇进行了广泛的实验，表明我们的方法具有有趣的性能。

translated by 谷歌翻译

A Robust Completed Local Binary Pattern (RCLBP) for Surface Defect Detection

Nana Kankam Gyimah , Abenezer Girma , Mahmoud Nabil Mahmoud , Shamila Nateghi , Abdollah Homaifar , Daniel Opoku

分类：计算机视觉

2021-12-07

在本文中，我们为表面缺陷检测任务呈现了一种完整的局部二进制模式（RCLBP）框架。我们的方法使用非本地（NL）表示滤波器的组合具有小波阈值和完成的本地二进制模式（CLBP）以提取燃料特征，该特征被馈入到用于表面缺陷检测的分类器中。本文结合了三个组分：建立基于非局部（NL）的去噪技术，该方法具有小波阈值的滤波器，以在保留纹理和边缘的同时代替噪声图像。其次，使用CLBP技术提取辨别特征。最后，鉴别特征被馈送到分类器中以构建检测模型并评估所提出的框架的性能。使用来自东北大学（NEU）的真实世界钢结构缺陷数据库来评估缺陷检测模型的性能。实验结果表明，所提出的方法RCLBP是噪声稳健，可在类内和阶级变化的不同条件下应用表面缺陷检测，并且具有照明变化。

translated by 谷歌翻译