智能论文笔记

Machine Learning for Postprocessing Medium-range Ensemble Streamflow Forecasts

Sanjib Sharma , Ganesh Raj Ghimire , Ridwan Siddique

分类：机器学习

2021-06-15

熟练的水流预测可以为水政策和管理各个领域的决策提供信息。我们集成了数值天气预测集合和分布式水文模型，以在中范围的交货时间（1-7天）下生成集合流量预测。我们展示了一项用于在美国东部的Susquehanna河流盆地的后处理过程中进行机器学习应用的案例研究。为了进行预测验证，我们使用不同的指标，例如技能得分和可靠性图，以提前时间，流量阈值和季节为条件。验证结果表明，机器学习后处理器可以改善相对于低复杂性预测（例如气候和时间持久性）以及确定性和原始集合预测的水流预测。与原始合奏相比，与较短的交货时间相比，在中等时间表的相对增益在后期时间表通常更高。与低压流相比，高流量和与凉爽的流量相比。总体而言，我们的结果突出了机器学习在许多方面的好处，以提高流量预测的技能和可靠性。

translated by 谷歌翻译

Tracking Passengers and Baggage Items using Multiple Overhead Cameras at Security Checkpoints

Abubakar Siddique , Henry Medeiros

分类：计算机视觉

2022-12-31

We introduce a novel framework to track multiple objects in overhead camera videos for airport checkpoint security scenarios where targets correspond to passengers and their baggage items. We propose a Self-Supervised Learning (SSL) technique to provide the model information about instance segmentation uncertainty from overhead images. Our SSL approach improves object detection by employing a test-time data augmentation and a regression-based, rotation-invariant pseudo-label refinement technique. Our pseudo-label generation method provides multiple geometrically-transformed images as inputs to a Convolutional Neural Network (CNN), regresses the augmented detections generated by the network to reduce localization errors, and then clusters them using the mean-shift algorithm. The self-supervised detector model is used in a single-camera tracking algorithm to generate temporal identifiers for the targets. Our method also incorporates a multi-view trajectory association mechanism to maintain consistent temporal identifiers as passengers travel across camera views. An evaluation of detection, tracking, and association performances on videos obtained from multiple overhead cameras in a realistic airport checkpoint environment demonstrates the effectiveness of the proposed approach. Our results show that self-supervision improves object detection accuracy by up to $42\%$ without increasing the inference time of the model. Our multi-camera association method achieves up to $89\%$ multi-object tracking accuracy with an average computation time of less than $15$ ms.

translated by 谷歌翻译

MEDS-Net: Self-Distilled Multi-Encoders Network with Bi-Direction Maximum Intensity projections for Lung Nodule Detection

Muhammad Usman , Azka Rehman , Abdullah Shahid , Siddique Latif , Shi Sub Byon , Byoung Dai Lee , Sung Hyun Kim , Byung il Lee , Yeong Gil Shin

分类：计算机视觉

2022-10-30

In this study, we propose a lung nodule detection scheme which fully incorporates the clinic workflow of radiologists. Particularly, we exploit Bi-Directional Maximum intensity projection (MIP) images of various thicknesses (i.e., 3, 5 and 10mm) along with a 3D patch of CT scan, consisting of 10 adjacent slices to feed into self-distillation-based Multi-Encoders Network (MEDS-Net). The proposed architecture first condenses 3D patch input to three channels by using a dense block which consists of dense units which effectively examine the nodule presence from 2D axial slices. This condensed information, along with the forward and backward MIP images, is fed to three different encoders to learn the most meaningful representation, which is forwarded into the decoded block at various levels. At the decoder block, we employ a self-distillation mechanism by connecting the distillation block, which contains five lung nodule detectors. It helps to expedite the convergence and improves the learning ability of the proposed architecture. Finally, the proposed scheme reduces the false positives by complementing the main detector with auxiliary detectors. The proposed scheme has been rigorously evaluated on 888 scans of LUNA16 dataset and obtained a CPM score of 93.6\%. The results demonstrate that incorporating of bi-direction MIP images enables MEDS-Net to effectively distinguish nodules from surroundings which help to achieve the sensitivity of 91.5% and 92.8% with false positives rate of 0.25 and 0.5 per scan, respectively.

translated by 谷歌翻译

Device-friendly Guava fruit and leaf disease detection using deep learning

Rabindra Nath Nandi , Aminul Haque Palash , Nazmul Siddique , Mohammed Golam Zilani

分类：计算机视觉

2022-09-26

这项工作使用水果和叶子的图像提出了一个基于学习的植物性诊断系统。已经使用了五个最先进的卷积神经网络（CNN）来实施该系统。迄今为止，模型的精度一直是此类应用程序的重点，并且尚未考虑模型的模型适用于最终用户设备。两种模型量化技术，例如float16和动态范围量化已应用于五个最新的CNN体系结构。研究表明，量化的GoogleNet模型达到了0.143 MB的尺寸，准确度为97％，这是考虑到大小标准的最佳候选模型。高效网络模型以99％的精度达到了4.2MB的大小，这是考虑性能标准的最佳模型。源代码可在https://github.com/compostieai/guava-disease-detection上获得。

translated by 谷歌翻译

Automated ischemic stroke lesion segmentation from 3D MRI

Md Mahfuzur Rahman Siddique , Dong Yang , Yufan He , Daguang Xu , Andriy Myronenko

分类：计算机视觉

2022-09-20

缺血性中风病变细分挑战（Isles 2022）为研究人员提供了一个平台，可以将其解决方案与3D MRI的缺血性中风区域进行比较。在这项工作中，我们描述了我们对2022分段任务的解决方案。我们将所有图像重新样本为一个共同的分辨率，使用两种输入MRI模式（DWI和ADC），并使用MONAI的Train Segresnet语义分割网络。最终提交是15个模型的合奏（来自3倍交叉验证的3次运行）。我们的解决方案（NVAUTO团队名称）在骰子度量标准（0.824）和总排名第2（基于合并的度量排名）方面获得了最高位置。

translated by 谷歌翻译

Self-supervised Learning for Panoptic Segmentation of Multiple Fruit Flower Species

Abubakar Siddique , Amy Tabb , Henry Medeiros

分类：计算机视觉

2022-09-10

使用手动生成标签训练的卷积神经网络通常用于语义或实例分割。在精确的农业中，自动花探测方法使用监督模型和后处理技术，这些技术可能不会始终如一地表现为花朵的出现，并且数据采集条件有所不同。我们提出了一种自我监督的学习策略，以使用自动生成的伪标签来增强分割模型对不同花种物种的敏感性。我们采用数据增强和完善方法来提高模型预测的准确性。然后将增强的语义预测转换为全景伪标签，以迭代训练多任务模型。可以通过现有的后处理方法来完善自我监督的模型预测，以进一步提高其准确性。对多物种果树花数据集的评估表明，我们的方法的表现优于最先进的模型，而无需计算昂贵的后处理步骤，为花朵检测应用提供了新的基线。

translated by 谷歌翻译

Self-Supervised Vision Transformers for Malware Detection

Sachith Seneviratne , Ridwan Shariffdeen , Sanka Rasnayaka , Nuran Kasthuriarachchi

分类：计算机视觉

2022-08-15

恶意软件检测在网络安全中起着至关重要的作用，随着恶意软件增长的增加和网络攻击的进步。以前看不见的恶意软件不是由安全供应商确定的，这些恶意软件通常在这些攻击中使用，并且不可避免地要找到可以从未标记的样本数据中自学习的解决方案。本文介绍了Sherlock，这是一种基于自学的深度学习模型，可根据视觉变压器（VIT）体系结构检测恶意软件。 Sherlock是一种新颖的恶意软件检测方法，它可以通过使用基于图像的二进制表示形式来学习独特的功能，以区分恶意软件和良性程序。在47种类型和696个家庭的层次结构中使用120万个Android应用的实验结果表明，自我监督的学习可以达到97％的恶意软件分类，而恶意软件的二进制分类比现有的最新技术更高。我们提出的模型还能够胜过针对多级恶意软件类型和家庭的最先进技术，分别为.497和.491。

translated by 谷歌翻译

Learning Large-scale Subsurface Simulations with a Hybrid Graph Network Simulator

Tailin Wu , Qinchen Wang , Yinan Zhang , Rex Ying , Kaidi Cao , Rok Sosič , Ridwan Jalali , Hassan Hamam , Marko Maucec , Jure Leskovec

分类：机器学习

2022-06-15

地下模拟使用计算模型来预测流体（例如油，水，气体）通过多孔介质的流动。这些模拟在工业应用（例如石油生产）中至关重要，在这些应用中，需要快速，准确的模型来进行高级决策，例如，进行井安置优化和现场开发计划。经典的有限差数数值模拟器需要大量的计算资源来对大规模现实世界的水库进行建模。另外，通过依靠近似物理模型，流线模拟器和数据驱动的替代模型在计算上更有效，但是它们不足以在大规模上对复杂的储层动力学进行建模。在这里，我们介绍了混合图网络模拟器（HGNS），这是一个数据驱动的替代模型，用于学习3D地下流体流的储层模拟。为了模拟局部和全球尺度上的复杂储层动力学，HGN由地下图神经网络（SGNN）组成，以建模流体流的演化和3D-U-NET，以建模压力的演变。 HGNS能够扩展到每个时间步长数百万个单元的网格，比以前的替代模型高两个数量级，并且可以准确地预测流体流量数十亿个时间步长（未来几年）。使用带有110万个单元的行业标准地下流数据集（SPE-10），我们证明HGNS能够将推理时间降低到与标准地下模拟器相比，最高18次，并且通过降低基于学习的模型，它可以优于其他基于学习的模型长期预测错误高达21％。

translated by 谷歌翻译

Two Decades of Bengali Handwritten Digit Recognition: A Survey

A. B. M. Ashikur Rahman , Md. Bakhtiar Hasan , Sabbir Ahmed , Tasnim Ahmed , Md. Hamjajul Ashmafee , Mohammad Ridwan Kabir , Md. Hasanul Kabir

分类：计算机视觉

2022-06-05

手写数字识别（HDR）是光学特征识别（OCR）领域中最具挑战性的任务之一。不管语言如何，HDR都存在一些固有的挑战，这主要是由于个人跨个人的写作风格的变化，编写媒介和环境的变化，无法在反复编写任何数字等时保持相同的笔触。除此之外，特定语言数字的结构复杂性可能会导致HDR的模棱两可。多年来，研究人员开发了许多离线和在线HDR管道，其中不同的图像处理技术与传统的机器学习（ML）基于基于的和/或基于深度学习（DL）的体系结构相结合。尽管文献中存在有关HDR的广泛审查研究的证据，例如：英语，阿拉伯语，印度，法尔西，中文等，但几乎没有对孟加拉人HDR（BHDR）的调查，这缺乏对孟加拉语HDR（BHDR）的研究，而这些调查缺乏对孟加拉语HDR（BHDR）的研究。挑战，基础识别过程以及可能的未来方向。在本文中，已经分析了孟加拉语手写数字的特征和固有的歧义，以及二十年来最先进的数据集的全面见解和离线BHDR的方法。此外，还详细讨论了一些涉及BHDR的现实应用特定研究。本文还将作为对离线BHDR背后科学感兴趣的研究人员的汇编，煽动了对相关研究的新途径的探索，这可能会进一步导致在不同应用领域对孟加拉语手写数字进行更好的离线认识。

translated by 谷歌翻译

Machine Learning-Based Disease Diagnosis:A Bibliometric Analysis

Md Manjurul Ahsan , Zahed Siddique

分类：机器学习

2022-01-08

机器学习（ML）从研究人员和从业者获得了相当大的关注，作为一种新的和适应性的疾病诊断工具。随着ML的进步和本领域的纸张和研究的增殖，需要完全检查机器学习的疾病诊断（MLBDD）。本文从一本书中，本文从2012年到2021年全面研究了MLBDD论文。因此，特定的关键字，1710篇关于助理信息的文件已从科学（WOS）数据库（WOS）数据库中提取，并集成到Excel数据表中进行进一步分析。首先，我们根据年度出版物和最富有成效的国家/地区，机构和作者来检查出版物结构。其次，使用R-Studio软件可视化国家/地区，机构，作者和文章的共同引文网络。他们进一步在引文结构和最具影响力的方面进行了检查。本文概述了MLBDD的研究人员对该主题感兴趣的研究人员，对那些对在这一领域进行更多研究的人进行彻底和完整的MLBDD研究。

translated by 谷歌翻译