智能论文笔记

Feature Extraction and Prediction for Hand Hygiene Gestures with KNN Algorithm

Rashmi Bakshi

分类：计算机视觉

2021-12-30

这项工作侧重于分析洗手过程中涉及的手势。世界卫生组织手卫生指南提供的洗手有六种标准手卫生手势。在本文中，使用计算机视觉库OpenCV来提取手中的手和手的轮廓，手的质心和沿着最大轮廓的极端手指。这些手特征在手卫生视频中为每个数据帧提取。在项目中创建了一只稳健的手卫生数据集。本工作中使用此数据集的子集。基于具有交叉折叠验证技术的KNN算法，进一步将提取的手特征进一步分组到类中，用于分类和预测未标记数据的分类和预测。实现了> 95％的平均准确度分数，并证明了具有适当输入值K = 5的KNN算法对于分类是有效的。具有六个不同的手动卫生课程的完整数据集将与KNN分类器一起使用以供将来的工作一起使用。

translated by 谷歌翻译

A Comparison of Deep Learning Models for the Prediction of Hand Hygiene Videos

Rashmi Bakshi

分类：计算机视觉

2021-11-03

本文介绍了各种深度学习模型，如例外，Reset-50和Inception v3，用于根据世界卫生组织（世卫组织）指南记录的手工卫生手势的分类和预测。数据集由视频格式的六个手卫生运动组成，聚集了30名参与者。该网络由预先训练的模型组成，具有图像净权重和模型的修改头。在培训25时25时，在分类报告中，在分类报告中实现了37％（七七型），33％（Inception V3）和72％（Reset-50）的准确性。 Reset-50模型明显优于正确的课程预测。通过使用快速处理GPU可以克服主要速度限制以进行未来的工作。一个完整的手工卫生数据集以及其他通用手势，如单手动运动（线性手动;圆形手旋转）将用Reset-50架构和医疗保健工作者的型号进行测试。

translated by 谷歌翻译

In-vehicle alertness monitoring for older adults

Heng Yao , Sanaz Motamedi , Wayne C. W. Giang , Alexandra Kondyli , Eakta Jain

分类：计算机视觉

2022-08-17

在驾驶的背景下进行警觉性监控可改善安全性并挽救生命。基于计算机视觉的警报监视是一个活跃的研究领域。但是，存在警觉性监控的算法和数据集主要针对年轻人（18-50岁）。我们提出了一个针对老年人进行车辆警报监控的系统。通过设计研究，我们确定了适合在5级车辆中独立旅行的老年人的变量和参数。我们实施了一个原型旅行者监测系统，并评估了十个老年人（70岁及以上）的警报检测算法。我们以适合初学者或从业者的详细级别报告系统设计和实施。我们的研究表明，数据集的开发是开发针对老年人的警觉性监测系统的首要挑战。这项研究是迄今为止研究不足的人群中的第一项研究，并通过参与方法对未来的算法开发和系统设计具有影响。

translated by 谷歌翻译

Analysis of the hands in egocentric vision: A survey

Andrea Bandini , José Zariffa

分类：计算机视觉

2019-12-23

由于价格合理的可穿戴摄像头和大型注释数据集的可用性，在过去几年中，Egintric Vision（又名第一人称视觉-FPV）的应用程序在过去几年中蓬勃发展。可穿戴摄像机的位置（通常安装在头部上）允许准确记录摄像头佩戴者在其前面的摄像头，尤其是手和操纵物体。这种内在的优势可以从多个角度研究手：将手及其部分定位在图像中；了解双手涉及哪些行动和活动；并开发依靠手势的人类计算机界面。在这项调查中，我们回顾了使用以自我为中心的愿景专注于手的文献，将现有方法分类为：本地化（其中的手或部分在哪里？）；解释（手在做什么？）；和应用程序（例如，使用以上为中心的手提示解决特定问题的系统）。此外，还提供了带有手基注释的最突出的数据集的列表。

translated by 谷歌翻译

Augmentation of base classifier performance via HMMs on a handwritten character data set

Hélder Campos , Nuno Paulino

分类：计算机视觉 | 机器学习

2021-11-17

本文介绍了几个基本分类器的表现研究，以识别现代拉丁字母的手写字符。通过利用维特比序列来通过确定维特比序列来进一步增强基础分类性能。隐藏的Markov模型（HMMS）模型在一个单词中的字母之间的关系挖掘，以确定最可能的字符序列。研究了四个基本分类器以及从手写数据集中提取的八个功能集。纠正后的最佳分类性能为89.8％，平均为68.1％

translated by 谷歌翻译

Design of Human Machine Interface through vision-based low-cost Hand Gesture Recognition system based on deep CNN with transfer-learning approach

Abir Sen , Tapas Kumar Mishra , Ratnakar Dash

分类：计算机视觉

2022-07-07

在这项工作中，提出了基于实时手势识别系统的实时手势识别系统界面（HCI）。该系统由六个阶段组成：（1）手势分割，（3）使用转移学习方法使用六个预训练的CNN模型，（4）构建交互式的人机界面，（（ 5）开发手势控制的虚拟鼠标，（6）使用卡尔曼过滤器来估计手部位置，因为指针的平滑度得到了改善。六个预训练的卷积神经网络（CNN）模型（VGG16，VGG19，RESNET50，RESNET101，INCEPTION-V1和MOBILENET-V1）已用于对手势图像进行分类。三个多级数据集（两个公开和一个自定义）已用于评估模型性能。考虑到模型的性能，已经观察到，与其他五个预训练的模型相比，Inception-V1在准确性，精度，召回和F-SCORE值方面表现出了更好的分类性能。手势识别系统已扩展并用于控制多媒体应用程序（例如VLC播放器，音频播放器，文件管理，播放2D Super-Mario-Bros游戏等），并在实时场景中具有不同的自定义手势命令。该系统的平均速度已达到35 fps（每秒帧），满足实时场景的要求。

translated by 谷歌翻译

ReViSe: Remote Vital Signs Measurement Using Smartphone Camera

Donghao Qiao , Amtul Haq Ayesha , Farhana Zulkernine , Raihan Masroor , Nauman Jaffar

分类：计算机视觉 | 机器学习

2022-06-13

远程光插图学（RPPG）是一种快速，有效，廉价和方便的方法，用于收集生物识别数据，因为它可以使用面部视频来估算生命体征。事实证明，远程非接触式医疗服务供应在COVID-19大流行期间是可怕的必要性。我们提出了一个端到端框架，以根据用户的视频中的RPPG方法来衡量人们的生命体征，包括心率（HR），心率变异性（HRV），氧饱和度（SPO2）和血压（BP）（BP）（BP）用智能手机相机捕获的脸。我们以实时的基于深度学习的神经网络模型来提取面部标志。通过使用预测的面部标志来提取多个称为利益区域（ROI）的面部斑块（ROI）。应用了几个过滤器，以减少称为血量脉冲（BVP）信号的提取的心脏信号中ROI的噪声。我们使用两个公共RPPG数据集培训和验证了机器学习模型，即Tokyotech RPPG和脉搏率检测（PURE）数据集，我们的模型在其上实现了以下平均绝对错误（MAE）：a），HR，1.73和3.95 BEATS- beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-beats-s-s-s-s-s-y-peats-beats-beats-beats-ship-s-s-s-in-chin-p-in-in-in-in-in-c--in-in-c-le-in-in- -t一下制。每分钟（bpm），b）分别为HRV，分别为18.55和25.03 ms，c）对于SPO2，纯数据集上的MAE为1.64。我们在现实生活环境中验证了端到端的RPPG框架，修订，从而创建了视频HR数据集。我们的人力资源估计模型在此数据集上达到了2.49 bpm的MAE。由于没有面对视频的BP测量不存在公开可用的RPPG数据集，因此我们使用了带有指标传感器信号的数据集来训练我们的模型，还创建了我们自己的视频数据集Video-BP。在我们的视频BP数据集中，我们的BP估计模型的收缩压（SBP）达到6.7 mmHg，舒张压（DBP）的MAE为9.6 mmHg。

translated by 谷歌翻译

Development of Automatic Tree Counting Software from UAV Based Aerial Images With Machine Learning

Musa Ataş , Ayhan Talay

分类：计算机视觉

2022-01-07

无人驾驶航空公司（UAV）成功地在许多应用领域中使用，例如军事，安全，监测，应急援助，旅游，农业和林业。本研究旨在从UAV获得的高分辨率图像自动在Siirt University Campus上的指定区域中计算树木。使用Adobe Photoshop的照片合并工具在地面站缝合在30米高的图像上获得的20％重叠。通过施加3x3中值和平均过滤器，将所得图像分别被释放并平滑。在某些区域生成由UAV捕获的空中图像的正极图之后，在这些地图上的不同对象的边界框标记在HSV（色调饱和值），RGB（红色绿色蓝色）和灰色的方式中标记。生成培训，验证和测试数据集，然后已经评估了使用各种机器学习算法与树检测相关的分类成功率。在最后一步中，通过获取实际的树编号来建立地面真理模型，然后通过将参考地面真理数据与所提出的模型进行比较来计算预测性能。认为已经为使用预定区域中的MLP分类器获得的平均精度率为87％的平均精度率已经实现了显着的成功。

translated by 谷歌翻译

A Novel IoT-based Framework for Non-Invasive Human Hygiene Monitoring using Machine Learning Techniques

Md Jobair Hossain Faruk , Shashank Trivedi , Mohammad Masum , Maria Valero , Hossain Shahriar , Sheikh Iqbal Ahamed

分类：机器学习

2022-07-07

人们的个人卫生习惯在每日生活方式中照顾身体和健康的状况。保持良好的卫生习惯不仅减少了患疾病的机会，而且还可以降低社区中传播疾病的风险。鉴于目前的大流行，每天的习惯，例如洗手或定期淋浴，在人们中至关重要，尤其是对于单独生活在家里或辅助生活设施中的老年人。本文提出了一个新颖的非侵入性框架，用于使用我们采用机器学习技术的振动传感器监测人卫生。该方法基于地球通传感器，数字化器和实用外壳中具有成本效益的计算机板的组合。监测日常卫生常规可能有助于医疗保健专业人员积极主动，而不是反应性，以识别和控制社区内潜在暴发的传播。实验结果表明，将支持向量机（SVM）用于二元分类，在不同卫生习惯的分类中表现出约95％的有希望的准确性。此外，基于树的分类器（随机福雷斯特和决策树）通过实现最高精度（100％）优于其他模型，这意味着可以使用振动和非侵入性传感器对卫生事件进行分类，以监测卫生活动。

translated by 谷歌翻译

Lab-scale Vibration Analysis Dataset and Baseline Methods for Machinery Fault Diagnosis with Machine Learning

Bagus Tris Atmaja , Haris Ihsannur , Suyanto , Dhany Arifianto

分类：机器学习

2022-12-27

The monitoring of machine conditions in a plant is crucial for production in manufacturing. A sudden failure of a machine can stop production and cause a loss of revenue. The vibration signal of a machine is a good indicator of its condition. This paper presents a dataset of vibration signals from a lab-scale machine. The dataset contains four different types of machine conditions: normal, unbalance, misalignment, and bearing fault. Three machine learning methods (SVM, KNN, and GNB) evaluated the dataset, and a perfect result was obtained by one of the methods on a 1-fold test. The performance of the algorithms is evaluated using weighted accuracy (WA) since the data is balanced. The results show that the best-performing algorithm is the SVM with a WA of 99.75\% on the 5-fold cross-validations. The dataset is provided in the form of CSV files in an open and free repository at https://zenodo.org/record/7006575.

translated by 谷歌翻译

Rapid detection and recognition of whole brain activity in a freely behaving Caenorhabditis elegans

Yuxiang Wu , Shang Wu , Xin Wang , Chengtian Lang , Quanshi Zhang , Quan Wen , Tianqi Xu

分类：计算机视觉

2021-09-22

先进的体积成像方法和遗传编码的活性指标已允许在\ textit {caenorhabditis elegans}中对全脑活性进行全面表征。然而，线虫神经系统的恒定运动和变形对行为动物中的密集填充神经元的一致构成了巨大的挑战。在这里，我们提出了一种级联解决方案，用于在自由移动的\ textit {c中长期和快速识别头发神经节神经元。秀丽隐杆线}。首先，通过深度学习算法检测到来自荧光图像的潜在神经元区。第二，二维神经元区域被融合到三维神经元实体中。第三，通过利用神经元和神经元之间的相对位置信息的神经元密度分布，多级人工神经网络将工程的神经元向量转化为数字神经元身份。有了少量的培训样品，我们的自下而上的方法能够处理每一卷 - $ 1024 \ times 1024 \ times 18 $ in Voxels-少于1秒钟，并获得了$ 91 \％\％$ $ $ 91 \％的神经元检测及以上的准确性$ 80 \％$ in Neuronal跟踪在长时间的视频录制中。我们的工作代表了迈向快速和完全自动化算法的一步，用于解码自然主义行为的全部大脑活动。

translated by 谷歌翻译

Can viewer proximity be a behavioural marker for Autism Spectrum Disorder?

Rahul Bishain , Sharat Chandran

分类：计算机视觉

2021-11-07

对任何自闭症谱系疾病的筛选是一种复杂的过程，通常涉及行为观察和基于问卷的测试的杂交。通常在受控环境中进行，此过程需要培训的临床医生或精神科医生进行此类评估。在移动平台上的技术进步浪潮中，已经在纳入移动和平板电脑设备上的这种评估时进行了多次尝试。在本文中，我们分析了使用这种筛选测试产生的视频。本文报道了使用观察者与显示屏距离的效果的第一次使用，同时向2-7岁的儿童作为自闭症的行为标记进行感官敏感性测试，在休闲家庭设置中使用如此的潜力很有希望。

translated by 谷歌翻译

Supervised laser-speckle image sampling of skin tissue to detect very early stage of diabetes by its effects on skin subcellular properties

Ahmet Orun , Luke Vella Critien , Jennifer Carter , Martin Stacey

分类：人工智能 | 计算机视觉

2021-12-18

本文研究了基于K最近邻居算法的专家系统的效力，用于激光散斑图像采样应用于早期检测糖尿病。利用人工智能引导激光散斑成像技术的最新发展，可以优化与合适的AI技术相关联的激光参数，例如波长，能级和图像纹理测量，以有效地与皮肤组织的亚细胞特性相互作用检测糖尿病的早期迹象。由于其优化的激光物理学和AI技术的优化组合，新方法可能比典型的皮肤葡萄糖水平观察更有效，并且另外，它允许非专家个人进行更频繁的皮肤组织测试以进行早期检测糖尿病。

translated by 谷歌翻译

How Facial Features Convey Attention in Stationary Environments

Janelle Domantay

分类：计算机视觉

2021-11-29

意识检测技术一直在各种企业中获得牵引力;最常用于驾驶员疲劳检测，最近的研究已经转向使用计算机视觉技术来分析在线教室等环境中的用户注意。本文旨在通过分析预测意识和疲劳的最大贡献，扩展了以前的分支检测研究。我们利用开源面部分析工具包OpenFace，以分析不同程度的注意力水平的受试者的视觉数据。然后，使用支持向量机（SVM），我们创建了几种用于用户注意的预测模型，并识别导向渐变（HOG）和动作单位的直方图，是我们测试的功能的最大预测因子。我们还将这种SVM的性能与利用卷积和/或经常性神经网络（CNN和CRNN）的性能进行了比较了这种SVM的性能。有趣的是，CRNN似乎没有比他们的CNN同行更好地表现出来。虽然深入学习方法实现了更大的预测精度，但使用较少的资源，使用某些参数来利用SVMS，能够逼近深度学习方法的性能。

translated by 谷歌翻译

Machine Learning For Classification Of Antithetical Emotional States

Jeevanshi Sharma , Rajat Maheshwari , Yusuf Uzzaman Khan

分类：机器学习

2022-09-06

通过脑电图信号的情绪分类取得了许多进步。但是，诸如缺乏数据和学习重要特征和模式之类的问题始终是具有在计算和预测准确性方面改进的领域。这项工作分析了基线机器学习分类器在DEAP数据集上的性能以及一种表格学习方法，该方法提供了最新的可比结果，从而利用了性能提升，这是由于其深度学习架构而无需部署重型神经网络。

translated by 谷歌翻译

Sign Language Detection

Shubham Deshmukh , Favin Fernandes , Amey Chavan

分类：计算机视觉

2022-09-08

随着计算机视觉技术的进步，根据其功能对图像进行分类的需求已成为一项巨大的任务和必要性。在此项目中，我们提出了2种模型，即使用ORB和SVM的特征提取和分类，第二个是使用CNN体系结构。该项目的最终结果是了解特征提取和图像分类背后的概念。训练有素的CNN模型还将用于将其转换为用于Android开发的TFLITE格式。

translated by 谷歌翻译

Sports Video: Fine-Grained Action Detection and Classification of Table Tennis Strokes from Videos for MediaEval 2021

Pierre-Etienne Martin , Jordan Calandre , Boris Mansencal , Jenny Benois-Pineau , Renaud Péteri , Laurent Mascarilla , Julien Morlier

分类：计算机视觉 | 人工智能 | 机器学习

2021-12-16

体育视频分析是由于各种应用领域的普遍研究课题，从多媒体智能设备带来了用户量身定制的易消化，以分析运动员的表现。体育视频任务是Mediaeval 2021基准测试的一部分。此任务可以从视频中解决细粒度的动作检测和分类。重点是乒乓球比赛的录音。自2019年以来运行，该任务从未在自然条件下录制的未经监测视频提供了分类挑战，每个行程都有已知的时间边界。今年，数据集延长并提供了未经注释的未经监测视频的检测挑战。这项工作旨在为体育教练和玩家创造工具，以分析体育绩效。在这种技术可以建立运动分析和玩家分析，以丰富运动员的培训经验，提高他们的表现。

translated by 谷歌翻译

Vision- and tactile-based continuous multimodal intention and attention recognition for safer physical human-robot interaction

Christopher Yee Wong , Lucas Vergez , Wael Suleiman

分类：机器人

2022-06-22

在机器人上使用皮肤样触觉传感器可以通过添加检测人类接触的能力来增强协作机器人的安全性和可用性。不幸的是，单独的简单二元触觉传感器无法确定人类接触的背景 - 无论是故意的互动还是需要安全操作的意外碰撞。许多已发表的方法使用更高级的触觉传感器或分析联合扭矩对离散相互作用进行了分类。取而代之的是，我们建议通过添加机器人安装的摄像头来增强简单二进制触觉传感器的意图识别能力。不同的相互作用特征，包括触摸位置，人姿势和凝视方向，用于训练监督的机器学习算法，以对触摸是否有意为92％的准确性。我们证明，与协作机器人百特（Baxter）的多模式意图识别相比单疗分析要准确得多。此外，我们的方法还可以通过凝视来衡量用户的注意力来连续监视在故意或无意间之间流动变化的相互作用。如果用户停止在中任务中注意注意力，则建议的意图和注意力识别算法可以激活安全功能，以防止不安全的互动。另外，提出的方法是机器人和触摸传感器布局不可知论，并且与其他方法互补。

translated by 谷歌翻译

Py-Feat: Python Facial Expression Analysis Toolbox

Eshin Jolly , Jin Hyun Cheong , Tiankang Xie , Sophie Byrne , Matthew Kenny , Luke J. Chang

分类：计算机视觉 | 机器学习

2021-04-08

Studying facial expressions is a notoriously difficult endeavor. Recent advances in the field of affective computing have yielded impressive progress in automatically detecting facial expressions from pictures and videos. However, much of this work has yet to be widely disseminated in social science domains such as psychology. Current state of the art models require considerable domain expertise that is not traditionally incorporated into social science training programs. Furthermore, there is a notable absence of user-friendly and open-source software that provides a comprehensive set of tools and functions that support facial expression research. In this paper, we introduce Py-Feat, an open-source Python toolbox that provides support for detecting, preprocessing, analyzing, and visualizing facial expression data. Py-Feat makes it easy for domain experts to disseminate and benchmark computer vision models and also for end users to quickly process, analyze, and visualize face expression data. We hope this platform will facilitate increased use of facial expression data in human behavior research.

translated by 谷歌翻译

SFF-DA: Sptialtemporal Feature Fusion for Detecting Anxiety Nonintrusively

Haimiao Mo , Yuchen Li , Shanlin Yang , Wei Zhang , Shuai Ding

分类：计算机视觉

2022-08-12

早期发现焦虑症对于减少精神障碍患者的苦难并改善治疗结果至关重要。基于MHealth平台的焦虑筛查在提高筛选效率和降低筛查成本方面具有特殊实用价值。实际上，受试者的身体和心理评估中移动设备的差异以及数据质量不均匀的问题和现实世界中数据的少量数据量使现有方法无效。因此，我们提出了一个基于时空特征融合的框架，用于非触发焦虑。为了降低数据质量不平衡的影响，我们构建了一个基于“ 3DCNN+LSTM”的特征提取网络，并融合了面部行为和非接触式生理学的时空特征。此外，我们设计了一种相似性评估策略，以解决较小的数据样本量导致模型准确性下降的问题。我们的框架已通过现实世界中的机组数据集进行了验证，并且两个公共数据集UBFC-Phys和Swell-KW。实验结果表明，我们框架的总体性能要比最新的比较方法更好。

translated by 谷歌翻译