智能论文笔记

RE-Tagger: A light-weight Real-Estate Image Classifier

Prateek Chhikara , Anil Goyal , Chirag Sharma

分类：计算机视觉 | 机器学习

2022-07-12

房地产图像标签是节省手动注释并增强用户体验的努力的重要用例之一。本文提出了针对房地产图像分类问题的端到端管道（称为重新调用）。我们使用Custom InceptionV3体系结构提出了两阶段的转移学习方法，将图像分为不同类别（即卧室，浴室，厨房，阳台，厅等）。最后，我们以REST API为托管的REST API发布，该应用程序是在2枚GB RAM上运行的Web应用程序。演示视频可在此处使用。

translated by 谷歌翻译

HyperionSolarNet: Solar Panel Detection from Aerial Images

Poonam Parhar , Ryan Sawasaki , Alberto Todeschini , Colorado Reed , Hossein Vahabi , Nathan Nusaputra , Felipe Vergara

分类：计算机视觉

2022-01-06

随着全球气候变化影响影响世界的影响，需要集体努力来减少温室气体排放。能源部门是气候变化的最大贡献者，许多努力集中在减少对碳源发电厂的依赖，并转向可再生能源，如太阳能。太阳能电池板位置的全面数据库对于协助分析师和政策制定者来说，在定义太阳能的进一步扩展方面的策略方面很重要。在本文中，我们专注于创建太阳能电池板的世界地图。我们识别给定地理区域内的太阳能电池板的位置和总表面积。我们使用深度学习方法来使用空中图像自动检测太阳能电池板位置及其表面积。该框架由使用具有语义分割模型的串联串联使用图像分类器的双分支模型组成的框架在我们创建的卫星图像的日数据集上培训。我们的作品提供了一种用于检测太阳能电池板的高效和可扩展的方法，实现分类的精度为0.96，并且对于分割性能，IOU分数为0.82。

translated by 谷歌翻译

Music Recommendation System based on Emotion, Age and Ethnicity

Ramiz Mammadli , Huma Bilgin , Ali Can Karaca

分类：计算机视觉 | 人工智能

2022-12-09

A Music Recommendation System based on Emotion, Age, and Ethnicity is developed in this study, using FER-2013 and ``Age, Gender, and Ethnicity (Face Data) CSV'' datasets. The CNN architecture, which is extensively used for this kind of purpose has been applied to the training of the models. After adding several appropriate layers to the training end of the project, in total, 3 separate models are trained in the Deep Learning side of the project: Emotion, Ethnicity, and Age. After the training step of these models, they are used as classifiers on the web application side. The snapshot of the user taken through the interface is sent to the models to predict their mood, age, and ethnic origin. According to these classifiers, various kinds of playlists pulled from Spotify API are proposed to the user in order to establish a functional and user-friendly atmosphere for the music selection. Afterward, the user can choose the playlist they want and listen to it by following the given link.

translated by 谷歌翻译

Weed Recognition using Deep Learning Techniques on Class-imbalanced Imagery

A S M Mahmudul Hasan , Ferdous Sohel , Dean Diepeveen , Hamid Laga , Michael G. K. Jones

分类：计算机视觉 | 人工智能

2021-12-15

大多数杂草物种都会通过竞争高价值作物所需的营养而产生对农业生产力的不利影响。手动除草对于大型种植区不实用。已经开展了许多研究，为农业作物制定了自动杂草管理系统。在这个过程中，其中一个主要任务是识别图像中的杂草。但是，杂草的认可是一个具有挑战性的任务。它是因为杂草和作物植物的颜色，纹理和形状类似，可以通过成像条件，当记录图像时的成像条件，地理或天气条件进一步加剧。先进的机器学习技术可用于从图像中识别杂草。在本文中，我们调查了五个最先进的深神经网络，即VGG16，Reset-50，Inception-V3，Inception-Resnet-V2和MobileNetv2，并评估其杂草识别的性能。我们使用了多种实验设置和多个数据集合组合。特别是，我们通过组合几个较小的数据集，通过数据增强构成了一个大型DataSet，缓解了类别不平衡，并在基于深度神经网络的基准测试中使用此数据集。我们通过保留预先训练的权重来调查使用转移学习技术来利用作物和杂草数据集的图像提取特征和微调它们。我们发现VGG16比小规模数据集更好地执行，而ResET-50比其他大型数据集上的其他深网络更好地执行。

translated by 谷歌翻译

Portuguese Man-of-War Image Classification with Convolutional Neural Networks

Alessandra Carneiro , Lorena Nascimento , Mauricio Noernberg , Carmem Hara , Aurora Pozo

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-04

葡萄牙人战士（PMW）是一种凝胶生物体，具有长长的触手，能够造成严重的燃烧，从而导致对人类活动（例如旅游和捕鱼）的负面影响。缺乏有关该物种的时空动力学的信息。因此，使用替代方法收集数据可以有助于其监视。鉴于社交网络的广泛使用和PMW的引人注目的外观，Instagram帖子可能是监视的有前途的数据源。遵循此方法的第一个任务是识别指向PMW的帖子。本文报告了使用卷积神经网络进行PMW图像分类，以自动识别Instagram帖子。我们创建了一个合适的数据集，并训练了三个不同的神经网络：VGG-16，RESNET50和InceptionV3，并在Imagenet数据集中进行了预先训练的步骤。我们使用准确性，精度，召回和F1评分指标分析了他们的结果。预先训练的RESNET50网络提供了最佳结果，获得了94％的精度和95％的精度，召回和F1分数。这些结果表明，卷积神经网络对于识别Instagram社交媒体的PMW图像非常有效。

translated by 谷歌翻译

Forged Image Detection using SOTA Image Classification Deep Learning Methods for Image Forensics with Error Level Analysis

Raunak Joshi , Abhishek Gupta , Nandan Kanvinde , Pandharinath Ghonge

分类：计算机视觉 | 机器学习

2022-11-28

The advancement in the area of computer vision has been brought using deep learning mechanisms. Image Forensics is one of the major areas of computer vision application. Forgery of images is sub-category of image forensics and can be detected using Error Level Analysis. Using such images as an input, this can turn out to be a binary classification problem which can be leveraged using variations of convolutional neural networks. In this paper we perform transfer learning with state-of-the-art image classification models over error level analysis induced CASIA ITDE v.2 dataset. The algorithms used are VGG-19, Inception-V3, ResNet-152-V2, XceptionNet and EfficientNet-V2L with their respective methodologies and results.

translated by 谷歌翻译

Lessons learned developing and using a machine learning model to automatically transcribe 2.3 million handwritten occupation codes

Bjørn-Richard Pedersen , Einar Holsbø , Trygve Andersen , Nikita Shvetsov , Johan Ravn , Hilde Leikny Sommerseth , Lars Ailo Bongo

分类：机器学习

2021-06-07

机器学习方法实现文本识别的高精度，因此越来越多地用于手写历史来源的转录。然而，在生产中使用机器学习需要简化的端到端管道，该流程将扩展到数据集大小和模型，该模型具有几个手动转录的高精度。还必须验证模型结果的正确性。本文介绍了我们的经验教训，从挪威1950年人口普查中译码了开发，调整和使用互联端到端机器学习管道。我们为自动转录的代码达到97％的准确性，我们向3％的码发送了手动验证。我们核实我们的结果中发现的职业码分布与我们的培训数据中发现的分布相匹配，这应该是整个人口普查的代表。我们相信我们的方法和经验教训可能对计划在生产中使用机器学习的其他转录项目有用。源代码可用于：https://github.com/uit-hdl/rhd-codes

translated by 谷歌翻译

PTSD in the Wild: A Video Database for Studying Post-Traumatic Stress Disorder Recognition in Unconstrained Environments

Moctar Abdoul Latif Sawadogo , Furkan Pala , Gurkirat Singh , Imen Selmi , Pauline Puteaux , Alice Othmani

分类：计算机视觉 | 机器学习

2022-09-28

创伤后应激障碍（PTSD）是一种长期衰弱的精神状况，是针对灾难性生活事件（例如军事战斗，性侵犯和自然灾害）而发展的。 PTSD的特征是过去的创伤事件，侵入性思想，噩梦，过度维护和睡眠障碍的闪回，所有这些都会影响一个人的生活，并导致相当大的社会，职业和人际关系障碍。 PTSD的诊断是由医学专业人员使用精神障碍诊断和统计手册（DSM）中定义的PTSD症状的自我评估问卷进行的。在本文中，这是我们第一次收集，注释并为公共发行准备了一个新的视频数据库，用于自动PTSD诊断，在野生数据集中称为PTSD。该数据库在采集条件下表现出“自然”和巨大的差异，面部表达，照明，聚焦，分辨率，年龄，性别，种族，遮挡和背景。除了描述数据集集合的详细信息外，我们还提供了评估野生数据集中PTSD的基于计算机视觉和机器学习方法的基准。此外，我们建议并评估基于深度学习的PTSD检测方法。提出的方法显示出非常有希望的结果。有兴趣的研究人员可以从：http：//www.lissi.fr/ptsd-dataset/下载PTSD-in-wild数据集的副本

translated by 谷歌翻译

A Comparison of Deep Learning Architectures for Optical Galaxy Morphology Classification

Ezra Fielding , Clement N. Nyirenda , Mattia Vaccari

分类：机器学习

2021-11-08

Galaxy形态的分类在理解星系形成和演变方面发挥着至关重要的作用。传统上，此过程是手动完成的。深度学习技巧的出现给了这个过程的自动化空间。因此，本文提供了深度学习架构的比较，以确定哪个最适合光学星系形态分类。调整Walmsley等人在2021中提出的模型训练方法，Zoobot Python库用于培训模型以预测由志愿者制作的Galaxy动物园贴花决策树响应，使用WequessileNet B0，DenSenet121和Reset50作为核心模型架构。然后，预测结果将用于生成每个决策树问题的精度度量来确定架构性能。发现DenSenet121在准确性方面产生最佳结果，具有合理的培训时间。未来，以更深入的学习架构进一步测试可能是有益的。

translated by 谷歌翻译

Action Recognition using Transfer Learning and Majority Voting for CSGO

Tasnim Sakib Apon , Abrar Islam , MD. Golam Rabiul Alam

分类：计算机视觉

2021-11-06

目前在线视频游戏已成为逐步最喜欢的娱乐和反击来源：全球攻势（CS：Go）是全球上市的在线第一人称射击游戏之一。通过Esports每年安排许多竞争游戏。尽管如此，（i）没有关于CS的视频分析和行动认可的研究：GO游戏 - 游戏，可以在游戏行业中发挥重要作用，以进行预测模型（ii）在实时申请中没有完成任何工作在CS的行动和结果上：GO匹配（III）匹配的游戏数据通常在HLTV中可用作CSV格式化文件，但它没有开放访问，HLTV倾向于阻止用户采取数据。此手稿旨在开发一种用于精确预测4种不同行动的模型，并与我们的自主开发的深神经网络相比，与我们的自我开发的深神经网络相比，识别最佳型号，并在后面的主要投票包括有资格提供实时预测和该模型的结果有助于建设自动收集和处理更多数据的自动化系统，并解决从HLTV收集数据的问题。

translated by 谷歌翻译

FedLess: Secure and Scalable Federated Learning Using Serverless Computing

Andreas Grafberger , Mohak Chadha , Anshul Jindal , Jianfeng Gu , Michael Gerndt

分类：机器学习

2021-11-05

传统的深度学习方法（DL）需要在中央服务器上收集和处理的培训数据，这些中央服务器通常在保健等隐私敏感域中挑战。为此，提出了一种新的学习范式，称为联合学习（FL），在解决隐私和数据所有权问题的同时将DL的潜力带到了这些域。 FL使远程客户端能够在保持数据本地时学习共享ML模型。然而，传统的FL系统面临多种挑战，例如可扩展性，复杂的基础设施管理，并且由于空闲客户端而被浪费的计算和产生的成本。 FL系统的这些挑战与无服务器计算和功能 - AS-Service（FAAS）平台旨在解决的核心问题密切对齐。这些包括快速可扩展性，无基础设施管理，自动缩放为空闲客户端，以及每次使用付费计费模型。为此，我们为无服务器FL展示了一个新颖的系统和框架，称为不发烟。我们的系统支持多个商业和自主主机的FAAS提供商，可以在机构数据中心和边缘设备上部署在云端，内部部署。据我们所知，我们是第一个能够在一大面料的异构FAAS提供商中启用FL，同时提供安全性和差异隐私等重要功能。我们展示了全面的实验，即使用我们的系统可以成功地培训多达200个客户功能的不同任务，更容易实现。此外，我们通过将其与传统的FL系统进行比较来证明我们的方法的实际可行性，并表明它可以更便宜，更资源效率更便宜。

translated by 谷歌翻译

Automatic Analysis of Available Source Code of Top Artificial Intelligence Conference Papers

Jialiang Lin , Yingmin Wang , Yao Yu , Yu Zhou , Yidong Chen , Xiaodong Shi

分类：人工智能 | 自然语言处理 | 机器学习

2022-09-28

源代码对于研究人员重现方法并复制人工智能（AI）论文的结果至关重要。一些组织和研究人员手动收集具有可用源代码的AI论文，以对AI社区做出贡献。但是，手动收集是一项劳动密集型且耗时的任务。为了解决此问题，我们提出了一种方法，可以自动识别具有可用源代码的论文并提取其源代码存储库URL。通过这种方法，我们发现，从2010年到2019年发布的10个最高AI会议的常规论文中有20.5％被确定为具有可用源代码的论文，并且这些源代码存储库中有8.1％不再可访问。我们还创建了XMU NLP Lab ReadMe数据集，这是用于源代码文档研究的标记已读数文件的最大数据集。通过此数据集，我们发现了很多读书文件没有提供的安装说明或使用教程。此外，对AI会议论文的源代码的一般图片进行了大规模的综合统计分析。提出的解决方案还可以超越AI会议论文，以分析来自期刊和会议的其他科学论文，以阐明更多领域。

translated by 谷歌翻译

Data-Efficient Classification of Radio Galaxies

Ashwin Samudre , Lijo George , Mahak Bansal , Yogesh Wadadekar

分类：机器学习

2020-11-26

无线电星系的连续排放通常可以分为不同的形态学类，如FRI，Frii，弯曲或紧凑。在本文中，我们根据使用深度学习方法使用小规模数据集的深度学习方法来探讨基于形态的无线电星系分类的任务（$ \ SIM 2000 $ Samples）。我们基于双网络应用了几次射击学习技术，并使用预先培训的DENSENET模型进行了先进技术的传输学习技术，如循环学习率和歧视性学习迅速训练模型。我们使用最佳表演模型实现了超过92 \％的分类准确性，其中最大的混乱来源是弯曲和周五型星系。我们的结果表明，专注于一个小但策划数据集随着使用最佳实践来训练神经网络可能会导致良好的结果。自动分类技术对于即将到来的下一代无线电望远镜的调查至关重要，这预计将在不久的将来检测数十万个新的无线电星系。

translated by 谷歌翻译

Monkeypox virus detection using pre-trained deep learning-based approaches

Chiranjibi Sitaula , Tej Bahadur Shahi

分类：计算机视觉 | 机器学习

2022-09-06

随着世界各地的COVID-19病毒感染的下降，Monkeypox病毒正在缓慢地出现。人们害怕它，认为它看起来像是Covid-19的大流行。因此，在广泛的社区传播之前，至关重要的是检测到它们。基于AI的检测可以帮助他们在早期识别它们。在本文中，我们首先比较了13个不同的预训练的深度学习（DL）模型，以检测蒙基氧基病毒。为此，我们首先将它们添加到所有这些层中，并使用四个完善的措施进行分析：精度，召回，F1得分和准确性。在确定了表现最佳的DL模型之后，我们将它们整合以利用从其获得的概率输出的多数投票来提高整体绩效。我们在公开可用的数据集上执行实验，这表明我们的集合方法提供了精度，召回，F1得分和精度为85.44 \％，85.47 \％，85.40 \％和87.13 \％。这些令人鼓舞的结果表明，所提出的方法适用于卫生从业人员进行大规模筛查。

translated by 谷歌翻译

Responsive parallelized architecture for deploying deep learning models in production environments

Nikhil Verma , Krishna Prasad

分类：机器学习 | 人工智能

2021-12-15

招聘人员可以通过查看课程简体文档来轻松地为工作候选人提供候选人。非结构化文件CV看到候选人组合和名为实体列表详细信息。本研究的主要目的是设计和提出面向Web的高度响应性计算管道，可以使用分层精制标签注意网络系统地预测CV实体。

translated by 谷歌翻译

Optimization of Artificial Neural Networks models applied to the identification of images of asteroids' resonant arguments

Valerio Carruba , Safwan Aljbaae , Gabriel Caritá , Rita Cassia Domingos , Bruno Martins

分类：机器学习

2022-07-28

小行星主带通过平均动力和世俗共振的网络越过，这在小行星和行星的基本频率之间具有相当性时发生。传统上，这些对象是通过视觉检查其共鸣论点的时间演变来识别的，它们是小行星和扰动星球的轨道元素的结合。由于在某些情况下，受这些共振影响的小行星人口是数千个的顺序，因此对于人类观察者来说，这已成为一项纳税任务。最近的作品使用卷积神经网络（CNN）模型自动执行此类任务。在这项工作中，我们将此类模型的结果与一些最先进和可公开的CNN体系结构（如VGG，Inception和Resnet）进行了比较。首先使用验证集和一系列正规化技术（例如数据扩展，辍学和批处理标准）进行测试和优化此类模型的性能。然后使用三个最佳模型来预测包含数千张图像的较大测试数据库的标签。事实证明，有和没有正规化的VGG模型是预测大型数据集标签的最有效方法。由于Vera C. Rubin天文台在未来几年内可能会发现多达四百万个新的小行星，因此这些模型的使用可能会非常有价值，以识别共鸣的次要人群。

translated by 谷歌翻译

Deployment of ML Models using Kubeflow on Different Cloud Providers

Aditya Pandey , Maitreya Sonawane , Sumit Mamtani

分类：机器学习

2022-06-27

该项目旨在使用称为KubeFlow [1]的开源工具（端到端ML堆栈编排工具包）探索在Kubernetes上部署机器学习模型的过程。我们以管道形式创建端到端的机器学习模型，并分析各个点，包括设置，部署模型，性能，限制，限制和功能。我们希望我们的项目几乎像一个研讨会/入门报告一样，可以帮助Vanilla Cloud/Kubernetes用户对KubeFlow的零知识使用KubeFlow来部署ML模型。从不同的云上的设置到通过互联网提供训练有素的模型 - 我们提供详细信息和指标，详细介绍KubeFlow的性能。

translated by 谷歌翻译

Detecting Damage Building Using Real-time Crowdsourced Images and Transfer Learning

Gaurav Chachra , Qingkai Kong , Jim Huang , Srujay Korlakunta , Jennifer Grannen , Alexander Robson , Richard Allen

分类：计算机视觉

2021-10-12

经过大量地震后，我们可以看到个人和媒体机构在社交媒体平台上发布的图像由于这些天智能手机的大规模使用而发布。这些图像可用于提供关于公共和研究群落的地震区域震荡损坏的信息，并且可能导致救援工作。本文提出了一种自动化的方法，可以在来自诸如Twitter等社交媒体平台的地震之后提取损坏的建筑图像，从而识别包含此类图像的特定用户帖子。使用传输学习和〜6500手动标记图像，我们培训了深入学习模型，以识别现场损坏的建筑物的图像。当在土耳其2020 M7.0地震发生后，在不同地区的新收购的地震图像上进行地震图像的地震图像时，训练有素的模型取得了良好的表现。此外，为了更好地了解模型如何做出决策，我们还实现了Grad-CAM方法来可视化促进决策的图像上的重要位置。

translated by 谷歌翻译

EpilNet: A Novel Approach to IoT based Epileptic Seizure Prediction and Diagnosis System using Artificial Intelligence

Shivam Gupta , Virender Ranga , Priyansh Agrawal

分类：机器学习

2021-11-05

癫痫是最常见的神经疾病之一。这种疾病的主要特征是频繁的癫痫发作，这是大脑中的电气不平衡。它通常伴随着身体部位摇动甚至导致（晕倒）。在过去的几年里，许多治疗已经出现了。这些主要涉及使用用于控制癫痫发作的抗癫痫药物。但在70％的病例中，这些药物无效，手术是唯一的解决方案时的状态恶化。所以患者需要在癫痫发作并安全的同时照顾自己。可穿戴的脑电图（EEG）设备已经提出了医学和技术的发展。这些设备有助于分析脑电活动。 EEG有助于定位受影响的皮质区域。最重要的是它可以预测现场的任何癫痫发作。这导致了对有效和高效的癫痫发作预测和诊断系统的需求突然增加。本文提出了一种新的癫痫发作预测和诊断系统EPILnet方法。它是一维（1D）卷积神经网络。 epilnet为五个课程提供79.13％的测试准确性，与相关工程相比，大幅增加约6-7％。开发的Web API有助于将Epilnet带入实际使用。因此，它是患者和医生的综合系统。该系统将有助于患者防止伤害或事故，并通过医院医生提高治疗过程的效率。

translated by 谷歌翻译

Diabetic Foot Ulcer Grand Challenge 2021: Evaluation and Summary

Bill Cassidy , Connah Kendrick , Neil D. Reeves , Joseph M. Pappachan , Claire O'Shea , David G. Armstrong , Moi Hoon Yap

分类：计算机视觉 | 机器学习

2021-11-19

糖尿病足溃疡分类系统使用伤口感染（伤口内的细菌）和缺血（限制血供给）作为重要的临床指标治疗和预测伤口愈合。研究使用自动化计算机化方法在糖尿病足伤中使用自动化计算机化方法的使用和缺血的使用是有限的，这是有限的，因为存在的公开可用数据集和严重数据不平衡存在。糖尿病脚溃疡挑战2021提供了一种具有更大量数据集的参与者，其总共包括15,683只糖尿病足溃疡贴剂，用于训练5,734，用于测试，额外的3,994个未标记的贴片，以促进半监督和弱的发展 - 监督深度学习技巧。本文提供了对糖尿病足溃疡攻击2021中使用的方法的评估，并总结了从每个网络获得的结果。最佳性能的网络是前3种型号的结果的集合，宏观平均F1分数为0.6307。

translated by 谷歌翻译