智能论文笔记

Fully Automated 2D and 3D Convolutional Neural Networks Pipeline for Video Segmentation and Myocardial Infarction Detection in Echocardiography

Oumaima Hamila , Sheela Ramanna , Christopher J. Henry , Serkan Kiranyaz , Ridha Hamila , Rashid Mazhar , Tahir Hamid

分类：计算机视觉 | 机器学习

2021-03-26

被称为超声心动图的心脏成像是一种非侵入性工具，用于生成包括图像和视频的数据，心脏病专家用来诊断心脏异常，尤其是心肌梗死（MI）。超声心动图机可以提供大量数据，需要由心脏病专家快速分析，以帮助他们做出诊断和治疗心脏病。但是，获得的数据质量取决于购置条件以及患者对设置说明的响应能力。这些限制对医生的挑战尤其是当患者面对MI并且他们的生命受到威胁时。在本文中，我们提出了一种基于卷积神经网络（CNN）的创新实时端到端全自动模型，以根据由左心室（LV）的区域壁运动异常（RWMA）检测到MI，该模型是由左心室（LV）的视频中的。超声心动图。我们的模型是由2D CNN组成的管道实现Mi。我们在由165个超声心动图视频组成的数据集上培训了两个CNN，每个CNN从一个独特的患者中获得。 2D CNN在数据分割方面达到了97.18％的精度，而3D CNN获得了90.9％的精度，100％的精度和95％的召回率。我们的结果表明，创建一个完全自动化的MI检测系统是可行且有利的。

translated by 谷歌翻译

Early Myocardial Infarction Detection over Multi-view Echocardiography

Aysen Degerli , Serkan Kiranyaz , Tahir Hamid , Rashid Mazhar , Moncef Gabbouj

分类：人工智能 | 计算机视觉 | 机器学习

2021-11-09

心肌梗塞（MI）是世界上死亡率的主要原因，由于饲喂心肌的冠状动脉堵塞。通过促进早期治疗干预措施，MI及其本土化的早期诊断可以减轻心肌损伤的程度。在冠状动脉堵塞后，缺血性心肌细分的区域壁运动异常（RWMA）是最早进入的变化。超声心动图是评估任何RWMA的基本工具。仅从单个超声心动图视图评估左心室（LV）壁的运动可能导致缺少MI的诊断，因为RWMA可能在该特定视图上不可见。因此，在本研究中，我们建议熔化顶端4室（A4C）和顶端2室（A2C）视图，其中可以分析总共11个心肌段的MI检测。所提出的方法首先通过活性多项式（AP）估计LV壁的运动，其提取并跟踪心内膜边界以计算心肌段位移。从A4C和A2C视图位移中提取的特征，该位移融合并馈送到分类器中以检测MI。本研究的主要贡献是1）通过包括A4C和A2C视图的共同分享与研究界的260个超声心动图录制，2）提高了阈值前后工作的性能基于机器学习的方法基于机器的AP，3）通过融合A4C和A2C视图的信息来通过多视图超声心动图进行先驱MI检测方法。实验结果表明，该方法达到了90.91％的敏感性和86.36％的MI检测精度，对多视角超声心动图进行了多视觉检测。

translated by 谷歌翻译

Plant Species Recognition with Optimized 3D Polynomial Neural Networks and Variably Overlapping Time-Coherent Sliding Window

Habib Ben Abdallah , Christopher J. Henry , Sheela Ramanna

分类：计算机视觉 | 机器学习

2022-03-04

最近，开发了EAGL-I系统是为了迅速创建大量标记的植物数据集，该数据集旨在被农民和研究人员普遍使用，以创建农业中的AI驱动解决方案。结果，由40,000张图像组成的公开植物识别数据集与系统一起创建了由8种植物物种组成的不同尺寸的图像，以证明其能力。本文提出了一种新颖的方法，称为可变重叠的时间连续滑动窗口（fotcsw），该方法将由图像组成的图像转换为具有可变大小的图像的数据集，为3D表示，具有适合卷积神经网络的固定大小，并证明了此表示形式是比将数据集的图像调整到给定尺寸的信息更丰富。我们从理论上正式化了该方法的用例及其固有的属性，我们证明了它对数据具有过采样和正则化效果。通过将Fotcsw方法与最近提出的称为1维多项式神经网络的机器学习模型的3D扩展相结合，我们能够创建一个模型，该模型在数据集中创建的数据集中达到了99.9％的最新精度， EAGL-I系统超过了众所周知的建筑，例如重新系统和启动。此外，我们创建了一种启发式算法，该算法能够降低任何预先训练的N维多项式神经网络，并在不改变其性能的情况下压缩它，从而使模型更快，更轻。此外，我们确定当前可用的数据集无法以目前的形式用于机器学习，这是因为训练集和测试集之间存在很大的类不平衡。因此，我们创建了一个特定的预处理和模型开发框架，使我们能够将准确性从49.23％提高到99.9％。

translated by 谷歌翻译

Applications of Deep Learning in Fish Habitat Monitoring: A Tutorial and Survey

Alzayat Saleh , Marcus Sheaves , Dean Jerry , Mostafa Rahimi Azghadi

分类：计算机视觉

2022-06-11

海洋生态系统及其鱼类栖息地越来越重要，因为它们在提供有价值的食物来源和保护效果方面的重要作用。由于它们的偏僻且难以接近自然，因此通常使用水下摄像头对海洋环境和鱼类栖息地进行监测。这些相机产生了大量数字数据，这些数据无法通过当前的手动处理方法有效地分析，这些方法涉及人类观察者。 DL是一种尖端的AI技术，在分析视觉数据时表现出了前所未有的性能。尽管它应用于无数领域，但仍在探索其在水下鱼类栖息地监测中的使用。在本文中，我们提供了一个涵盖DL的关键概念的教程，该教程可帮助读者了解对DL的工作原理的高级理解。该教程还解释了一个逐步的程序，讲述了如何为诸如水下鱼类监测等挑战性应用开发DL算法。此外，我们还提供了针对鱼类栖息地监测的关键深度学习技术的全面调查，包括分类，计数，定位和细分。此外，我们对水下鱼类数据集进行了公开调查，并比较水下鱼类监测域中的各种DL技术。我们还讨论了鱼类栖息地加工深度学习的新兴领域的一些挑战和机遇。本文是为了作为希望掌握对DL的高级了解，通过遵循我们的分步教程而为其应用开发的海洋科学家的教程，并了解如何发展其研究，以促进他们的研究。努力。同时，它适用于希望调查基于DL的最先进方法的计算机科学家，以进行鱼类栖息地监测。

translated by 谷歌翻译

Computer Vision on X-ray Data in Industrial Production and Security Applications: A survey

Mehdi Rafiei , Jenni Raitoharju , Alexandros Iosifidis

分类：计算机视觉

2022-11-10

X-ray imaging technology has been used for decades in clinical tasks to reveal the internal condition of different organs, and in recent years, it has become more common in other areas such as industry, security, and geography. The recent development of computer vision and machine learning techniques has also made it easier to automatically process X-ray images and several machine learning-based object (anomaly) detection, classification, and segmentation methods have been recently employed in X-ray image analysis. Due to the high potential of deep learning in related image processing applications, it has been used in most of the studies. This survey reviews the recent research on using computer vision and machine learning for X-ray analysis in industrial production and security applications and covers the applications, techniques, evaluation metrics, datasets, and performance comparison of those techniques on publicly available datasets. We also highlight some drawbacks in the published research and give recommendations for future research in computer vision-based X-ray analysis.

translated by 谷歌翻译

A Review of Modern Approaches for Coronary Angiography Imaging Analysis

Maxim Popov , Temirgali Aimyshev , Eldar Ismailov , Ablay Bulegenov , Siamac Fazli

分类：计算机视觉

2022-09-28

冠心病（CHD）是现代世界中死亡的主要原因。用于诊断和治疗CHD的现代分析工具的开发正在从科学界受到极大的关注。基于深度学习的算法，例如分割网络和检测器，通过及时分析患者的血管造影来协助医疗专业人员，在协助医疗专业人员方面发挥着重要作用。本文着重于X射线冠状动脉造影（XCA），该血管造影被认为是CHD诊断和治疗中的“黄金标准”。首先，我们描述了XCA图像的公开可用数据集。然后，审查了图像预处理的经典和现代技术。此外，讨论了共同的框架选择技术，这是输入质量以及模型性能的重要因素。在以下两章中，我们讨论了现代血管分割和狭窄检测网络，最后是当前最新技术的开放问题和当前局限性。

translated by 谷歌翻译

RRWaveNet: A Compact End-to-End Multi-Scale Residual CNN for Robust PPG Respiratory Rate Estimation

Pongpanut Osathitporn , Guntitat Sawadwuthikul , Punnawish Thuwajit , Kawisara Ueafuea , Thee Mateepithaktham , Narin Kunaseth , Tanut Choksatchawathi , Proadpran Punyabukkana , Emmanuel Mignot , Theerawit Wilaiprasitporn

分类：人工智能 | 计算机视觉 | 机器学习

2022-08-18

呼吸率（RR）是重要的生物标志物，因为RR变化可以反映严重的医学事件，例如心脏病，肺部疾病和睡眠障碍。但是，不幸的是，标准手动RR计数容易出现人为错误，不能连续执行。这项研究提出了一种连续估计RR，RRWAVENET的方法。该方法是一种紧凑的端到端深度学习模型，不需要特征工程，可以将低成本的原始光摄影学（PPG）用作输入信号。对RRWAVENET进行了独立于主题的测试，并与三个数据集（BIDMC，Capnobase和Wesad）中的基线进行了比较，并使用三个窗口尺寸（16、32和64秒）进行了比较。 RRWAVENET优于最佳窗口大小为1.66 \ pm 1.01、1.59 \ pm 1.08的最佳绝对错误的最新方法，每个数据集每分钟每分钟呼吸0.96。在远程监视设置（例如在WESAD数据集中），我们将传输学习应用于其他两个ICU数据集，将MAE降低到1.52 \ pm每分钟0.50呼吸，显示此模型可以准确且实用的RR对负担得起的可穿戴设备进行准确估算。我们的研究表明，在远程医疗和家里，远程RR监测的可行性。

translated by 谷歌翻译

Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep Learning

Alexandru Munteanu , Marian Neagul

分类：计算机视觉 | 人工智能

2022-09-28

近年来，地理空间行业一直在稳定发展。这种增长意味着增加卫星星座，每天都会产生大量的卫星图像和其他遥感数据。有时，这些信息，即使在某些情况下我们指的是公开可用的数据，由于它的大小，它也无法占据。从时间和其他资源的角度来看，借助人工或使用传统的自动化方法来处理如此大量的数据并不总是可行的解决方案。在目前的工作中，我们提出了一种方法，用于创建一个由公开可用的遥感数据组成的多模式和时空数据集，并使用ART机器学习（ML）技术进行可行性进行测试。确切地说，卷积神经网络（CNN）模型的用法能够分离拟议数据集中存在的不同类别的植被。在地理信息系统（GIS）和计算机视觉（CV）的背景下，类似方法的受欢迎程度和成功更普遍地表明，应考虑并进一步分析和开发方法。

translated by 谷歌翻译

Intelligent 3D Network Protocol for Multimedia Data Classification using Deep Learning

Arslan Syed , Eman A. Aldhahri , Muhammad Munawar Iqbal , Abid Ali , Ammar Muthanna , Harun Jamil , Faisal Jamil

分类：计算机视觉 | 人工智能

2022-07-23

在视频中，人类的行为是三维（3D）信号。这些视频研究了人类行为的时空知识。使用3D卷积神经网络（CNN）研究了有希望的能力。 3D CNN尚未在静止照片中为其建立良好的二维（2D）等效物获得高输出。董事会3D卷积记忆和时空融合面部训练难以防止3D CNN完成非凡的评估。在本文中，我们实施了混合深度学习体系结构，该体系结构结合了Stip和3D CNN功能，以有效地增强3D视频的性能。实施后，在每个时空融合圈中进行训练的较详细和更深的图表。训练模型在处理模型的复杂评估后进一步增强了结果。视频分类模型在此实现模型中使用。引入了使用深度学习的多媒体数据分类的智能3D网络协议，以进一步了解人类努力中的时空关联。在实施结果时，著名的数据集（即UCF101）评估了提出的混合技术的性能。结果击败了提出的混合技术，该混合动力技术基本上超过了最初的3D CNN。将结果与文献的最新框架进行比较，以识别UCF101的行动识别，准确度为95％。

translated by 谷歌翻译

1-Dimensional polynomial neural networks for audio signal related problems

Habib Ben Abdallah , Christopher J. Henry , Sheela Ramanna

分类：机器学习

2020-09-09

除了极其非线性的情况外，如果不是数十亿个参数来解决或至少要获得良好的解决方案，并且众所周知，众所周知，众所周知，并且通过深化和扩大其拓扑来实现复杂性的神经网络增加更好近似所需的非线性水平。然而，紧凑的拓扑始终优先于更深的拓扑，因为它们提供了使用较少计算单元和更少参数的优势。这种兼容性以减少的非线性的价格出现，因此有限的解决方案搜索空间。我们提出了使用自动多项式内核估计的1维多项式神经网络（1DPNN）模型，用于1维卷积神经网络（1dcnns），并且从第一层引入高度的非线性，这可以补偿深度的需要和/或宽拓扑。我们表明，这种非线性使得模型能够产生比与音频信号相关的各种分类和回归问题的常规1dcnn的计算和空间复杂性更好的结果，即使它在神经元水平上引入了更多的计算和空间复杂性。实验在三个公共数据集中进行，并证明，在解决的问题上，所提出的模型可以在更少的时间内从数据中提取比1dcnn更多的相关信息，并且存储器较少。

translated by 谷歌翻译

Deep learning and machine learning for Malaria detection: overview, challenges and future directions

Imen Jdey , Ghazala Hcini , Hela Ltifi

分类：机器学习 | 人工智能

2022-09-27

为了产生最大的影响，必须使用基于证据的决策制定公共卫生计划。创建机器学习算法是为了收集，存储，处理和分析数据以提供知识和指导决策。任何监视系统的关键部分是图像分析。截至最近，计算机视觉和机器学习的社区最终对此感到好奇。这项研究使用各种机器学习和图像处理方法来检测和预测疟疾疾病。在我们的研究中，我们发现了深度学习技术作为具有更广泛适用于疟疾检测的智能工具的潜力，通过协助诊断病情，可以使医生受益。我们研究了针对计算机框架和组织的深度学习的共同限制，计算需要准备数据，准备开销，实时执行和解释能力，并发现对这些限制的轴承的未来询问。

translated by 谷歌翻译

Automatic Detection of Aedes aegypti Breeding Grounds Based on Deep Networks with Spatio-Temporal Consistency

Wesley L. Passos , Gabriel M. Araujo , Amaro A. de Lima , Sergio L. Netto , Eduardo A. B. da Silva

分类：计算机视觉

2020-07-29

每年，AEDESAEGYPTI蚊子都感染了数百万人，如登录，ZIKA，Chikungunya和城市黄热病等疾病。战斗这些疾病的主要形式是通过寻找和消除潜在的蚊虫养殖场来避免蚊子繁殖。在这项工作中，我们介绍了一个全面的空中视频数据集，获得了无人驾驶飞行器，含有可能的蚊帐。使用识别所有感兴趣对象的边界框手动注释视频数据集的所有帧。该数据集被用于开发基于深度卷积网络的这些对象的自动检测系统。我们提出了通过在可以注册检测到的对象的时空检测管道的对象检测流水线中的融合来利用视频中包含的时间信息，这些时间是可以注册检测到的对象的，最大限度地减少最伪正和假阴性的出现。此外，我们通过实验表明使用视频比仅使用框架对马赛克组成马赛克更有利。使用Reset-50-FPN作为骨干，我们可以分别实现0.65和0.77的F $ _1 $ -70分别对“轮胎”和“水箱”的对象级别检测，说明了正确定位潜在蚊子的系统能力育种对象。

translated by 谷歌翻译

Modelling Patient Trajectories Using Multimodal Information

João Figueira Silva , Sérgio Matos

分类：机器学习

2022-09-09

电子健康记录（EHRS）在患者级别汇总了多种信息，并保留了整个时间内患者健康状况进化的轨迹代表。尽管此信息提供了背景，并且可以由医生利用以监控患者的健康并进行更准确的预后/诊断，但患者记录可以包含长期跨度的信息，这些信息与快速生成的医疗数据速率相结合，使临床决策变得更加复杂。患者轨迹建模可以通过以可扩展的方式探索现有信息来帮助，并可以通过促进预防医学实践来增强医疗保健质量。我们为建模患者轨迹提出了一种解决方案，该解决方案结合了不同类型的信息并考虑了临床数据的时间方面。该解决方案利用了两种不同的架构：一组支持灵活的输入功能集，以将患者的录取转换为密集的表示；以及在基于复发的架构中进行的第二次探索提取的入院表示，其中使用滑动窗口机制在子序列中处理患者轨迹。使用公开可用的模仿III临床数据库评估了开发的解决方案，以两种不同的临床结果，意外的患者再入院和疾病进展。获得的结果证明了第一个体系结构使用单个患者入院进行建模和诊断预测的潜力。虽然临床文本中的信息并未显示在其他现有作品中观察到的判别能力，但这可以通过微调临床模型来解释。最后，我们使用滑动窗口机制来表示基于序列的体系结构的潜力，以表示输入数据，从而获得与其他现有解决方案的可比性能。

translated by 谷歌翻译

A Comparison Study of Deep CNN Architecture in Detecting of Pneumonia

Al Mohidur Rahman Porag , Md. Mahedi Hasan , Dr. Md Taimur Ahad

分类：计算机视觉 | 机器学习

2022-12-30

Pneumonia, a respiratory infection brought on by bacteria or viruses, affects a large number of people, especially in developing and impoverished countries where high levels of pollution, unclean living conditions, and overcrowding are frequently observed, along with insufficient medical infrastructure. Pleural effusion, a condition in which fluids fill the lung and complicate breathing, is brought on by pneumonia. Early detection of pneumonia is essential for ensuring curative care and boosting survival rates. The approach most usually used to diagnose pneumonia is chest X-ray imaging. The purpose of this work is to develop a method for the automatic diagnosis of bacterial and viral pneumonia in digital x-ray pictures. This article first presents the authors' technique, and then gives a comprehensive report on recent developments in the field of reliable diagnosis of pneumonia. In this study, here tuned a state-of-the-art deep convolutional neural network to classify plant diseases based on images and tested its performance. Deep learning architecture is compared empirically. VGG19, ResNet with 152v2, Resnext101, Seresnet152, Mobilenettv2, and DenseNet with 201 layers are among the architectures tested. Experiment data consists of two groups, sick and healthy X-ray pictures. To take appropriate action against plant diseases as soon as possible, rapid disease identification models are preferred. DenseNet201 has shown no overfitting or performance degradation in our experiments, and its accuracy tends to increase as the number of epochs increases. Further, DenseNet201 achieves state-of-the-art performance with a significantly a smaller number of parameters and within a reasonable computing time. This architecture outperforms the competition in terms of testing accuracy, scoring 95%. Each architecture was trained using Keras, using Theano as the backend.

translated by 谷歌翻译

Automated pharyngeal phase detection and bolus localization in videofluoroscopic swallowing study: Killing two birds with one stone?

Andrea Bandini , Sana Smaoui , Catriona M. Steele

分类：计算机视觉

2021-11-08

荧光吞咽研究（VFSS）是一种用于评估吞咽的金标成像技术，但VFSS录音的分析和评级是耗时，需要专门的培训和专业知识。研究人员已经证明，可以通过计算机视觉方法自动检测吞咽的咽部阶段，并通过计算机视觉方法本地化推注中的推注，促进新颖的自动VFSS分析技术的开发。但是，培训算法以执行这些任务需要很少可用的大量注释数据。我们证明，可以使用单一方法在一起解决咽期检测和推注定位的挑战。我们提出了一个深入学习的框架，以弱监督的方式共同解决咽期检测和推注定位，只需要临时阶段的初始和最终框架作为培训的地面真理注释。我们的方法源于观察结果，即咽部中的推注存在是最突出的视觉特征，在其上推断单个VFSS帧是否属于咽部阶段。我们在来自59个健康受试者的1245 VFS剪辑的数据集中进行了大量卷积神经网络（CNNS）进行了广泛的实验。我们证明，可以检测咽部阶段，其F1分数高于0.9。此外，通过处理CNN的类激活图，我们能够通过有前途的结果本地化推注，从未获得高于0.9的地面真理轨迹的相关性，而无需用于训练目的的推注定位的任何手动注释。一旦验证了吞咽障碍的更大的参与者样本，我们的框架将为VFSS分析开发智能工具的开发，以支持临床医生吞咽评估。

translated by 谷歌翻译

Towards deep observation: A systematic survey on artificial intelligence techniques to monitor fetus via Ultrasound Images

Mahmood Alzubaidi , Marco Agus , Khalid Alyafei , Khaled A Althelaya , Uzair Shah , Alaa Abd-Alrazaq , Mohammed Anbar , Michel Makhlouf , Mowafa Househ

分类：机器学习 | 计算机视觉

2022-01-17

开发旨在增强胎儿监测的创新信息学方法是生殖医学研究的新领域。已经对人工智能（AI）技术进行了几项评论，以改善妊娠结局。他们的限制是专注于特定数据，例如怀孕期间母亲的护理。这项系统的调查旨在探讨人工智能（AI）如何通过超声（US）图像帮助胎儿生长监测。我们使用了八个医学和计算机科学书目数据库，包括PubMed，Embase，Psycinfo，ScienceDirect，IEEE Explore，ACM图书馆，Google Scholar和Web of Science。我们检索了2010年至2021年之间发表的研究。从研究中提取的数据是使用叙述方法合成的。在1269项检索研究中，我们包括了107项与调查中有关该主题的查询的不同研究。我们发现，与3D和4D超声图像（n = 19）相比，2D超声图像更受欢迎（n = 88）。分类是最常用的方法（n = 42），其次是分割（n = 31），与分割（n = 16）集成的分类和其他其他杂项，例如对象检测，回归和增强学习（n = 18）。妊娠结构域中最常见的区域是胎儿头（n = 43），然后是胎儿（n = 31），胎儿心脏（n = 13），胎儿腹部（n = 10），最后是胎儿的面孔（n = 10）。在最近的研究中，深度学习技术主要使用（n = 81），其次是机器学习（n = 16），人工神经网络（n = 7）和增强学习（n = 2）。 AI技术在预测胎儿疾病和鉴定怀孕期间胎儿解剖结构中起着至关重要的作用。需要进行更多的研究来从医生的角度验证这项技术，例如试点研究和有关AI及其在医院环境中的应用的随机对照试验。

translated by 谷歌翻译

A lightweight hybrid CNN-LSTM model for ECG-based arrhythmia detection

Negin Alamatsaz , Leyla s Tabatabaei , Mohammadreza Yazdchi , Hamidreza Payan , Nima Alamatsaz , Fahimeh Nasimi

分类：机器学习

2022-08-29

心电图（ECG）是用于监测心脏电信号和评估其功能的最常见和常规诊断工具。人心脏可能患有多种疾病，包括心律不齐。心律不齐是一种不规则的心律，在严重的情况下会导致心脏中风，可以通过ECG记录诊断。由于早期发现心律不齐非常重要，因此在过去的几十年中，计算机化和自动化的分类以及这些异常心脏信号的识别引起了很多关注。方法：本文引入了一种轻度的深度学习方法，以高精度检测8种不同的心律不齐和正常节奏。为了利用深度学习方法，将重新采样和基线徘徊清除技术应用于ECG信号。在这项研究中，将500个样本ECG段用作模型输入。节奏分类是通过11层网络以端到端方式完成的，而无需手工制作的手动功能提取。结果：为了评估提出的技术，从两个Physionet数据库，MIT-BIH心律失常数据库和长期AF数据库中选择了ECG信号。基于卷积神经网络（CNN）和长期记忆（LSTM）的组合，提出的深度学习框架比大多数最先进的方法显示出令人鼓舞的结果。所提出的方法达到98.24％的平均诊断准确性。结论：成功开发和测试了使用多种心电图信号的心律失常分类的训练有素的模型。意义：由于本工作使用具有高诊断精度的光分类技术与其他值得注意的方法相比，因此可以在Holter Monitor设备中成功实施以进行心律失常检测。

translated by 谷歌翻译

The Prominence of Artificial Intelligence in COVID-19

MD Abdullah Al Nasim , Aditi Dhali , Faria Afrin , Noshin Tasnim Zaman , Nazmul Karim

分类：机器学习 | 人工智能

2021-11-18

2019年12月，一个名为Covid-19的新型病毒导致了迄今为止的巨大因果关系。与新的冠状病毒的战斗在西班牙语流感后令人振奋和恐怖。虽然前线医生和医学研究人员在控制高度典型病毒的传播方面取得了重大进展，但技术也证明了在战斗中的重要性。此外，许多医疗应用中已采用人工智能，以诊断许多疾病，甚至陷入困境的经验丰富的医生。因此，本调查纸探讨了提议的方法，可以提前援助医生和研究人员，廉价的疾病诊断方法。大多数发展中国家难以使用传统方式进行测试，但机器和深度学习可以采用显着的方式。另一方面，对不同类型的医学图像的访问已经激励了研究人员。结果，提出了一种庞大的技术数量。本文首先详细调了人工智能域中传统方法的背景知识。在此之后，我们会收集常用的数据集及其用例日期。此外，我们还显示了采用深入学习的机器学习的研究人员的百分比。因此，我们对这种情况进行了彻底的分析。最后，在研究挑战中，我们详细阐述了Covid-19研究中面临的问题，我们解决了我们的理解，以建立一个明亮健康的环境。

translated by 谷歌翻译

Integrating Deep Learning and Augmented Reality to Enhance Situational Awareness in Firefighting Environments

Manish Bhattarai

分类：计算机视觉

2021-07-23

我们提出了一种新的四管齐下的方法，在文献中首次建立消防员的情境意识。我们构建了一系列深度学习框架，彼此之叠，以提高消防员在紧急首次响应设置中进行的救援任务的安全性，效率和成功完成。首先，我们使用深度卷积神经网络（CNN）系统，以实时地分类和识别来自热图像的感兴趣对象。接下来，我们将此CNN框架扩展了对象检测，跟踪，分割与掩码RCNN框架，以及具有多模级自然语言处理（NLP）框架的场景描述。第三，我们建立了一个深入的Q学习的代理，免受压力引起的迷失方向和焦虑，能够根据现场消防环境中观察和存储的事实来制定明确的导航决策。最后，我们使用了一种低计算无监督的学习技术，称为张量分解，在实时对异常检测进行有意义的特征提取。通过这些临时深度学习结构，我们建立了人工智能系统的骨干，用于消防员的情境意识。要将设计的系统带入消防员的使用，我们设计了一种物理结构，其中处理后的结果被用作创建增强现实的投入，这是一个能够建议他们所在地的消防员和周围的关键特征，这对救援操作至关重要在手头，以及路径规划功能，充当虚拟指南，以帮助迷彩的第一个响应者恢复安全。当组合时，这四种方法呈现了一种新颖的信息理解，转移和综合方法，这可能会大大提高消防员响应和功效，并降低寿命损失。

translated by 谷歌翻译

Automatic COVID-19 disease diagnosis using 1D convolutional neural network and augmentation with human respiratory sound based on parameters: cough, breath, and voice

Kranthi Kumar Lella , Alphonse Pja

分类：机器学习

2021-12-14

呼吸声分类中的问题已在去年的临床科学家和医学研究员团体中获得了良好的关注，以诊断Covid-19疾病。迄今为止，各种模型的人工智能（AI）进入了现实世界，从人类生成的声音等人生成的声音中检测了Covid-19疾病，例如语音/言语，咳嗽和呼吸。实现卷积神经网络（CNN）模型，用于解决基于人工智能（AI）的机器上的许多真实世界问题。在这种情况下，建议并实施一个维度（1D）CNN，以诊断Covid-19的呼吸系统疾病，例如语音，咳嗽和呼吸。应用基于增强的机制来改善Covid-19声音数据集的预处理性能，并使用1D卷积网络自动化Covid-19疾病诊断。此外，使用DDAE（数据去噪自动编码器）技术来产生诸如输入功能的深声特征，而不是采用MFCC（MEL频率跳跃系数）的标准输入，并且它更好地执行比以前的型号的准确性和性能。

translated by 谷歌翻译