智能论文笔记

Mythological Medical Machine Learning: Boosting the Performance of a Deep Learning Medical Data Classifier Using Realistic Physiological Models

Ismail Sadiq , Erick A. Perez-Alday , Amit J. Shah , Ali Bahrami Rad , Reza Sameni , Gari D. Clifford

分类：机器学习

2021-12-28

目的：确定逼真，但是电磁图的计算上有效模型可用于预先列车，具有广泛的形态和特定于给定条件的形态和异常 - T波段（TWA）由于创伤后应激障碍，或重点 - 在稀有人的小型数据库上显着提高了性能。方法：使用先前经过验证的人工ECG模型，我们生成了180,000人的人工ECG，有或没有重要的TWA，具有不同的心率，呼吸率，TWA幅度和ECG形态。在70,000名患者中培训的DNN进行分类为25种不同的节奏，将输出层修改为二进制类（TWA或NO-TWA，或等效，PTSD或NO-PTSD），并对人工ECG进行转移学习。在最终转移学习步骤中，DNN在ECG的培训和交叉验证，从12个PTE和24个控件，用于使用三个数据库的所有组合。主要结果：通过进行转移学习步骤，使用预先培训的心律失常DNN，人工数据和真实的PTSD相关的心电图数据，发现了最佳性能的方法（AUROC = 0.77，精度= 0.72，F1-SCATE = 0.64）。从训练中删除人工数据导致性能的最大下降。从培训中取出心律失常数据提供了适度但重要的，表现下降。最终模型在人工数据上显示出在性能下没有显着下降，表明没有过度拟合。意义：在医疗保健中，通常只有一小部分高质量数据和标签，或更大的数据库，质量较低（和较差的相关）标签。这里呈现的范式，涉及基于模型的性能提升，通过在大型现实人工数据库和部分相关的真实数据库上传输学习来提供解决方案。

translated by 谷歌翻译

Training neural networks with synthetic electrocardiograms

Matti Kaisti , Juho Laitala , Antti Airola

分类：机器学习 | 人工智能

2021-11-11

我们提出了一种用合成心电图训练神经网络的方法，其模拟可穿戴单引线心电图监测器产生的模拟信号。我们使用域随机化，其中对于每个训练示例，诸如波形形状，RR间隔和噪声之类的合成信号属性。使用合成数据培训的模型与具有真实数据训练的对应物进行比较。在不同物理活性和心房颤动期间记录的心电图中的R波检测用于比较模型。通过允许随机化超出现实数据中通常观察到的内容，性能是对具有实际数据训练的网络的性能的par或取代。实验表明，在不同的测试集上具有不同的种子和训练示例，而无需任何测试设定特定调谐。该方法可以使用实际上自由收集数据与准确的标签一起培训神经网络，无需手动注释，并且当使用疾病使用疾病特定的先验信息时，它会开辟了在心脏病分类上延长使用的合成数据的可能性在心电图一代。另外，可以控制数据的分布消除通常在健康相关数据中观察到的类别不平衡，并且另外，生成的数据本质上是私有的。

translated by 谷歌翻译

Deep conv-attention model for diagnosing left bundle branch block from 12-lead electrocardiograms

Alireza Sadeghi , Alireza Rezaee , Farshid Hajati

分类：机器学习

2022-12-07

Cardiac resynchronization therapy (CRT) is a treatment that is used to compensate for irregularities in the heartbeat. Studies have shown that this treatment is more effective in heart patients with left bundle branch block (LBBB) arrhythmia. Therefore, identifying this arrhythmia is an important initial step in determining whether or not to use CRT. On the other hand, traditional methods for detecting LBBB on electrocardiograms (ECG) are often associated with errors. Thus, there is a need for an accurate method to diagnose this arrhythmia from ECG data. Machine learning, as a new field of study, has helped to increase human systems' performance. Deep learning, as a newer subfield of machine learning, has more power to analyze data and increase systems accuracy. This study presents a deep learning model for the detection of LBBB arrhythmia from 12-lead ECG data. This model consists of 1D dilated convolutional layers. Attention mechanism has also been used to identify important input data features and classify inputs more accurately. The proposed model is trained and validated on a database containing 10344 12-lead ECG samples using the 10-fold cross-validation method. The final results obtained by the model on the 12-lead ECG data are as follows. Accuracy: 98.80+-0.08%, specificity: 99.33+-0.11 %, F1 score: 73.97+-1.8%, and area under the receiver operating characteristics curve (AUC): 0.875+-0.0192. These results indicate that the proposed model in this study can effectively diagnose LBBB with good efficiency and, if used in medical centers, will greatly help diagnose this arrhythmia and early treatment.

translated by 谷歌翻译

A lightweight hybrid CNN-LSTM model for ECG-based arrhythmia detection

Negin Alamatsaz , Leyla s Tabatabaei , Mohammadreza Yazdchi , Hamidreza Payan , Nima Alamatsaz , Fahimeh Nasimi

分类：机器学习

2022-08-29

心电图（ECG）是用于监测心脏电信号和评估其功能的最常见和常规诊断工具。人心脏可能患有多种疾病，包括心律不齐。心律不齐是一种不规则的心律，在严重的情况下会导致心脏中风，可以通过ECG记录诊断。由于早期发现心律不齐非常重要，因此在过去的几十年中，计算机化和自动化的分类以及这些异常心脏信号的识别引起了很多关注。方法：本文引入了一种轻度的深度学习方法，以高精度检测8种不同的心律不齐和正常节奏。为了利用深度学习方法，将重新采样和基线徘徊清除技术应用于ECG信号。在这项研究中，将500个样本ECG段用作模型输入。节奏分类是通过11层网络以端到端方式完成的，而无需手工制作的手动功能提取。结果：为了评估提出的技术，从两个Physionet数据库，MIT-BIH心律失常数据库和长期AF数据库中选择了ECG信号。基于卷积神经网络（CNN）和长期记忆（LSTM）的组合，提出的深度学习框架比大多数最先进的方法显示出令人鼓舞的结果。所提出的方法达到98.24％的平均诊断准确性。结论：成功开发和测试了使用多种心电图信号的心律失常分类的训练有素的模型。意义：由于本工作使用具有高诊断精度的光分类技术与其他值得注意的方法相比，因此可以在Holter Monitor设备中成功实施以进行心律失常检测。

translated by 谷歌翻译

Application of federated learning techniques for arrhythmia classification using 12-lead ECG signals

Daniel Mauricio Jimenez Gutierrez , Hafiz Muuhammad Hassan , Lorella Landi , Andrea Vitaletti , Ioannis Chatzigiannakis

分类：机器学习

2022-08-23

背景：基于AI的足够大型，精心策划的医疗数据集的分析已被证明有望提供早期检测，更快的诊断，更好的决策和更有效的治疗方法。但是，从多种来源获得的如此高度机密且非常敏感的医疗数据通常受到高度限制，因为不当使用，不安全的存储，数据泄漏或滥用可能侵犯了一个人的隐私。在这项工作中，我们将联合学习范式应用于异质的，孤立的高清心电图集，该图从12铅的ECG传感器阵列到达来训练AI模型。与在中心位置收集相同的数据时，我们评估了所得模型的能力，与经过训练的最新模型相比，获得了等效性能。方法：我们提出了一种基于联合学习范式训练AI模型的隐私方法，以培训AI模型，以实现异质，分布式，数据集。该方法应用于基于梯度增强，卷积神经网络和具有长期短期记忆的复发神经网络的广泛机器学习技术。这些模型在一个心电图数据集上进行了培训，该数据集包含从六名地理分开和异质来源的43,059名患者收集的12个铅录音。研究结果：用于检测心血管异常的AI模型的结果集获得了与使用集中学习方法训练的模型相当的预测性能。解释：计算参数的方法在本地为全局模型做出了贡献，然后仅交换此类参数，而不是ML中的整个敏感数据，这有助于保留医疗数据隐私。

translated by 谷歌翻译

On Merging Feature Engineering and Deep Learning for Diagnosis, Risk-Prediction and Age Estimation Based on the 12-Lead ECG

Eran Zvuloni , Jesse Read , Antônio H. Ribeiro , Antonio Luiz P. Ribeiro , Joachim A. Behar

分类：机器学习

2022-07-13

目的：机器学习技术已广泛用于12铅心电图（ECG）分析。对于生理时间序列，基于领域知识的深度学习（DL）优势（FE）方法仍然是一个悬而未决的问题。此外，尚不清楚将DL与FE结合起来是否可以提高性能。方法：我们考虑了要解决这些研究差距的三个任务：心律不齐的诊断（多类 - 甲状腺素分类），房颤风险预测（二进制分类）和年龄估计（回归）。我们使用2.3m 12铅ECG录音的总体数据集来培训每个任务的以下模型：i）随机森林将FE作为输入作为经典的机器学习方法培训； ii）端到端DL模型； iii）Fe+DL的合并模型。结果：FE得出的结果与DL产生了可比的结果，同时需要较少的两个分类任务数据，并且对于回归任务而言，DL的表现优于DL。对于所有任务，将FE与DL合并并不能单独提高DL的性能。结论：我们发现，对于传统的12铅ECG诊断任务，DL并未对FE产生有意义的改进，而它显着改善了非传统回归任务。我们还发现，将FE与DL相结合并不能单独改善DL，这表明FE与DL学到的功能是多余的。意义：我们的发现提供了有关哪种机器学习策略和数据制度的重要建议，可以选择基于12 Lead ECG开发新机器学习模型的任务。

translated by 谷歌翻译

MedalCare-XL: 16,900 healthy and pathological 12 lead ECGs obtained through electrophysiological simulations

Karli Gillette , Matthias A. F. Gsell , Claudia Nagel , Jule Bender , Bejamin Winkler , Steven E. Williams , Markus Bär , Tobias Schäffter , Olaf Dössel , Gernot Plank

分类：机器学习

2022-11-29

Mechanistic cardiac electrophysiology models allow for personalized simulations of the electrical activity in the heart and the ensuing electrocardiogram (ECG) on the body surface. As such, synthetic signals possess known ground truth labels of the underlying disease and can be employed for validation of machine learning ECG analysis tools in addition to clinical signals. Recently, synthetic ECGs were used to enrich sparse clinical data or even replace them completely during training leading to improved performance on real-world clinical test data. We thus generated a novel synthetic database comprising a total of 16,900 12 lead ECGs based on electrophysiological simulations equally distributed into healthy control and 7 pathology classes. The pathological case of myocardial infraction had 6 sub-classes. A comparison of extracted features between the virtual cohort and a publicly available clinical ECG database demonstrated that the synthetic signals represent clinical ECGs for healthy and pathological subpopulations with high fidelity. The ECG database is split into training, validation, and test folds for development and objective assessment of novel machine learning algorithms.

translated by 谷歌翻译

Generalizable and Robust Deep Learning Algorithm for Atrial Fibrillation Diagnosis Across Ethnicities, Ages and Sexes

Shany Biton , Mohsin Aldhafeeri , Erez Marcusohn , Kenta Tsutsui , Tom Szwagier , Adi Elias , Julien Oster , Jean Marc Sellal , Mahmoud Suleiman , Joachim A. Behar

分类：机器学习 | 人工智能

2022-07-20

为了推动满足所有人需求并使医疗保健民主化的健康创新，有必要评估各种分配转变的深度学习（DL）算法的概括性能，以确保这些算法具有强大的态度。据我们所知，这项回顾性研究是第一个开发和评估从跨种族，年龄和性别的长期跳动间隔的AF事件检测的深度学习模型（DL）模型的概括性能（DL）模型的概括。新的复发DL模型（表示为ARNET2）是在2,147名患者的大型回顾性数据集中开发的，总计51,386小时连续心电图（ECG）。对来自四个中心（美国，以色列，日本和中国）的手动注释测试集评估了模型的概括，总计402名患者。该模型在以色列海法的Rambam医院Holter Clinic的1,730个Consecutives Holter记录中进一步验证了该模型。该模型的表现优于最先进的模型，并且在种族，年龄和性别之间进行了广泛的良好。女性的表现高于男性和年轻人（不到60岁），并且在种族之间显示出一些差异。解释这些变化的主要发现是心房颤动患病率更高（AFL）的群体的性能受损。我们关于跨组的ARNET2相对性能的发现可能对选择相对于感兴趣群的首选AF检查方法具有临床意义。

translated by 谷歌翻译

Project Achoo: A Practical Model and Application for COVID-19 Detection from Recordings of Breath, Voice, and Cough

Alexander Ponomarchuk , Ilya Burenko , Elian Malkin , Ivan Nazarov , Vladimir Kokh , Manvel Avetisian , Leonid Zhukov

分类：机器学习

2021-07-12

Covid-19大流行为感染检测和监测解决方案产生了重大的兴趣和需求。在本文中，我们提出了一种机器学习方法，可以使用在消费者设备上进行的录音来快速分离Covid-19。该方法将信号处理方法与微调深层学习网络相结合，提供了信号去噪，咳嗽检测和分类的方法。我们还开发并部署了一个移动应用程序，使用症状检查器与语音，呼吸和咳嗽信号一起使用，以检测Covid-19感染。该应用程序对两个开放的数据集和最终用户在测试版测试期间收集的嘈杂数据显示了鲁棒性能。

translated by 谷歌翻译

A Comparison Study of Deep CNN Architecture in Detecting of Pneumonia

Al Mohidur Rahman Porag , Md. Mahedi Hasan , Dr. Md Taimur Ahad

分类：计算机视觉 | 机器学习

2022-12-30

Pneumonia, a respiratory infection brought on by bacteria or viruses, affects a large number of people, especially in developing and impoverished countries where high levels of pollution, unclean living conditions, and overcrowding are frequently observed, along with insufficient medical infrastructure. Pleural effusion, a condition in which fluids fill the lung and complicate breathing, is brought on by pneumonia. Early detection of pneumonia is essential for ensuring curative care and boosting survival rates. The approach most usually used to diagnose pneumonia is chest X-ray imaging. The purpose of this work is to develop a method for the automatic diagnosis of bacterial and viral pneumonia in digital x-ray pictures. This article first presents the authors' technique, and then gives a comprehensive report on recent developments in the field of reliable diagnosis of pneumonia. In this study, here tuned a state-of-the-art deep convolutional neural network to classify plant diseases based on images and tested its performance. Deep learning architecture is compared empirically. VGG19, ResNet with 152v2, Resnext101, Seresnet152, Mobilenettv2, and DenseNet with 201 layers are among the architectures tested. Experiment data consists of two groups, sick and healthy X-ray pictures. To take appropriate action against plant diseases as soon as possible, rapid disease identification models are preferred. DenseNet201 has shown no overfitting or performance degradation in our experiments, and its accuracy tends to increase as the number of epochs increases. Further, DenseNet201 achieves state-of-the-art performance with a significantly a smaller number of parameters and within a reasonable computing time. This architecture outperforms the competition in terms of testing accuracy, scoring 95%. Each architecture was trained using Keras, using Theano as the backend.

translated by 谷歌翻译

Learning from few examples: Classifying sex from retinal images via deep learning

Aaron Berk , Gulcenur Ozturan , Parsa Delavari , David Maberley , Özgür Yılmaz , Ipek Oruc

分类：计算机视觉 | 机器学习

2022-07-20

深度学习对医学成像产生了极大的兴趣，特别是在使用卷积神经网络（CNN）来开发自动诊断工具方面。其非侵入性获取的设施使视网膜底面成像适合这种自动化方法。使用CNN分析底面图像的最新工作依靠访问大量数据进行培训和验证 - 成千上万的图像。但是，数据驻留和数据隐私限制阻碍了这种方法在患者机密性是任务的医疗环境中的适用性。在这里，我们展示了小型数据集上DL的性能的结果，以从眼睛图像中对患者性别进行分类 - 直到最近，底眼前图像中才出现或可量化的特征。我们微调了一个RESNET-152模型，其最后一层已修改以进行二进制分类。在几个实验中，我们使用一个私人（DOV）和一个公共（ODIR）数据源评估在小数据集上下文中的性能。我们的模型使用大约2500张底面图像开发，实现了高达0.72的AUC评分（95％CI：[0.67，0.77]）。尽管与文献中的先前工作相比，数据集大小降低了近1000倍，但这仅仅是降低25％的性能。即使从视网膜图像中进行性别分类等艰巨的任务，我们也会发现使用非常小的数据集可以进行分类。此外，我们在DOV和ODIR之间进行了域适应实验。探索数据策展对培训和概括性的影响；并调查模型结合在小型开发数据集中最大化CNN分类器性能。

translated by 谷歌翻译

SFF-DA: Sptialtemporal Feature Fusion for Detecting Anxiety Nonintrusively

Haimiao Mo , Yuchen Li , Shanlin Yang , Wei Zhang , Shuai Ding

分类：计算机视觉

2022-08-12

早期发现焦虑症对于减少精神障碍患者的苦难并改善治疗结果至关重要。基于MHealth平台的焦虑筛查在提高筛选效率和降低筛查成本方面具有特殊实用价值。实际上，受试者的身体和心理评估中移动设备的差异以及数据质量不均匀的问题和现实世界中数据的少量数据量使现有方法无效。因此，我们提出了一个基于时空特征融合的框架，用于非触发焦虑。为了降低数据质量不平衡的影响，我们构建了一个基于“ 3DCNN+LSTM”的特征提取网络，并融合了面部行为和非接触式生理学的时空特征。此外，我们设计了一种相似性评估策略，以解决较小的数据样本量导致模型准确性下降的问题。我们的框架已通过现实世界中的机组数据集进行了验证，并且两个公共数据集UBFC-Phys和Swell-KW。实验结果表明，我们框架的总体性能要比最新的比较方法更好。

translated by 谷歌翻译

ECG-Based Electrolyte Prediction: Evaluating Regression and Probabilistic Methods

Philipp Von Bachmann , Daniel Gedon , Fredrik K. Gustafsson , Antônio H. Ribeiro , Erik Lampa , Stefan Gustafsson , Johan Sundström , Thomas B. Schön

分类：计算机视觉 | 机器学习

2022-12-21

Objective: Imbalances of the electrolyte concentration levels in the body can lead to catastrophic consequences, but accurate and accessible measurements could improve patient outcomes. While blood tests provide accurate measurements, they are invasive and the laboratory analysis can be slow or inaccessible. In contrast, an electrocardiogram (ECG) is a widely adopted tool which is quick and simple to acquire. However, the problem of estimating continuous electrolyte concentrations directly from ECGs is not well-studied. We therefore investigate if regression methods can be used for accurate ECG-based prediction of electrolyte concentrations. Methods: We explore the use of deep neural networks (DNNs) for this task. We analyze the regression performance across four electrolytes, utilizing a novel dataset containing over 290000 ECGs. For improved understanding, we also study the full spectrum from continuous predictions to binary classification of extreme concentration levels. To enhance clinical usefulness, we finally extend to a probabilistic regression approach and evaluate different uncertainty estimates. Results: We find that the performance varies significantly between different electrolytes, which is clinically justified in the interplay of electrolytes and their manifestation in the ECG. We also compare the regression accuracy with that of traditional machine learning models, demonstrating superior performance of DNNs. Conclusion: Discretization can lead to good classification performance, but does not help solve the original problem of predicting continuous concentration levels. While probabilistic regression demonstrates potential practical usefulness, the uncertainty estimates are not particularly well-calibrated. Significance: Our study is a first step towards accurate and reliable ECG-based prediction of electrolyte concentration levels.

translated by 谷歌翻译

Atrial Fibrillation Recurrence Risk Prediction from 12-lead ECG Recorded Pre- and Post-Ablation Procedure

Eran Zvuloni , Sheina Gendelman , Sanghamitra Mohanty , Jason Lewen , Andrea Natale , Joachim A. Behar

分类：机器学习

2022-08-22

简介：在房颤（AF）导管消融过程（CAP）期间记录了12条铅心电图（ECG）。如果没有长时间的随访评估AF复发（AFR），确定CAP是否成功并不容易。因此，AFR风险预测算法可以使CAP患者更好地管理。在这项研究中，我们从CAP前后记录的12铅ECG中提取功能，并训练AFR风险预测机学习模型。方法：从112例患者中提取前和后段段。该分析包括信号质量标准，心率变异性和由12铅ECG设计的形态生物标志物（总体804个功能）。在112名患者中，有43例AFR临床终点可用。这些用于使用前或后CAP特征来评估AFR风险预测的可行性。在嵌套的交叉验证框架内训练了一个随机的森林分类器。结果：发现36个特征在区分手术前和手术后具有统计学意义（n = 112）。对于分类，报告了接收器操作特性（AUROC）曲线下的区域，AUROC_PRE = 0.64，AUROC_POST = 0.74（n = 43）。讨论和结论：此初步分析表明AFR风险预测的可行性。这样的模型可用于改善盖帽管理。

translated by 谷歌翻译

Classification of animal sounds in a hyperdiverse rainforest using Convolutional Neural Networks

Yuren Sun , Tatiana Midori Maeda , Claudia Solis-Lemus , Daniel Pimentel-Alarcon , Zuzana Burivalova

分类：机器学习

2021-11-29

为了保护热带森林生物多样性，我们需要能够可靠，便宜地和规模地检测它。通过机器学习方法从被动录制的SoundScapes检测自动化物种是对此目标的有希望的技术，但它受到大型训练数据集的必要性。在婆罗洲的热带森林中使用Soundcapes和通过转移学习创建的卷积神经网络模型（CNN），我们调查I）最低可行训练数据集规模，用于准确预测呼叫类型（'Sonotypes'）和II）的程度数据增强可以克服小型训练数据集的问题。我们发现甚至相对较高的样本尺寸（每个呼叫类型）导致平庸的精度，然而，无论分类学组或呼叫特征如何，数据增强都会显着提高。我们的研究结果表明，即使对于具有许多罕见物种的小型Sountscape的项目，转移学习和数据增强可以使用CNN来分类物种的发声。我们的开源方法有可能使节约计划能够通过在生物多样性的自适应管理中使用Soundscape数据来实现更有证据。

translated by 谷歌翻译

Learning Realistic Patterns from Unrealistic Stimuli: Generalization and Data Anonymization

Konstantinos Nikolaidis , Stein Kristiansen , Thomas Plagemann , Vera Goebel , Knut Liestøl , Mohan Kankanhalli , Gunn Marit Traaen , Britt Øverland , Harriet Akre , Lars Aakerøy

分类：机器学习 | (统计)机器学习

2020-09-21

良好的培训数据是开发有用的ML应用程序的先决条件。但是，在许多域中，现有数据集不能由于隐私法规（例如，从医学研究）而被共享。这项工作调查了一种简单而非规范的方法，可以匿名数据综合来使第三方能够受益于此类私人数据。我们探讨了从不切实际，任务相关的刺激中隐含地学习的可行性，这通过激发训练有素的深神经网络（DNN）的神经元来合成。因此，神经元励磁用作伪生成模型。刺激数据用于培训新的分类模型。此外，我们将此框架扩展以抑制与特定个人相关的表示。我们使用开放和大型闭合临床研究的睡眠监测数据，并评估（1）最终用户是否可以创建和成功使用定制分类模型进行睡眠呼吸暂停检测，并且（2）研究中参与者的身份受到保护。广泛的比较实证研究表明，在刺激上培训的不同算法能够在与原始模型相同的任务上成功概括。然而，新和原始模型之间的架构和算法相似性在性能方面发挥着重要作用。对于类似的架构，性能接近使用真实数据（例如，精度差为0.56 \％，Kappa系数差为0.03-0.04）。进一步的实验表明，刺激可以在很大程度上成功地匿名匿名研究临床研究的参与者。

translated by 谷歌翻译

Analysis of an adaptive lead weighted ResNet for multiclass classification of 12-lead ECGs

Zhibin Zhao , Darcy Murphy , Hugh Gifford , Stefan Williams , Annie Darlington , Samuel D. Relton , Hui Fang , David C. Wong

分类：人工智能 | 机器学习

2021-12-01

背景：12个引线ECG是心血管疾病的核心诊断工具。在这里，我们描述并分析了一个集成的深度神经网络架构，从12个引导eCG分类了24个心脏异常。方法：我们提出了挤压和激发reset，以自动学习来自12个引主ECG的深度特征，以识别24个心脏病。在最终完全连接的层中，随着年龄和性别特征增强了深度特征。使用约束网格搜索设置每个类的输出阈值。为了确定为什么该模型的预测不正确，两个专家诊所人员独立地解释了一组关于左轴偏差的一次无序的ECG。结果：采用定制加权精度度量，我们达到了0.684的5倍交叉验证得分，灵敏度和特异性分别为0.758和0.969。我们在完整的测试数据中得分0.520，并在官方挑战排名中排名第21中。在一系列被错误分类的心电图中，两个临床医生和训练标签之间的协议差（临床医生1：Kappa = -0.057，临床医生2：Kappa = -0.159）。相比之下，临床医生之间的协议非常高（Kappa = 0.92）。讨论：与在相同数据上培训的模型相比，所提出的预测模型很好地对验证和隐藏的测试数据进行了良好。我们还发现培训标签的相当不一致，这可能会阻碍更准确的模型的开发。

translated by 谷歌翻译

A Semi-Supervised Algorithm for Improving the Consistency of Crowdsourced Datasets: The COVID-19 Case Study on Respiratory Disorder Classification

Lara Orlandic , Tomas Teijeiro , David Atienza

分类：人工智能

2022-09-09

咳嗽音频信号分类是筛查呼吸道疾病（例如COVID-19）的潜在有用工具。由于从这种传染性疾病的患者那里收集数据是危险的，因此许多研究团队已转向众包来迅速收集咳嗽声数据，因为它是为了生成咳嗽数据集的工作。 Coughvid数据集邀请专家医生诊断有限数量上传的记录中存在的潜在疾病。但是，这种方法遭受了咳嗽的潜在标签，以及专家之间的显着分歧。在这项工作中，我们使用半监督的学习（SSL）方法来提高咳嗽数据集的标签一致性以及COVID-19的鲁棒性与健康的咳嗽声音分类。首先，我们利用现有的SSL专家知识聚合技术来克服数据集中的标签不一致和稀疏性。接下来，我们的SSL方法用于识别可用于训练或增加未来咳嗽分类模型的重新标记咳嗽音频样本的子样本。证明了重新标记的数据的一致性，因为它表现出高度的类可分离性，尽管原始数据集中存在专家标签不一致，但它比用户标记的数据高3倍。此外，在重新标记的数据中放大了用户标记的音频段的频谱差异，从而导致健康和COVID-19咳嗽之间的功率频谱密度显着不同，这既证明了新数据集的一致性及其与新数据的一致性及其与新数据的一致性的提高，其解释性与其与其解释性的一致性相同。声学的观点。最后，我们演示了如何使用重新标记的数据集来训练咳嗽分类器。这种SSL方法可用于结合几位专家的医学知识，以提高任何诊断分类任务的数据库一致性。

translated by 谷歌翻译

The Prominence of Artificial Intelligence in COVID-19

MD Abdullah Al Nasim , Aditi Dhali , Faria Afrin , Noshin Tasnim Zaman , Nazmul Karim

分类：机器学习 | 人工智能

2021-11-18

2019年12月，一个名为Covid-19的新型病毒导致了迄今为止的巨大因果关系。与新的冠状病毒的战斗在西班牙语流感后令人振奋和恐怖。虽然前线医生和医学研究人员在控制高度典型病毒的传播方面取得了重大进展，但技术也证明了在战斗中的重要性。此外，许多医疗应用中已采用人工智能，以诊断许多疾病，甚至陷入困境的经验丰富的医生。因此，本调查纸探讨了提议的方法，可以提前援助医生和研究人员，廉价的疾病诊断方法。大多数发展中国家难以使用传统方式进行测试，但机器和深度学习可以采用显着的方式。另一方面，对不同类型的医学图像的访问已经激励了研究人员。结果，提出了一种庞大的技术数量。本文首先详细调了人工智能域中传统方法的背景知识。在此之后，我们会收集常用的数据集及其用例日期。此外，我们还显示了采用深入学习的机器学习的研究人员的百分比。因此，我们对这种情况进行了彻底的分析。最后，在研究挑战中，我们详细阐述了Covid-19研究中面临的问题，我们解决了我们的理解，以建立一个明亮健康的环境。

translated by 谷歌翻译

Synthetic Data in Human Analysis: A Survey

Indu Joshi , Marcel Grimmer , Christian Rathgeb , Christoph Busch , Francois Bremond , Antitza Dantcheva

分类：计算机视觉

2022-08-19

深度神经网络在人类分析中已经普遍存在，增强了应用的性能，例如生物识别识别，动作识别以及人重新识别。但是，此类网络的性能通过可用的培训数据缩放。在人类分析中，对大规模数据集的需求构成了严重的挑战，因为数据收集乏味，廉价，昂贵，并且必须遵守数据保护法。当前的研究研究了\ textit {合成数据}的生成，作为在现场收集真实数据的有效且具有隐私性的替代方案。这项调查介绍了基本定义和方法，在生成和采用合成数据进行人类分析时必不可少。我们进行了一项调查，总结了当前的最新方法以及使用合成数据的主要好处。我们还提供了公开可用的合成数据集和生成模型的概述。最后，我们讨论了该领域的局限性以及开放研究问题。这项调查旨在为人类分析领域的研究人员和从业人员提供。

translated by 谷歌翻译