ECG数据库通常由于正常的心电图和异常病例的稀缺性而高度不平衡。因此,经过不平衡数据集培训的深度学习分类器通常表现不佳,尤其是在次要课程上。一种解决方案是使用生成对抗网络(GAN)生成逼真的合成ECG信号,以增强数据集的不平衡数据集。在这项研究中,我们首次将条件GAN与WGAN-GAN结合在一起,并以1D形式开发了AC-WGAN-GP,以应用于MIT-BIH心律失常数据集。我们研究了数据增强对心律失常分类的影响。我们采用了两个模型进行心电图生成:(i)无条件的gan; Wasserstein gan具有梯度罚款(WGAN-GP)在每个班级上都受过训练; (ii)有条件的gan;一个辅助分类器WGAN-GP(AC-WGAN-GP)模型均在所有类别上训练,然后用于在所有类别中生成合成节拍。每种情况下定义了两种情况:(a)未经检查;使用了所有生成的合成节拍,并且(b)筛选;基于其动态时间翘曲(DTW)到指定模板,仅选择并使用了一部分生成的节拍。在每个增强数据集和性能指标(精确/召回/F1得分微型和宏观水平,混淆矩阵,多层级别的Precision-Recall Precall curves)中,对最先进的重新NET分类器(ECGRESNET34)进行了培训(precision/Recemision/Recker/F1得分微观和宏观分数)。与未表现不平衡案件的案件相比。我们还使用了简单的度量净改进。这三个指标始终显示出净改进(总和次级和次级),无条件的GAN具有原始生成的数据(未筛选)可创造最佳改进。
translated by 谷歌翻译
由于异常情况的稀缺性,心电图(ECG)数据集往往受到高度不平衡的。此外,由于隐私问题,使用真正的患者的心电图是高度监管的。因此,总是需要更多的ECG数据,特别是对于自动诊断机器学习模型的培训,这在培训在平衡数据集时更好地执行。我们研究了从生成的对抗网络(GAN)家庭的5种不同模型的合成ECG生成能力,并比较了它们的表演,焦点仅在正常的心脏周期上。动态时间翘曲(DTW),FR \'echet和欧几里德距离功能用于定量测量性能。提出并应用了评估生成节拍的五种不同方法。我们还提出了3个新概念(阈值,接受的节拍和生产率),并将其与上述方法一起作为一种系统的方式,以便在模型之间进行比较。结果表明,所有测试模型都可以在一定程度上成功地产生具有高相似性的可接受的心跳,在形态特征中具有高相似性,并且可能所有这些都可以使用它们来增强不平衡的数据集。然而,产生的节拍的目视检查有利于Bilstm-DC Gan和Wan,因为它们产生统计上更可接受的节拍。此外,关于生产率,经典GaN优越,生产率72%。
translated by 谷歌翻译
以时间序列形式出现的信号测量是医疗机学习应用中使用的最常见数据类型之一。这样的数据集的大小通常很小,收集和注释昂贵,并且可能涉及隐私问题,这阻碍了我们培训用于生物医学应用的大型,最先进的深度学习模型的能力。对于时间序列数据,我们可以用来扩展数据集大小的数据增强策略套件受到维护信号的基本属性的限制。生成对抗网络(GAN)可以用作另一种数据增强工具。在本文中,我们提出了TTS-CGAN,这是一种基于变压器的条件GAN模型,可以在现有的多级数据集上进行训练,并生成特定于类的合成时间序列序列的任意长度。我们详细介绍了模型架构和设计策略。由我们的模型生成的合成序列与真实的序列无法区分,可以用来补充或替换相同类型的真实信号,从而实现了数据增强的目标。为了评估生成的数据的质量,我们修改小波相干度量指标,以比较两组信号之间的相似性,还可以进行案例研究,其中使用合成和真实数据的混合来训练深度学习模型用于序列分类。与其他可视化技术和定性评估方法一起,我们证明TTS-CGAN生成的合成数据类似于真实数据,并且我们的模型的性能优于为时间序列数据生成而构建的其他最先进的GAN模型。
translated by 谷歌翻译
在过去的几十年中,数据科学领域已经存在着激烈的进展,而其他学科则不断受益于此。结构健康监测(SHM)是使用人工智能(AI)的那些领域之一,例如机器学习(ML)和深度学习(DL)算法,用于基于所收集的数据的民用结构的条件评估。 ML和DL方法需要大量的培训程序数据;但是,在SHM中,来自民间结构的数据收集非常详尽;特别是获得有用的数据(相关数据损坏)可能非常具有挑战性。本文使用1-D Wasserstein深卷积生成的对抗网络,使用梯度惩罚(1-D WDCGAN-GP)进行合成标记的振动数据生成。然后,通过使用1-D深卷积神经网络(1-D DCNN)来实现在不同级别的合成增强振动数据集的结构损伤检测。损伤检测结果表明,1-D WDCAN-GP可以成功地利用以解决基于振动的民用结构的损伤诊断数据稀缺。关键词:结构健康监测(SHM),结构损伤诊断,结构损伤检测,1-D深卷积神经网络(1-D DCNN),1-D生成对抗网络(1-D GAN),深卷积生成的对抗网络( DCGAN),Wassersein生成的对抗性网络具有梯度惩罚(WAN-GP)
translated by 谷歌翻译
物联网技术的开发使各种传感器可以集成到移动设备中。基于传感器数据的人类活动识别(HAR)已成为机器学习和无处不在计算领域的积极研究主题。但是,由于人类活动的频率不一致,人类活动数据集中的每个活动的数据量都会失衡。考虑到有限的传感器资源和手动标记的传感器数据的高成本,人类活动识别面临着高度不平衡的活动数据集的挑战。在本文中,我们建议平衡传感器数据生成的对抗网络(BSDGAN),以生成少数人类活动的传感器数据。所提出的BSDGAN由生成器模型和鉴别模型组成。考虑到人类活动数据集的极端失衡,使用自动编码器来初始化BSDGAN的训练过程,并确保可以学习每个活动的数据特征。生成的活动数据与原始数据集结合在一起,以平衡人类活动类别的活动数据量。我们在两个公开可用的人类活动数据集WISDM和UNIMIB上部署了多个人类活动识别模型。实验结果表明,提出的BSDGAN可以有效地捕获真实人类活动传感器数据的数据特征,并生成逼真的合成传感器数据。同时,平衡的活动数据集可以有效地帮助活动识别模型提高识别精度。
translated by 谷歌翻译
本文提出了一个低成本且高度准确的ECG监测系统,用于针对可穿戴移动传感器的个性化早期心律不齐检测。对个性化心电图监测的早期监督方法需要异常和正常的心跳来训练专用分类器。但是,在真实的情况下,个性化算法嵌入了可穿戴设备中,这种训练数据不适合没有心脏障碍史的健康人。在这项研究中,(i)我们对通过稀疏字典学习获得的健康信号空间进行了无空间分析,并研究了如何简单的无效空间投影或基于最小二乘的规范性分类方法可以降低计算复杂性,而无需牺牲牺牲计算的复杂性。与基于稀疏表示的分类相比,检测准确性。 (ii)然后,我们引入了基于稀疏表示的域适应技术,以便将其他现有用户的异常和正常信号投射到新用户的信号空间上,使我们能够训练专用的分类器而无需​​新用户的任何异常心跳。因此,无需合成异常的心跳产生,可以实现零射学习。在基准MIT-BIH ECG数据集上执行的一组大量实验表明,当该基于域的基于域的训练数据生成器与简单的1-D CNN分类器一起使用时,该方法以明显的差距优于先前的工作。 (iii)然后,通过组合(i)和(ii),我们提出了一个整体分类器,以进一步提高性能。这种零射门心律失常检测的方法的平均准确性水平为98.2%,F1得分为92.8%。最后,使用上述创新提出了一个个性化的节能ECG监测计划。
translated by 谷歌翻译
心电图(ECG)是用于监测心脏电信号和评估其功能的最常见和常规诊断工具。人心脏可能患有多种疾病,包括心律不齐。心律不齐是一种不规则的心律,在严重的情况下会导致心脏中风,可以通过ECG记录诊断。由于早期发现心律不齐非常重要,因此在过去的几十年中,计算机化和自动化的分类以及这些异常心脏信号的识别引起了很多关注。方法:本文引入了一种轻度的深度学习方法,以高精度检测8种不同的心律不齐和正常节奏。为了利用深度学习方法,将重新采样和基线徘徊清除技术应用于ECG信号。在这项研究中,将500个样本ECG段用作模型输入。节奏分类是通过11层网络以端到端方式完成的,而无需手工制作的手动功能提取。结果:为了评估提出的技术,从两个Physionet数据库,MIT-BIH心律失常数据库和长期AF数据库中选择了ECG信号。基于卷积神经网络(CNN)和长期记忆(LSTM)的组合,提出的深度学习框架比大多数最先进的方法显示出令人鼓舞的结果。所提出的方法达到98.24%的平均诊断准确性。结论:成功开发和测试了使用多种心电图信号的心律失常分类的训练有素的模型。意义:由于本工作使用具有高诊断精度的光分类技术与其他值得注意的方法相比,因此可以在Holter Monitor设备中成功实施以进行心律失常检测。
translated by 谷歌翻译
Common measures of brain functional connectivity (FC) including covariance and correlation matrices are semi-positive definite (SPD) matrices residing on a cone-shape Riemannian manifold. Despite its remarkable success for Euclidean-valued data generation, use of standard generative adversarial networks (GANs) to generate manifold-valued FC data neglects its inherent SPD structure and hence the inter-relatedness of edges in real FC. We propose a novel graph-regularized manifold-aware conditional Wasserstein GAN (GR-SPD-GAN) for FC data generation on the SPD manifold that can preserve the global FC structure. Specifically, we optimize a generalized Wasserstein distance between the real and generated SPD data under an adversarial training, conditioned on the class labels. The resulting generator can synthesize new SPD-valued FC matrices associated with different classes of brain networks, e.g., brain disorder or healthy control. Furthermore, we introduce additional population graph-based regularization terms on both the SPD manifold and its tangent space to encourage the generator to respect the inter-subject similarity of FC patterns in the real data. This also helps in avoiding mode collapse and produces more stable GAN training. Evaluated on resting-state functional magnetic resonance imaging (fMRI) data of major depressive disorder (MDD), qualitative and quantitative results show that the proposed GR-SPD-GAN clearly outperforms several state-of-the-art GANs in generating more realistic fMRI-based FC samples. When applied to FC data augmentation for MDD identification, classification models trained on augmented data generated by our approach achieved the largest margin of improvement in classification accuracy among the competing GANs over baselines without data augmentation.
translated by 谷歌翻译
心电图(ECG)是心脏病的广泛使用的非侵入性诊断工具。许多研究设计了ECG分析模型(例如分类器)来协助诊断。作为一项上游任务,研究建立了生成模型来综合ECG数据,这对提供培训样本,隐私保护和减少注释是有益的。但是,以前的ECG生成方法通常既不合成多视图数据,也不涉及心脏病状况。在本文中,我们提出了一种新型的,用于多视图ECG合成的新型疾病的生成对抗网络,称为ME-GAN,该网络获得了以心脏病为条件的全磁心电图表示,并将其投射到多个标准视图上,以产生ECG信号。由于心脏病的心电图表现通常位于特定波形中,因此我们提出了一种新的“混合标准化”,以精确地注入合适的位置。此外,我们提出了一个视图歧视者,将无序的心电图视图恢复为预定的顺序,监督发电机以获取代表正确视图特征的ECG。此外,提出了一个新的度量RFID,以评估合成的ECG信号的质量。全面的实验验证了我们的ME-GAN在具有可信赖的病态表现的多视图ECG信号合成上表现良好。
translated by 谷歌翻译
模拟重力波(GW)检测器环境的时间域观察将使GW源有更好的了解,增强用于GW信号检测的数据集并帮助表征探测器的噪声,从而提供更好的物理学。本文提出了一种新的方法,该方法是使用三人瓦斯汀生成对抗网络(WGAN)(称为dvgan)模拟固定长度的时间域信号,其中包括一个辅助鉴别器,该辅助歧视器在输入信号的衍生物上进行区分。一项消融研究用于比较包括带有香草两种玩家wgan的辅助导数歧视器的对抗反馈的效果。我们表明,在训练阶段,对衍生物的区分可以稳定1D连续信号的GAN组件学习。这会导致更平滑的信号与实际样本不太区分,并更好地捕获训练数据的分布。 DVGAN还用于模拟高级LIGO GW检测器中捕获的真实瞬态噪声事件。
translated by 谷歌翻译
系外行星的检测为发现新的可居住世界的发现打开了大门,并帮助我们了解行星的形成方式。 NASA的目的是寻找类似地球的宜居行星,推出了开普勒太空望远镜及其后续任务K2。观察能力的进步增加了可用于研究的新鲜数据的范围,并且手动处理它们既耗时又困难。机器学习和深度学习技术可以极大地帮助降低人类以经济和公正的方式处理这些系外行星计划的现代工具所产生的大量数据的努力。但是,应注意精确地检测所有系外行星,同时最大程度地减少对非外界星星的错误分类。在本文中,我们利用了两种生成对抗网络的变体,即半监督的生成对抗网络和辅助分类器生成对抗网络,在K2数据中检测传播系外行星。我们发现,这些模型的用法可能有助于用系外行星的恒星分类。我们的两种技术都能够在测试数据上以召回和精度为1.00的光曲线分类。我们的半监督技术有益于解决创建标签数据集的繁琐任务。
translated by 谷歌翻译
Supervised classification methods have been widely utilized for the quality assurance of the advanced manufacturing process, such as additive manufacturing (AM) for anomaly (defects) detection. However, since abnormal states (with defects) occur much less frequently than normal ones (without defects) in the manufacturing process, the number of sensor data samples collected from a normal state outweighs that from an abnormal state. This issue causes imbalanced training data for classification models, thus deteriorating the performance of detecting abnormal states in the process. It is beneficial to generate effective artificial sample data for the abnormal states to make a more balanced training set. To achieve this goal, this paper proposes a novel data augmentation method based on a generative adversarial network (GAN) using additive manufacturing process image sensor data. The novelty of our approach is that a standard GAN and classifier are jointly optimized with techniques to stabilize the learning process of standard GAN. The diverse and high-quality generated samples provide balanced training data to the classifier. The iterative optimization between GAN and classifier provides the high-performance classifier. The effectiveness of the proposed method is validated by both open-source data and real-world case studies in polymer and metal AM processes.
translated by 谷歌翻译
心血管疾病是一个大的全球医疗保健问题;症状通常突然存在,最小的警告。心电图(ECG)是一种快速,简单可靠,通过测量通过皮肤上的电极记录的电极来评估心脏健康的方法。 ECG经常需要通过心脏病专家分析,花时间可以花在改善患者护理和结果上。因此,已经提出了使用机器学习的自动ECG分类系统,可以学习ECG功能之间的复杂交互,并使用它来检测异常。然而,为此目的构建的算法经常无法概括到解开数据,报告最初令人印象深刻的结果,在应用于新环境时急剧下降。此外,机器学习算法遭受“黑匣子”问题,其中难以确定如何做出决定。这对医疗保健的应用至关重要,因为临床医生需要能够验证评估过程以信任算法。本文提出了一种用于在MIT-BIH心律失常数据集中的每个类中可视化模型决策的方法,使用完整类的平均调整显着图来确定正在学习的模式。我们通过基于最先进的模型构建两种算法来实现这一点。本文突出了这些地图如何用于在模型中找到可能影响概括性和模型性能的模型中的问题。比较完整类的显着性图给出了模型中混淆变量或其他偏差的总体印象,而不同于在ECG-By-ECG基础上比较显着图时会突出显示的内容。
translated by 谷歌翻译
这项研究建议使用生成模型(GAN)来增强欧洲裔欧洲裔数据集用于土地使用和土地覆盖(LULC)分类任务。我们使用DCGAN和WGAN-GP为数据集中的每个类生成图像。然后,我们探讨了在每种情况下将原始数据集增加约10%的效果对模型性能。GAN体系结构的选择似乎对模型性能没有明显的影响。然而,几何增强和GAN生成图像的结合改善了基线结果。我们的研究表明,GANS的增强可以改善卫星图像上深层分类模型的普遍性。
translated by 谷歌翻译
轴承是容易出乎意料断层的旋转机的重要组成部分之一。因此,轴承诊断和状况监测对于降低众多行业的运营成本和停机时间至关重要。在各种生产条件下,轴承可以在一系列载荷和速度下进行操作,这会导致与每种故障类型相关的不同振动模式。正常数据很足够,因为系统通常在所需条件下工作。另一方面,故障数据很少见,在许多情况下,没有记录故障类别的数据。访问故障数据对于开发数据驱动的故障诊断工具至关重要,该工具可以提高操作的性能和安全性。为此,引入了基于条件生成对抗网络(CGAN)的新型算法。该算法对任何实际故障条件的正常和故障数据进行培训,从目标条件的正常数据中生成故障数据。所提出的方法在现实世界中的数据集上进行了验证,并为不同条件生成故障数据。实施了几种最先进的分类器和可视化模型,以评估合成数据的质量。结果证明了所提出的算法的功效。
translated by 谷歌翻译
频谱图分类在分析引力波数据中起重要作用。在本文中,我们提出了一个框架来通过使用生成对抗网络(GAN)来改善分类性能。由于注释光谱图需要大量的努力和专业知识,因此训练示例的数量非常有限。但是,众所周知,只有当训练集的样本量足够大时,深层网络才能表现良好。此外,不同类别中的样本数量不平衡也会阻碍性能。为了解决这些问题,我们提出了一个基于GAN的数据增强框架。虽然无法在频谱图上应用常规图像的标准数据增强方法,但我们发现,甘恩(Progan)的一种变体能够生成高分辨率频谱图,这些光谱图与高分辨率原始图像的质量一致并提供了理想的多样性。我们通过将{\ it Gravity间谍}数据集中的小故障与GAN生成的频谱图分类为训练,从而验证了我们的框架。我们表明,所提出的方法可以为使用深网的分类提供转移学习的替代方法,即使用高分辨率GAN进行数据增强。此外,可以大大降低分类性能的波动,用于训练和评估的小样本量。在我们的框架中,使用训练有素的网络,我们还检查了{\ it Gravity Spy}中标签异常的频谱图。
translated by 谷歌翻译
数据通常以表格格式存储。几个研究领域(例如,生物医学,断层/欺诈检测),容易出现不平衡的表格数据。由于阶级失衡,对此类数据的监督机器学习通常很困难,从而进一步增加了挑战。合成数据生成,即过采样是一种用于提高分类器性能的常见补救措施。最先进的线性插值方法,例如洛拉斯和普罗拉斯,可用于从少数族裔类的凸空间中生成合成样本,以在这种情况下提高分类器的性能。生成的对抗网络(GAN)是合成样本生成的常见深度学习方法。尽管GAN被广泛用于合成图像生成,但在不平衡分类的情况下,它们在表格数据上的范围没有充分探索。在本文中,我们表明,与线性插值方法相比,现有的深层生成模型的性能较差,该方法从少数族裔类的凸空间中生成合成样本,对于小规模的表格数据集中的分类问题不平衡。我们提出了一个深厚的生成模型,将凸出空间学习和深层生成模型的思想结合在一起。 Convgen了解了少数族类样品的凸组合的系数,因此合成数据与多数类的不同。我们证明,与现有的深层生成模型相比,我们提出的模型Convgen在与现有的线性插值方法相当的同时,改善了此类小数据集的不平衡分类。此外,我们讨论了如何将模型用于一般的综合表格数据生成,甚至超出了数据不平衡的范围,从而提高了凸空间学习的整体适用性。
translated by 谷歌翻译
随着深度学习生成模型的最新进展,它在时间序列领域的出色表现并没有花费很长时间。用于与时间序列合作的深度神经网络在很大程度上取决于培训中使用的数据集的广度和一致性。这些类型的特征通常在现实世界中不丰富,在现实世界中,它们通常受到限制,并且通常具有必须保证的隐私限制。因此,一种有效的方法是通过添加噪声或排列并生成新的合成数据来使用\ gls {da}技术增加数据数。它正在系统地审查该领域的当前最新技术,以概述所有可用的算法,并提出对最相关研究的分类法。将评估不同变体的效率;作为过程的重要组成部分,将分析评估性能的不同指标以及有关每个模型的主要问题。这项研究的最终目的是摘要摘要,这些领域的进化和性能会产生更好的结果,以指导该领域的未来研究人员。
translated by 谷歌翻译
In recent years, applying deep learning (DL) to assess structural damages has gained growing popularity in vision-based structural health monitoring (SHM). However, both data deficiency and class-imbalance hinder the wide adoption of DL in practical applications of SHM. Common mitigation strategies include transfer learning, over-sampling, and under-sampling, yet these ad-hoc methods only provide limited performance boost that varies from one case to another. In this work, we introduce one variant of the Generative Adversarial Network (GAN), named the balanced semi-supervised GAN (BSS-GAN). It adopts the semi-supervised learning concept and applies balanced-batch sampling in training to resolve low-data and imbalanced-class problems. A series of computer experiments on concrete cracking and spalling classification were conducted under the low-data imbalanced-class regime with limited computing power. The results show that the BSS-GAN is able to achieve better damage detection in terms of recall and $F_\beta$ score than other conventional methods, indicating its state-of-the-art performance.
translated by 谷歌翻译
对应用深神网络自动解释和分析12铅心电图(ECG)的兴趣增加了。机器学习方法的当前范例通常受到标记数据量的限制。对于临床上的数据,这种现象尤其有问题,在该数据中,根据所需的专业知识和人类努力,规模标签可能是耗时且昂贵的。此外,深度学习分类器可能容易受到对抗性例子和扰动的影响,例如在医疗,临床试验或保险索赔的背景下应用时,可能会带来灾难性的后果。在本文中,我们提出了一种受生理启发的数据增强方法,以提高性能并根据ECG信号提高心脏病检测的鲁棒性。我们通过将数据分布驱动到瓦斯坦斯坦空间中的大地测量中的其他类别来获得增强样品。为了更好地利用领域特定的知识,我们设计了一个基础指标,该指标识别基于生理确定的特征的ECG信号之间的差异。从12铅ECG信号中学习,我们的模型能够区分五种心脏条件。我们的结果表明,准确性和鲁棒性的提高,反映了我们数据增强方法的有效性。
translated by 谷歌翻译