本文使用签名的累积分布变换(SCDT)提出了一种新的端到端信号分类方法。我们采用基于运输的生成模型来定义分类问题。然后,我们利用SCDT的数学属性来使问题更容易在变换域中,并使用SCDT域中的最接近局部子空间(NLS)搜索算法求解未知样本的类。实验表明,所提出的方法提供了高精度的分类结果,同时又有数据效率,对分布样本的强大稳定性以及相对于深度学习端到端分类方法的计算复杂性而具有竞争力。在Python语言中的实现将其作为软件包Pytranskit(https://github.com/rohdelab/pytranskit)的一部分集成。
translated by 谷歌翻译
深度卷积神经网络(CNNS)广泛地被认为是最先进的通用端到端图像分类系统。然而,当训练数据受到限制时,它们众所周知,他们需要渲染方法计算得昂贵并且并不总是有效的数据增强策略。而不是使用数据增强策略来编码在机器学习中通常在机器学习中进行的修正,而我们建议通过利用氡累积分配变换(R-CDT)的某些数学属性来数学上增强切片 - Wasserstein空间中最近的子空间分类模型。最近引入的图像变换。我们证明,对于特定类型的学习问题,我们的数学解决方案在分类精度和计算复杂性方面具有深度CNN的数据增强,并且在有限的训练数据设置下特别有效。该方法简单,有效,计算高效,不迭代,不需要调整参数。实现我们的方法的Python代码可在https://github.com/rohdelab/mathemation_augmentation中获得。我们的方法是作为软件包Pytranskit的一部分,可在https://github.com/rohdelab/pytranskit中获得。
translated by 谷歌翻译
基于运输的指标和相关嵌入(转换)最近已用于模拟存在非线性结构或变化的信号类。在本文中,我们研究了具有广义的瓦斯汀度量的时间序列数据的测量特性,以及与它们在嵌入空间中签名的累积分布变换有关的几何形状。此外,我们展示了如何理解这种几何特征可以为某些时间序列分类器提供可解释性,并成为更强大的分类器的灵感。
translated by 谷歌翻译
Time Series Classification (TSC) is an important and challenging problem in data mining. With the increase of time series data availability, hundreds of TSC algorithms have been proposed. Among these methods, only a few have considered Deep Neural Networks (DNNs) to perform this task. This is surprising as deep learning has seen very successful applications in the last years. DNNs have indeed revolutionized the field of computer vision especially with the advent of novel deeper architectures such as Residual and Convolutional Neural Networks. Apart from images, sequential data such as text and audio can also be processed with DNNs to reach state-of-the-art performance for document classification and speech recognition. In this article, we study the current state-ofthe-art performance of deep learning algorithms for TSC by presenting an empirical study of the most recent DNN architectures for TSC. We give an overview of the most successful deep learning applications in various time series domains under a unified taxonomy of DNNs for TSC. We also provide an open source deep learning framework to the TSC community where we implemented each of the compared approaches and evaluated them on a univariate TSC benchmark (the UCR/UEA archive) and 12 multivariate time series datasets. By training 8,730 deep learning models on 97 time series datasets, we propose the most exhaustive study of DNNs for TSC to date.
translated by 谷歌翻译
TimeSeries Partitioning是大多数机器学习驱动的传感器的IOT应用程序的重要步骤。本文介绍了一种采样效率,鲁棒,时序分割模型和算法。我们表明,通过基于最大平均差异(MMD)的分割目标来学习特定于分割目标的表示,我们的算法可以鲁布布地检测不同应用程序的时间序列事件。我们的损耗功能允许我们推断是否从相同的分布(空假设)中绘制了连续的样本序列,并确定拒绝零假设的对之间的变化点(即,来自不同的分布)。我们展示了其在基于环境传感的活动识别的实际IOT部署中的适用性。此外,虽然文献中存在许多关于变更点检测的作品,但我们的模型明显更简单,匹配或优于最先进的方法。我们可以平均地在9-93秒内完全培训我们的模型,而在不同应用程序上的数据的差异很小。
translated by 谷歌翻译
本文提出了一个低成本且高度准确的ECG监测系统,用于针对可穿戴移动传感器的个性化早期心律不齐检测。对个性化心电图监测的早期监督方法需要异常和正常的心跳来训练专用分类器。但是,在真实的情况下,个性化算法嵌入了可穿戴设备中,这种训练数据不适合没有心脏障碍史的健康人。在这项研究中,(i)我们对通过稀疏字典学习获得的健康信号空间进行了无空间分析,并研究了如何简单的无效空间投影或基于最小二乘的规范性分类方法可以降低计算复杂性,而无需牺牲牺牲计算的复杂性。与基于稀疏表示的分类相比,检测准确性。 (ii)然后,我们引入了基于稀疏表示的域适应技术,以便将其他现有用户的异常和正常信号投射到新用户的信号空间上,使我们能够训练专用的分类器而无需​​新用户的任何异常心跳。因此,无需合成异常的心跳产生,可以实现零射学习。在基准MIT-BIH ECG数据集上执行的一组大量实验表明,当该基于域的基于域的训练数据生成器与简单的1-D CNN分类器一起使用时,该方法以明显的差距优于先前的工作。 (iii)然后,通过组合(i)和(ii),我们提出了一个整体分类器,以进一步提高性能。这种零射门心律失常检测的方法的平均准确性水平为98.2%,F1得分为92.8%。最后,使用上述创新提出了一个个性化的节能ECG监测计划。
translated by 谷歌翻译
大量的数据和创新算法使数据驱动的建模成为现代行业的流行技术。在各种数据驱动方法中,潜在变量模型(LVM)及其对应物占主要份额,并在许多工业建模领域中起着至关重要的作用。 LVM通常可以分为基于统计学习的经典LVM和基于神经网络的深层LVM(DLVM)。我们首先讨论经典LVM的定义,理论和应用,该定义和应用既是综合教程,又是对经典LVM的简短申请调查。然后,我们对当前主流DLVM进行了彻底的介绍,重点是其理论和模型体系结构,此后不久就提供了有关DLVM的工业应用的详细调查。上述两种类型的LVM具有明显的优势和缺点。具体而言,经典的LVM具有简洁的原理和良好的解释性,但是它们的模型能力无法解决复杂的任务。基于神经网络的DLVM具有足够的模型能力,可以在复杂的场景中实现令人满意的性能,但它以模型的解释性和效率为例。旨在结合美德并减轻这两种类型的LVM的缺点,并探索非神经网络的举止以建立深层模型,我们提出了一个新颖的概念,称为“轻量级Deep LVM(LDLVM)”。在提出了这个新想法之后,该文章首先阐述了LDLVM的动机和内涵,然后提供了两个新颖的LDLVM,并详尽地描述了其原理,建筑和优点。最后,讨论了前景和机会,包括重要的开放问题和可能的研究方向。
translated by 谷歌翻译
本文提出和评估了一种用于脑电图(EEG)信号分类的基于新的基于实例的方法。 EEG信号的非静止性质,与具有有限培训数据的苛刻的模式识别以及潜在的嘈杂的信号采集条件相结合,并且具有潜在的嘈杂的信号采集条件,这是在本研究中报告的工作。所提出的自适应模板增强机制通过单独处理每个特征维度来改变特征级实例,因此导致改进的类别分离和更好的查询类匹配。将提出的基于实例的学习算法与许多情况下的一些相关算法进行了比较。使用单个干燥传感器的低成本系统获得的临床级64电极EEG数据库以及使用低成本系统获得的低质量(高噪声水平)EEG数据库已用于生物识别人员识别中的评估。所提出的方法在识别和验证方案中表明了显着提高的分类准确性。特别是,看到这种新方法可以为嘈杂的EEG数据提供良好的分类性能,表明其适用于各种应用的可能性。
translated by 谷歌翻译
动态系统的故障诊断是通过检测时间序列数据的变化(例如由系统降解和故障组件引起的残差)来完成的。通用多级分类方法用于故障诊断的使用使训练数据和未知的故障类别变得复杂。另一个复杂因素是,不同的故障类别可能导致相似的残余输出,尤其是对于小故障,这会导致分类歧义。在这项工作中,开发了用于使用Kullback-Leibler Divergence进行故障诊断应用程序的数据驱动分析和开放集分类的框架。提出了数据驱动的故障分类算法,该算法可以处理不平衡的数据集,类重叠和未知故障。此外,提出了一种算法来估计训练数据包含来自已知故障实现的信息时的故障大小。提出的框架的一个优点是,它也可以用于定量分析故障诊断性能,例如分析对不同幅度的故障进行分类的容易性。为了评估所提出方法的有用性,已经从内部燃烧引擎测试工作台收集了来自不同故障场景的多个数据集,以说明数据驱动诊断系统的设计过程,包括定量错误诊断分析和开发的开放式设置的评估故障分类算法。
translated by 谷歌翻译
胎儿心电图(FECG)首先在20世纪初从母体腹表面记录。在过去的五十年中,最先进的电子技术和信号处理算法已被用于将非侵入性胎儿心电图转化为可靠的胎儿心脏监测技术。在本章中,已经对来自非侵入性母亲腹部录像进行了建模,提取和分析的主要信号处理技术,并详细介绍了来自非侵入性母亲腹部录像的型号的建模,提取和分析。本章的主要主题包括:1)FECG的电生理学从信号处理视点,2)母体体积传导介质的数学模型和从体表的FECG的波形模型,3)信号采集要求,4)基于模型的FECG噪声和干扰取消的技术,包括自适应滤波器和半盲源分离技术,以及5)胎儿运动跟踪和在线FECG提取的最近算法的进步。
translated by 谷歌翻译
第五代(5G)网络和超越设想巨大的东西互联网(物联网)推出,以支持延长现实(XR),增强/虚拟现实(AR / VR),工业自动化,自主驾驶和智能所有带来的破坏性应用一起占用射频(RF)频谱的大规模和多样化的IOT设备。随着频谱嘎嘎和吞吐量挑战,这种大规模的无线设备暴露了前所未有的威胁表面。 RF指纹识别是预约的作为候选技术,可以与加密和零信任安全措施相结合,以确保无线网络中的数据隐私,机密性和完整性。在未来的通信网络中,在这项工作中,在未来的通信网络中的相关性,我们对RF指纹识别方法进行了全面的调查,从传统观点到最近的基于深度学习(DL)的算法。现有的调查大多专注于无线指纹方法的受限制呈现,然而,许多方面仍然是不可能的。然而,在这项工作中,我们通过解决信号智能(SIGINT),应用程序,相关DL算法,RF指纹技术的系统文献综述来缓解这一点,跨越过去二十年的RF指纹技术的系统文献综述,对数据集和潜在研究途径的讨论 - 必须以百科全书的方式阐明读者的必要条件。
translated by 谷歌翻译
设想制造部门受到基于人工智能的技术的严重影响,计算能力和数据量的大幅增加。制造业领域的一个核心挑战在于一般框架的要求,以确保满足不同制造应用中的诊断和监视性能。在这里,我们提出了一个通用数据驱动的端到端框架,用于监视制造系统。该框架是从深度学习技术中得出的,评估了融合的感觉测量值,以检测甚至预测故障和磨损条件。这项工作利用了深度学习的预测能力,从嘈杂的时间表数据中自动提取隐藏的降解功能。我们已经在从各种制造应用中绘制的十个代表性数据集上试验了拟议的框架。结果表明,该框架在检查的基准应用中表现良好,可以在不同的情况下应用,这表明其潜在用作智能制造中的关键角石。
translated by 谷歌翻译
时间序列数据是数据驱动技术中使用的原始数据表示的基本类型之一。在机器状态监测中,时间序列振动数据用于深度神经网络的数据挖掘中。通常,振动数据被转换为使用深神经网络(DNN)进行分类的图像,并且缩放是图像表示最有效的形式。然而,DNN分类器需要大量标记的训练样本来达到最佳性能。因此,将多种形式的数据增强技术应用于分类器以补偿缺乏训练样本。然而,缩放图是现有增强技术受到的图形表示,因为它们要么改变图形含义,要么在改变物理含义的样本中有太多的噪声。在本研究中,提出了一种名为集合增强的数据增强技术来克服这种限制。该增强方法使用集合中添加的白噪声的功率到原始样本以产生真实样本。在使用集合平均信号之后,获得包含原始信号特性的新信号。使用模拟信号验证集合增强的参数。使用三种轴承振动数据使用三种最先进的传输学习(TL)模型来评估所提出的方法,即Inception-V3,MobileNet-V2和Reset50。增强的增量产生了增量:第一个增量产生与训练样本相同数量的假样本,并且在第二个增量中,样本的数量逐渐增加。所提出的方法的输出与使用深度卷积生成的对冲网络(DCGAN)的增强,增强,以及几何变换基的增强......
translated by 谷歌翻译
电力系统容易出现各种事件(例如线路旅行和发电损失),而在情境意识,可靠性和安全性方面,对此类事件的实时识别至关重要。使用来自多个同步管理器的测量值,即相量测量单元(PMU),我们建议通过基于模态动力学提取特征来识别事件。我们将这种基于物理学的特征提取方法与机器学习结合在一起,以区分不同的事件类型。包括每个PMU的所有测量通道都允许利用各种功能,但还需要在高维空间上学习分类模型。为了解决此问题,实现了各种功能选择方法,以选择最佳功能子集。使用获得的功能子集,我们研究了两个众所周知的分类模型的性能,即逻辑回归(LR)和支持向量机(SVM),以识别两个数据集中的发电损失和线路跳闸事件。第一个数据集是从得克萨斯州2000-Bus合成网格中的模拟发电损失和线路跳闸事件中获得的。第二个是专有数据集,其标记事件是从美国的大型公用事业中获得的,涉及近500 pmus的测量。我们的结果表明,所提出的框架有望确定两种类型的事件。
translated by 谷歌翻译
使用最后一英里无线连接的终端设备的数量随着智能基础设施的上升而大大增加,并且需要可靠的功能来支持平滑和高效的业务流程。为了有效地管理此类大规模无线网络,需要更先进和准确的网络监控和故障检测解决方案。在本文中,我们使用复制图和克朗尼亚角场进行无线异常检测的基于图像的表示技术的第一次分析,并提出了一种启用精确异常检测的新的深度学习架构。我们详细阐述了开发资源意识架构的设计考虑因素,并使用时间序列提出新模型以使用复制图来实现图像转换。我们表明,所提出的模型a)以最多14个百分点的基于语法角字段优异的型号,b)使用动态时间翘曲高达24个百分点,c)优于24个百分点的典型ML模型,C)优于或与主流架构相表现出如AlexNet和VGG11的同时具有<10倍的权重和高达$ \其计算复杂度的8倍,而d)优于各个应用面积的最新状态高达55个百分点。最后,我们还在随机选择的示例上解释了分类器如何决定。
translated by 谷歌翻译
基于签名的技术使数学洞察力洞悉不断发展的数据的复杂流之间的相互作用。这些见解可以自然地转化为理解流数据的数值方法,也许是由于它们的数学精度,已被证明在数据不规则而不是固定的情况下分析流的数据以及数据和数据的尺寸很有用样本量均为中等。了解流的多模式数据是指数的:$ d $ d $的字母中的$ n $字母中的一个单词可以是$ d^n $消息之一。签名消除了通过采样不规则性引起的指数级噪声,但仍然存在指数量的信息。这项调查旨在留在可以直接管理指数缩放的域中。在许多问题中,可伸缩性问题是一个重要的挑战,但需要另一篇调查文章和进一步的想法。这项调查描述了一系列环境集足够小以消除大规模机器学习的可能性,并且可以有效地使用一小部分免费上下文和原则性功能。工具的数学性质可以使他们对非数学家的使用恐吓。本文中介绍的示例旨在弥合此通信差距,并提供从机器学习环境中绘制的可进行的工作示例。笔记本可以在线提供这些示例中的一些。这项调查是基于伊利亚·雪佛兰(Ilya Chevryev)和安德烈·科米利津(Andrey Kormilitzin)的早期论文,它们在这种机械开发的较早时刻大致相似。本文说明了签名提供的理论见解是如何在对应用程序数据的分析中简单地实现的,这种方式在很大程度上对数据类型不可知。
translated by 谷歌翻译
先进的Ligo和先进的处女座地面干涉仪有望探测前所未有的大量空间,从而增强了观测值的发现能力,甚至是重力波发射器的新来源。在这种情况下,高度优化的重力波检测算法的发展至关重要。我们提出了一个新型的分层框架,用于实时检测受语音处理技术启发的引力波,以及在本实施中,基于一种最新的机器学习方法,涉及遗传编程和神经网络的杂交。新提出的框架的关键方面是:结构良好的分层方法和低计算复杂性。本文描述了框架的基本概念和前三层的推导。即使在当前的实现中,这些层是基于使用机器学习方法得出的模型,拟议的分层结构具有普遍的性质。为了训练和测试模型,我们在合成高斯噪声中使用了模拟的二进制黑洞重力波形,代表了高级Ligo灵敏度设计。与更复杂的方法(例如卷积神经网络)相比,我们的框架,即使使用论文中描述的简单地面模型,具有相似的性能,但计算复杂性较低,模块化程度较高。此外,对短期特征的潜在剥削使新框架的结果几乎独立于引力波信号的时间位置,从而在第二代干涉仪中简化了其在实时多层管道中对重力波检测的实时多层管道的未来剥削。
translated by 谷歌翻译
在2015年和2019年之间,地平线的成员2020年资助的创新培训网络名为“Amva4newphysics”,研究了高能量物理问题的先进多变量分析方法和统计学习工具的定制和应用,并开发了完全新的。其中许多方法已成功地用于提高Cern大型Hadron撞机的地图集和CMS实验所执行的数据分析的敏感性;其他几个人,仍然在测试阶段,承诺进一步提高基本物理参数测量的精确度以及新现象的搜索范围。在本文中,在研究和开发的那些中,最相关的新工具以及对其性能的评估。
translated by 谷歌翻译
胶囊网络在了解与视觉相关任务的2D数据中的空间关系方面表现出色。即使它们并非旨在捕获一维时间关系,但在时间表中,我们证明了鉴于能力,胶囊网络在理解时间关系方面表现出色。为此,我们沿时间和频道尺寸生成胶囊,从而创建两个时间特征检测器,以学习对比关系。时间代表通过在识别13个心电图(ECG)信号拍打类别方面达到96.21%的精度,超过了最新结果,同时在确定30类短音频命令时获得了AN-PAR结果。此外,胶囊网络固有学到的实例化参数使我们能够完全参数化1D信号,从而在信号处理中打开各种可能性。
translated by 谷歌翻译
心律不齐的右心肌病(ARVC)是一种遗传性心肌疾病,在患者生命的第二和十年之间出现,导致35岁之前的心脏突然死亡的20%。在心电图(ECG)上,在降低过早心血管死亡率中可能具有至关重要的作用。在我们的分析中,我们首先概述了基于纸张的ECG信号的数字化过程,该空间过滤器旨在消除数据集图像中与ECG波形无关的黑暗区域,从而产生不良的噪声。接下来,我们建议使用低 - 复杂性卷积神经网络来检测心律失常心脏病,迄今为止尚未通过使用深度学习方法来研究,迄今为止的使用,达到高分类准确性,即99.98%的训练和98.6%测试准确性,与其他心律失常异常相反,在疾病上,其主要鉴定标准是ECG形态的无限千伏变化。最后,通过进行光谱分析,我们研究了与ARVC患者相对应的正常ECG和ECG之间频率领域的显着区别。在我们遇到统计学上显着分化的18个频率中,有16个中,正常的心电图的特征是与异常相比更大的归一化振幅。本文进行的总体研究强调了将数学方法整合到各种疾病的检查和有效诊断中的重要性,旨在为他们的成功治疗做出重大贡献。
translated by 谷歌翻译