智能论文笔记

Contrastive Feature Learning for Fault Detection and Diagnostics in Railway Applications

Katharina Rombach , Gabriel Michau , Kajan Ratnasabapathy , Lucian-Stefan Ancu , Wilfried Bürzle , Stefan Koller , Olga Fink

分类：机器学习

2022-08-28

铁路是一个复杂的系统，包括多个基础设施和滚动库存资产。为了安全，可靠，有效地操作系统，需要监视许多组件的条件。为了自动化此过程，可以使用数据驱动的故障检测和诊断模型。但是，实际上，如果培训数据集并不代表所有可能的未来条件，则数据驱动模型的性能可能会受到损害。我们建议通过学习特征表示，一方面是对操作或环境因素不变的，但另一方面，对资产的健康状况的变化敏感。我们评估了如何在有监督的和无监督的故障检测和诊断任务上使用对比度学习，并在铁路系统中进行实际状态监控数据集 - 来自基础架构资产的一个图像数据集和来自滚动库存资产的一次时间序列数据集。首先，我们评估了标有标记图像数据集的铁路卧铺缺陷分类任务上有监督的对比功能学习的性能。其次，我们评估了无监督的对比功能学习的性能，而没有在铁路轮数据集的异常检测任务上访问故障样本。在这里，我们检验了特征编码器对降解的敏感性是否对数据中的新故障模式敏感的假设。我们的结果表明，与最先进的方法相比，对比功能学习可以提高有关卧铺的监督分类任务的绩效。此外，在有关铁路轮的异常检测任务上，与最新方法相比，炮击缺陷的检测得到了改善。

translated by 谷歌翻译

HTML版本

Controlled Generation of Unseen Faults for Partial and Open-Partial Domain Adaptation

Katharina Rombach , Dr. Gabriel Michau , Prof. Dr. Olga Fink

分类：机器学习

2022-04-29

由于培训和测试数据分布之间的域移动，新的操作条件可能会导致故障诊断模型的大量性能下降。尽管已经提出了几种域的适应方法来克服此类域移位，但如果两个域中表示的故障类别不相同，则其应用是有限的。为了在两个不同的域之间启用训练有素的模型的更好可传递性，尤其是在两个域之间仅共享健康数据类别的设置中，我们提出了一个新的框架，以基于生成不同的故障签名的部分和开放式域适应一个瓦斯林甘。提出的框架的主要贡献是具有两个主要不同特征的受控合成断层数据生成。首先，所提出的方法使目标域中仅能访问目标域中的健康样品和源域中的样本错误，从而在目标域中生成未观察到的故障类型。其次，可以将故障产生控制以精确生成不同的故障类型和故障严重程度。所提出的方法特别适合于极端域的适应设置，这些设置在复杂和安全关键系统的背景下特别相关，其中两个域之间仅共享一个类。我们在两个轴承断层诊断案例研究上评估了部分和开放式域适应任务的拟议框架。我们在不同标签空间设置中进行的实验展示了提出的框架的多功能性。与给定较大域间隙的其他方法相比，提出的方法提供了优越的结果。

translated by 谷歌翻译

Anomaly Detection in IR Images of PV Modules using Supervised Contrastive Learning

Lukas Bommes , Mathis Hoffmann , Claudia Buerhop-Lutz , Tobias Pickel , Jens Hauch , Christoph Brabec , Andreas Maier , Ian Marius Peters

分类：计算机视觉

2021-12-06

增加光伏（PV）工厂的部署需要在模态中自动检测故障PV模块，例如红外（IR）图像。最近，深入学习已经为此受欢迎。然而，相关的作品通常是来自相同分布的样本列车和测试数据忽略不同光伏工厂数据之间的域移位的存在。相反，我们将故障检测视为更现实无监督的域适应问题，我们在训练一个源PV工厂的标记数据并在另一个目标工厂进行预测。我们培训具有监督对比损失的Reset-34卷积神经网络，在其中我们采用K-Collect Exband Classifier来检测异常。我们的方法在接收器下实现令人满意的区域（Auroc），在九个源和目标数据集的九种组合中的达到73.3％至96.6％，其中8.5％的8.5％是异常的。在某些情况下，它甚至优于二进制交叉熵分类器。固定决策阈值，这导致79.4％和77.1％分别正确分类正常和异常图像。大多数错误分类的异常具有低严重程度，例如热二极管和小型热点。我们的方法对封锁率设置不敏感，汇聚快速并可靠地检测未知类型的异常，使其适合实践。可能的用途是自动PV工厂检测系统或通过过滤普通图像来简化IR数据集的手动标记。此外，我们的工作为使用无监督域适应的PV模块故障检测提供了更现实的观点，以开发具有有利的概括功能的更加性能的方法。

translated by 谷歌翻译

SensorSCAN: Self-Supervised Learning and Deep Clustering for Fault Diagnosis in Chemical Processes

Maksim Golyadkin , Vitaliy Pozdnyakov , Leonid Zhukov , Ilya Makarov

分类：机器学习 | 人工智能

2022-08-17

现代工业设施在生产过程中生成大量的原始传感器数据。该数据用于监视和控制过程，可以分析以检测和预测过程异常。通常，数据必须由专家注释，以进一步用于预测建模。当今的大多数研究都集中在需要手动注释数据的无监督异常检测算法或监督方法上。这些研究通常是使用过程模拟器生成的狭窄事件类别的数据进行的，并且在公开可用的数据集上很少验证建议的算法。在本文中，我们提出了一种新型的方法，用于用于工业化学传感器数据的无监督故障检测和诊断。我们根据具有各种故障类型的田纳西州伊士曼进程的两个公开数据集证明了我们的模型性能。结果表明，我们的方法显着优于现有方法（固定FPR的+0.2-0.3 TPR），并在不使用专家注释的情况下检测大多数过程故障。此外，我们进行了实验，以证明我们的方法适用于未提前不知道故障类型数量的现实世界应用。

translated by 谷歌翻译

Through-life Monitoring of Resource-constrained Systems and Fleets

Felipe Montana , Adam Hartwell , Will Jacobs , Visakan Kadirkamanathan , Andrew R Mills , Tom Clark

分类：机器学习

2023-01-03

A Digital Twin (DT) is a simulation of a physical system that provides information to make decisions that add economic, social or commercial value. The behaviour of a physical system changes over time, a DT must therefore be continually updated with data from the physical systems to reflect its changing behaviour. For resource-constrained systems, updating a DT is non-trivial because of challenges such as on-board learning and the off-board data transfer. This paper presents a framework for updating data-driven DTs of resource-constrained systems geared towards system health monitoring. The proposed solution consists of: (1) an on-board system running a light-weight DT allowing the prioritisation and parsimonious transfer of data generated by the physical system; and (2) off-board robust updating of the DT and detection of anomalous behaviours. Two case studies are considered using a production gas turbine engine system to demonstrate the digital representation accuracy for real-world, time-varying physical systems.

translated by 谷歌翻译

Vibration fault detection in wind turbines based on normal behaviour models without feature engineering

Stefan Jonas , Dimitrios Anagnostos , Bernhard Brodbeck , Angela Meyer

分类：机器学习

2022-06-24

大多数风力涡轮机受到24/7的远程监测，以允许早期发现操作问题并产生损坏。我们提出了一种新的故障检测方法，用于不需要任何功能工程的振动监控传动系统。我们的方法依赖于简单的模型体系结构来实践中实现直接实现。我们建议将卷积自动编码器以自动方式从半频谱中识别和提取最相关的功能，从而节省时间和精力。因此，从过去的测量值中学习了受监测组件的正常振动响应的光谱模型。我们证明该模型可以成功区分受损部件，并从其振动响应中检测出受损的发电机轴承和损坏的变速箱零件。使用商用风力涡轮机和测试钻机的测量结果，我们表明，可以在没有光谱特征的常规前期定义的情况下进行风力涡轮机传动系统中的基于振动的故障检测。提出方法的另一个优点是，监测整个半频谱，而不是通常关注各个频率和谐波。

translated by 谷歌翻译

RUAD: unsupervised anomaly detection in HPC systems

Martin Molan , Andrea Borghesi , Daniele Cesarini , Luca Benini , Andrea Bartolini

分类：机器学习 | 人工智能

2022-08-28

现代高性能计算（HPC）系统的复杂性日益增加，需要引入自动化和数据驱动的方法，以支持系统管理员为增加系统可用性的努力。异常检测是改善可用性不可或缺的一部分，因为它减轻了系统管理员的负担，并减少了异常和解决方案之间的时间。但是，对当前的最新检测方法进行了监督和半监督，因此它们需要具有异常的人体标签数据集 - 在生产HPC系统中收集通常是不切实际的。基于聚类的无监督异常检测方法，旨在减轻准确的异常数据的需求，到目前为止的性能差。在这项工作中，我们通过提出RUAD来克服这些局限性，RUAD是一种新型的无监督异常检测模型。 Ruad比当前的半监督和无监督的SOA方法取得了更好的结果。这是通过考虑数据中的时间依赖性以及在模型体系结构中包括长短期限内存单元的实现。提出的方法是根据tier-0系统（带有980个节点的Cineca的Marconi100的完整历史）评估的。 RUAD在半监督训练中达到曲线（AUC）下的区域（AUC）为0.763，在无监督的训练中达到了0.767的AUC，这改进了SOA方法，在半监督训练中达到0.747的AUC，无需训练的AUC和0.734的AUC在无处不在的AUC中提高了AUC。训练。它还大大优于基于聚类的当前SOA无监督的异常检测方法，其AUC为0.548。

translated by 谷歌翻译

In-flight Novelty Detection with Convolutional Neural Networks

Adam Hartwell , Felipe Montana , Will Jacobs , Visakan Kadirkamanathan , Andrew R Mills , Tom Clark

分类：机器学习

2021-12-07

燃气轮机发动机是复杂的机器，通常产生大量数据，并且需要仔细监控，以允许具有成本效益的预防性维护。在航空航天应用中，将所有测量数据返回到地面是昂贵的，通常会导致有用，高值，要丢弃的数据。因此，在实时检测，优先级和返回有用数据的能力是至关重要的。本文提出了由卷积神经网络常态模型描述的系统输出测量，实时优先考虑预防性维护决策者。由于燃气轮机发动机时变行为的复杂性，导出精确的物理模型难以困难，并且通常导致预测精度低的模型和与实时执行不相容。数据驱动的建模是一种理想的替代方案，生产高精度，资产特定模型，而无需从第一原理推导。我们提出了一种用于在线检测和异常数据的优先级的数据驱动系统。通过集成到深神经预测模型中的不确定管理，避免了偏离新的操作条件的数据评估。测试是对实际和合成数据进行的，显示对真实和合成故障的敏感性。该系统能够在低功耗嵌入式硬件上实时运行，目前正在部署Rolls-Royce Pearl 15发动机飞行试验。

translated by 谷歌翻译

Roadmap on Signal Processing for Next Generation Measurement Systems

D. K. Iakovidis , M. Ooi , Y. C. Kuang , S. Damidenko , A. Shestakov , V. Sinistin , M. Henry , A. Sciacchitano , A. Discetti , S. Donati

分类：人工智能 | 计算机视觉

2021-11-03

信号处理是几乎任何传感器系统的基本组件，具有不同科学学科的广泛应用。时间序列数据，图像和视频序列包括可以增强和分析信息提取和量化的代表性形式的信号。人工智能和机器学习的最近进步正在转向智能，数据驱动，信号处理的研究。该路线图呈现了最先进的方法和应用程序的关键概述，旨在突出未来的挑战和对下一代测量系统的研究机会。它涵盖了广泛的主题，从基础到工业研究，以简明的主题部分组织，反映了每个研究领域的当前和未来发展的趋势和影响。此外，它为研究人员和资助机构提供了识别新前景的指导。

translated by 谷歌翻译

Cadence: A Practical Time-series Partitioning Algorithm for Unlabeled IoT Sensor Streams

Tahiya Chowdhury , Murtadha Aldeer , Shantanu Laghate , Jorge Ortiz

分类：机器学习

2021-12-06

TimeSeries Partitioning是大多数机器学习驱动的传感器的IOT应用程序的重要步骤。本文介绍了一种采样效率，鲁棒，时序分割模型和算法。我们表明，通过基于最大平均差异（MMD）的分割目标来学习特定于分割目标的表示，我们的算法可以鲁布布地检测不同应用程序的时间序列事件。我们的损耗功能允许我们推断是否从相同的分布（空假设）中绘制了连续的样本序列，并确定拒绝零假设的对之间的变化点（即，来自不同的分布）。我们展示了其在基于环境传感的活动识别的实际IOT部署中的适用性。此外，虽然文献中存在许多关于变更点检测的作品，但我们的模型明显更简单，匹配或优于最先进的方法。我们可以平均地在9-93秒内完全培训我们的模型，而在不同应用程序上的数据的差异很小。

translated by 谷歌翻译

The Digital Twin Landscape at the Crossroads of Predictive Maintenance, Machine Learning and Physics Based Modeling

Brian Kunzer , Mario Berges , Artur Dubrawski

分类：机器学习

2022-06-21

在过去的十年中，数字双胞胎的概念在受欢迎程度上爆发了，但围绕其多个定义，其新颖性作为新技术的新颖性以及其实际适用性仍然存在，尽管进行了许多评论，调查和新闻稿，但其实际适用性仍然存在。探索了数字双胞胎一词的历史，以及其在产品生命周期管理，资产维护和设备车队管理，运营和计划领域的初始背景。还基于七个基本要素提供了一个最小可行的框架来利用数字双胞胎的定义。还概述了采用DT方法的DT应用程序和行业的简短旅行。预测维护领域突出了数字双胞胎框架的应用，并使用基于机器学习和基于物理的建模的扩展。采用机器学习和基于物理的建模的组合形成混合数字双胞胎框架，可以协同减轻隔离使用时每种方法的缺点。还讨论了实践实施数字双胞胎模型的关键挑战。随着数字双技术的快速增长及其成熟，预计将实现实质性增强工具和解决方案的巨大希望，以实现智能设备的智能维护。

translated by 谷歌翻译

A multi-stage semi-supervised improved deep embedded clustering method for bearing fault diagnosis under the situation of insufficient labeled samples

Tongda Sun , Gang Yu

分类：机器学习 | 人工智能

2021-09-28

虽然数据驱动的故障诊断方法已被广泛应用，但模型培训需要大规模标记数据。然而，在真正的行业实施这一点难以阻碍这些方法的应用。因此，迫切需要在这种情况下运行良好的有效诊断方法。本研究中，多级半监督改进的深度嵌入式聚类（MS-SSIDEC）方法，将半监督学习与改进的深度嵌入式聚类相结合（IDEC），建议共同探索稀缺标记的数据和大规模的未标记数据。在第一阶段，提出了一种可以自动将未标记的数据映射到低维特征空间中的跳过连接的卷积自动编码器（SCCAE），并预先培训以成为故障特征提取器。在第二阶段，提出了一个半监督的改进的深嵌入式聚类（SSIDEC）网络以进行聚类。首先用可用标记数据初始化，然后用于同时优化群集标签分配，并使要素空间更加群集。为了解决过度装备现象，在本阶段将虚拟的对抗培训（增值税）作为正则化术语。在第三阶段，伪标签是通过SSIDEC的高质量结果获得的。标记的数据集可以由这些伪标记的数据增强，然后利用以训练轴承故障诊断模型。来自滚动轴承的两个振动数据数据集用于评估所提出的方法的性能。实验结果表明，该方法在半监督和无监督的故障诊断任务中实现了有希望的性能。该方法通过有效地探索无监督数据，提供了在有限标记样本的情况下的故障诊断方法。

translated by 谷歌翻译

Multivariate Time Series Anomaly Detection with Few Positive Samples

Feng Xue , Weizhong Yan

分类：机器学习 | 人工智能 | 神经与进化计算

2022-07-02

鉴于在现实世界应用中缺乏异常情况，大多数文献一直集中在建模正态上。学到的表示形式可以将异常检测作为正态性模型进行训练，以捕获正常情况下的某些密钥数据规律性。在实际环境中，尤其是工业时间序列异常检测中，我们经常遇到有大量正常操作数据以及随时间收集的少量异常事件的情况。这种实际情况要求方法学来利用这些少量的异常事件来创建更好的异常检测器。在本文中，我们介绍了两种方法来满足这种实际情况的需求，并将其与最近开发的最新技术进行了比较。我们提出的方法锚定在具有自回归（AR）模型的正常运行的代表性学习以及损失组件上，以鼓励表示正常与几个积极示例的表示形式。我们将提出的方法应用于两个工业异常检测数据集，并与文献相比表现出有效的性能。我们的研究还指出了在实际应用中采用此类方法的其他挑战。

translated by 谷歌翻译

Computer Vision on X-ray Data in Industrial Production and Security Applications: A survey

Mehdi Rafiei , Jenni Raitoharju , Alexandros Iosifidis

分类：计算机视觉

2022-11-10

X-ray imaging technology has been used for decades in clinical tasks to reveal the internal condition of different organs, and in recent years, it has become more common in other areas such as industry, security, and geography. The recent development of computer vision and machine learning techniques has also made it easier to automatically process X-ray images and several machine learning-based object (anomaly) detection, classification, and segmentation methods have been recently employed in X-ray image analysis. Due to the high potential of deep learning in related image processing applications, it has been used in most of the studies. This survey reviews the recent research on using computer vision and machine learning for X-ray analysis in industrial production and security applications and covers the applications, techniques, evaluation metrics, datasets, and performance comparison of those techniques on publicly available datasets. We also highlight some drawbacks in the published research and give recommendations for future research in computer vision-based X-ray analysis.

translated by 谷歌翻译

Fruit Ripeness Classification: a Survey

Matteo Rizzo , Matteo Marcuzzo , Alessandro Zangari , Andrea Gasparetto , Andrea Albarelli

分类：计算机视觉 | 机器学习

2022-12-29

Fruit is a key crop in worldwide agriculture feeding millions of people. The standard supply chain of fruit products involves quality checks to guarantee freshness, taste, and, most of all, safety. An important factor that determines fruit quality is its stage of ripening. This is usually manually classified by experts in the field, which makes it a labor-intensive and error-prone process. Thus, there is an arising need for automation in the process of fruit ripeness classification. Many automatic methods have been proposed that employ a variety of feature descriptors for the food item to be graded. Machine learning and deep learning techniques dominate the top-performing methods. Furthermore, deep learning can operate on raw data and thus relieve the users from having to compute complex engineered features, which are often crop-specific. In this survey, we review the latest methods proposed in the literature to automatize fruit ripeness classification, highlighting the most common feature descriptors they operate on.

translated by 谷歌翻译

Data-Driven Fault Diagnosis Analysis and Open-Set Classification of Time-Series Data

Andreas Lundgren , Daniel Jung

分类： (统计)机器学习 | 机器学习

2020-09-10

动态系统的故障诊断是通过检测时间序列数据的变化（例如由系统降解和故障组件引起的残差）来完成的。通用多级分类方法用于故障诊断的使用使训练数据和未知的故障类别变得复杂。另一个复杂因素是，不同的故障类别可能导致相似的残余输出，尤其是对于小故障，这会导致分类歧义。在这项工作中，开发了用于使用Kullback-Leibler Divergence进行故障诊断应用程序的数据驱动分析和开放集分类的框架。提出了数据驱动的故障分类算法，该算法可以处理不平衡的数据集，类重叠和未知故障。此外，提出了一种算法来估计训练数据包含来自已知故障实现的信息时的故障大小。提出的框架的一个优点是，它也可以用于定量分析故障诊断性能，例如分析对不同幅度的故障进行分类的容易性。为了评估所提出方法的有用性，已经从内部燃烧引擎测试工作台收集了来自不同故障场景的多个数据集，以说明数据驱动诊断系统的设计过程，包括定量错误诊断分析和开发的开放式设置的评估故障分类算法。

translated by 谷歌翻译

A Machine Learning Enhanced Approach for Automated Sunquake Detection in Acoustic Emission Maps

Vanessa Mercea , Alin Razvan Paraschiv , Daniela Adriana Lacatus , Anca Marginean , Diana Besliu-Ionescu

分类：计算机视觉 | 机器学习

2022-12-13

Sunquakes are seismic emissions visible on the solar surface, associated with some solar flares. Although discovered in 1998, they have only recently become a more commonly detected phenomenon. Despite the availability of several manual detection guidelines, to our knowledge, the astrophysical data produced for sunquakes is new to the field of Machine Learning. Detecting sunquakes is a daunting task for human operators and this work aims to ease and, if possible, to improve their detection. Thus, we introduce a dataset constructed from acoustic egression-power maps of solar active regions obtained for Solar Cycles 23 and 24 using the holography method. We then present a pedagogical approach to the application of machine learning representation methods for sunquake detection using AutoEncoders, Contrastive Learning, Object Detection and recurrent techniques, which we enhance by introducing several custom domain-specific data augmentation transformations. We address the main challenges of the automated sunquake detection task, namely the very high noise patterns in and outside the active region shadow and the extreme class imbalance given by the limited number of frames that present sunquake signatures. With our trained models, we find temporal and spatial locations of peculiar acoustic emission and qualitatively associate them to eruptive and high energy emission. While noting that these models are still in a prototype stage and there is much room for improvement in metrics and bias levels, we hypothesize that their agreement on example use cases has the potential to enable detection of weak solar acoustic manifestations.

translated by 谷歌翻译

Unsupervised detection and open-set classification of fast-ramped flexibility activation events

Nils Müller , Carsten Heinrich , Kai Heussen , Henrik W. Bindner

分类： (统计)机器学习

2021-11-03

迁移率和加热部门的连续电气化将对分布网格运行引入新的挑战。不协调的灵活单元激活，例如，电动车辆同时充电作为对价格信号的反应，可以系统地触发变压器或线路保护。实时识别这种快速升高的灵活性激活将允许抵消以避免潜在的社会和财务成本。在这项工作中，提出了一种用于识别快速升高灵活性激活事件的新型数据处理流水线。管道结合了无监督事件检测和开放式分类的技术。实际负载数据的系统评估演示了所提出的管道的主要构建块可以通过满足分布式事件检测架构中应用的重要要求的方法来实现。为了检测灵活性激活事件，识别了上部性能限制。此外，证明了与广泛应用的闭合分类器相比，用于分类的开放式分类器的应用可以提高性能。

translated by 谷歌翻译

Deep Learning for Time Series Anomaly Detection: A Survey

Zahra Zamanzadeh Darban , Geoffrey I. Webb , Shirui Pan , Charu C. Aggarwal , Mahsa Salehi

分类：机器学习 | 人工智能

2022-11-09

Time series anomaly detection has applications in a wide range of research fields and applications, including manufacturing and healthcare. The presence of anomalies can indicate novel or unexpected events, such as production faults, system defects, or heart fluttering, and is therefore of particular interest. The large size and complex patterns of time series have led researchers to develop specialised deep learning models for detecting anomalous patterns. This survey focuses on providing structured and comprehensive state-of-the-art time series anomaly detection models through the use of deep learning. It providing a taxonomy based on the factors that divide anomaly detection models into different categories. Aside from describing the basic anomaly detection technique for each category, the advantages and limitations are also discussed. Furthermore, this study includes examples of deep anomaly detection in time series across various application domains in recent years. It finally summarises open issues in research and challenges faced while adopting deep anomaly detection models.

translated by 谷歌翻译

A Unified Survey on Anomaly, Novelty, Open-Set, and Out-of-Distribution Detection: Solutions and Future Challenges

Mohammadreza Salehi , Hossein Mirzaei , Dan Hendrycks , Yixuan Li , Mohammad Hossein Rohban , Mohammad Sabokrou

分类：计算机视觉 | 机器学习

2021-10-26

机器学习模型通常会遇到与训练分布不同的样本。无法识别分布（OOD）样本，因此将该样本分配给课堂标签会显着损害模型的可靠性。由于其对在开放世界中的安全部署模型的重要性，该问题引起了重大关注。由于对所有可能的未知分布进行建模的棘手性，检测OOD样品是具有挑战性的。迄今为止，一些研究领域解决了检测陌生样本的问题，包括异常检测，新颖性检测，一级学习，开放式识别识别和分布外检测。尽管有相似和共同的概念，但分别分布，开放式检测和异常检测已被独立研究。因此，这些研究途径尚未交叉授粉，创造了研究障碍。尽管某些调查打算概述这些方法，但它们似乎仅关注特定领域，而无需检查不同领域之间的关系。这项调查旨在在确定其共同点的同时，对各个领域的众多著名作品进行跨域和全面的审查。研究人员可以从不同领域的研究进展概述中受益，并协同发展未来的方法。此外，据我们所知，虽然进行异常检测或单级学习进行了调查，但没有关于分布外检测的全面或最新的调查，我们的调查可广泛涵盖。最后，有了统一的跨域视角，我们讨论并阐明了未来的研究线，打算将这些领域更加紧密地融为一体。

translated by 谷歌翻译