智能论文笔记

Through-life Monitoring of Resource-constrained Systems and Fleets

Felipe Montana , Adam Hartwell , Will Jacobs , Visakan Kadirkamanathan , Andrew R Mills , Tom Clark

分类：机器学习

2023-01-03

A Digital Twin (DT) is a simulation of a physical system that provides information to make decisions that add economic, social or commercial value. The behaviour of a physical system changes over time, a DT must therefore be continually updated with data from the physical systems to reflect its changing behaviour. For resource-constrained systems, updating a DT is non-trivial because of challenges such as on-board learning and the off-board data transfer. This paper presents a framework for updating data-driven DTs of resource-constrained systems geared towards system health monitoring. The proposed solution consists of: (1) an on-board system running a light-weight DT allowing the prioritisation and parsimonious transfer of data generated by the physical system; and (2) off-board robust updating of the DT and detection of anomalous behaviours. Two case studies are considered using a production gas turbine engine system to demonstrate the digital representation accuracy for real-world, time-varying physical systems.

translated by 谷歌翻译

In-flight Novelty Detection with Convolutional Neural Networks

Adam Hartwell , Felipe Montana , Will Jacobs , Visakan Kadirkamanathan , Andrew R Mills , Tom Clark

分类：机器学习

2021-12-07

燃气轮机发动机是复杂的机器，通常产生大量数据，并且需要仔细监控，以允许具有成本效益的预防性维护。在航空航天应用中，将所有测量数据返回到地面是昂贵的，通常会导致有用，高值，要丢弃的数据。因此，在实时检测，优先级和返回有用数据的能力是至关重要的。本文提出了由卷积神经网络常态模型描述的系统输出测量，实时优先考虑预防性维护决策者。由于燃气轮机发动机时变行为的复杂性，导出精确的物理模型难以困难，并且通常导致预测精度低的模型和与实时执行不相容。数据驱动的建模是一种理想的替代方案，生产高精度，资产特定模型，而无需从第一原理推导。我们提出了一种用于在线检测和异常数据的优先级的数据驱动系统。通过集成到深神经预测模型中的不确定管理，避免了偏离新的操作条件的数据评估。测试是对实际和合成数据进行的，显示对真实和合成故障的敏感性。该系统能够在低功耗嵌入式硬件上实时运行，目前正在部署Rolls-Royce Pearl 15发动机飞行试验。

translated by 谷歌翻译

The Digital Twin Landscape at the Crossroads of Predictive Maintenance, Machine Learning and Physics Based Modeling

Brian Kunzer , Mario Berges , Artur Dubrawski

分类：机器学习

2022-06-21

在过去的十年中，数字双胞胎的概念在受欢迎程度上爆发了，但围绕其多个定义，其新颖性作为新技术的新颖性以及其实际适用性仍然存在，尽管进行了许多评论，调查和新闻稿，但其实际适用性仍然存在。探索了数字双胞胎一词的历史，以及其在产品生命周期管理，资产维护和设备车队管理，运营和计划领域的初始背景。还基于七个基本要素提供了一个最小可行的框架来利用数字双胞胎的定义。还概述了采用DT方法的DT应用程序和行业的简短旅行。预测维护领域突出了数字双胞胎框架的应用，并使用基于机器学习和基于物理的建模的扩展。采用机器学习和基于物理的建模的组合形成混合数字双胞胎框架，可以协同减轻隔离使用时每种方法的缺点。还讨论了实践实施数字双胞胎模型的关键挑战。随着数字双技术的快速增长及其成熟，预计将实现实质性增强工具和解决方案的巨大希望，以实现智能设备的智能维护。

translated by 谷歌翻译

A Temporal Anomaly Detection System for Vehicles utilizing Functional Working Groups and Sensor Channels

Subash Neupane , Ivan A. Fernandez , Wilson Patterson , Sudip Mittal , Shahram Rahimi

分类：机器学习 | 人工智能 | 神经与进化计算

2022-09-14

装有传感器，执行器和电子控制单元（ECU）的现代车辆可以分为几个称为功能工作组（FWGS）的操作子系统。这些FWG的示例包括发动机系统，变速箱，燃油系统，制动器等。每个FWG都有相关的传感器通道，可以衡量车辆操作条件。这种丰富的数据环境有利于预测维护（PDM）技术的开发。削弱各种PDM技术的是需要强大的异常检测模型，该模型可以识别出明显偏离大多数数据的事件或观察结果，并且不符合正常车辆操作行为的明确定义的概念。在本文中，我们介绍了车辆性能，可靠性和操作（VEPRO）数据集，并使用它来创建一种基于多阶段的异常检测方法。利用时间卷积网络（TCN），我们的异常检测系统可以达到96％的检测准确性，并准确预测91％的真实异常。当利用来自多个FWG的传感器通道时，我们的异常检测系统的性能会改善。

translated by 谷歌翻译

Deep Learning for Time Series Anomaly Detection: A Survey

Zahra Zamanzadeh Darban , Geoffrey I. Webb , Shirui Pan , Charu C. Aggarwal , Mahsa Salehi

分类：机器学习 | 人工智能

2022-11-09

Time series anomaly detection has applications in a wide range of research fields and applications, including manufacturing and healthcare. The presence of anomalies can indicate novel or unexpected events, such as production faults, system defects, or heart fluttering, and is therefore of particular interest. The large size and complex patterns of time series have led researchers to develop specialised deep learning models for detecting anomalous patterns. This survey focuses on providing structured and comprehensive state-of-the-art time series anomaly detection models through the use of deep learning. It providing a taxonomy based on the factors that divide anomaly detection models into different categories. Aside from describing the basic anomaly detection technique for each category, the advantages and limitations are also discussed. Furthermore, this study includes examples of deep anomaly detection in time series across various application domains in recent years. It finally summarises open issues in research and challenges faced while adopting deep anomaly detection models.

translated by 谷歌翻译

Cloud Failure Prediction with Hierarchical Temporal Memory: An Empirical Assessment

Oliviero Riganelli , Paolo Saltarel , Alessandro Tundo , Marco Mobilio , Leonardo Mariani

分类：神经与进化计算 | 人工智能 | 机器学习

2021-10-06

分层时间记忆（HTM）是一种无监督的学习算法，其灵感来自Neocortex的功能，可用于连续处理流数据并检测异常，而无需大量数据进行培训，也不需要标记数据。 HTM还能够从样本中不断学习，提供一个始终是关于观察的模型。这些特性使HTM特别适用于支持云系统中的在线故障预测，这是具有动态变化行为的系统必须监视以预测问题。本文介绍了在故障预测的背景下评估HTM的第一个系统研究。考虑到72个HTM配置所获得的HTM配置到Clearwater云系统中引入的12种不同类型的故障表明，HTM可以帮助预测具有足够有效性（F-Measure = 0.76）的失败，代表有趣的实际替代方案（半 - ）监督算法。

translated by 谷歌翻译

RUAD: unsupervised anomaly detection in HPC systems

Martin Molan , Andrea Borghesi , Daniele Cesarini , Luca Benini , Andrea Bartolini

分类：机器学习 | 人工智能

2022-08-28

现代高性能计算（HPC）系统的复杂性日益增加，需要引入自动化和数据驱动的方法，以支持系统管理员为增加系统可用性的努力。异常检测是改善可用性不可或缺的一部分，因为它减轻了系统管理员的负担，并减少了异常和解决方案之间的时间。但是，对当前的最新检测方法进行了监督和半监督，因此它们需要具有异常的人体标签数据集 - 在生产HPC系统中收集通常是不切实际的。基于聚类的无监督异常检测方法，旨在减轻准确的异常数据的需求，到目前为止的性能差。在这项工作中，我们通过提出RUAD来克服这些局限性，RUAD是一种新型的无监督异常检测模型。 Ruad比当前的半监督和无监督的SOA方法取得了更好的结果。这是通过考虑数据中的时间依赖性以及在模型体系结构中包括长短期限内存单元的实现。提出的方法是根据tier-0系统（带有980个节点的Cineca的Marconi100的完整历史）评估的。 RUAD在半监督训练中达到曲线（AUC）下的区域（AUC）为0.763，在无监督的训练中达到了0.767的AUC，这改进了SOA方法，在半监督训练中达到0.747的AUC，无需训练的AUC和0.734的AUC在无处不在的AUC中提高了AUC。训练。它还大大优于基于聚类的当前SOA无监督的异常检测方法，其AUC为0.548。

translated by 谷歌翻译

IoT Data Analytics in Dynamic Environments: From An Automated Machine Learning Perspective

Li Yang , Abdallah Shami

分类：机器学习

2022-09-16

近年来，随着传感器和智能设备的广泛传播，物联网（IoT）系统的数据生成速度已大大增加。在物联网系统中，必须经常处理，转换和分析大量数据，以实现各种物联网服务和功能。机器学习（ML）方法已显示出其物联网数据分析的能力。但是，将ML模型应用于物联网数据分析任务仍然面临许多困难和挑战，特别是有效的模型选择，设计/调整和更新，这给经验丰富的数据科学家带来了巨大的需求。此外，物联网数据的动态性质可能引入概念漂移问题，从而导致模型性能降解。为了减少人类的努力，自动化机器学习（AUTOML）已成为一个流行的领域，旨在自动选择，构建，调整和更新机器学习模型，以在指定任务上实现最佳性能。在本文中，我们对Automl区域中模型选择，调整和更新过程中的现有方法进行了审查，以识别和总结将ML算法应用于IoT数据分析的每个步骤的最佳解决方案。为了证明我们的发现并帮助工业用户和研究人员更好地实施汽车方法，在这项工作中提出了将汽车应用于IoT异常检测问题的案例研究。最后，我们讨论并分类了该领域的挑战和研究方向。

translated by 谷歌翻译

A Comprehensive Review of Digital Twin -- Part 2: Roles of Uncertainty Quantification and Optimization, a Battery Digital Twin, and Perspectives

Adam Thelen , Xiaoge Zhang , Olga Fink , Yan Lu , Sayan Ghosh , Byeng D. Youn , Michael D. Todd , Sankaran Mahadevan , Chao Hu , Zhen Hu

分类：机器学习

2022-08-27

作为行业4.0时代的一项新兴技术，数字双胞胎因其承诺进一步优化流程设计，质量控制，健康监测，决策和政策制定等，通过全面对物理世界进行建模，以进一步优化流程设计，质量控制，健康监测，决策和政策，因此获得了前所未有的关注。互连的数字模型。在一系列两部分的论文中，我们研究了不同建模技术，孪生启用技术以及数字双胞胎常用的不确定性量化和优化方法的基本作用。第二篇论文介绍了数字双胞胎的关键启示技术的文献综述，重点是不确定性量化，优化方法，开源数据集和工具，主要发现，挑战和未来方向。讨论的重点是当前的不确定性量化和优化方法，以及如何在数字双胞胎的不同维度中应用它们。此外，本文介绍了一个案例研究，其中构建和测试了电池数字双胞胎，以说明在这两部分评论中回顾的一些建模和孪生方法。 GITHUB上可以找到用于生成案例研究中所有结果和数字的代码和预处理数据。

translated by 谷歌翻译

Data-Driven Fault Diagnosis Analysis and Open-Set Classification of Time-Series Data

Andreas Lundgren , Daniel Jung

分类： (统计)机器学习 | 机器学习

2020-09-10

动态系统的故障诊断是通过检测时间序列数据的变化（例如由系统降解和故障组件引起的残差）来完成的。通用多级分类方法用于故障诊断的使用使训练数据和未知的故障类别变得复杂。另一个复杂因素是，不同的故障类别可能导致相似的残余输出，尤其是对于小故障，这会导致分类歧义。在这项工作中，开发了用于使用Kullback-Leibler Divergence进行故障诊断应用程序的数据驱动分析和开放集分类的框架。提出了数据驱动的故障分类算法，该算法可以处理不平衡的数据集，类重叠和未知故障。此外，提出了一种算法来估计训练数据包含来自已知故障实现的信息时的故障大小。提出的框架的一个优点是，它也可以用于定量分析故障诊断性能，例如分析对不同幅度的故障进行分类的容易性。为了评估所提出方法的有用性，已经从内部燃烧引擎测试工作台收集了来自不同故障场景的多个数据集，以说明数据驱动诊断系统的设计过程，包括定量错误诊断分析和开发的开放式设置的评估故障分类算法。

translated by 谷歌翻译

A survey on concept drift adaptation

分类：

Concept drift primarily refers to an online supervised learning scenario when the relation between the input data and the target variable changes over time. Assuming a general knowledge of supervised learning in this paper we characterize adaptive learning process, categorize existing strategies for handling concept drift, overview the most representative, distinct and popular techniques and algorithms, discuss evaluation methodology of adaptive algorithms, and present a set of illustrative applications. The survey covers the different facets of concept drift in an integrated way to reflect on the existing scattered state-of-the-art. Thus, it aims at providing a comprehensive introduction to the concept drift adaptation for researchers, industry analysts and practitioners.

translated by 谷歌翻译

Using Machine Learning for Anomaly Detection on a System-on-Chip under Gamma Radiation

Eduardo Weber Wachter , Server Kasap , Sefki Kolozali , Xiaojun Zhai , Shoaib Ehsan , Klaus McDonald-Maier

分类：机器学习

2022-01-05

新的纳米级技术的出现对辐射环境中的可靠电子系统造成了重大挑战。少数种类的辐射等全电离剂量（TID）效应通常导致在这种纳米级电子设备上的永久性损坏，以及当前最先进的技术，以使用昂贵的辐射硬化装置。本文重点介绍了一种新颖且不同的方法：在消费者电子级现场可编程门阵列（FPGA）上使用机器学习算法来解决TID效果并在停止工作之前监控它们替换。这种情况有一个研究挑战，以期待电路板因TID效应而导致总失效。我们观察到γ辐射下FPGA板的内部测量，并使用了三种不同的异常检测机学习（ML）算法来检测伽马辐射环境中的传感器测量中的异常。统计结果表明伽马辐射曝光水平与板测量之间的高度显着关系。此外，我们的异常检测结果表明，具有径向基函数内核的单级支持向量机的平均召回得分为0.95。此外，在电路板停止工作之前，可以检测到所有异常。

translated by 谷歌翻译

A Robust and Explainable Data-Driven Anomaly Detection Approach For Power Electronics

Alexander Beattie , Pavol Mulinka , Subham Sahoo , Ioannis T. Christou , Charalampos Kalalas , Daniel Gutierrez-Rojas , Pedro H. J. Nardelli

分类：机器学习

2022-09-23

及时，准确地检测功率电子中的异常，对于维持复杂的生产系统而变得越来越重要。强大而可解释的策略有助于减少系统的停机时间，并抢占或减轻基础设施网络攻击。这项工作从解释当前数据集和机器学习算法输出中存在的不确定性类型开始。然后引入和分析三种打击这些不确定性的技术。我们进一步介绍了两种异常检测和分类方法，即矩阵曲线算法和异常变压器，它们是在电源电子转换器数据集的背景下应用的。具体而言，矩阵配置文件算法被证明非常适合作为检测流时间序列数据中实时异常的概括方法。迭代矩阵配置文件的结构python库实现用于创建检测器。创建了一系列自定义过滤器并将其添加到检测器中，以调整其灵敏度，回忆和检测精度。我们的数值结果表明，通过简单的参数调整，检测器在各种故障场景中提供了高精度和性能。

translated by 谷歌翻译

The Role of Machine Learning in Cybersecurity

Giovanni Apruzzese , Pavel Laskov , Edgardo Montes de Oca , Wissam Mallouli , Luis Burdalo Rapa , Athanasios Vasileios Grammatopoulos , Fabio Di Franco

分类：机器学习

2022-06-20

机器学习（ML）代表了当前和未来信息系统的关键技术，许多域已经利用了ML的功能。但是，网络安全中ML的部署仍处于早期阶段，揭示了研究和实践之间的显着差异。这种差异在当前的最新目的中具有其根本原因，该原因不允许识别ML在网络安全中的作用。除非广泛的受众理解其利弊，否则ML的全部潜力将永远不会释放。本文是对ML在整个网络安全领域中的作用的首次尝试 - 对任何对此主题感兴趣的潜在读者。我们强调了ML在人类驱动的检测方法方面的优势，以及ML在网络安全方面可以解决的其他任务。此外，我们阐明了影响网络安全部署实际ML部署的各种固有问题。最后，我们介绍了各种利益相关者如何为网络安全中ML的未来发展做出贡献，这对于该领域的进一步进步至关重要。我们的贡献补充了两项实际案例研究，这些案例研究描述了ML作为对网络威胁的辩护的工业应用。

translated by 谷歌翻译

Anomaly detection in laser-guided vehicles' batteries: a case study

Gianfranco Lombardo , Stefano Cagnoni , Stefano Cavalli , Juan José Contreras Gonzáles , Francesco Monica , Monica Mordonini , Michele Tomaiuolo

分类：机器学习

2022-12-27

Detecting anomalous data within time series is a very relevant task in pattern recognition and machine learning, with many possible applications that range from disease prevention in medicine, e.g., detecting early alterations of the health status before it can clearly be defined as "illness" up to monitoring industrial plants. Regarding this latter application, detecting anomalies in an industrial plant's status firstly prevents serious damages that would require a long interruption of the production process. Secondly, it permits optimal scheduling of maintenance interventions by limiting them to urgent situations. At the same time, they typically follow a fixed prudential schedule according to which components are substituted well before the end of their expected lifetime. This paper describes a case study regarding the monitoring of the status of Laser-guided Vehicles (LGVs) batteries, on which we worked as our contribution to project SUPER (Supercomputing Unified Platform, Emilia Romagna) aimed at establishing and demonstrating a regional High-Performance Computing platform that is going to represent the main Italian supercomputing environment for both computing power and data volume.

translated by 谷歌翻译

System Resilience through Health Monitoring and Reconfiguration

Ion Matei , Wiktor Piotrowski , Alexandre Perez , Johan de Kleer , Jorge Tierno , Wendy Mungovan , Vance Turnewitsch

分类：人工智能

2022-08-30

我们展示了一个端到端框架，以提高人造系统对不可预见的事件的弹性。该框架基于基于物理的数字双胞胎模型和三个负责实时故障诊断，预后和重新配置的模块。故障诊断模块使用基于模型的诊断算法来检测和分离断层，并在系统中产生干预措施，以消除不确定的诊断解决方案。我们通过使用基于物理学的数字双胞胎的平行化和替代模型来扩展故障诊断算法为所需的实时性能。预后模块跟踪故障进度，并训练在线退化模型，以计算系统组件的剩余使用寿命。此外，我们使用降解模型来评估断层进程对操作要求的影响。重新配置模块使用基于PDDL的计划，并带有语义附件来调整系统控件，从而最大程度地减少了对系统操作的故障影响。我们定义一个弹性度量，并以燃料系统模型的示例来说明该指标如何通过我们的框架改进。

translated by 谷歌翻译

Exploring the Use of Data-Driven Approaches for Anomaly Detection in the Internet of Things (IoT) Environment

Eleonora Achiluzzi , Menglu Li , Md Fahd Al Georgy , Rasha Kashef

分类：机器学习

2022-12-31

The Internet of Things (IoT) is a system that connects physical computing devices, sensors, software, and other technologies. Data can be collected, transferred, and exchanged with other devices over the network without requiring human interactions. One challenge the development of IoT faces is the existence of anomaly data in the network. Therefore, research on anomaly detection in the IoT environment has become popular and necessary in recent years. This survey provides an overview to understand the current progress of the different anomaly detection algorithms and how they can be applied in the context of the Internet of Things. In this survey, we categorize the widely used anomaly detection machine learning and deep learning techniques in IoT into three types: clustering-based, classification-based, and deep learning based. For each category, we introduce some state-of-the-art anomaly detection methods and evaluate the advantages and limitations of each technique.

translated by 谷歌翻译

Operations for Autonomous Spacecraft

Rebecca Castano , Tiago Vaquero , Federico Rossi , Vandi Verma , Ellen Van Wyk , Dan Allard , Bennett Huffmann , Erin M. Murphy , Nihal Dhamani , Robert A. Hewitt

分类：机器人 | 人工智能

2021-11-22

船上自治技术，如规划和调度，识别科学目标和基于内容的数据摘要，将导致令人兴奋的新空间科学任务。然而，尚未研究具有此类船上自治能力的经营任务的挑战，这是足以在使命概念中考虑的细节水平。这些自主功能需要更改当前的操作流程，实践和工具。我们制定了一个案例研究，以评估使运营商和科学家通过促进地面人员和车载算法之间的共同模型来运营自主航天器所需的变化。我们评估使运营商和科学家能够向航天器传达所需的新的操作工具和工作流程，并能够重建和解释船上和航天器状态的决定。这些工具的模型用于用户学习，了解过程和工具在实现共享理解框架方面的有效性，以及在运营商和科学家有效实现特派团科学目标的能力。

translated by 谷歌翻译

Machine learning enabling high-throughput and remote operations at large-scale user facilities

Tatiana Konstantinova , Phillip M. Maffettone , Bruce Ravel , Stuart I. Campbell , Andi M. Barbour , Daniel Olds

分类：机器学习

2022-01-09

成像，散射和光谱是理解和发现新功能材料的基础。自动化和实验技术的当代创新导致这些测量更快，分辨率更高，从而产生了大量的分析数据。这些创新在用户设施和同步射击光源时特别明显。机器学习（ML）方法经常开发用于实时地处理和解释大型数据集。然而，仍然存在概念障碍，进入设施一般用户社区，通常缺乏ML的专业知识，以及部署ML模型的技术障碍。在此，我们展示了各种原型ML模型，用于在国家同步光源II（NSLS-II）的多个波束线上在飞行分析。我们谨慎地描述这些示例，专注于将模型集成到现有的实验工作流程中，使得读者可以容易地将它们自己的ML技术与具有普通基础设施的NSLS-II或设施的实验中的实验。此处介绍的框架展示了几乎没有努力，多样化的ML型号通过集成到实验编程和数据管理的现有Blueske套件中与反馈回路一起运行。

translated by 谷歌翻译

Online Self-Evolving Anomaly Detection in Cloud Computing Environments

Haili Wang , Jingda Guo , Xu Ma , Song Fu , Qing Yang , Yunzhong Xu

分类：人工智能

2021-11-16

现代云计算系统包含数百到数千个计算和存储服务器。这种规模与不断增长的系统复杂性相结合，对可靠云计算的失败和资源管理导致关键挑战。自主失败检测是了解系统级可靠性保证的紧急，云现象和自我管理云资源的重要技术。要检测到失败，我们需要监控云执行并收集运行时性能数据。这些数据通常是未标记的，因此在生产云中并不总是可用的现有故障历史。在本文中，我们提出了一种\ emph {自我不断发展的异常检测}（SEAD）框架，用于云可靠性保证。我们的框架通过递归探索新验证的异常记录并在线持续更新异常探测器。作为我们框架的鲜明优势，云系统管理员只需要检查少量检测到的异常，并且它们的决定可以利用以更新探测器。因此，探测器在升级系统硬件，软件堆栈的更新和用户工作负载的更改之后演变。此外，我们设计了两种类型的探测器，一个用于一般异常检测，另一类用于特异性异常检测。在自我不断发展的技术的帮助下，我们的探测器可以平均达到88.94 \％的灵敏度和94.60 \％，这使得它们适合现实世界部署。

translated by 谷歌翻译