预测农作物易受影响的极端温室气温是在温室种植领域的必要条件。它有助于避免热量或冷冻损坏和经济损失。因此,开发可以准确预测它们的模型非常重要。由于数据集中缺乏极端的温度数据,模型准确预测它是具有挑战性的。在本文中,我们提出了一种改进的损耗功能,适用于各种机器学习模型。通过增加极端温度样本的重量并降低误判极端温度的可能性正常,所提出的损失函数可以增强极端情况的预测结果。为了验证所提出的方法的有效性,我们在LightGBM,长期内记忆和人工神经网络中实现了改进的损失功能,并在真实世界温室数据集进行实验。结果表明,与极端情况下的原始模型相比,增强了具有改进损耗功能的模型的性能。改进的模型可用于保证在农业温室中及时判断极端温度,从而防止由不正确的预测引起的不必要的损失。
translated by 谷歌翻译
Remaining Useful Life (RUL) estimation plays a critical role in Prognostics and Health Management (PHM). Traditional machine health maintenance systems are often costly, requiring sufficient prior expertise, and are difficult to fit into highly complex and changing industrial scenarios. With the widespread deployment of sensors on industrial equipment, building the Industrial Internet of Things (IIoT) to interconnect these devices has become an inexorable trend in the development of the digital factory. Using the device's real-time operational data collected by IIoT to get the estimated RUL through the RUL prediction algorithm, the PHM system can develop proactive maintenance measures for the device, thus, reducing maintenance costs and decreasing failure times during operation. This paper carries out research into the remaining useful life prediction model for multi-sensor devices in the IIoT scenario. We investigated the mainstream RUL prediction models and summarized the basic steps of RUL prediction modeling in this scenario. On this basis, a data-driven approach for RUL estimation is proposed in this paper. It employs a Multi-Head Attention Mechanism to fuse the multi-dimensional time-series data output from multiple sensors, in which the attention on features is used to capture the interactions between features and attention on sequences is used to learn the weights of time steps. Then, the Long Short-Term Memory Network is applied to learn the features of time series. We evaluate the proposed model on two benchmark datasets (C-MAPSS and PHM08), and the results demonstrate that it outperforms the state-of-art models. Moreover, through the interpretability of the multi-head attention mechanism, the proposed model can provide a preliminary explanation of engine degradation. Therefore, this approach is promising for predictive maintenance in IIoT scenarios.
translated by 谷歌翻译
Forecasting time series with extreme events has been a challenging and prevalent research topic, especially when the time series data are affected by complicated uncertain factors, such as is the case in hydrologic prediction. Diverse traditional and deep learning models have been applied to discover the nonlinear relationships and recognize the complex patterns in these types of data. However, existing methods usually ignore the negative influence of imbalanced data, or severe events, on model training. Moreover, methods are usually evaluated on a small number of generally well-behaved time series, which does not show their ability to generalize. To tackle these issues, we propose a novel probability-enhanced neural network model, called NEC+, which concurrently learns extreme and normal prediction functions and a way to choose among them via selective back propagation. We evaluate the proposed model on the difficult 3-day ahead hourly water level prediction task applied to 9 reservoirs in California. Experimental results demonstrate that the proposed model significantly outperforms state-of-the-art baselines and exhibits superior generalization ability on data with diverse distributions.
translated by 谷歌翻译
Data Centers are huge power consumers, both because of the energy required for computation and the cooling needed to keep servers below thermal redlining. The most common technique to minimize cooling costs is increasing data room temperature. However, to avoid reliability issues, and to enhance energy efficiency, there is a need to predict the temperature attained by servers under variable cooling setups. Due to the complex thermal dynamics of data rooms, accurate runtime data center temperature prediction has remained as an important challenge. By using Gramatical Evolution techniques, this paper presents a methodology for the generation of temperature models for data centers and the runtime prediction of CPU and inlet temperature under variable cooling setups. As opposed to time costly Computational Fluid Dynamics techniques, our models do not need specific knowledge about the problem, can be used in arbitrary data centers, re-trained if conditions change and have negligible overhead during runtime prediction. Our models have been trained and tested by using traces from real Data Center scenarios. Our results show how we can fully predict the temperature of the servers in a data rooms, with prediction errors below 2 C and 0.5 C in CPU and server inlet temperature respectively.
translated by 谷歌翻译
提出了一种自动编码器(AE)极限学习机(ELM)-AE-ELM模型,以根据相互信息算法(MI),AE和ELM的组合来预测NOX发射浓度。首先,实用变量的重要性由MI算法计算,并分析了该机制以确定与NOX发射浓度相关的变量。然后,进一步分析了所选变量与NOX发射浓度之间的时间延迟相关性,以重建建模数据。随后,将AE应用于输入变量中的隐藏特征。最后,ELM算法建立了NOX发射浓度与深度特征之间的关系。实用数据的实验结果表明,与最先进的模型相比,提出的模型显示出有希望的性能。
translated by 谷歌翻译
近年来,在运输电气化方面取得了重大进展。作为主要的储能设备,锂离子电池(LIB)已受到广泛关注。准确地预测健康状况(SOH)不仅可以缓解用户对电池寿命的焦虑,而且还可以为电池管理提供重要信息。本文提出了一种基于视觉变压器(VIT)模型的SOH的预测方法。首先,预定义电压范围的离散充电数据用作输入数据矩阵。然后,电池的循环特征是由VIT捕获的,可以获得可以获得全局特征,并且通过将循环特征与完整连接(FC)层相结合来获得SOH。同时,引入了转移学习(TL),并根据目标任务电池的早期周期数据进一步微调基于源任务电池训练的预测模型,以提供准确的预测。实验表明,与现有的深度学习方法相比,我们的方法可以获得更好的特征表达,从而可以实现更好的预测效果和传递效果。
translated by 谷歌翻译
在这项综合研究中,通过基于能量环境分析添加入口空气冷却和再生冷却来评估涡轮轴发动机。首先,飞行器数量,飞行高度,主要周期中压缩机1的压缩比,主周期中涡轮-1的涡轮入口温度,涡轮-2的温度分数,辅助的压缩比循环和入口空气冷却系统中的进气温变化,这些功能性能参数的某些功能性能参数,配备了带有入口空气冷却系统的再生涡轮轴发动机周期,例如功率特异性的燃油消耗,功率输出,热效率和硝酸盐氧化物的质量流量(质量流量) NOX)通过使用氢作为燃料工作,研究了NO和NO2。因此,基于分析,开发了一个模型来预测带有冷却空气冷却系统基于深神经网络(DNN)的再生涡轮轴发动机周期的能量环境性能层。该模型提出的旨在预测含有NO和NO2的氮化物氧化物(NOX)的质量流量和质量流量。结果证明了综合DNN模型的准确性,具有适当的MSE,MAE和RMSD成本函数,用于验证测试和培训数据。同样,对于热效率和NOX发射质量流量,对于热效率的验证和NOX发射质量流量质量预测值及其测试数据,R和R^2都非常接近1。
translated by 谷歌翻译
Time Series Forecasting has been an active area of research due to its many applications ranging from network usage prediction, resource allocation, anomaly detection, and predictive maintenance. Numerous publications published in the last five years have proposed diverse sets of objective loss functions to address cases such as biased data, long-term forecasting, multicollinear features, etc. In this paper, we have summarized 14 well-known regression loss functions commonly used for time series forecasting and listed out the circumstances where their application can aid in faster and better model convergence. We have also demonstrated how certain categories of loss functions perform well across all data sets and can be considered as a baseline objective function in circumstances where the distribution of the data is unknown. Our code is available at GitHub: https://github.com/aryan-jadon/Regression-Loss-Functions-in-Time-Series-Forecasting-Tensorflow.
translated by 谷歌翻译
天然气管道中的泄漏检测是石油和天然气行业的一个重要且持续的问题。这尤其重要,因为管道是运输天然气的最常见方法。这项研究旨在研究数据驱动的智能模型使用基本操作参数检测天然气管道的小泄漏的能力,然后使用现有的性能指标比较智能模型。该项目应用观察者设计技术,使用回归分类层次模型来检测天然气管道中的泄漏,其中智能模型充当回归器,并且修改后的逻辑回归模型充当分类器。该项目使用四个星期的管道数据流研究了五个智能模型(梯度提升,决策树,随机森林,支持向量机和人工神经网络)。结果表明,虽然支持向量机和人工神经网络比其他网络更好,但由于其内部复杂性和所使用的数据量,它们并未提供最佳的泄漏检测结果。随机森林和决策树模型是最敏感的,因为它们可以在大约2小时内检测到标称流量的0.1%的泄漏。所有智能模型在测试阶段中具有高可靠性,错误警报率为零。将所有智能模型泄漏检测的平均时间与文献中的实时短暂模型进行了比较。结果表明,智能模型在泄漏检测问题中的表现相对较好。该结果表明,可以与实时瞬态模型一起使用智能模型,以显着改善泄漏检测结果。
translated by 谷歌翻译
这项工作提出了一种用于参与感测的无线传感器网络的提议,其中IOT传感装置特别用于监测和预测空气质量,作为高成本气象站的替代方案。该系统称为PMSening,旨在测量颗粒材料。通过将原型收集的数据与来自车站的数据进行比较来完成验证。比较表明,结果是关闭的,这可以为问题提供低成本解决方案。该系统仍然呈现了使用反复性神经网络的预测分析,在这种情况下,在这种情况下,预测呈现与实际数据相关的高精度。
translated by 谷歌翻译
在这项研究中,我们开发了机器学习模型,以预测废物到燃料植物的未来传感器读数,这将积极控制工厂的运营。我们开发了可预测传感器读数30和60分钟的模型。使用历史数据对模型进行了培训,并根据在特定时间进行的传感器读数进行预测。我们比较了三种类型的模型:(a)仅考虑最后一个预测值的a n \“ aive预测,(b)基于过去的传感器数据进行预测的神经网络(我们考虑了不同的时间窗口尺寸以进行预测)和(c)由我们开发的一组功能创建的梯度增强树回收剂。我们在加拿大的一家废物燃料工厂上开发并测试了模型。我们发现提供的方法(c)提供了最佳结果,而方法(b)提供了不同的结果,并且无法始终如一地超越n \“ aive”。
translated by 谷歌翻译
电力是一种波动的电源,需要短期和长期的精力计划和资源管理。更具体地说,在短期,准确的即时能源消耗中,预测极大地提高了建筑物的效率,为采用可再生能源提供了新的途径。在这方面,数据驱动的方法,即基于机器学习的方法,开始优先于更传统的方法,因为它们不仅提供了更简化的部署方式,而且还提供了最新的结果。从这个意义上讲,这项工作应用和比较了几种深度学习算法,LSTM,CNN,CNN-LSTM和TCN的性能,在制造业内的一个真实测试中。实验结果表明,TCN是预测短期即时能源消耗的最可靠方法。
translated by 谷歌翻译
本文调查了股票回购,特别是分享回购公告。它解决了如何识别此类公告,股票回购的超额回报以及股票回购公告后的回报的预测。我们说明了两种NLP方法,用于自动检测股票回购公告。即使有少量的培训数据,我们也可以达到高达90%的准确性。该论文利用这些NLP方法生成一个由57,155个股票回购公告组成的大数据集。通过分析该数据集,本论文的目的是表明大多数宣布回购的公司的大多数公司都表现不佳。但是,少数公司的表现极大地超过了MSCI世界。当查看所有公司的平均值时,这种重要的表现过高会导致净收益。如果根据公司的规模调整了基准指数,则平均表现过高,并且大多数表现不佳。但是,发现宣布股票回购的公司至少占其市值的1%,即使使用调整后的基准,也平均交付了显着的表现。还发现,在危机时期宣布股票回购的公司比整个市场更好。此外,生成的数据集用于训练72个机器学习模型。通过此,它能够找到许多可以达到高达77%并产生大量超额回报的策略。可以在六个不同的时间范围内改善各种性能指标,并确定明显的表现。这是通过训练多个模型的不同任务和时间范围以及结合这些不同模型的方法来实现的,从而通过融合弱学习者来产生重大改进,以创造一个强大的学习者。
translated by 谷歌翻译
石油加工行业的产品质量评估可能难以耗时,例如耗时。由于手动收集来自植物的液体样品和随后的样品化学实验室分析。产品质量是一个重要的财产,通知该过程的产品是否在规范内。特别是,样品处理(集合,实验室测量,结果分析,报告)引起的延迟会导致经济不利影响。处理此问题的策略之一是软传感器。软传感器是一种模型的集合,可以用于预测和预测基于物理传感器提供的温度,压力和流速的更频繁测量量的数量频繁测量的一些不经常测量的特性(例如石油产品的实验室测量)。软传感器短切路线,以获得有关产品质量的相关信息,通常每分钟提供频繁的测量。软传感器的一个应用是通过对操作参数的目标适应来实时优化化学过程。用于软传感器的模型可以具有各种形式,然而,最常见的是基于人工神经网络(ANNS)的形式。虽然软传感器可以处理炼油厂流程中的一些问题,但他们的开发和部署可以提出本文解决的其他挑战。首先,重要的是要在数据预处理阶段(如方法部分中所述)中的两组数据(实验室测量和物理传感器)的质量非常重要。其次,一旦数据集被预先处理,需要针对预测误差和模型的解释性测试不同的模型。在这项工作中,我们介绍了从原始数据到即用型号的软传感器开发的框架。
translated by 谷歌翻译
通过有效的监控和调整电池操作条件,促进了锂离子电池的寿命和安全性。因此,为电池管理系统上的健康状况(SOH)监测提供快速准确的算法至关重要。由于对电池劣化的复杂性和多种因素的复杂性和多种因素的复杂性,特别是因为不同的劣化过程发生在各种时间尺度,并且它们的相互作用发挥着重要作用。数据驱动方法通过用统计或机器学习模型近似复杂进程来绕过这个问题。本文提出了一种数据驱动方法,在电池劣化的背景下,尽管其简单性和易于计算:多变量分数多项式(MFP)回归。模型从一个耗尽的细胞的历史数据训练,并用于预测其他细胞的SOH。数据的特征在于模拟动态操作条件的载荷变化。考虑了两个假设情景:假设最近的容量测量是已知的,则另一个仅基于标称容量。结果表明,在考虑到电池寿命的电池结束时,通过其历史数据的历史数据受到它们的历史数据的影响,电池的降解行为受到其历史数据的影响。此外,我们提供了一种多因素视角,分析了每个不同因素的影响程度。最后,我们与长期内记忆神经网络和其他来自相同数据集的文献的其他作品进行比较。我们得出结论,MFP回归与当代作品有效和竞争,提供了几种额外的优点。在可解释性,恒定性和可实现性方面。
translated by 谷歌翻译
野火越来越多地影响环境,人类健康和安全。在加利福尼亚前20名野火中,2020 - 2021年的野火比上世纪的燃烧更大。加利福尼亚的2018年野火季节造成了1485亿美元的损失。在数百万受影响的人中,由于不足的警报手段,残疾人(约占世界人口的15%)受到不成比例的影响。在该项目中,基于先进的机器学习体系结构开发了多模式野火预测和个性化预警系统。从2012年到2018年的环境保护局和历史野火数据的传感器数据已编译,以建立一个全面的野火数据库,即同类最大的数据库。接下来,设计了一种新型的U-Convolutional-LSTM(长短期记忆)神经网络,设计了一种特殊的体系结构,可从连续的环境参数中提取关键的空间和时间特征,以指示即将来临的野火。环境和气象因素被纳入数据库,并分类为主要指标和落后指标,分别与野火构想和传播的风险相关。此外,地质数据还用于提供更好的野火风险评估。这种新颖的时空神经网络使用传统的卷积神经网络实现了> 97%的精度,而左右的卷积神经网络则达到了约76%,成功地预测了2018年2018年最具破坏性的野火,提前5-14天提前5-14天。最后,提出了一种个性化的预警系统,该警告系统针对有感觉障碍或呼吸系统加剧条件的人量身定制。该技术将使消防部门在袭击之前预测和防止野火,并为处于危险中的个人提供早期警告以更好地准备,从而挽救生命并减少经济损失。
translated by 谷歌翻译
在医疗保健系统中,需要患者使用可穿戴设备进行远程数据收集和对健康数据的实时监控以及健康状况的状态。可穿戴设备的这种采用导致收集和传输的数据量显着增加。由于设备由较小的电池电源运行,因此由于设备的高处理要求以进行数据收集和传输,因此可以快速减少它们。鉴于医疗数据的重要性,必须所有传输数据遵守严格的完整性和可用性要求。减少医疗保健数据的量和传输频率将通过使用推理算法改善设备电池寿命。有一个以准确性和效率改善传输指标的问题,彼此之间的权衡,例如提高准确性会降低效率。本文表明,机器学习可用于分析复杂的健康数据指标,例如数据传输的准确性和效率,以使用Levenberg-Marquardt算法来克服权衡问题,从而增强这两个指标,从而通过少较少的样本来传输,同时保持维护准确性。使用标准心率数据集测试该算法以比较指标。结果表明,LMA最好以3.33倍的效率进行样本数据尺寸和79.17%的精度,在7种不同的采样案例中具有相似的准确性,用于测试,但表明效率提高。与具有高效率的现有方法相比,这些提出的方法使用机器学习可以显着改善两个指标,而无需牺牲其他指标。
translated by 谷歌翻译
Wind power forecasting helps with the planning for the power systems by contributing to having a higher level of certainty in decision-making. Due to the randomness inherent to meteorological events (e.g., wind speeds), making highly accurate long-term predictions for wind power can be extremely difficult. One approach to remedy this challenge is to utilize weather information from multiple points across a geographical grid to obtain a holistic view of the wind patterns, along with temporal information from the previous power outputs of the wind farms. Our proposed CNN-RNN architecture combines convolutional neural networks (CNNs) and recurrent neural networks (RNNs) to extract spatial and temporal information from multi-dimensional input data to make day-ahead predictions. In this regard, our method incorporates an ultra-wide learning view, combining data from multiple numerical weather prediction models, wind farms, and geographical locations. Additionally, we experiment with global forecasting approaches to understand the impact of training the same model over the datasets obtained from multiple different wind farms, and we employ a method where spatial information extracted from convolutional layers is passed to a tree ensemble (e.g., Light Gradient Boosting Machine (LGBM)) instead of fully connected layers. The results show that our proposed CNN-RNN architecture outperforms other models such as LGBM, Extra Tree regressor and linear regression when trained globally, but fails to replicate such performance when trained individually on each farm. We also observe that passing the spatial information from CNN to LGBM improves its performance, providing further evidence of CNN's spatial feature extraction capabilities.
translated by 谷歌翻译
机器学习(ML)是指根据大量数据预测有意义的输出或对复杂系统进行分类的计算机算法。 ML应用于各个领域,包括自然科学,工程,太空探索甚至游戏开发。本文的重点是在化学和生物海洋学领域使用机器学习。在预测全球固定氮水平,部分二氧化碳压力和其他化学特性时,ML的应用是一种有前途的工具。机器学习还用于生物海洋学领域,可从各种图像(即显微镜,流车和视频记录器),光谱仪和其他信号处理技术中检测浮游形式。此外,ML使用其声学成功地对哺乳动物进行了分类,在特定的环境中检测到濒临灭绝的哺乳动物和鱼类。最重要的是,使用环境数据,ML被证明是预测缺氧条件和有害藻华事件的有效方法,这是对环境监测的重要测量。此外,机器学习被用来为各种物种构建许多对其他研究人员有用的数据库,而创建新算法将帮助海洋研究界更好地理解海洋的化学和生物学。
translated by 谷歌翻译
作为自然现象的地震,历史上不断造成伤害和人类生活的损失。地震预测是任何社会计划的重要方面,可以增加公共准备,并在很大程度上减少损坏。然而,由于地震的随机特征以及实现了地震预测的有效和可靠模型的挑战,迄今为止努力一直不足,需要新的方法来解决这个问题。本文意识到​​这些问题,提出了一种基于注意机制(AM),卷积神经网络(CNN)和双向长短期存储器(BILSTM)模型的新型预测方法,其可以预测数量和最大幅度中国大陆各地区的地震为基于该地区的地震目录。该模型利用LSTM和CNN具有注意机制,以更好地关注有效的地震特性并产生更准确的预测。首先,将零阶保持技术应用于地震数据上的预处理,使得模型的输入数据更适当。其次,为了有效地使用空间信息并减少输入数据的维度,CNN用于捕获地震数据之间的空间依赖性。第三,使用Bi-LSTM层来捕获时间依赖性。第四,引入了AM层以突出其重要的特征来实现更好的预测性能。结果表明,该方法具有比其他预测方法更好的性能和概括能力。
translated by 谷歌翻译