今天的时间序列在当今的许多领域都引起了很多关注。基于复杂网络分析的时间序列预测算法是研究热点。如何使用时间序列信息来实现更准确的预测是一个问题。为了解决这个问题,本文提出了一种加权网络预测方法,以提高预测准确性。首先,时间序列将转换为一个复杂的网络,并将找到节点之间的相似性。然后,相似性将用作权重,以对不同节点产生的预测值进行加权预测。与先前的方法相比,提出的方法更准确。为了验证所提出的方法的效果,在M1,M3数据集和施工成本指数(CCI)数据集上测试了实验部分,这表明所提出的方法具有更准确的预测性能。
translated by 谷歌翻译
时间序列预测一直是科学研究的热点。随着人工智能的发展,通过仿生研究和改进过去的方法,新时期序列预测方法已经获得了更好的预测效果和预测性能。可见性图(VG)算法通常用于先前研究中的时间序列预测,但预测效果不如人工神经网络(ANN),卷积神经网络(CNN)和长期短期等深度学习预测方法内存网络(LSTM)预测。 VG算法包含丰富的网络信息,但之前的研究没有有效地使用网络信息来进行预测,导致相对大的预测错误。为了解决这个问题,本文通过VG的仿生设计和过去研究的扩展,提出了深度可见性系列(DVS)模块,这是第一次将VG与仿生设计和深网络联合起来。通过将生物视觉的仿生设计应用于VG,DVS的时间序列已经获得了卓越的预测精度,这对时间序列预测产生了贡献。与此同时,本文将DVS预测方法应用于建设成本指数预测,具有实际意义。
translated by 谷歌翻译
发达的ET(指数平滑或误差,趋势,季节性)方法在状态空间表示中纳入了指数平滑模型家族,已广泛用于自动预测。现有的ETS方法使用信息标准来选择模型选择,通过在适用于给定时间序列的所有模型中选择具有最小信息标准的最佳模型。当应用于大规模时间序列数据时,这种模型选择方案下的ETS方法会遭受计算复杂性。为了解决此问题,我们通过模拟数据上的培训分类器提出了一种有效的ETS模型选择方法,以预测给定时间序列的适当模型组件形式。我们提供了一项模拟研究,以显示模拟数据中提出的方法的模型选择能力。我们根据点预测和预测间隔,对广泛使用的预测竞争数据集M4评估我们的方法。为了证明我们方法的实际价值,我们在每月医院数据集上展示了方法的绩效改进。
translated by 谷歌翻译
能够捕获与特征向量的时间序列的特征是具有多种应用的非常重要的任务,例如分类,聚类或预测。通常,该特征是从线性和非线性时间序列测量获得的特征,其可能存在若干数据相关的缺点。在这项工作中,我们将NetF介绍作为替代特征,包括时间序列的不同复杂网络映射的几种代表性拓扑测量。我们的方法不需要数据预处理,并且无论任何数据特征如何,都适用。探索我们的新颖特征向量,我们能够将映射的网络功能连接到多样化的时间序列模型中固有的属性,显示NetF可以有用的时间数据。此外,我们还展示了我们在聚类合成和基准时间序列组中的方法的适用性,比较其具有更多传统功能的性能,展示了Netf如何实现高精度集群。我们的结果非常有前途,具有来自不同映射方法的网络特征,捕获时间序列的不同属性,将不同且丰富的功能设置为文献。
translated by 谷歌翻译
网络科学将自己确立为建模时间序列和复杂系统的重要工具。这个建模过程包括将集合或单个时间序列转换为网络。节点可以代表完整的时间序列,段或单个值,而链接定义了所代表部分之间的关​​联或相似性。 R是数据科学,统计和机器学习中使用的主要编程语言之一,并提供许多软件包。但是,没有单个软件包提供将时间序列转换为网络的必要方法。本文介绍了TS2NET,这是一个用于将一个或多个时间序列建模为网络的R软件包。该软件包提供了时间序列距离函数,可以在超级计算机和超级计算机中轻松计算,以处理较大的数据集和方法,以将距离矩阵转换为网络。 TS2NET还提供了将单个时间序列转换为网络的方法,例如复发网络,可见性图和过渡网络。与其他软件包一起,TS2NET允许使用网络科学和图形挖掘工具从时间序列中提取信息。
translated by 谷歌翻译
Dengue fever is a virulent disease spreading over 100 tropical and subtropical countries in Africa, the Americas, and Asia. This arboviral disease affects around 400 million people globally, severely distressing the healthcare systems. The unavailability of a specific drug and ready-to-use vaccine makes the situation worse. Hence, policymakers must rely on early warning systems to control intervention-related decisions. Forecasts routinely provide critical information for dangerous epidemic events. However, the available forecasting models (e.g., weather-driven mechanistic, statistical time series, and machine learning models) lack a clear understanding of different components to improve prediction accuracy and often provide unstable and unreliable forecasts. This study proposes an ensemble wavelet neural network with exogenous factor(s) (XEWNet) model that can produce reliable estimates for dengue outbreak prediction for three geographical regions, namely San Juan, Iquitos, and Ahmedabad. The proposed XEWNet model is flexible and can easily incorporate exogenous climate variable(s) confirmed by statistical causality tests in its scalable framework. The proposed model is an integrated approach that uses wavelet transformation into an ensemble neural network framework that helps in generating more reliable long-term forecasts. The proposed XEWNet allows complex non-linear relationships between the dengue incidence cases and rainfall; however, mathematically interpretable, fast in execution, and easily comprehensible. The proposal's competitiveness is measured using computational experiments based on various statistical metrics and several statistical comparison tests. In comparison with statistical, machine learning, and deep learning methods, our proposed XEWNet performs better in 75% of the cases for short-term and long-term forecasting of dengue incidence.
translated by 谷歌翻译
预测时间序列数据代表了数据科学和知识发现研究的新兴领域,其广泛应用程序从股票价格和能源需求预测到早期预测流行病。在过去的五十年中,已经提出了许多统计和机器学习方法,对高质量和可靠预测的需求。但是,在现实生活中的预测问题中,存在基于上述范式之一的模型是可取的。因此,需要混合解决方案来弥合经典预测方法与现代神经网络模型之间的差距。在这种情况下,我们介绍了一个概率自回归神经网络(PARNN)模型,该模型可以处理各种复杂的时间序列数据(例如,非线性,非季节性,远程依赖性和非平稳性)。拟议的PARNN模型是通过建立综合运动平均值和自回归神经网络的融合来构建的,以保持个人的解释性,可伸缩性和``白色盒子样''的预测行为。通过考虑相关的马尔可夫链的渐近行为,获得了渐近平稳性和几何形状的足够条件。与先进的深度学习工具不同,基于预测间隔的PARNN模型的不确定性量化。在计算实验期间,Parnn在各种各样的现实世界数据集中,超过了标准统计,机器学习和深度学习模型(例如,变形金刚,Nbeats,Deepar等),来自宏观经济学,旅游,能源,流行病学和其他人的真实数据集集合 - 期,中期和长期预测。与最先进的预报相比,与最佳方法相比,与最佳方法进行了多重比较,以展示该提案的优越性。
translated by 谷歌翻译
Time Series Forecasting has been an active area of research due to its many applications ranging from network usage prediction, resource allocation, anomaly detection, and predictive maintenance. Numerous publications published in the last five years have proposed diverse sets of objective loss functions to address cases such as biased data, long-term forecasting, multicollinear features, etc. In this paper, we have summarized 14 well-known regression loss functions commonly used for time series forecasting and listed out the circumstances where their application can aid in faster and better model convergence. We have also demonstrated how certain categories of loss functions perform well across all data sets and can be considered as a baseline objective function in circumstances where the distribution of the data is unknown. Our code is available at GitHub: https://github.com/aryan-jadon/Regression-Loss-Functions-in-Time-Series-Forecasting-Tensorflow.
translated by 谷歌翻译
本文介绍了一个集成预测方法,通过减少特征和模型选择假设来显示M4Competitiation数据集的强劲结果,称为甜甜圈(不利用人为假设)。我们的假设减少,主要由自动生成的功能和更多样化的集合模型组成,显着优于Montero-Manso等人的统计特征的集合方法FForma。 (2020)。此外,我们用长短期内存网络(LSTM)AutoEncoder调查特征提取,并发现此类特征包含传统统计特征方法未捕获的重要信息。合奏加权模型使用LSTM功能和统计功能准确地结合模型。特征重要性和交互的分析表明,单独的统计数据的LSTM特征略有优势。聚类分析表明,不同的基本LSTM功能与大多数统计特征不同。我们还发现,通过使用新模型增强合奏来增加加权模型的解决方案空间是加权模型学习使用的东西,解释了准确性的一部分。最后,我们为集合的最佳组合和选择提供了正式的前后事实分析,通过M4数据集的线性优化量化差异。我们还包括一个简短的证据,模型组合优于模型选择,后者。
translated by 谷歌翻译
时间序列与许多其他机器学习领域一样,从统计学到深度学习进行了过渡。尽管随着模型在许多公开可用的数据集中的更新时,似乎精度一直在提高,但通常只会将比例尺增加几倍,以换取准确性的略有差异。通过该实验,我们指出了不同的思维方式,时间序列,尤其是长期预测,可能与其他领域有所不同。不必使用广泛而复杂的模型来掌握时间序列的所有方面,而是使用纯模型来掌握时间序列的核心规则。有了这个简单但有效的想法,我们创建了Purets,这是一个具有三个纯线性层的网络,在80%的长序列预测任务中实现了最新的,同时几乎是最轻的模型,并且运行速度最快。在此基础上,我们讨论了纯线性层在现象和本质中的潜力。理解核心法律的能力有助于长距离预测的高精度,并且合理的波动可以防止其扭曲多步预测中的曲线,例如主流深度学习模型,该模型总结为纯粹的线性神经网络,避免了范围 - 覆盖。最后,我们建议轻巧长时间时间序列任务的基本设计标准:输入和输出应尝试具有相同的维度,并且结构避免了碎片化和复杂的操作。
translated by 谷歌翻译
传染病仍然是全世界人类疾病和死亡的主要因素之一,其中许多疾病引起了流行的感染波。特定药物和预防疫苗防止大多数流行病的不可用,这使情况变得更糟。这些迫使公共卫生官员,卫生保健提供者和政策制定者依靠由流行病的可靠预测产生的预警系统。对流行病的准确预测可以帮助利益相关者调整对手的对策,例如疫苗接种运动,人员安排和资源分配,以减少手头的情况,这可以转化为减少疾病影响的影响。不幸的是,大多数过去的流行病(例如,登革热,疟疾,肝炎,流感和最新的Covid-19)表现出非线性和非平稳性特征,这是由于它们基于季节性依赖性变化以及这些流行病的性质的扩散波动而引起的。 。我们使用基于最大的重叠离散小波变换(MODWT)自动回归神经网络分析了各种流行时期时间序列数据集,并将其称为EWNET。 MODWT技术有效地表征了流行时间序列中的非平稳行为和季节性依赖性,并在拟议的集合小波网络框架中改善了自回旋神经网络的预测方案。从非线性时间序列的角度来看,我们探讨了所提出的EWNET模型的渐近平稳性,以显示相关的马尔可夫链的渐近行为。我们还理论上还研究了学习稳定性的效果以及在拟议的EWNET模型中选择隐藏的神经元的选择。从实际的角度来看,我们将我们提出的EWNET框架与以前用于流行病预测的几种统计,机器学习和深度学习模型进行了比较。
translated by 谷歌翻译
统计建模和数据驱动学习是吸引许多关注的两个重要领域。统计模型打算捕获和解释变量之间的关系,而基于数据的学习尝试直接从数据中提取信息而无需通过复杂模型预先处理。鉴于两个字段中的广泛研究,一个微妙的问题是如何正确地整合基于数据的方法现有知识或模型。在本文中,基于时间序列数据,我们提出了两种不同的方向来集成两者,基于分解的方法和利用数据特征的统计提取方法。第一个将数据分解成线性稳定,非线性稳定和不稳定部件,其中合适的统计模型用于线性稳定和非线性稳定部件,而适当的机器学习工具用于不稳定部件。第二个应用统计模型来提取数据的统计特征,并将其作为额外的输入送入机器学习平台进行培训。最关键和具有挑战性的是如何从数学或统计模型中确定和提取有价值的信息,以提高机器学习算法的性能。我们使用具有不同程度的稳定性的时间序列数据评估该提案。性能结果表明,两种方法都可以优于使用模型和单独学习的现有方案,而改进可能超过60%。我们所提出的方法都具有促进拓展模型和数据驱动的方案之间的差距,并集成了两个,以提供全面的高等学校性能。
translated by 谷歌翻译
间歇时间序列的分层预测是研究和实证研究中的挑战。庞大的研究侧重于提高每个层次结构的准确性,尤其是底部层次的间歇时间序列。然后,在每个层次结构上调和预测,以进一步提高整体性能。在本文中,我们提出了一种与分层对准方法的预测,该方法将底部水平预测视为可变的柔和预测,以确保在层次结构的上层上的预测精度。我们采用纯深度学习预测方法的N- BEATS对高层的连续时间序列和广泛使用的基于树的算法LightGBM为底层间歇时间序列。具有对准方法的分层预测是自下而上方法的简单且有效的变体,其占难以观察到底部水平的偏差。它允许在较低级别的次优预测保留更高的整体性能。该研究在本实证研究中由第一作者在M5预测准确性竞争期间开发,排名第二。该方法也是良好的商业战略规划有益。
translated by 谷歌翻译
消费者和生产商参与需求响应计划的智能电网有所增加,从而降低了电力系统的投资和运营成本。同样,随着可再生能源的出现,电力市场变得越来越复杂和不可预测。为了有效地实施需求响应计划,预测电力的未来价格对于电力市场的生产商至关重要。电价非常波动,在各种因素的影响下发生变化,例如温度,风速,降雨,商业和日常活动的强度等。因此,将影响因素视为因变量可以提高预测的准确性。在本文中,根据门控复发单元提出了电价预测模型。电负荷消耗被认为是该模型中的输入变量。电价中的噪音严重降低了分析的效率和有效性。因此,将自适应降噪的减少器集成到模型中以减少降噪。然后,SAE用于从售电价中提取功能。最后,馈入GRU以训练预测变量。实际数据集上的结果表明,所提出的方法可以在预测电价方面有效地执行。
translated by 谷歌翻译
准确的短期太阳能和风电预测在电力系统的规划和运营中起着重要作用。然而,由于局部天气条件,由于局部天气条件,因此,可再生能源的短期功率预测始终被认为是复杂的回归问题,而输出能力的波动和动态变化规律,即时空相关性。为了同时捕获时空特征,本文提出了一种新的基于图的神经网络的短期功率预测方法,它结合了图形卷积网络(GCN)和长短期内存(LSTM)。具体地,GCN用于学习相邻可再生能量之间的复杂空间相关性,并且LSTM用于学习功率曲线的动态变化。仿真结果表明,该拟议的混合方法可以模拟可再生能源的时空相关性,其性能优于现实世界数据集上的流行基线。
translated by 谷歌翻译
与单变量预测方法相比,在一组多个时间序列中培训的全球预测模型(GFM)在许多预测竞赛和现实世界应用方面表现出优越的结果。 ETS和Arima等统计预测模型的普及的一个方面是它们相对简单和可解释性(就相关的滞后,趋势,季节性等),而GFM通常缺乏可解释性,特别是对特定时间序列。这减少了基于预测的决策时对利益相关者的信任和信心,而不是能够理解预测。为了减轻这个问题,在这项工作中,我们提出了一种新颖的本地模型 - 不可知论解释方法来解释GFM的预测。我们培训更简单的单变量代理模型,这些模型被认为是通过自动启动或直截了当地作为时间序列的一步的全局黑匣子模型预测所获得的邻域内的邻域内的样本的可解释(例如,ETS)。需要解释哪些。之后,我们评估了对全球模型在定性和定量方面的预测的解释,例如准确性,保真度,稳定性和可理性,并且能够展示我们方法的好处。
translated by 谷歌翻译
天气预报是一项有吸引力的挑战性任务,因为它对人类生活和大气运动的复杂性的影响。在大量历史观察到的时间序列数据的支持下,该任务适用于数据驱动的方法,尤其是深层神经网络。最近,基于图神经网络(GNN)方法在时空预测方面取得了出色的性能。但是,基于规范的GNNS方法仅分别对每个站的气象变量的局部图或整个车站的全局图进行建模,从而缺乏不同站点的气象变量之间的信息相互作用。在本文中,我们提出了一种新型的层次时空图形神经网络(Histgnn),以模拟多个站点气象变量之间的跨区域时空相关性。自适应图学习层和空间图卷积用于构建自学习图,并研究可变级别和站点级别图的节点之间的隐藏依赖性。为了捕获时间模式,扩张的成立为GATE时间卷积的主干旨在对长而各种气象趋势进行建模。此外,提出了动态的交互学习来构建在层次图中传递的双向信息。三个现实世界中的气象数据集的实验结果表明,史基元超过7个基准的卓越性能,并且将误差降低了4.2%至11.6%,尤其是与最先进的天气预测方法相比。
translated by 谷歌翻译
由于动态和复杂的时空依赖性,交通预测具有挑战性。但是,现有方法仍然受到两个关键局限性。首先,许多方法通常使用静态预定义或自适应的空间图来捕获流量系统中动态的时空依赖性,这限制了灵活性,并且仅捕获了整个时间的共享模式,从而导致了次优性能。此外,大多数方法在每个时间步骤中都单独和独立地考虑地面真理与预测之间的绝对误差,这无法维持整体时间序列的全球属性和统计数据,并导致地面真相和预测之间的趋势差异。为此,在本文中,我们提出了一个动态自适应和对抗图卷积网络(DAAGCN),该网络将图形卷积网络(GCN)与生成的对抗网络(GANS)结合在一起,以进行流量预测。具体而言,DAAGCN利用带栅极模块的通用范式将时间变化的嵌入与节点嵌入集成在一起,以生成动态自适应图,以在每个时间步骤中推断空间 - 周期依赖性。然后,设计了两个歧视因子,以维持预测时间序列的全局属性的一致性,并在序列和图形级别上具有地面真相。在四个基准数据集上进行的广泛实验表明,DAAGCN的表现平均比最新的5.05%,3.80%和5.27%在MAE,RMSE和MAPE方面,同时加快收敛性高达9倍。代码可从https://github.com/juyongjiang/daagcn获得。
translated by 谷歌翻译
交通预测是机器学习领域最受欢迎的时空任务之一。该领域的一种普遍方法是将图形卷积网络和经常性神经网络组合以进行时空处理。竞争激烈,提出了许多新的方法。在本文中,我们介绍了时空图神经控制微分方程(STG-NCDE)的方法。神经控制微分方程(NCDE)是用于处理顺序数据的突破性概念。我们扩展了概念和设计两个NCDES:一个用于时间处理,另一个用于空间处理。之后,我们将它们结合成一个框架。我们用6个基准数据集和20个基线进行实验。STG-NCDE在所有情况下显示最佳准确性,优于非琐碎的边缘的所有20个基线。
translated by 谷歌翻译
信息爆炸的时代促使累积巨大的时间序列数据,包括静止和非静止时间序列数据。最先进的算法在处理静止时间数据方面取得了体面的性能。然而,解决静止​​时间系列的传统算法不适用于外汇交易的非静止系列。本文调查了适用的模型,可以提高预测未来非静止时间序列序列趋势的准确性。特别是,我们专注于识别潜在模型,并调查识别模式从历史数据的影响。我们提出了基于RNN的\ Rebuttal {The} SEQ2Seq模型的组合,以及通过动态时间翘曲和Zigzag峰谷指示器提取的注重机制和富集的集合特征。定制损失函数和评估指标旨在更加关注预测序列的峰值和谷点。我们的研究结果表明,我们的模型可以在外汇数据集中预测高精度的4小时未来趋势,这在逼真的情况下至关重要,以协助外汇交易决策。我们进一步提供了对各种损失函数,评估指标,模型变体和组件对模型性能的影响的评估。
translated by 谷歌翻译