我们提出了一种对任何概率基础预测进行核对的原则方法。我们展示了如何通过通过贝叶斯规则合并底部预测和上层时间序列中包含的信息来获得概率对帐。我们在玩具层次结构上说明了我们的方法,展示了我们的框架如何允许对任何基本预测的概率对帐。我们对计数时间序列的时间层次结构进行对帐进行实验,与基于高斯或截短的高斯分布相比,获得了重大改进。
translated by 谷歌翻译
Hierarchical time series are common in several applied fields. Forecasts are required to be coherent, that is, to satisfy the constraints given by the hierarchy. The most popular technique to enforce coherence is called reconciliation, which adjusts the base forecasts computed for each time series. However, recent works on probabilistic reconciliation present several limitations. In this paper, we propose a new approach based on conditioning to reconcile any type of forecast distribution. We then introduce a new algorithm, called Bottom-Up Importance Sampling, to efficiently sample from the reconciled distribution. It can be used for any base forecast distribution: discrete, continuous, or in the form of samples, providing a major speedup compared to the current methods. Experiments on several temporal hierarchies show a significant improvement over base probabilistic forecasts.
translated by 谷歌翻译
当时间序列具有自然组结构时,出现分层预测问题,并且需要在多个聚集水平和对组中分类的预测。在这些问题中,通常希望满足给定层次结构中的聚合约束,称为文献中的分层一致性。在生产准确的预测的同时保持层次连贯可能是一个具有挑战性的问题,特别是在概率预测的情况下。我们提出了一种能够对等级序列准确和相干的概率预测的新方法。我们称之为Deep Poisson混合网络(DPMN)。它依赖于神经网络的组合和用于分层多变量时间序列结构的关节分布的统计模型。通过施工,模型可确保分层一致性,并为预测分布的聚集和分解提供简单的规则。我们进行广泛的实证评估,将DPMN与其他最先进的方法进行比较,该方法在多个公共数据集上产生分层相干的概率预测。与现有的相干概率模型相比,我们在澳大利亚国内旅游数据的总体连续排名概率评分(CRP)的总体连续排名概率评分(CRP)的相对改善,24.2位于青年杂货店销售数据集中,6.9%在旧金山湾区公路交通数据集。
translated by 谷歌翻译
预测组合在预测社区中蓬勃发展,近年来,已经成为预测研究和活动主流的一部分。现在,由单个(目标)系列产生的多个预测组合通过整合来自不同来源收集的信息,从而提高准确性,从而减轻了识别单个“最佳”预测的风险。组合方案已从没有估计的简单组合方法演变为涉及时间变化的权重,非线性组合,组件之间的相关性和交叉学习的复杂方法。它们包括结合点预测和结合概率预测。本文提供了有关预测组合的广泛文献的最新评论,并参考可用的开源软件实施。我们讨论了各种方法的潜在和局限性,并突出了这些思想如何随着时间的推移而发展。还调查了有关预测组合实用性的一些重要问题。最后,我们以当前的研究差距和未来研究的潜在见解得出结论。
translated by 谷歌翻译
Multivariate time series forecasting with hierarchical structure is pervasive in real-world applications, demanding not only predicting each level of the hierarchy, but also reconciling all forecasts to ensure coherency, i.e., the forecasts should satisfy the hierarchical aggregation constraints. Moreover, the disparities of statistical characteristics between levels can be huge, worsened by non-Gaussian distributions and non-linear correlations. To this extent, we propose a novel end-to-end hierarchical time series forecasting model, based on conditioned normalizing flow-based autoregressive transformer reconciliation, to represent complex data distribution while simultaneously reconciling the forecasts to ensure coherency. Unlike other state-of-the-art methods, we achieve the forecasting and reconciliation simultaneously without requiring any explicit post-processing step. In addition, by harnessing the power of deep model, we do not rely on any assumption such as unbiased estimates or Gaussian distribution. Our evaluation experiments are conducted on four real-world hierarchical datasets from different industrial domains (three public ones and a dataset from the application servers of Alipay's data center) and the preliminary results demonstrate efficacy of our proposed method.
translated by 谷歌翻译
我们介绍了称为\ texttt {mecats}的异构专家框架的混合,其同时预测通过聚合层次结构相关的一组时间序列的值。不同类型的预测模型可以作为个别专家使用,以便可以根据相应时间序列的性质来定制每个模型的形式。 \ TextTt {Mecats}在培训阶段期间了解分层关系,以帮助概括在被建模的所有时间序列中更好地提高,并且还减轻了由于层次结构施加的约束而产生的一致性问题。我们进一步在点预测的顶部构建多个分位数估计值。由此产生的概率预测几乎是连贯的,无分布的,并且独立于预测模型的选择。我们对两点和概率预测进行了全面的评估,并制定了序列数据中存在变化点的情况的扩展。通常,我们的方法是强大的,适用于具有不同特性的数据集,对大规模预测管道具有高度可配置和高效的。
translated by 谷歌翻译
This paper extends quantile factor analysis to a probabilistic variant that incorporates regularization and computationally efficient variational approximations. By means of synthetic and real data experiments it is established that the proposed estimator can achieve, in many cases, better accuracy than a recently proposed loss-based estimator. We contribute to the literature on measuring uncertainty by extracting new indexes of low, medium and high economic policy uncertainty, using the probabilistic quantile factor methodology. Medium and high indexes have clear contractionary effects, while the low index is benign for the economy, showing that not all manifestations of uncertainty are the same.
translated by 谷歌翻译
概率预测包括基于过去观察的未来结果的概率分布组成。在气象中,运行基于物理的数值模型的集合以获得此类分发。通常,使用评分规则,预测分配的功能和观察结果进行评估。通过一些评分规则,可以同时评估预测的校准和清晰度。在深度学习中,生成神经网络参数化在高维空间上的分布,并通过从潜变量转换绘制来轻松允许采样。条件生成网络另外限制输入变量上的分布。在此稿件中,我们使用培训的条件生成网络执行概率预测,以最小化评分规则值。与生成的对抗网络(GANS)相比,不需要鉴别者,培训是稳定的。我们对两种混沌模型进行实验和天气观测的全球数据集;结果令人满意,更好地校准而不是由GANS实现的。
translated by 谷歌翻译
分位数特征选择与相关的多变量时间序列数据一直是一种方法论挑战,是一个公开的问题。在本文中,我们提出了一般的概率方法,用于在分位数特征选择时间序列(QFSTS)模型的名称下进行关节定量时间序列分析中的特征选择。 QFSTS模型是一般的结构时间序列模型,其中每个组件对具有直接解释的时间序列建模产生了添加剂贡献。其灵活性是化合物,用户可以在用户可以为每个次系列添加/扣除组件,并且每个时间序列都可以具有其自身特定的不同大小的价值组件。特征选择是在分位数回归组件中进行的,其中每个时间序列都有自己的同时外部预测器池,允许“垂圈”。通过多变量非对称LAPLACE分布,“峰值板”先前设置,Metropolis-Hastings算法和贝叶斯模型平均技术,开发了创造性的概率方法在扩展到分量时间序列研究区域的特征选择。始终如一地在贝叶斯范式中。与大多数机器学习算法不同,QFSTS模型需要小型数据集训练,快速收敛,并且可在普通的个人计算机上进行可执行。对模拟数据和经验数据的广泛检查确认QFSTS模型具有卓越的性能特征选择,参数估计和预测。
translated by 谷歌翻译
Probabilistic forecasting, i.e. estimating the probability distribution of a time series' future given its past, is a key enabler for optimizing business processes. In retail businesses, for example, forecasting demand is crucial for having the right inventory available at the right time at the right place. In this paper we propose DeepAR, a methodology for producing accurate probabilistic forecasts, based on training an auto-regressive recurrent network model on a large number of related time series. We demonstrate how by applying deep learning techniques to forecasting, one can overcome many of the challenges faced by widely-used classical approaches to the problem. We show through extensive empirical evaluation on several real-world forecasting data sets accuracy improvements of around 15% compared to state-of-the-art methods.
translated by 谷歌翻译
电力在不同的时间范围和法规上在各个市场上进行交易。由于更高的可再生能源渗透,短期交易变得越来越重要。在德国,盘中电价通常以独特的小时模式围绕EPEX现货市场的白天价格波动。这项工作提出了一种概率建模方法,该方法对日前合同的盘中价格差异进行了建模。该模型通过将每天的每日价格间隔的四个15分钟的间隔视为四维的关节分布,从而捕获了新兴的小时模式。使用归一化流量,即结合条件多元密度估计和概率回归的深层生成模型,从而学习了最终的多元价格差异分布。将归一化流程与选择的历史数据,高斯副群和高斯回归模型进行了比较。在不同的模型中,归一化流量最准确地识别趋势,并且预测间隔最窄。值得注意的是,归一化流是唯一识别稀有价格峰的方法。最后,这项工作讨论了不同外部影响因素的影响,并发现个人大多数因素都可以忽略不计。只有价格差异实现的直接历史和所有投入因素的组合才能显着改善预测。
translated by 谷歌翻译
基于预测方法的深度学习已成为时间序列预测或预测的许多应用中的首选方法,通常通常优于其他方法。因此,在过去的几年中,这些方法现在在大规模的工业预测应用中无处不在,并且一直在预测竞赛(例如M4和M5)中排名最佳。这种实践上的成功进一步提高了学术兴趣,以理解和改善深厚的预测方法。在本文中,我们提供了该领域的介绍和概述:我们为深入预测的重要构建块提出了一定深度的深入预测;随后,我们使用这些构建块,调查了最近的深度预测文献的广度。
translated by 谷歌翻译
我们研究了欧洲排放津贴(EUA)的价格,从而分析了它们对相关能源市场的不确定性和依赖性。我们提出了一个概率的多元条件时间序列模型,该模型利用数据的关键特征。在广泛的滚动窗口预测研究中评估了提议模型和各种竞争模型的预测性能,涵盖了将近两年的样本外。因此,我们预测了30步。多元概率预测的准确性由能量评分评估。鉴于俄罗斯对乌克兰的入侵,我们还讨论了着重于波动性溢出和随时间变化的相关性的发现。
translated by 谷歌翻译
在本文中,我们提出了Beta自回归移动平均模型的五个预测间隔。该模型适用于在间隔$(0,1)$中假设值的建模和预测变量。提出的两个预测间隔是基于近似值,考虑到β分布的正态分布和分位功能。我们还考虑基于自举的预测间隔,即:(i)自举预测错误(BPE)间隔; (ii)偏置校正和加速度(BCA)预测间隔; (iii)基于两种不同的自举计划的引导程序预测值的分位数的百分位预测间隔。根据蒙特卡洛模拟评估了提出的预测间隔。 BCA预测间隔在评估的间隔中提供了最佳性能,显示出较低的覆盖率失真和较小的平均长度。我们应用了我们的方法来预测巴西S \ ao Paulo的Cantareira供水系统的水位。
translated by 谷歌翻译
远程预测是许多决策支持系统的起点,需要在预测值上从高级聚合模式中汲取推断。最先进的时间序列预测方法要么受到Long-Horizo n预测的概念漂移,或者未能准确地预测连贯和准确的高水平聚集体。在这项工作中,我们提出了一种新颖的概率预测方法,其在基础级别和预测总统计方面产生了一致的预测。我们使用新推断方法实现预测基础级和聚合统计数据之间的一致性。我们的推断方法基于KL分歧,可以在封闭形式中有效地解决。我们表明,我们的方法在基本级别和静电汇总推断上的预测性能提高了三种不同域的真实数据集的帖子推断。
translated by 谷歌翻译
We propose Multivariate Quantile Function Forecaster (MQF$^2$), a global probabilistic forecasting method constructed using a multivariate quantile function and investigate its application to multi-horizon forecasting. Prior approaches are either autoregressive, implicitly capturing the dependency structure across time but exhibiting error accumulation with increasing forecast horizons, or multi-horizon sequence-to-sequence models, which do not exhibit error accumulation, but also do typically not model the dependency structure across time steps. MQF$^2$ combines the benefits of both approaches, by directly making predictions in the form of a multivariate quantile function, defined as the gradient of a convex function which we parametrize using input-convex neural networks. By design, the quantile function is monotone with respect to the input quantile levels and hence avoids quantile crossing. We provide two options to train MQF$^2$: with energy score or with maximum likelihood. Experimental results on real-world and synthetic datasets show that our model has comparable performance with state-of-the-art methods in terms of single time step metrics while capturing the time dependency structure.
translated by 谷歌翻译
在过去几十年中,已经提出了各种方法,用于估计回归设置中的预测间隔,包括贝叶斯方法,集合方法,直接间隔估计方法和保形预测方法。重要问题是这些方法的校准:生成的预测间隔应该具有预定义的覆盖水平,而不会过于保守。在这项工作中,我们从概念和实验的角度审查上述四类方法。结果来自各个域的基准数据集突出显示从一个数据集中的性能的大波动。这些观察可能归因于违反某些类别的某些方法所固有的某些假设。我们说明了如何将共形预测用作提供不具有校准步骤的方法的方法的一般校准程序。
translated by 谷歌翻译
时间变化数量的估计是医疗保健和金融等领域决策的基本组成部分。但是,此类估计值的实际实用性受到它们量化预测不确定性的准确程度的限制。在这项工作中,我们解决了估计高维多元时间序列的联合预测分布的问题。我们提出了一种基于变压器体系结构的多功能方法,该方法使用基于注意力的解码器估算关节分布,该解码器可被学会模仿非参数Copulas的性质。最终的模型具有多种理想的属性:它可以扩展到数百个时间序列,支持预测和插值,可以处理不规则和不均匀的采样数据,并且可以在训练过程中无缝地适应丢失的数据。我们从经验上证明了这些属性,并表明我们的模型在多个现实世界数据集上产生了最新的预测。
translated by 谷歌翻译
已经显示混合方法以在预测任务中以纯粹的统计和纯粹的深度学习方法优于预测,并定量与这些预测(预测间隔)的相关不确定性。一个示例是指数平滑复发性神经网络(ES-RNN),统计预测模型和经常性神经网络变体之间的混合。 ES-RNN在Makridakis-4预测竞争中实现了9.4 \%的绝对错误。这种改进和类似的混合模型的表现主要是仅在单变量数据集上展示。将混合预测方法应用于多变量数据的困难包括($ i $)的高参数调整所涉及的高计算成本,用于与数据中固有的自动关联相关的模型(II $)挑战,以及( $ iii $)在可能难以捕获的协变量之间的复杂依赖(交叉相关)。本文介绍了多变量指数平滑的长短短期记忆(MES-LSTM),对ES-RNN的广义多元扩展,克服了这些挑战。 MES-LSTM利用了矢量化实现。我们在2019年(Covid-19)发病率数据集的几种聚集冠状病毒病中测试MES-LSTM,并发现我们的混合方法在预测准确性和预测间隔建设下对纯统计和深度学习方法进行了一致的,显着改善。
translated by 谷歌翻译
Methods for reasoning under uncertainty are a key building block of accurate and reliable machine learning systems. Bayesian methods provide a general framework to quantify uncertainty. However, because of model misspecification and the use of approximate inference, Bayesian uncertainty estimates are often inaccurate -for example, a 90% credible interval may not contain the true outcome 90% of the time. Here, we propose a simple procedure for calibrating any regression algorithm; when applied to Bayesian and probabilistic models, it is guaranteed to produce calibrated uncertainty estimates given enough data. Our procedure is inspired by Platt scaling and extends previous work on classification. We evaluate this approach on Bayesian linear regression, feedforward, and recurrent neural networks, and find that it consistently outputs well-calibrated credible intervals while improving performance on time series forecasting and model-based reinforcement learning tasks.
translated by 谷歌翻译