太阳能无线电通量以及地磁指数是太阳能活动的重要指标及其效果。耀斑和地磁风暴等极端太阳能事件可能对低地轨道中的卫星的空间环境产生负面影响。因此,预测这些空间天气指数在太空运营和科学方面具有重要意义。在这项研究中,我们提出了一种基于长期短期内存神经网络的模型,以了解时间序列数据的分布,以便使用时间序列以及太阳能图像提供空间天气指标的同时多元27天预测数据。我们展示了30-40 \%的根均方误差改进了,而仅包括使用时间序列数据的太阳能图像数据,而单独使用时间序列数据。与训练有素的深神经网络模型相比,诸如持久性和运行平均预测之类的简单基线也将与训练有素的深神经网络模型进行比较。我们还使用模型集合量化我们预测中的不确定性。
translated by 谷歌翻译
我们基准了一个简单学习模型的亚季节预测工具包,该工具包优于操作实践和最先进的机器学习和深度学习方法。这些模型,由Mouatadid等人引入。 (2022),包括(a)气候++,这是气候学的一种适应性替代品,对于降水而言,准确性9%,比美国运营气候预测系统(CFSV2)高9%,熟练250%; (b)CFSV2 ++,一种学习的CFSV2校正,可将温度和降水精度提高7-8%,技能提高50-275%; (c)持久性++是一种增强的持久性模型,将CFSV2预测与滞后测量相结合,以将温度和降水精度提高6-9%,技能提高40-130%。在整个美国,气候++,CFSV2 ++和持久性++工具包始终优于标准气象基准,最先进的机器和深度学习方法,以及欧洲中等范围的天气预报集合中心。
translated by 谷歌翻译
熟练的水流预测可以为水政策和管理各个领域的决策提供信息。我们集成了数值天气预测集合和分布式水文模型,以在中范围的交货时间(1-7天)下生成集合流量预测。我们展示了一项用于在美国东部的Susquehanna河流盆地的后处理过程中进行机器学习应用的案例研究。为了进行预测验证,我们使用不同的指标,例如技能得分和可靠性图,以提前时间,流量阈值和季节为条件。验证结果表明,机器学习后处理器可以改善相对于低复杂性预测(例如气候和时间持久性)以及确定性和原始集合预测的水流预测。与原始合奏相比,与较短的交货时间相比,在中等时间表的相对增益在后期时间表通常更高。与低压流相比,高流量和与凉爽的流量相比。总体而言,我们的结果突出了机器学习在许多方面的好处,以提高流量预测的技能和可靠性。
translated by 谷歌翻译
Forecasting time series with extreme events has been a challenging and prevalent research topic, especially when the time series data are affected by complicated uncertain factors, such as is the case in hydrologic prediction. Diverse traditional and deep learning models have been applied to discover the nonlinear relationships and recognize the complex patterns in these types of data. However, existing methods usually ignore the negative influence of imbalanced data, or severe events, on model training. Moreover, methods are usually evaluated on a small number of generally well-behaved time series, which does not show their ability to generalize. To tackle these issues, we propose a novel probability-enhanced neural network model, called NEC+, which concurrently learns extreme and normal prediction functions and a way to choose among them via selective back propagation. We evaluate the proposed model on the difficult 3-day ahead hourly water level prediction task applied to 9 reservoirs in California. Experimental results demonstrate that the proposed model significantly outperforms state-of-the-art baselines and exhibits superior generalization ability on data with diverse distributions.
translated by 谷歌翻译
随着Covid-19影响每个国家的全球和改变日常生活,预测疾病的传播的能力比任何先前的流行病更重要。常规的疾病 - 展开建模方法,隔间模型,基于对病毒的扩散的时空均匀性的假设,这可能导致预测到欠低,特别是在高空间分辨率下。本文采用替代技术 - 时空机器学习方法。我们提出了Covid-LSTM,一种基于长期短期内存深度学习架构的数据驱动模型,用于预测Covid-19在美国县级的发病率。我们使用每周数量的新阳性案例作为时间输入,以及来自Facebook运动和连通数据集的手工工程空间特征,以捕捉时间和空间的疾病的传播。 Covid-LSTM在我们的17周的评估期间优于Covid-19预测集线器集合模型(CovidHub-Ensemble),使其首先比一个或多个预测期更准确的模型。在4周的预测地平线上,我们的型号平均每县平均50例比CovidHub-Ensemble更准确。我们强调,在Covid-19之前,在Covid-19之前的数据驱动预测的未充分利用疾病传播的预测可能是由于以前疾病缺乏足够的数据,除了最近的时尚预测方法的机器学习方法的进步。我们讨论了更广泛的数据驱动预测的障碍,以及将来将使用更多的基于学习的模型。
translated by 谷歌翻译
将间歇性可再生能源集成到大量的电网中是具有挑战性的。旨在解决这一困难的建立良好的方法涉及即将到来的能源供应可变性以适应电网的响应。在太阳能中,可以在全天空摄像机(前方30分钟)和卫星观测(提前6小时)的不同时间尺度上预测由遮挡云引起的短期变化。在这项研究中,我们将这两种互补的观点集成到单个机器学习框架中的云覆盖物上,以改善时间内(最高60分钟)的辐照度预测。确定性和概率预测均在不同的天气条件(晴朗,多云,阴天)以及不同的输入配置(天空图像,卫星观测和/或过去的辐照度值)中进行评估。我们的结果表明,混合模型在晴朗的条件下有益于预测,并改善了长期预测。这项研究为将来的新颖方法奠定了基础,即在单个学习框架中将天空图像和卫星观测结合起来,以推动太阳现象。
translated by 谷歌翻译
太阳能的高效整合到电力组合中取决于其间歇性的可靠预期。预测由云覆盖动态产生的太阳辐照度的时间变异的有希望的方法是基于地面天空图像或卫星图像序列的分析。尽管结果令人鼓舞,但现有深度学习方法的经常性限制在于对过去观察的反应而不是积极预期未来事件的无处不在的趋势。这导致频繁的时间滞后和有限的预测突发事件的能力。为了解决这一挑战,我们介绍了Eclipse,一种时空神经网络架构,即模型从天空图像模拟云运动,不仅预测未来的辐照水平,而且还可以在本地辐照度图上提供更丰富的信息。我们表明Eclipse预期关键事件,并在产生视觉上现实期货的同时降低时间延误。
translated by 谷歌翻译
Wind power forecasting helps with the planning for the power systems by contributing to having a higher level of certainty in decision-making. Due to the randomness inherent to meteorological events (e.g., wind speeds), making highly accurate long-term predictions for wind power can be extremely difficult. One approach to remedy this challenge is to utilize weather information from multiple points across a geographical grid to obtain a holistic view of the wind patterns, along with temporal information from the previous power outputs of the wind farms. Our proposed CNN-RNN architecture combines convolutional neural networks (CNNs) and recurrent neural networks (RNNs) to extract spatial and temporal information from multi-dimensional input data to make day-ahead predictions. In this regard, our method incorporates an ultra-wide learning view, combining data from multiple numerical weather prediction models, wind farms, and geographical locations. Additionally, we experiment with global forecasting approaches to understand the impact of training the same model over the datasets obtained from multiple different wind farms, and we employ a method where spatial information extracted from convolutional layers is passed to a tree ensemble (e.g., Light Gradient Boosting Machine (LGBM)) instead of fully connected layers. The results show that our proposed CNN-RNN architecture outperforms other models such as LGBM, Extra Tree regressor and linear regression when trained globally, but fails to replicate such performance when trained individually on each farm. We also observe that passing the spatial information from CNN to LGBM improves its performance, providing further evidence of CNN's spatial feature extraction capabilities.
translated by 谷歌翻译
预测基金绩效对投资者和基金经理都是有益的,但这是一项艰巨的任务。在本文中,我们测试了深度学习模型是否比传统统计技术更准确地预测基金绩效。基金绩效通常通过Sharpe比率进行评估,该比例代表了风险调整的绩效,以确保基金之间有意义的可比性。我们根据每月收益率数据序列数据计算了年度夏普比率,该数据的时间序列数据为600多个投资于美国上市大型股票的开放式共同基金投资。我们发现,经过现代贝叶斯优化训练的长期短期记忆(LSTM)和封闭式复发单元(GRUS)深度学习方法比传统统计量相比,预测基金的Sharpe比率更高。结合了LSTM和GRU的预测的合奏方法,可以实现所有模型的最佳性能。有证据表明,深度学习和结合能提供有希望的解决方案,以应对基金绩效预测的挑战。
translated by 谷歌翻译
随着高级数字技术的蓬勃发展,用户以及能源分销商有可能获得有关家庭用电的详细信息。这些技术也可以用来预测家庭用电量(又称负载)。在本文中,我们研究了变分模式分解和深度学习技术的使用,以提高负载预测问题的准确性。尽管在文献中已经研究了这个问题,但选择适当的分解水平和提供更好预测性能的深度学习技术的关注较少。这项研究通过研究六个分解水平和五个不同的深度学习网络的影响来弥合这一差距。首先,使用变分模式分解将原始负载轮廓分解为固有模式函数,以减轻其非平稳方面。然后,白天,小时和过去的电力消耗数据作为三维输入序列馈送到四级小波分解网络模型。最后,将与不同固有模式函数相关的预测序列组合在一起以形成聚合预测序列。使用摩洛哥建筑物的电力消耗数据集(MORED)的五个摩洛哥家庭的负载曲线评估了该方法,并根据最新的时间序列模型和基线持久性模型进行了基准测试。
translated by 谷歌翻译
太阳能现在是历史上最便宜的电力形式。不幸的是,由于其变异性,显着提高栅格的太阳能的一部分仍然具有挑战性,这使得电力的供需平衡更加困难。虽然热发电机坡度 - 它们可以改变输出的最高速率 - 是有限的,太阳能的坡度基本上是无限的。因此,准确的近期太阳能预测或垂圈,对于提供预警来调整热发电机输出,以响应于太阳能变化来调整热发电机,以确保平衡供需。为了解决问题,本文开发了使用自我监督学习的丰富和易于使用的多光谱卫星数据的太阳能垂圈的一般模型。具体而言,我们使用卷积神经网络(CNN)和长短期内存网络(LSTM)开发深度自动回归模型,这些模型在多个位置训练全球培训,以预测最近推出的最近收集的时空数据的未来观察-R系列卫星。我们的模型估计了基于卫星观测的未来的太阳辐照度,我们向较小的场地特定的太阳能数据培训的回归模型提供,以提供近期太阳能光伏(PV)预测,其考虑了现场特征的特征。我们评估了我们在25个太阳能场所的不同覆盖区域和预测视野的方法,并表明我们的方法利用地面真理观察结果产生靠近模型的错误。
translated by 谷歌翻译
在本文中,我们介绍了蒙面的多步多变量预测(MMMF),这是一个新颖而普遍的自我监督学习框架,用于时间序列预测,并提供已知的未来信息。在许多真实世界的预测情况下,已知一些未来的信息,例如,在进行短期到中期的电力需求预测或进行飞机出发预测时的油价预测时,天气信息。现有的机器学习预测框架可以分为(1)基于样本的方法,在此方法中进行每个预测,以及(2)时间序列回归方法,其中未来信息未完全合并。为了克服现有方法的局限性,我们提出了MMMF,这是一个培训能够生成一系列输出的神经网络模型的框架,将过去的时间信息和有关未来的已知信息结合在一起,以做出更好的预测。实验在两个现实世界数据集上进行(1)中期电力需求预测,以及(2)前两个月的飞行偏离预测。他们表明,所提出的MMMF框架的表现不仅优于基于样本的方法,而且具有与完全相同的基本模型的现有时间序列预测模型。此外,一旦通过MMMF进行了神经网络模型,其推理速度与接受传统回归配方训练的相同模型的推理速度相似,从而使MMMF成为现有回归训练的时间序列的更好替代品,如果有一些可用的未来,信息。
translated by 谷歌翻译
对于长期来说,研究人员一直在开发可靠而准确的股票价格预测预测模型。根据文献,如果预测模型是正确的设计和精炼,他们可以煞费苦心地和忠实地估计未来的库存价值。本文展示了一组时间序列,计量经济性和各种基于学习的股票价格预测模型。在此处使用来自2004年1月至2019年12月至2019年12月的Infosys,Icici和Sun Pharma的数据用于培训和测试模型,以了解哪种模型在哪个部门中表现最佳。一个时间序列模型(Holt-Winters指数平滑),一个计量计量模型(Arima),两台机器学习模型(随机林和火星),以及两种深度学习的模型(简单的RNN和LSTM)已被列入本文。火星已被证明是最好的执行机器学习模式,而LSTM已被证明是表现最好的深层学习模式。但总体而言,对于所有三个部门 - 它(在Infosys数据上),银行业务(在ICICI数据)和健康(在Sun Pharma数据上),Mars已被证明是销售预测中最佳表现模式。
translated by 谷歌翻译
A well-performing prediction model is vital for a recommendation system suggesting actions for energy-efficient consumer behavior. However, reliable and accurate predictions depend on informative features and a suitable model design to perform well and robustly across different households and appliances. Moreover, customers' unjustifiably high expectations of accurate predictions may discourage them from using the system in the long term. In this paper, we design a three-step forecasting framework to assess predictability, engineering features, and deep learning architectures to forecast 24 hourly load values. First, our predictability analysis provides a tool for expectation management to cushion customers' anticipations. Second, we design several new weather-, time- and appliance-related parameters for the modeling procedure and test their contribution to the model's prediction performance. Third, we examine six deep learning techniques and compare them to tree- and support vector regression benchmarks. We develop a robust and accurate model for the appliance-level load prediction based on four datasets from four different regions (US, UK, Austria, and Canada) with an equal set of appliances. The empirical results show that cyclical encoding of time features and weather indicators alongside a long-short term memory (LSTM) model offer the optimal performance.
translated by 谷歌翻译
衡量全球经济均衡的定量指标与农业供应链和国际贸易流量具有强大而相互依存的关系。这些过程中的突然震动由贸易战争,流行病或天气等异常事件造成的,可能对全球经济具有复杂影响。在本文中,我们提出了一种新颖的框架,即:Depeag,采用经济学,使用深度学习(DL)来测量异常事件检测的影响,以确定普通财务指数(如Dowjones)之间的关系,以及生产价值农产品(如奶酪和牛奶)。我们使用称为长期内存(LSTM)网络的DL技术成功地预测商品生产,高精度,也是五个流行的模型(回归和提升)作为基准,以测量异常事件的影响。结果表明,具有异常值的考虑因素(使用隔离林)优于基线模型的Depeag,以及具有异常值检测的相同模型。在预测财务指标预测商品生产时,异常事件会产生相当大的影响。此外,我们展示了Deepag对公共政策的影响,为政策制定者和农民提供了洞察力,以及农业生态系统的运作决策。收集数据,模型开发,并记录和呈现结果。
translated by 谷歌翻译
在本文中,我们呈现SSDNet,这是一个新的时间序列预测的深层学习方法。SSDNet将变压器架构与状态空间模型相结合,提供概率和可解释的预测,包括趋势和季节性成分以及前一步对预测很重要。变压器架构用于学习时间模式并直接有效地估计状态空间模型的参数,而无需对卡尔曼滤波器的需要。我们全面评估了SSDNET在五个数据集上的性能,显示SSDNet是一种有效的方法,可在准确性和速度,优于最先进的深度学习和统计方法方面是一种有效的方法,能够提供有意义的趋势和季节性组件。
translated by 谷歌翻译
我们调查预测中的合奏技术,并检查其使用与Covid-19大流行早期类似的非季度时间系列的潜力。开发改进的预测方法是必不可少的,因为它们在关键阶段为组织和决策者提供数据驱动的决策。我们建议使用后期数据融合,使用两个预测模型的堆叠集合和两个元特征,并在初步预测阶段证明其预测力。最终的集合包括先知和长期短期内存(LSTM)神经网络作为基础模型。基础模型由多层的Perceptron(MLP)组合,考虑到元素,表示与每个基础模型的预测精度最高的相关性。我们进一步表明,包含Meta-Features通常会在七和十四天的两个预测视野中提高集合的预测准确性。该研究强化了以前的工作,并展示了与深层学习模型相结合的传统统计模型的价值,以生产更多来自不同领域和季节性的时间序列的预测模型。
translated by 谷歌翻译
最近实现了更准确的短期预测的数据驱动的空气质量预测。尽管取得了成功,但大多数目前的数据驱动解决方案都缺乏适当的模型不确定性的量化,以传达信任预测的程度。最近,在概率深度学习中已经制定了几种估计不确定性的实用工具。但是,在空气质量预测领域的域中没有经验应用和广泛的比较这些工具。因此,这项工作在空气质量预测的真实环境中应用了最先进的不确定性量化。通过广泛的实验,我们描述了培训概率模型,并根据经验性能,信心可靠性,置信度估计和实际适用性评估其预测性不确定性。我们还使用空气质量数据中固有的“自由”对抗培训和利用时间和空间相关性提出改善这些模型。我们的实验表明,所提出的模型比以前的工作更好地在量化数据驱动空气质量预测中的不确定性方面表现出。总体而言,贝叶斯神经网络提供了更可靠的不确定性估计,但可能挑战实施和规模。其他可扩展方法,如深合奏,蒙特卡罗(MC)辍学和随机重量平均-Gaussian(SWAG)可以执行良好,如果正确应用,但具有不同的权衡和性能度量的轻微变化。最后,我们的结果表明了不确定性估计的实际影响,并证明了,实际上,概率模型更适合提出知情决策。代码和数据集可用于\ url {https:/github.com/abdulmajid-murad/deep_probabilistic_forecast}
translated by 谷歌翻译
21世纪的现代旅游面临着许多挑战。这些挑战之一是太空有限地区的游客数量迅速增长,例如历史城市中心,博物馆或地理瓶颈,例如狭窄的山谷。在这种情况下,对特定领域内的旅游量和旅游流程的正确准确预测对于游客管理任务,例如游客流量控制和预防人满为患至关重要。静态流量控制方法,例如限制对热点或使用常规低级控制器的访问,无法解决问题。在本文中,我们通过使用旅游区提供的可用粒状数据,并将结果与​​Arima进行比较,并将结果与​​Arima进行比较经典统计方法。我们的结果表明,与Arima方法相比,深度学习模型可以产生更好的预测,同时具有更快的推理时间和能够结合其他输入功能。
translated by 谷歌翻译
杂交和集合学习技术是改善预测方法的预测能力的流行模型融合技术。通过有限的研究,将这两种有前途的方法结合在一起,本文着重于不同合奏的基础模型池中指数平滑的旋转神经网络(ES-RNN)的实用性。我们将某些最先进的结合技术和算术模型平均作为基准进行比较。我们对M4预测数据集进行了100,000个时间序列,结果表明,基于特征的预测模型平均(FFORFORA)平均是与ES-RNN的晚期数据融合的最佳技术。但是,考虑到M4的每日数据子集,堆叠是处理所有基本模型性能相似的情况下唯一成功的合奏。我们的实验结果表明,与N-Beats作为基准相比,我们达到了艺术的预测结果。我们得出的结论是,模型平均比模型选择和堆叠策略更强大。此外,结果表明,提高梯度对于实施合奏学习策略是优越的。
translated by 谷歌翻译