智能论文笔记

Adaptive Bias Correction for Improved Subseasonal Forecasting

Soukayna Mouatadid , Paulo Orenstein , Genevieve Flaspohler , Judah Cohen , Miruna Oprescu , Ernest Fraenkel , Lester Mackey

分类：机器学习 | (统计)机器学习

2022-09-21

季节预测$ \ unicode {x2013} $预测温度和降水量为2至6周$ \ unicode {x2013} $，对于有效的水分配，野火管理，干旱和缓解洪水至关重要。最近的国际研究工作提高了操作动力学模型的亚季节能力，但是温度和降水预测技能仍然很差，部分原因是代表动态模型内大气动力学和物理学的顽固错误。为了应对这些错误，我们引入了一种自适应偏置校正（ABC）方法，该方法将最新的动力学预测与使用机器学习的观察结合在一起。当应用于欧洲中等天气预测中心（ECMWF）的领先的亚季节模型时，ABC将温度预测技能提高了60-90％，在美国的连续美国，降水预测技能提高了40-69％基于Shapley队列的实用工作流程，用于解释ABC技能的提高并根据特定的气候条件识别机遇的高技能窗口。

translated by 谷歌翻译

Learned Benchmarks for Subseasonal Forecasting

Soukayna Mouatadid , Paulo Orenstein , Genevieve Flaspohler , Miruna Oprescu , Judah Cohen , Franklyn Wang , Sean Knight , Maria Geogdzhayeva , Sam Levang , Ernest Fraenkel

分类：机器学习 | (统计)机器学习

2021-09-21

我们基准了一个简单学习模型的亚季节预测工具包，该工具包优于操作实践和最先进的机器学习和深度学习方法。这些模型，由Mouatadid等人引入。（2022），包括（a）气候++，这是气候学的一种适应性替代品，对于降水而言，准确性9％，比美国运营气候预测系统（CFSV2）高9％，熟练250％；（b）CFSV2 ++，一种学习的CFSV2校正，可将温度和降水精度提高7-8％，技能提高50-275％；（c）持久性++是一种增强的持久性模型，将CFSV2预测与滞后测量相结合，以将温度和降水精度提高6-9％，技能提高40-130％。在整个美国，气候++，CFSV2 ++和持久性++工具包始终优于标准气象基准，最先进的机器和深度学习方法，以及欧洲中等范围的天气预报集合中心。

translated by 谷歌翻译

Machine Learning for Postprocessing Medium-range Ensemble Streamflow Forecasts

Sanjib Sharma , Ganesh Raj Ghimire , Ridwan Siddique

分类：机器学习

2021-06-15

熟练的水流预测可以为水政策和管理各个领域的决策提供信息。我们集成了数值天气预测集合和分布式水文模型，以在中范围的交货时间（1-7天）下生成集合流量预测。我们展示了一项用于在美国东部的Susquehanna河流盆地的后处理过程中进行机器学习应用的案例研究。为了进行预测验证，我们使用不同的指标，例如技能得分和可靠性图，以提前时间，流量阈值和季节为条件。验证结果表明，机器学习后处理器可以改善相对于低复杂性预测（例如气候和时间持久性）以及确定性和原始集合预测的水流预测。与原始合奏相比，与较短的交货时间相比，在中等时间表的相对增益在后期时间表通常更高。与低压流相比，高流量和与凉爽的流量相比。总体而言，我们的结果突出了机器学习在许多方面的好处，以提高流量预测的技能和可靠性。

translated by 谷歌翻译

Probabilistic forecasts of extreme heatwaves using convolutional neural networks in a regime of lack of data

George Miloshevich , Bastien Cozian , Patrice Abry , Pierre Borgnat , Freddy Bouchet

分类：机器学习

2022-08-01

了解极端事件及其可能性是研究气候变化影响，风险评估，适应和保护生物的关键。在这项工作中，我们开发了一种方法来构建极端热浪的预测模型。这些模型基于卷积神经网络，对极长的8，000年气候模型输出进行了培训。由于极端事件之间的关系本质上是概率的，因此我们强调概率预测和验证。我们证明，深度神经网络适用于法国持续持续14天的热浪，快速动态驱动器提前15天（500 hpa地球电位高度场），并且在慢速较长的交货时间内，慢速物理时间驱动器（土壤水分）。该方法很容易实现和通用。我们发现，深神经网络选择了与北半球波数字3模式相关的极端热浪。我们发现，当将2米温度场添加到500 HPA地球电位高度和土壤水分场中时，2米温度场不包含任何新的有用统计信息。主要的科学信息是，训练深层神经网络预测极端热浪的发生是在严重缺乏数据的情况下发生的。我们建议大多数其他应用在大规模的大气和气候现象中都是如此。我们讨论了处理缺乏数据制度的观点，例如罕见的事件模拟，以及转移学习如何在后一种任务中发挥作用。

translated by 谷歌翻译

Short-range forecasts of global precipitation using using deep learning-augmented numerical weather prediction

Manmeet Singh , Vaisakh S B , Nachiketa Acharya , Suryachandra A Rao , Bipin Kumar , Zong-Liang Yang , Dev Niyogi

分类：人工智能 | 计算机视觉

2022-06-23

降水控制地球气候，其日常时空波动具有重大的社会经济影响。通过改善温度和压力等各种物理领域的预测来衡量数值天气预测（NWP）的进步；然而，降水预测中存在很大的偏见。我们通过深度学习来增强著名的NWP模型CFSV2的输出，以创建一个混合模型，该模型在1日，2天和3天的交货时间内改善了短期全局降水量。为了混合使用，我们通过使用修改的DLWP-CS体系结构来解决全局数据的球形，从而将所有字段转换为立方体投影。动态模型沉淀和表面温度输出被喂入改良的DLWP-CS（UNET），以预测地面真相降水。虽然CFSV2的平均偏差为土地+5至+7毫米/天，但多元深度学习模型将其降低到-1至+1 mm/天。卡特里娜飓风在2005年，伊万飓风，2010年的中国洪水，2005年的印度洪水和2008年的缅甸风暴纳尔吉斯（Myanmar Storm Nargis）用于确认混合动力学深度学习模型的技能大大提高。 CFSV2通常在空间模式中显示中度至大偏置，并在短期时间尺度上高估了沉淀。拟议的深度学习增强了NWP模型可以解决这些偏见，并大大改善了预测降水的空间模式和幅度。与CFSV2相比，深度学习增强了CFSV2在重要的土地区域的平均偏差为1天铅1天。时空深度学习系统开辟了途径，以进一步提高全球短期降水预测的精度和准确性。

translated by 谷歌翻译

A Meta-Analysis of Solar Forecasting Based on Skill Score

Thi Ngoc Nguyen , Felix Müsgens

分类：机器学习

2022-08-22

我们基于技能评分，对确定性太阳预测进行了首次全面的荟萃分析，筛选了Google Scholar的1,447篇论文，并审查了320篇论文的全文以进行数据提取。用多元自适应回归样条模型，部分依赖图和线性回归构建和分析了4,758点的数据库。值得注意的是，分析说明了数据中最重要的非线性关系和交互项。我们量化了对重要变量的预测准确性的影响，例如预测范围，分辨率，气候条件，区域的年度太阳辐照度水平，电力系统大小和容量，预测模型，火车和测试集以及使用不同的技术和投入。通过控制预测之间的关键差异，包括位置变量，可以在全球应用分析的发现。还提供了该领域科学进步的概述。

translated by 谷歌翻译

GraphCast: Learning skillful medium-range global weather forecasting

Remi Lam , Alvaro Sanchez-Gonzalez , Matthew Willson , Peter Wirnsberger , Meire Fortunato , Alexander Pritzel , Suman Ravuri , Timo Ewalds , Ferran Alet , Zach Eaton-Rosen

分类：机器学习

2022-12-24

We introduce a machine-learning (ML)-based weather simulator--called "GraphCast"--which outperforms the most accurate deterministic operational medium-range weather forecasting system in the world, as well as all previous ML baselines. GraphCast is an autoregressive model, based on graph neural networks and a novel high-resolution multi-scale mesh representation, which we trained on historical weather data from the European Centre for Medium-Range Weather Forecasts (ECMWF)'s ERA5 reanalysis archive. It can make 10-day forecasts, at 6-hour time intervals, of five surface variables and six atmospheric variables, each at 37 vertical pressure levels, on a 0.25-degree latitude-longitude grid, which corresponds to roughly 25 x 25 kilometer resolution at the equator. Our results show GraphCast is more accurate than ECMWF's deterministic operational forecasting system, HRES, on 90.0% of the 2760 variable and lead time combinations we evaluated. GraphCast also outperforms the most accurate previous ML-based weather forecasting model on 99.2% of the 252 targets it reported. GraphCast can generate a 10-day forecast (35 gigabytes of data) in under 60 seconds on Cloud TPU v4 hardware. Unlike traditional forecasting methods, ML-based forecasting scales well with data: by training on bigger, higher quality, and more recent data, the skill of the forecasts can improve. Together these results represent a key step forward in complementing and improving weather modeling with ML, open new opportunities for fast, accurate forecasting, and help realize the promise of ML-based simulation in the physical sciences.

translated by 谷歌翻译

Beyond Ensemble Averages: Leveraging Climate Model Ensembles for Subseasonal Forecasting

Elena Orlova , Haokun Liu , Raphael Rossellini , Benjamin Cash , Rebecca Willett

分类：机器学习

2022-11-29

Producing high-quality forecasts of key climate variables such as temperature and precipitation on subseasonal time scales has long been a gap in operational forecasting. Recent studies have shown promising results using machine learning (ML) models to advance subseasonal forecasting (SSF), but several open questions remain. First, several past approaches use the average of an ensemble of physics-based forecasts as an input feature of these models. However, ensemble forecasts contain information that can aid prediction beyond only the ensemble mean. Second, past methods have focused on average performance, whereas forecasts of extreme events are far more important for planning and mitigation purposes. Third, climate forecasts correspond to a spatially-varying collection of forecasts, and different methods account for spatial variability in the response differently. Trade-offs between different approaches may be mitigated with model stacking. This paper describes the application of a variety of ML methods used to predict monthly average precipitation and two meter temperature using physics-based predictions (ensemble forecasts) and observational data such as relative humidity, pressure at sea level, or geopotential height, two weeks in advance for the whole continental United States. Regression, quantile regression, and tercile classification tasks using linear models, random forests, convolutional neural networks, and stacked models are considered. The proposed models outperform common baselines such as historical averages (or quantiles) and ensemble averages (or quantiles). This paper further includes an investigation of feature importance, trade-offs between using the full ensemble or only the ensemble average, and different modes of accounting for spatial variability.

translated by 谷歌翻译

A Moment in the Sun: Solar Nowcasting from Multispectral Satellite Data using Self-Supervised Learning

Akansha Singh Bansal , Trapit Bansal , David Irwin

分类：机器学习 | 人工智能 | 计算机视觉

2021-12-28

太阳能现在是历史上最便宜的电力形式。不幸的是，由于其变异性，显着提高栅格的太阳能的一部分仍然具有挑战性，这使得电力的供需平衡更加困难。虽然热发电机坡度 - 它们可以改变输出的最高速率 - 是有限的，太阳能的坡度基本上是无限的。因此，准确的近期太阳能预测或垂圈，对于提供预警来调整热发电机输出，以响应于太阳能变化来调整热发电机，以确保平衡供需。为了解决问题，本文开发了使用自我监督学习的丰富和易于使用的多光谱卫星数据的太阳能垂圈的一般模型。具体而言，我们使用卷积神经网络（CNN）和长短期内存网络（LSTM）开发深度自动回归模型，这些模型在多个位置训练全球培训，以预测最近推出的最近收集的时空数据的未来观察-R系列卫星。我们的模型估计了基于卫星观测的未来的太阳辐照度，我们向较小的场地特定的太阳能数据培训的回归模型提供，以提供近期太阳能光伏（PV）预测，其考虑了现场特征的特征。我们评估了我们在25个太阳能场所的不同覆盖区域和预测视野的方法，并表明我们的方法利用地面真理观察结果产生靠近模型的错误。

translated by 谷歌翻译

Skillful Twelve Hour Precipitation Forecasts using Large Context Neural Networks

Lasse Espeholt , Shreya Agrawal , Casper Sønderby , Manoj Kumar , Jonathan Heek , Carla Bromberg , Cenk Gazen , Jason Hickey , Aaron Bell , Nal Kalchbrenner

分类：机器学习

2021-11-14

由于其对人类生命，运输，粮食生产和能源管理的高度影响，因此在科学上研究了预测天气的问题。目前的运营预测模型基于物理学，并使用超级计算机来模拟大气预测，提前预测数小时和日期。更好的基于物理的预测需要改进模型本身，这可能是一个实质性的科学挑战，以及潜在的分辨率的改进，可以计算令人望而却步。基于神经网络的新出现的天气模型代表天气预报的范式转变：模型学习来自数据的所需变换，而不是依赖于手工编码的物理，并计算效率。然而，对于神经模型，每个额外的辐射时间都会构成大量挑战，因为它需要捕获更大的空间环境并增加预测的不确定性。在这项工作中，我们提出了一个神经网络，能够提前十二小时的大规模降水预测，并且从相同的大气状态开始，该模型能够比最先进的基于物理的模型更高的技能HRRR和HREF目前在美国大陆运营。可解释性分析加强了模型学会模拟先进物理原则的观察。这些结果代表了建立与神经网络有效预测的新范式的实质性步骤。

translated by 谷歌翻译

ENS-10: A Dataset For Post-Processing Ensemble Weather Forecast

Saleh Ashkboos , Langwen Huang , Nikoli Dryden , Tal Ben-Nun , Peter Dueben , Lukas Gianinazzi , Luca Kummer , Torsten Hoefler

分类：机器学习

2022-06-29

后处理整体预测系统可以改善天气预报，尤其是对于极端事件预测。近年来，已经开发出不同的机器学习模型来提高后处理步骤的质量。但是，这些模型在很大程度上依赖数据并生成此类合奏成员需要以高计算成本的数值天气预测模型进行多次运行。本文介绍了ENS-10数据集，由十个合奏成员组成，分布在20年中（1998-2017）。合奏成员是通过扰动数值天气模拟来捕获地球的混乱行为而产生的。为了代表大气的三维状态，ENS-10在11个不同的压力水平以及0.5度分辨率的表面中提供了最相关的大气变量。该数据集以48小时的交货时间针对预测校正任务，这实质上是通过消除合奏成员的偏见来改善预测质量。为此，ENS-10为预测交货时间t = 0、24和48小时（每周两个数据点）提供了天气变量。我们在ENS-10上为此任务提供了一组基线，并比较了它们在纠正不同天气变量预测时的性能。我们还评估了使用数据集预测极端事件的基准。 ENS-10数据集可在创意共享归因4.0国际（CC By 4.0）许可下获得。

translated by 谷歌翻译

Omnivision forecasting: combining satellite observations with sky images for improved intra-hour solar energy predictions

Quentin Paletta , Guillaume Arbod , Joan Lasenby

分类：计算机视觉 | 人工智能

2022-06-07

将间歇性可再生能源集成到大量的电网中是具有挑战性的。旨在解决这一困难的建立良好的方法涉及即将到来的能源供应可变性以适应电网的响应。在太阳能中，可以在全天空摄像机（前方30分钟）和卫星观测（提前6小时）的不同时间尺度上预测由遮挡云引起的短期变化。在这项研究中，我们将这两种互补的观点集成到单个机器学习框架中的云覆盖物上，以改善时间内（最高60分钟）的辐照度预测。确定性和概率预测均在不同的天气条件（晴朗，多云，阴天）以及不同的输入配置（天空图像，卫星观测和/或过去的辐照度值）中进行评估。我们的结果表明，混合模型在晴朗的条件下有益于预测，并改善了长期预测。这项研究为将来的新颖方法奠定了基础，即在单个学习框架中将天空图像和卫星观测结合起来，以推动太阳现象。

translated by 谷歌翻译

ECLIPSE : Envisioning Cloud Induced Perturbations in Solar Energy

Quentin Paletta , Anthony Hu , Guillaume Arbod , Joan Lasenby

分类：计算机视觉 | 人工智能 | 机器学习

2021-04-26

太阳能的高效整合到电力组合中取决于其间歇性的可靠预期。预测由云覆盖动态产生的太阳辐照度的时间变异的有希望的方法是基于地面天空图像或卫星图像序列的分析。尽管结果令人鼓舞，但现有深度学习方法的经常性限制在于对过去观察的反应而不是积极预期未来事件的无处不在的趋势。这导致频繁的时间滞后和有限的预测突发事件的能力。为了解决这一挑战，我们介绍了Eclipse，一种时空神经网络架构，即模型从天空图像模拟云运动，不仅预测未来的辐照水平，而且还可以在本地辐照度图上提供更丰富的信息。我们表明Eclipse预期关键事件，并在产生视觉上现实期货的同时降低时间延误。

translated by 谷歌翻译

Evaluation of Machine Learning Techniques for Forecast Uncertainty Quantification

Maximiliano A. Sacco , Juan J. Ruiz , Manuel Pulido , Pierre Tandeo

分类：机器学习 | 人工智能

2021-11-29

生产精确的天气预报和不确定的不确定性的可靠量化是一个开放的科学挑战。到目前为止，集团预测是最成功的方法，以产生相关预测的方法以及估计其不确定性。集合预测的主要局限性是高计算成本，难以捕获和量化不同的不确定性来源，特别是与模型误差相关的源。在这项工作中，进行概念证据模型实验，以检查培训的ANN的性能，以预测系统的校正状态和使用单个确定性预测作为输入的状态不确定性。我们比较不同的培训策略：一个基于使用集合预测的平均值和传播作为目标的直接培训，另一个依赖于使用确定性预测作为目标的决定性预测，其中来自数据隐含地学习不确定性。对于最后一种方法，提出和评估了两个替代损失函数，基于数据观察似然和基于误差的本地估计来评估另一个丢失功能。在不同的交货时间和方案中检查网络的性能，在没有模型错误的情况下。使用Lorenz'96模型的实验表明，ANNS能够模拟集合预测的一些属性，如最不可预测模式的过滤和预测不确定性的状态相关量化。此外，ANNS提供了在模型误差存在下的预测不确定性的可靠估计。

translated by 谷歌翻译

A two-step machine learning approach to statistical post-processing of weather forecasts for power generation

Ágnes Baran , Sándor Baran

分类： (统计)机器学习 | 机器学习

2022-07-15

到2021年底，全球电力容量的可再生能源份额达到38.3％，新设施以风能和太阳能为主，分别显示全球增长12.7％和18.5％。但是，风能和光伏能源都是高度挥发性的，使得对网格操作员的计划很难，因此对相应天气变量的准确预测对于可靠的电力预测至关重要。天气预测中最先进的方法是合奏方法，它为概率预测打开了大门。尽管合奏预测通常不足，并且会遭受系统的偏见。因此，它们需要某种形式的统计后处理，其中参数模型提供了手头天气变量的完整预测分布。我们提出了一种基于两步机的一般学习方法，用于校准集合天气预报，在第一步中，生成了改进点的预测，然后将其与各种合奏统计数据一起作为神经网络的输入特征，估计估计的参数。预测分布。在两个案例研究中，基于100m风速和全球水平辐照度预测匈牙利气象服务的操作集合词典系统，将这种新颖方法的预测性能与原始合奏的预测技能进行了比较ART参数方法。两种案例研究都证实，至少高达48H统计后处理可实质上改善了所有被考虑的预测范围的原始合奏的预测性能。所提出的两步方法的研究变体在其竞争对手方面优于技能，建议的新方法非常适用于不同的天气数量和广泛的预测分布。

translated by 谷歌翻译

Benchmark Dataset for Precipitation Forecasting by Post-Processing the Numerical Weather Prediction

Taehyeon Kim , Namgyu Ho , Donggyu Kim , Se-Young Yun

分类：机器学习

2022-06-30

降水预测是一项重要的科学挑战，对社会产生广泛影响。从历史上看，这项挑战是使用数值天气预测（NWP）模型解决的，该模型基于基于物理的模拟。最近，许多作品提出了一种替代方法，使用端到端深度学习（DL）模型来替代基于物理的NWP。尽管这些DL方法显示出提高的性能和计算效率，但它们在长期预测中表现出局限性，并且缺乏NWP模型的解释性。在这项工作中，我们提出了一个混合NWP-DL工作流程，以填补独立NWP和DL方法之间的空白。在此工作流程下，NWP输出被馈入深层模型，该模型后处理数据以产生精致的降水预测。使用自动气象站（AWS）观测值作为地面真相标签，对深层模型进行了监督训练。这可以实现两全其美，甚至可以从NWP技术的未来改进中受益。为了促进朝这个方向进行研究，我们提出了一个专注于朝鲜半岛的新型数据集，该数据集称为KOMET（KOMEN（KOREA气象数据集），由NWP预测和AWS观察组成。对于NWP，我们使用全局数据同化和预测系统-KOREA集成模型（GDAPS-KIM）。

translated by 谷歌翻译

Machine learning for Earth System Science (ESS): A survey, status and future directions for South Asia

Manmeet Singh , Bipin Kumar , Rajib Chattopadhyay , K Amarjyothi , Anup K Sutar , Sukanta Roy , Suryachandra A Rao , Ravi S. Nanjundiah

分类：机器学习

2021-12-24

该调查侧重于地球系统科学中的当前问题，其中可以应用机器学习算法。它概述了以前的工作，在地球科学部，印度政府的持续工作，以及ML算法的未来应用到一些重要的地球科学问题。我们提供了与本次调查的比较的比较，这是与机器学习相关的多维地区的思想地图，以及地球系统科学（ESS）中机器学习的Gartner的炒作周期。我们主要关注地球科学的关键组成部分，包括大气，海洋，地震学和生物圈，以及覆盖AI / ML应用程序统计侦查和预测问题。

translated by 谷歌翻译

An Interpretable Probabilistic Model for Short-Term Solar Power Forecasting Using Natural Gradient Boosting

Georgios Mitrentsis , Hendrik Lens

分类：机器学习

2021-08-05

PV power forecasting models are predominantly based on machine learning algorithms which do not provide any insight into or explanation about their predictions (black boxes). Therefore, their direct implementation in environments where transparency is required, and the trust associated with their predictions may be questioned. To this end, we propose a two stage probabilistic forecasting framework able to generate highly accurate, reliable, and sharp forecasts yet offering full transparency on both the point forecasts and the prediction intervals (PIs). In the first stage, we exploit natural gradient boosting (NGBoost) for yielding probabilistic forecasts, while in the second stage, we calculate the Shapley additive explanation (SHAP) values in order to fully comprehend why a prediction was made. To highlight the performance and the applicability of the proposed framework, real data from two PV parks located in Southern Germany are employed. Comparative results with two state-of-the-art algorithms, namely Gaussian process and lower upper bound estimation, manifest a significant increase in the point forecast accuracy and in the overall probabilistic performance. Most importantly, a detailed analysis of the model's complex nonlinear relationships and interaction effects between the various features is presented. This allows interpreting the model, identifying some learned physical properties, explaining individual predictions, reducing the computational requirements for the training without jeopardizing the model accuracy, detecting possible bugs, and gaining trust in the model. Finally, we conclude that the model was able to develop complex nonlinear relationships which follow known physical properties as well as human logic and intuition.

translated by 谷歌翻译

Optimisation of a global climate model ensemble for prediction of extreme heat days

Mala Virdee , Markus Kaiser , Emily Shuckburgh , Carl Henrik Ek , Ieva Kazlauskaite

分类：机器学习

2022-11-26

Adaptation-relevant predictions of climate change are often derived by combining climate models in a multi-model ensemble. Model evaluation methods used in performance-based ensemble weighting schemes have limitations in the context of high-impact extreme events. We introduce a locally time-invariant model evaluation method with focus on assessing the simulation of extremes. We explore the behaviour of the proposed method in predicting extreme heat days in Nairobi.

translated by 谷歌翻译

Forecast combinations: an over 50-year review

Xiaoqian Wang , Rob J Hyndman , Feng Li , Yanfei Kang

分类： (统计)机器学习

2022-05-09

预测组合在预测社区中蓬勃发展，近年来，已经成为预测研究和活动主流的一部分。现在，由单个（目标）系列产生的多个预测组合通过整合来自不同来源收集的信息，从而提高准确性，从而减轻了识别单个“最佳”预测的风险。组合方案已从没有估计的简单组合方法演变为涉及时间变化的权重，非线性组合，组件之间的相关性和交叉学习的复杂方法。它们包括结合点预测和结合概率预测。本文提供了有关预测组合的广泛文献的最新评论，并参考可用的开源软件实施。我们讨论了各种方法的潜在和局限性，并突出了这些思想如何随着时间的推移而发展。还调查了有关预测组合实用性的一些重要问题。最后，我们以当前的研究差距和未来研究的潜在见解得出结论。

translated by 谷歌翻译