从Kaya Identity开始,我们使用了神经颂歌模型来预测若干与碳排放有关的指标的演变,以国家一级:人口,GDP人均GDP,能源强度的能量强度。我们将模型与基线统计模型进行比较 - var - 并获得了良好的性能。我们得出结论,这种机器学习方法可用于产生广泛的结果,并对政策制定者提供相关的洞察力
translated by 谷歌翻译
Dengue fever is a virulent disease spreading over 100 tropical and subtropical countries in Africa, the Americas, and Asia. This arboviral disease affects around 400 million people globally, severely distressing the healthcare systems. The unavailability of a specific drug and ready-to-use vaccine makes the situation worse. Hence, policymakers must rely on early warning systems to control intervention-related decisions. Forecasts routinely provide critical information for dangerous epidemic events. However, the available forecasting models (e.g., weather-driven mechanistic, statistical time series, and machine learning models) lack a clear understanding of different components to improve prediction accuracy and often provide unstable and unreliable forecasts. This study proposes an ensemble wavelet neural network with exogenous factor(s) (XEWNet) model that can produce reliable estimates for dengue outbreak prediction for three geographical regions, namely San Juan, Iquitos, and Ahmedabad. The proposed XEWNet model is flexible and can easily incorporate exogenous climate variable(s) confirmed by statistical causality tests in its scalable framework. The proposed model is an integrated approach that uses wavelet transformation into an ensemble neural network framework that helps in generating more reliable long-term forecasts. The proposed XEWNet allows complex non-linear relationships between the dengue incidence cases and rainfall; however, mathematically interpretable, fast in execution, and easily comprehensible. The proposal's competitiveness is measured using computational experiments based on various statistical metrics and several statistical comparison tests. In comparison with statistical, machine learning, and deep learning methods, our proposed XEWNet performs better in 75% of the cases for short-term and long-term forecasting of dengue incidence.
translated by 谷歌翻译
随着Covid-19影响每个国家的全球和改变日常生活,预测疾病的传播的能力比任何先前的流行病更重要。常规的疾病 - 展开建模方法,隔间模型,基于对病毒的扩散的时空均匀性的假设,这可能导致预测到欠低,特别是在高空间分辨率下。本文采用替代技术 - 时空机器学习方法。我们提出了Covid-LSTM,一种基于长期短期内存深度学习架构的数据驱动模型,用于预测Covid-19在美国县级的发病率。我们使用每周数量的新阳性案例作为时间输入,以及来自Facebook运动和连通数据集的手工工程空间特征,以捕捉时间和空间的疾病的传播。 Covid-LSTM在我们的17周的评估期间优于Covid-19预测集线器集合模型(CovidHub-Ensemble),使其首先比一个或多个预测期更准确的模型。在4周的预测地平线上,我们的型号平均每县平均50例比CovidHub-Ensemble更准确。我们强调,在Covid-19之前,在Covid-19之前的数据驱动预测的未充分利用疾病传播的预测可能是由于以前疾病缺乏足够的数据,除了最近的时尚预测方法的机器学习方法的进步。我们讨论了更广泛的数据驱动预测的障碍,以及将来将使用更多的基于学习的模型。
translated by 谷歌翻译
粒子加速器是复杂的设施,可产生大量的结构化数据,并具有明确的优化目标以及精确定义的控制要求。因此,它们自然适合数据驱动的研究方法。来自传感器和监视加速器形式的多元时间序列的数据。在加速器控制和诊断方面,快速的先发制人方法是高度首选的,数据驱动的时间序列预测方法的应用尤其有希望。这篇综述提出了时间序列预测问题,并总结了现有模型,并在各个科学领域的应用中进行了应用。引入了粒子加速器领域中的几次和将来的尝试。预测到粒子加速器的时间序列的应用显示出令人鼓舞的结果和更广泛使用的希望,现有的问题(例如数据一致性和兼容性)已开始解决。
translated by 谷歌翻译
Because of the considerable heterogeneity and complexity of the technological landscape, building accurate models to forecast is a challenging endeavor. Due to their high prevalence in many complex systems, S-curves are a popular forecasting approach in previous work. However, their forecasting performance has not been directly compared to other technology forecasting approaches. Additionally, recent developments in time series forecasting that claim to improve forecasting accuracy are yet to be applied to technological development data. This work addresses both research gaps by comparing the forecasting performance of S-curves to a baseline and by developing an autencoder approach that employs recent advances in machine learning and time series forecasting. S-curves forecasts largely exhibit a mean average percentage error (MAPE) comparable to a simple ARIMA baseline. However, for a minority of emerging technologies, the MAPE increases by two magnitudes. Our autoencoder approach improves the MAPE by 13.5% on average over the second-best result. It forecasts established technologies with the same accuracy as the other approaches. However, it is especially strong at forecasting emerging technologies with a mean MAPE 18% lower than the next best result. Our results imply that a simple ARIMA model is preferable over the S-curve for technology forecasting. Practitioners looking for more accurate forecasts should opt for the presented autoencoder approach.
translated by 谷歌翻译
随着人口的指数增长,至关重要的是保存自然资源,而不必损害足够的食物来养活所有人。这样做可以改善目前和后代的人的生计,健康和生态系统。可持续发展是联合国的范式,植根于食品,农作物,牲畜,森林,人口,甚至气体的排放。通过了解过去不同国家自然资源的总体使用,可以预测每个国家的需求。提出的解决方案包括使用统计回归模型实施机器学习系统,该模型可以预测将来在特定时期内每个国家 /地区短缺的顶级K产品。根据绝对误差和根平方误差的预测性能由于其低误差而显示出令人鼓舞的结果。该解决方案可以帮助组织和制造商了解满足全球需求所需的生产力和可持续性。
translated by 谷歌翻译
Climate change, population growth, and water scarcity present unprecedented challenges for agriculture. This project aims to forecast soil moisture using domain knowledge and machine learning for crop management decisions that enable sustainable farming. Traditional methods for predicting hydrological response features require significant computational time and expertise. Recent work has implemented machine learning models as a tool for forecasting hydrological response features, but these models neglect a crucial component of traditional hydrological modeling that spatially close units can have vastly different hydrological responses. In traditional hydrological modeling, units with similar hydrological properties are grouped together and share model parameters regardless of their spatial proximity. Inspired by this domain knowledge, we have constructed a novel domain-inspired temporal graph convolution neural network. Our approach involves clustering units based on time-varying hydrological properties, constructing graph topologies for each cluster, and forecasting soil moisture using graph convolutions and a gated recurrent neural network. We have trained, validated, and tested our method on field-scale time series data consisting of approximately 99,000 hydrological response units spanning 40 years in a case study in northeastern United States. Comparison with existing models illustrates the effectiveness of using domain-inspired clustering with time series graph neural networks. The framework is being deployed as part of a pro bono social impact program. The trained models are being deployed on small-holding farms in central Texas.
translated by 谷歌翻译
本文介绍了一个集成预测方法,通过减少特征和模型选择假设来显示M4Competitiation数据集的强劲结果,称为甜甜圈(不利用人为假设)。我们的假设减少,主要由自动生成的功能和更多样化的集合模型组成,显着优于Montero-Manso等人的统计特征的集合方法FForma。 (2020)。此外,我们用长短期内存网络(LSTM)AutoEncoder调查特征提取,并发现此类特征包含传统统计特征方法未捕获的重要信息。合奏加权模型使用LSTM功能和统计功能准确地结合模型。特征重要性和交互的分析表明,单独的统计数据的LSTM特征略有优势。聚类分析表明,不同的基本LSTM功能与大多数统计特征不同。我们还发现,通过使用新模型增强合奏来增加加权模型的解决方案空间是加权模型学习使用的东西,解释了准确性的一部分。最后,我们为集合的最佳组合和选择提供了正式的前后事实分析,通过M4数据集的线性优化量化差异。我们还包括一个简短的证据,模型组合优于模型选择,后者。
translated by 谷歌翻译
COVID-19的大流行提出了对多个领域决策者的流行预测的重要性,从公共卫生到整个经济。虽然预测流行进展经常被概念化为类似于天气预测,但是它具有一些关键的差异,并且仍然是一项非平凡的任务。疾病的传播受到人类行为,病原体动态,天气和环境条件的多种混杂因素的影响。由于政府公共卫生和资助机构的倡议,捕获以前无法观察到的方面的丰富数据来源的可用性增加了研究的兴趣。这尤其是在“以数据为中心”的解决方案上进行的一系列工作,这些解决方案通过利用非传统数据源以及AI和机器学习的最新创新来增强我们的预测能力的潜力。这项调查研究了各种数据驱动的方法论和实践进步,并介绍了一个概念框架来导航它们。首先,我们列举了与流行病预测相关的大量流行病学数据集和新的数据流,捕获了各种因素,例如有症状的在线调查,零售和商业,流动性,基因组学数据等。接下来,我们将讨论关注最近基于数据驱动的统计和深度学习方法的方法和建模范式,以及将机械模型知识域知识与统计方法的有效性和灵活性相结合的新型混合模型类别。我们还讨论了这些预测系统的现实部署中出现的经验和挑战,包括预测信息。最后,我们重点介绍了整个预测管道中发现的一些挑战和开放问题。
translated by 谷歌翻译
传染病仍然是全世界人类疾病和死亡的主要因素之一,其中许多疾病引起了流行的感染波。特定药物和预防疫苗防止大多数流行病的不可用,这使情况变得更糟。这些迫使公共卫生官员,卫生保健提供者和政策制定者依靠由流行病的可靠预测产生的预警系统。对流行病的准确预测可以帮助利益相关者调整对手的对策,例如疫苗接种运动,人员安排和资源分配,以减少手头的情况,这可以转化为减少疾病影响的影响。不幸的是,大多数过去的流行病(例如,登革热,疟疾,肝炎,流感和最新的Covid-19)表现出非线性和非平稳性特征,这是由于它们基于季节性依赖性变化以及这些流行病的性质的扩散波动而引起的。 。我们使用基于最大的重叠离散小波变换(MODWT)自动回归神经网络分析了各种流行时期时间序列数据集,并将其称为EWNET。 MODWT技术有效地表征了流行时间序列中的非平稳行为和季节性依赖性,并在拟议的集合小波网络框架中改善了自回旋神经网络的预测方案。从非线性时间序列的角度来看,我们探讨了所提出的EWNET模型的渐近平稳性,以显示相关的马尔可夫链的渐近行为。我们还理论上还研究了学习稳定性的效果以及在拟议的EWNET模型中选择隐藏的神经元的选择。从实际的角度来看,我们将我们提出的EWNET框架与以前用于流行病预测的几种统计,机器学习和深度学习模型进行了比较。
translated by 谷歌翻译
基于预测方法的深度学习已成为时间序列预测或预测的许多应用中的首选方法,通常通常优于其他方法。因此,在过去的几年中,这些方法现在在大规模的工业预测应用中无处不在,并且一直在预测竞赛(例如M4和M5)中排名最佳。这种实践上的成功进一步提高了学术兴趣,以理解和改善深厚的预测方法。在本文中,我们提供了该领域的介绍和概述:我们为深入预测的重要构建块提出了一定深度的深入预测;随后,我们使用这些构建块,调查了最近的深度预测文献的广度。
translated by 谷歌翻译
中期地平线(几个月到一年)功耗预测是能源部门的主要挑战,特别是当考虑概率预测时。我们提出了一种新的建模方法,该方法包含趋势,季节性和天气条件,作为具有自回归特征的浅神经网络中的解析变量。我们在将其应用于新英格兰的日常电力消耗的一年试验集上获得优异的效果预测。一方面已经验证了实现的电力消耗概率预测的质量,将结果与其他标准进行比较密度预测模型,另一方面,考虑在能量扇区中经常使用的措施,作为弹球损失和CI逆退。
translated by 谷歌翻译
人工智能(AI)最近展示了它几乎所有生活领域的能力。机器学习是AI的一个子集,是研究人员的“热门”主题。机器学习在几乎全自然应用中优于其他经典预测技术。这是现代研究的关键部分。根据本声明,现代机器学习算法令人渴望大数据。由于小型数据集,研究人员可能不喜欢使用机器学习算法。为了解决这个问题,本调查的主要目的是说明,证明相关的研究,以了解称为灰色机器学习(GML)的半参数机学习框架的重要性。这种框架能够处理大型数据集以及用于时间序列预测可能结果的小型数据集。该调查概述了现有的时间序列预测的半参数机学习技术。本文为研究人员提供了关于GML框架的引物调查。为了允许对读者进行深入的理解,讨论了机器学习的简要描述,以及各种形式的传统灰色预测模型。此外,介绍了关于GML框架的重要性的简要说明。
translated by 谷歌翻译
由于在许多领域的无与伦比的成功,例如计算机视觉,自然语言处理,推荐系统以及最近在模拟多物理问题和预测非线性动力学系统方面,深度学习引起了人们的关注。但是,建模和预测混乱系统的动态仍然是一个开放的研究问题,因为训练深度学习模型需要大数据,在许多情况下,这并不总是可用的。可以通过从模拟结果获得的其他信息以及执行混乱系统的物理定律来培训这样的深度学习者。本文考虑了极端事件及其动态,并提出了基于深层神经网络的优雅模型,称为基于知识的深度学习(KDL)。我们提出的KDL可以通过直接从动力学及其微分方程中对真实和模拟数据进行联合培训来学习控制混乱系统的复杂模式。这些知识被转移到模型和预测现实世界中的混乱事件,表现出极端行为。我们通过在三个实际基准数据集上进行评估来验证模型的效率:El Nino海面温度,San Juan登革热病毒感染和BJ {\ o} rn {\ o} ya每日降水,所有这些都受极端事件的控制'动态。利用对极端事件和基于物理的损失功能的先验知识来领导神经网络学习,我们即使在小型数据制度中也可以确保身体一致,可推广和准确的预测。
translated by 谷歌翻译
由于人口和全球化的增加,对能源的需求大大增加。因此,准确的能源消耗预测已成为政府规划,减少能源浪费和能源管理系统稳定运行的基本先决条件。在这项工作中,我们介绍了对家庭能耗的时间序列预测的主要机器学习模型的比较分析。具体来说,我们使用WEKA(一种数据挖掘工具)首先将模型应用于Kaggle数据科学界可获得的小时和每日家庭能源消耗数据集。应用的模型是:多层感知器,K最近的邻居回归,支持向量回归,线性回归和高斯过程。其次,我们还在Python实施了时间序列预测模型Arima和Var,以预测有或没有天气数据的韩国家庭能源消耗。我们的结果表明,预测能源消耗预测的最佳方法是支持向量回归,然后是多层感知器和高斯过程回归。
translated by 谷歌翻译
可持续性需要提高能源效率,而最小的废物则需要提高能源效率。因此,未来的电力系统应提供高水平的灵活性IIN控制能源消耗。对于能源行业的决策者和专业人员而言,对未来能源需求/负载的精确预测非常重要。预测能源负载对能源提供者和客户变得更有优势,使他们能够建立有效的生产策略以满足需求。这项研究介绍了两个混合级联模型,以预测不同分辨率中的多步户家庭功耗。第一个模型将固定小波变换(SWT)集成为有效的信号预处理技术,卷积神经网络和长期短期记忆(LSTM)。第二种混合模型将SWT与名为Transformer的基于自我注意的神经网络结构相结合。使用时频分析方法(例如多步预测问题中的SWT)的主要限制是,它们需要顺序信号,在多步骤预测应用程序中有问题的信号重建问题。级联模型可以通过使用回收输出有效地解决此问题。实验结果表明,与现有的多步电消耗预测方法相比,提出的混合模型实现了出色的预测性能。结果将为更准确和可靠的家庭用电量预测铺平道路。
translated by 谷歌翻译
As of 2022, greenhouse gases (GHG) emissions reporting and auditing are not yet compulsory for all companies and methodologies of measurement and estimation are not unified. We propose a machine learning-based model to estimate scope 1 and scope 2 GHG emissions of companies not reporting them yet. Our model, specifically designed to be transparent and completely adapted to this use case, is able to estimate emissions for a large universe of companies. It shows good out-of-sample global performances as well as good out-of-sample granular performances when evaluating it by sectors, by countries or by revenues buckets. We also compare our results to those of other providers and find our estimates to be more accurate. Thanks to the proposed explainability tools using Shapley values, our model is fully interpretable, the user being able to understand which factors split explain the GHG emissions for each particular company.
translated by 谷歌翻译
A well-performing prediction model is vital for a recommendation system suggesting actions for energy-efficient consumer behavior. However, reliable and accurate predictions depend on informative features and a suitable model design to perform well and robustly across different households and appliances. Moreover, customers' unjustifiably high expectations of accurate predictions may discourage them from using the system in the long term. In this paper, we design a three-step forecasting framework to assess predictability, engineering features, and deep learning architectures to forecast 24 hourly load values. First, our predictability analysis provides a tool for expectation management to cushion customers' anticipations. Second, we design several new weather-, time- and appliance-related parameters for the modeling procedure and test their contribution to the model's prediction performance. Third, we examine six deep learning techniques and compare them to tree- and support vector regression benchmarks. We develop a robust and accurate model for the appliance-level load prediction based on four datasets from four different regions (US, UK, Austria, and Canada) with an equal set of appliances. The empirical results show that cyclical encoding of time features and weather indicators alongside a long-short term memory (LSTM) model offer the optimal performance.
translated by 谷歌翻译
地下水位预测是一个应用时间序列预测任务,具有重要的社会影响,以优化水管理以及防止某些自然灾害:例如,洪水或严重的干旱。在文献中已经报告了机器学习方法以实现这项任务,但它们仅专注于单个位置的地下水水平的预测。一种全球预测方法旨在利用从各个位置的地下水级时序列序列,一次在一个地方或一次在几个地方产生预测。鉴于全球预测方法在著名的竞争中取得了成功,因此在地下水级别的预测上进行评估并查看它们与本地方法的比较是有意义的。在这项工作中,我们创建了一个1026地下水级时序列的数据集。每个时间序列都是由每日测量地下水水平和两个外源变量,降雨和蒸散量制成的。该数据集可向社区提供可重现性和进一步评估。为了确定最佳的配置,可以有效地预测完整的时间序列的地下水水平,我们比较了包括本地和全球时间序列预测方法在内的不同预测因子。我们评估了外源变量的影响。我们的结果分析表明,通过训练过去的地下水位和降雨数据的全球方法获得最佳预测。
translated by 谷歌翻译
急诊部门(EDS)是葡萄牙国家卫生服务局的基本要素,可作为具有多样化和非常严重医疗问题的用户的切入点。由于ED的固有特征;预测使用服务的患者数量特别具有挑战性。富裕和医疗专业人员人数之间的不匹配可能会导致提供的服务质量下降,并造成对整个医院产生影响的问题,并从其他部门征用医疗保健工作者以及推迟手术。 。 ED人满为患的部分是由非紧急患者驱动的,尽管没有医疗紧急情况,但诉诸于紧急服务,几乎占每日患者总数的一半。本文描述了一种新颖的深度学习体系结构,即时间融合变压器,该结构使用日历和时间序列协变量来预测预测间隔和4周期间的点预测。我们得出的结论是,可以预测葡萄牙健康区域(HRA)(HRA)的平均绝对百分比误差(MAPE)和均方根误差(RMSE)为84.4102人/天的平均绝对百分比误差(MAPE)。本文显示了支持使用静态和时间序列协变量的多元方法的经验证据,同时超越了文献中常见的其他模型。
translated by 谷歌翻译