智能论文笔记

Validation Methods for Energy Time Series Scenarios from Deep Generative Models

Eike Cramer , Leonardo Rydin Gorjão , Alexander Mitsos , Benjamin Schäfer , Dirk Witthaut , Manuel Dahmen

分类：机器学习

2021-10-27

现代能源系统的设计和运营受到时间依赖性和不确定参数的严重影响，例如可再生发电，负荷需求和电价。这些通常由称为场景的一组离散的实现表示。一种流行的情景生成方法使用允许场景生成的深生成模型（DGM），而无需现有的数据分布。但是，生成方案的验证很困难，目前缺乏对适当的验证方法的全面讨论。为了开始讨论，我们对能源情景生成文献中当前使用的验证方法的关键评估。特别是，我们评估基于概率密度，自动相关和功率谱密度的验证方法。此外，我们建议使用多重术后波动分析（MFDFA）作为峰，爆发和平稳等非琐碎功能的额外验证方法。作为代表性的例子，我们培养了两种可再生发电时间序列（2013年到2015年德国的Photovolataic Antialsion（VAES），以及来自德国的光伏和风的变分自动化器（VAES）和一天电费时间序列在2017年至2019年形成欧洲能源交换。我们将四种验证方法应用于历史和生成的数据，并讨论验证结果的解释以及验证方法的常见错误，陷阱和局限性。我们的评估表明，没有单一方法足够特征，但理想的验证应该包括多种方法，并且在短时间内的情况下仔细解释。

translated by 谷歌翻译

Principal Component Density Estimation for Scenario Generation Using Normalizing Flows

Eike Cramer , Alexander Mitsos , Raul Tempone , Manuel Dahmen

分类：机器学习

2021-04-21

基于神经网络的学习，从光伏（PV）和风中的来源以及负载需求的来源的不可转型可再生发电的分布的学习最近得到了注意力。由于通过直接对数似然最大化训练，归一化流量密度模型特别适用于此任务。然而，从图像生成领域的研究表明，标准归一化流量只能学习歧管分布的涂抹版本。以前的作品在规范化基于流的方案生成的情况下，不要解决这个问题，并且掩弹的分布导致噪声时间序列的采样。在本文中，我们利用了主成分分析（PCA）的等距，从而建立了较低尺寸空间中的标准化流量，同时保持直接和计算有效的似然最大化。我们在2013年至2015年培训PV和风力发电的数据以及德国的负载需求的所得到的主要成分流量（PCF）。本研究结果表明，PCF保留了原始分布的关键特征，如作为时间序列的概率密度和频率行为。然而，PCF的应用不限于可再生能力，而是扩展到任何数据集，时间序列或其他方式，可以使用PCA有效地减少。

translated by 谷歌翻译

Normalizing Flow-based Day-Ahead Wind Power Scenario Generation for Profitable and Reliable Delivery Commitments by Wind Farm Operators

Eike Cramer , Leonard Paeleke , Alexander Mitsos , Manuel Dahmen

分类：机器学习

2022-04-05

我们提出了一种专门的方案生成方法，该方法利用预测信息来生成用于日期调度问题的方案。特别是，我们使用归一化的流量来通过从有条件的分布进行采样，该分布使用风速预测来定制方案到特定的一天。我们将生成的方案应用于风能生产者的随机日期招标问题中，并分析该方案是否产生有利可图的决策。与高斯Copulas和Wasserstein基因的对抗网络相比，正常化的流程成功地缩小了每日趋势周围的各种场景范围，同时保持了各种可能的实现。在随机日间招标问题中，与历史场景的无条件选择相比，所有方法的条件情况都会导致更稳定的盈利结果。归一化流量始终获得最高利润，即使对于小型场景。

translated by 谷歌翻译

Multivariate Probabilistic Forecasting of Intraday Electricity Prices using Normalizing Flows

Eike Cramer , Dirk Witthaut , Alexander Mitsos , Manuel Dahmen

分类：机器学习

2022-05-27

电力在不同的时间范围和法规上在各个市场上进行交易。由于更高的可再生能源渗透，短期交易变得越来越重要。在德国，盘中电价通常以独特的小时模式围绕EPEX现货市场的白天价格波动。这项工作提出了一种概率建模方法，该方法对日前合同的盘中价格差异进行了建模。该模型通过将每天的每日价格间隔的四个15分钟的间隔视为四维的关节分布，从而捕获了新兴的小时模式。使用归一化流量，即结合条件多元密度估计和概率回归的深层生成模型，从而学习了最终的多元价格差异分布。将归一化流程与选择的历史数据，高斯副群和高斯回归模型进行了比较。在不同的模型中，归一化流量最准确地识别趋势，并且预测间隔最窄。值得注意的是，归一化流是唯一识别稀有价格峰的方法。最后，这项工作讨论了不同外部影响因素的影响，并发现个人大多数因素都可以忽略不计。只有价格差异实现的直接历史和所有投入因素的组合才能显着改善预测。

translated by 谷歌翻译

Learning Noise with Generative Adversarial Networks: Explorations with Classical Random Process Models

Adam Wunderlich , Jack Sklar

分类：机器学习

2022-07-03

物理过程引起的随机噪声是测量的固有特征，也是大多数信号处理任务的限制因素。鉴于最近对数据驱动信号建模的生成对抗网络（GAN）的兴趣，重要的是要确定甘恩在目标数据集中忠实地再现噪声的程度。在本文中，我们提出了一项实证研究，旨在阐明时间序列的这个问题。也就是说，我们检查了两个通用时间序列gans，一种直接的时间序列模型和使用短时傅立叶变换（STFT）表示的基于图像的模型的能力，可以学习常见的广泛噪声类型在电子和通信系统中：带限制的热噪声，功率定律噪声，射击噪声和冲动噪声。我们发现，甘斯有能力学习许多噪声类型，尽管当gan架构不太适合噪音的某些方面，例如具有极端异常值的冲动时间序列时，它们可以预见。我们的发现提供了有关当前时间序列gan的能力和潜在局限性的见解，并突出了进一步研究的领域。此外，我们的一系列测试提供了一个有用的基准，可帮助开发时间序列的深层生成模型。

translated by 谷歌翻译

Generative Adversarial Networks and Other Generative Models

Markus Wenzel

分类：计算机视觉 | 机器学习

2022-07-08

与CNN的分类，分割或对象检测相比，生成网络的目标和方法根本不同。最初，它们不是作为图像分析工具，而是生成自然看起来的图像。已经提出了对抗性训练范式来稳定生成方法，并已被证明是非常成功的 - 尽管绝不是第一次尝试。本章对生成对抗网络（GAN）的动机进行了基本介绍，并通过抽象基本任务和工作机制并得出了早期实用方法的困难来追溯其成功的道路。将显示进行更稳定的训练方法，也将显示出不良收敛及其原因的典型迹象。尽管本章侧重于用于图像生成和图像分析的gan，但对抗性训练范式本身并非特定于图像，并且在图像分析中也概括了任务。在将GAN与最近进入场景的进一步生成建模方法进行对比之前，将闻名图像语义分割和异常检测的架构示例。这将允许对限制的上下文化观点，但也可以对gans有好处。

translated by 谷歌翻译

Data Augmentation techniques in time series domain: A survey and taxonomy

Edgar Talavera , Guillermo Iglesias , Ángel González-Prieto , Alberto Mozo , Sandra Gómez-Canaval

分类：机器学习 | 人工智能

2022-06-25

随着深度学习生成模型的最新进展，它在时间序列领域的出色表现并没有花费很长时间。用于与时间序列合作的深度神经网络在很大程度上取决于培训中使用的数据集的广度和一致性。这些类型的特征通常在现实世界中不丰富，在现实世界中，它们通常受到限制，并且通常具有必须保证的隐私限制。因此，一种有效的方法是通过添加噪声或排列并生成新的合成数据来使用\ gls {da}技术增加数据数。它正在系统地审查该领域的当前最新技术，以概述所有可用的算法，并提出对最相关研究的分类法。将评估不同变体的效率；作为过程的重要组成部分，将分析评估性能的不同指标以及有关每个模型的主要问题。这项研究的最终目的是摘要摘要，这些领域的进化和性能会产生更好的结果，以指导该领域的未来研究人员。

translated by 谷歌翻译

TACTiS: Transformer-Attentional Copulas for Time Series

Alexandre Drouin , Étienne Marcotte , Nicolas Chapados

分类：机器学习 | (统计)机器学习

2022-02-07

时间变化数量的估计是医疗保健和金融等领域决策的基本组成部分。但是，此类估计值的实际实用性受到它们量化预测不确定性的准确程度的限制。在这项工作中，我们解决了估计高维多元时间序列的联合预测分布的问题。我们提出了一种基于变压器体系结构的多功能方法，该方法使用基于注意力的解码器估算关节分布，该解码器可被学会模仿非参数Copulas的性质。最终的模型具有多种理想的属性：它可以扩展到数百个时间序列，支持预测和插值，可以处理不规则和不均匀的采样数据，并且可以在训练过程中无缝地适应丢失的数据。我们从经验上证明了这些属性，并表明我们的模型在多个现实世界数据集上产生了最新的预测。

translated by 谷歌翻译

Deep Learning for Time Series Anomaly Detection: A Survey

Zahra Zamanzadeh Darban , Geoffrey I. Webb , Shirui Pan , Charu C. Aggarwal , Mahsa Salehi

分类：机器学习 | 人工智能

2022-11-09

Time series anomaly detection has applications in a wide range of research fields and applications, including manufacturing and healthcare. The presence of anomalies can indicate novel or unexpected events, such as production faults, system defects, or heart fluttering, and is therefore of particular interest. The large size and complex patterns of time series have led researchers to develop specialised deep learning models for detecting anomalous patterns. This survey focuses on providing structured and comprehensive state-of-the-art time series anomaly detection models through the use of deep learning. It providing a taxonomy based on the factors that divide anomaly detection models into different categories. Aside from describing the basic anomaly detection technique for each category, the advantages and limitations are also discussed. Furthermore, this study includes examples of deep anomaly detection in time series across various application domains in recent years. It finally summarises open issues in research and challenges faced while adopting deep anomaly detection models.

translated by 谷歌翻译

Generating Multivariate Load States Using a Conditional Variational Autoencoder

Chenguang Wang , Ensieh Sharifnia , Zhi Gao , Simon H. Tindemans , Peter Palensky

分类：机器学习

2021-10-21

For planning of power systems and for the calibration of operational tools, it is essential to analyse system performance in a large range of representative scenarios. When the available historical data is limited, generative models are a promising solution, but modelling high-dimensional dependencies is challenging. In this paper, a multivariate load state generating model on the basis of a conditional variational autoencoder (CVAE) neural network is proposed. Going beyond common CVAE implementations, the model includes stochastic variation of output samples under given latent vectors and co-optimizes the parameters for this output variability. It is shown that this improves statistical properties of the generated data. The quality of generated multivariate loads is evaluated using univariate and multivariate performance metrics. A generation adequacy case study on the European network is used to illustrate model's ability to generate realistic tail distributions. The experiments demonstrate that the proposed generator outperforms other data generating mechanisms.

translated by 谷歌翻译

Introduction to Machine Learning for the Sciences

Titus Neupert , Mark H Fischer , Eliska Greplova , Kenny Choo , M. Michael Denner

分类：机器学习

2021-02-08

这是一门专门针对STEM学生开发的介绍性机器学习课程。我们的目标是为有兴趣的读者提供基础知识，以在自己的项目中使用机器学习，并将自己熟悉术语作为进一步阅读相关文献的基础。在这些讲义中，我们讨论受监督，无监督和强化学习。注释从没有神经网络的机器学习方法的说明开始，例如原理分析，T-SNE，聚类以及线性回归和线性分类器。我们继续介绍基本和先进的神经网络结构，例如密集的进料和常规神经网络，经常性的神经网络，受限的玻尔兹曼机器，（变性）自动编码器，生成的对抗性网络。讨论了潜在空间表示的解释性问题，并使用梦和对抗性攻击的例子。最后一部分致力于加强学习，我们在其中介绍了价值功能和政策学习的基本概念。

translated by 谷歌翻译

The Dark Machines Anomaly Score Challenge: Benchmark Data and Model Independent Event Classification for the Large Hadron Collider

T. Aarrestad , M. van Beekveld , M. Bona , A. Boveia , S. Caron , J. Davies , A. De Simone , C. Doglioni , J. M. Duarte , A. Farbin

分类： (统计)机器学习

2021-05-28

我们描述了作为黑暗机器倡议和LES Houches 2019年物理学研讨会进行的数据挑战的结果。挑战的目标是使用无监督机器学习算法检测LHC新物理学的信号。首先，我们提出了如何实现异常分数以在LHC搜索中定义独立于模型的信号区域。我们定义并描述了一个大型基准数据集，由> 10亿美元的Muton-Proton碰撞，其中包含> 10亿美元的模拟LHC事件组成。然后，我们在数据挑战的背景下审查了各种异常检测和密度估计算法，我们在一组现实分析环境中测量了它们的性能。我们绘制了一些有用的结论，可以帮助开发无监督的新物理搜索在LHC的第三次运行期间，并为我们的基准数据集提供用于HTTPS://www.phenomldata.org的未来研究。重现分析的代码在https://github.com/bostdiek/darkmachines-unsupervisedChallenge提供。

translated by 谷歌翻译

Deep Learning for Time Series Forecasting: Tutorial and Literature Survey

Konstantinos Benidis , Syama Sundar Rangapuram , Valentin Flunkert , Yuyang Wang , Danielle Maddix , Caner Turkmen , Jan Gasthaus , Michael Bohlke-Schneider , David Salinas , Lorenzo Stella

分类：机器学习 | (统计)机器学习

2020-04-21

基于预测方法的深度学习已成为时间序列预测或预测的许多应用中的首选方法，通常通常优于其他方法。因此，在过去的几年中，这些方法现在在大规模的工业预测应用中无处不在，并且一直在预测竞赛（例如M4和M5）中排名最佳。这种实践上的成功进一步提高了学术兴趣，以理解和改善深厚的预测方法。在本文中，我们提供了该领域的介绍和概述：我们为深入预测的重要构建块提出了一定深度的深入预测；随后，我们使用这些构建块，调查了最近的深度预测文献的广度。

translated by 谷歌翻译

Scenario generation for market risk models using generative neural networks

Solveig Flaig , Gero Junike

分类：机器学习

2021-09-21

在这项研究中，我们展示了如何扩展使用生成对抗网络（GAN）作为经济情景发电机（ESG）的现有方法到整个内部市场风险模型 - 具有足够的风险因素，可以为保险的全部投资范围建模。公司和偿付能力2中所需的一年时间范围内的一年时间范围。我们证明了基于GAN的内部模型的结果与欧洲的监管批准的内部模型相似。因此，基于GAN的模型可以看作是数据驱动的替代市场风险建模方式。

translated by 谷歌翻译

Generative Adversarial Networks: An Overview

Antonia Creswell , Tom White , Vincent Dumoulin , Kai Arulkumaran , Biswa Sengupta , Anil A Bharath

分类：

2017-10-19

Generative adversarial networks (GANs) provide a way to learn deep representations without extensively annotated training data. They achieve this through deriving backpropagation signals through a competitive process involving a pair of networks. The representations that can be learned by GANs may be used in a variety of applications, including image synthesis, semantic image editing, style transfer, image super-resolution and classification. The aim of this review paper is to provide an overview of GANs for the signal processing community, drawing on familiar analogies and concepts where possible. In addition to identifying different methods for training and constructing GANs, we also point to remaining challenges in their theory and application.

translated by 谷歌翻译

Adversarial sampling of unknown and high-dimensional conditional distributions

Malik Hassanaly , Andrew Glaws , Karen Stengel , Ryan N. King

分类： (统计)机器学习 | 机器学习

2021-11-08

许多工程问题需要预测实现实现变异性或建模量的精致描述。在这种情况下，有必要采用未知高维空间的元素，其中可能具有数百万自由度。虽然存在能够具有具有已知形状的概率密度函数（PDF）的方法的方法，但是当分布未知时需要进行若干近似。在本文中，基础分布的采样方法以及底层分布的推动都是用一种称为生成对抗网络（GaN）的数据驱动方法，该方法列举了两个竞争的神经网络来生产可以有效地产生样本的网络从训练集分发。在实践中，通常需要从条件分布中绘制样品。当条件变量是连续的时，可以仅可用对应于调节变量的特定值的一个（如果有）数据点，这不足以估计条件分布。使用PDF的条件时刻的先验估计，处理此问题。这里比较两种方法，随机估计和外部神经网络，用于计算这些时刻;但是，可以使用任何优选的方法。在过滤的湍流流场的解构的情况下，证明了算法。结果表明，与最先进的方法相比，所提出的算法的所有版本有效地对目标条件分布进行了最小的影响，对样品的质量的影响最小。另外，该过程可以用作由连续变量的条件GaN（CGAN）产生的样本的分集的度量。

translated by 谷歌翻译

TimeVAE: A Variational Auto-Encoder for Multivariate Time Series Generation

Abhyuday Desai , Cynthia Freeman , Zuhui Wang , Ian Beaver

分类：机器学习

2021-11-15

最近在时间序列域中的合成数据生成的工作集中在使用生成的对抗网络。我们提出了一种用于综合生成时间序列数据的新型架构，使用变分自动编码器（VAES）。拟议的架构具有多种不同的特性：可解释性，编码域知识的能力，以及减少培训时间。我们通过对四个多变量数据集的相似性和可预测性评估数据生成质量。我们试验不同尺寸的培训数据，以测量数据可用性对我们VAE方法的产生质量的影响以及几种最先进的数据生成方法。我们对相似性测试的结果表明，VAE方法能够准确地代表原始数据的时间属性。在使用生成数据的下一步预测任务上，所提出的VAE架构一致地满足或超过最先进的数据生成方法的性能。虽然降噪可能导致所生成的数据偏离原始数据，但是我们演示了所产生的去噪数据可以使用生成的数据显着提高下一步预测的性能。最后，所提出的架构可以包含域特定的时间模式，例如多项式趋势和季节性，以提供可解释的输出。这种解释性在需要模型输出的透明度的应用中可以是非常有利的，或者用户希望将时间序列模式的先验知识注入到生成模型中。

translated by 谷歌翻译

Denoising diffusion probabilistic models for probabilistic energy forecasting

Esteban Hernandez Capel , Jonathan Dumas

分类：机器学习 | 人工智能

2022-12-06

Scenario-based probabilistic forecasts have become a vital tool to equip decision-makers to address the uncertain nature of renewable energies. To that end, this paper presents a recent promising deep learning generative approach called denoising diffusion probabilistic models. It is a class of latent variable models which have recently demonstrated impressive results in the computer vision community. However, to the best of our knowledge, there has yet to be a demonstration that they can generate high-quality samples of load, PV, or wind power time series, crucial elements to face the new challenges in power systems applications. Thus, we propose the first implementation of this model for energy forecasting using the open data of the Global Energy Forecasting Competition 2014. The results demonstrate this approach is competitive with other state-of-the-art deep learning generative models, including generative adversarial networks, variational autoencoders, and normalizing flows.

translated by 谷歌翻译

A Generative Deep Learning Approach to Stochastic Downscaling of Precipitation Forecasts

Lucy Harris , Andrew T. T. McRae , Matthew Chantry , Peter D. Dueben , Tim N. Palmer

分类：人工智能 | 计算机视觉 | 机器学习 | (统计)机器学习

2022-04-05

尽管有持续的改进，但降水预测仍然没有其他气象变量的准确和可靠。造成这种情况的一个主要因素是，几个影响降水分布和强度的关键过程出现在全球天气模型的解决规模以下。计算机视觉社区已经证明了生成的对抗网络（GAN）在超分辨率问题上取得了成功，即学习为粗图像添加精细的结构。 Leinonen等。（2020年）先前使用GAN来产生重建的高分辨率大气场的集合，并给定较粗糙的输入数据。在本文中，我们证明了这种方法可以扩展到更具挑战性的问题，即通过使用高分辨率雷达测量值作为“地面真相”来提高天气预报模型中相对低分辨率输入的准确性和分辨率。神经网络必须学会添加分辨率和结构，同时考虑不可忽略的预测错误。我们表明，甘斯和vae-gan可以在创建高分辨率的空间相干降水图的同时，可以匹配最新的后处理方法的统计特性。我们的模型比较比较与像素和合并的CRP分数，功率谱信息和等级直方图（用于评估校准）的最佳现有缩减方法。我们测试了我们的模型，并表明它们在各种场景中的表现，包括大雨。

translated by 谷歌翻译

Text to Image Synthesis using Stacked Conditional Variational Autoencoders and Conditional Generative Adversarial Networks

Haileleol Tibebu , Aadin Malik , Varuna De Silva

分类：计算机视觉

2022-07-06

从文本描述中综合现实图像是计算机视觉中的主要挑战。当前对图像合成方法的文本缺乏产生代表文本描述符的高分辨率图像。大多数现有的研究都依赖于生成的对抗网络（GAN）或变异自动编码器（VAE）。甘斯具有产生更清晰的图像的能力，但缺乏输出的多样性，而VAE擅长生产各种输出，但是产生的图像通常是模糊的。考虑到gan和vaes的相对优势，我们提出了一个新的有条件VAE（CVAE）和条件gan（CGAN）网络架构，用于合成以文本描述为条件的图像。这项研究使用条件VAE作为初始发电机来生成文本描述符的高级草图。这款来自第一阶段的高级草图输出和文本描述符被用作条件GAN网络的输入。第二阶段GAN产生256x256高分辨率图像。所提出的体系结构受益于条件加强和有条件的GAN网络的残留块，以实现结果。使用CUB和Oxford-102数据集进行了多个实验，并将所提出方法的结果与Stackgan等最新技术进行了比较。实验表明，所提出的方法生成了以文本描述为条件的高分辨率图像，并使用两个数据集基于Inception和Frechet Inception评分产生竞争结果

translated by 谷歌翻译