智能论文笔记

On the universality of the volatility formation process: when machine learning and rough volatility agree

Mathieu Rosenbaum , Jianfei Zhang

分类：机器学习 | (统计)机器学习

2022-06-28

我们根据数百个液体库存制成的合并数据集培训LSTM网络，旨在预测所有股票的下一个每日实现的波动性。显示了这种通用LSTM相对于其他资产特异性参数模型的一致性，我们发现了与过去的市场实现相关的普遍波动性形成机制的非参数证据，包括每日回报和波动率与当前的波动。结合粗糙的分数随机波动率和二次粗糙的Heston模型的简约参数预测设备与固定参数相结合的二次粗糙heston模型会导致与通用LSTM相同的性能水平，从参数角度来证实了波动性形成过程的通用性。

translated by 谷歌翻译

Predicting Performances of Mutual Funds using Deep Learning and Ensemble Techniques

Nghia Chu , Binh Dao , Nga Pham , Huy Nguyen , Hien Tran

分类：机器学习

2022-09-18

预测基金绩效对投资者和基金经理都是有益的，但这是一项艰巨的任务。在本文中，我们测试了深度学习模型是否比传统统计技术更准确地预测基金绩效。基金绩效通常通过Sharpe比率进行评估，该比例代表了风险调整的绩效，以确保基金之间有意义的可比性。我们根据每月收益率数据序列数据计算了年度夏普比率，该数据的时间序列数据为600多个投资于美国上市大型股票的开放式共同基金投资。我们发现，经过现代贝叶斯优化训练的长期短期记忆（LSTM）和封闭式复发单元（GRUS）深度学习方法比传统统计量相比，预测基金的Sharpe比率更高。结合了LSTM和GRU的预测的合奏方法，可以实现所有模型的最佳性能。有证据表明，深度学习和结合能提供有希望的解决方案，以应对基金绩效预测的挑战。

translated by 谷歌翻译

Forex Trading Volatility Prediction using NeuralNetwork Models

Shujian Liao , Jian Chen , Hao Ni

分类：机器学习

2021-12-02

在本文中，我们研究了使用深层学习技术预测外汇货币对未来波动性的问题。我们逐步展示如何通过对白天波动率的经验模式的指导来构建深度学习网络。数值结果表明，与传统的基线（即自回归和GARCH模型）相比，多尺寸长的短期内存（LSTM）模型与多货币对的输入相比一致地实现了最先进的准确性，即自动增加和加入模型其他深度学习模式。

translated by 谷歌翻译

Forecast Evaluation in Large Cross-Sections of Realized Volatility

Christis Katsouris

分类： (统计)机器学习 | 机器学习

2021-12-09

在本文中，我们考虑了使用相同的预测精度测试程序在横截面依赖下实现了实现波动率测量的预测评估。在预测实现挥发性时，我们根据增强横截面评估模型的预测精度。在相等预测精度的零假设下，所采用的基准模型是标准的HAR模型，而在非相同的预测精度的替代方案下，预测模型是通过套索缩收估计的增强的HAR模型。我们通过结合测量误差校正以及横截面跳转分量测量来研究预报对模型规范的敏感性。使用数值实现评估模型的样本外预测评估。

translated by 谷歌翻译

Price graphs: Utilizing the structural information of financial time series for stock prediction

Junran Wu , Ke Xu , Xueyuan Chen , Shangzhe Li , Jichang Zhao

分类：机器学习

2021-06-04

良好的研究努力致力于利用股票预测中的深度神经网络。虽然远程依赖性和混沌属性仍然是在预测未来价格趋势之前降低最先进的深度学习模型的表现。在这项研究中，我们提出了一个新的框架来解决这两个问题。具体地，在将时间序列转换为复杂网络方面，我们将市场价格系列转换为图形。然后，从映射的图表中提取参考时间点和节点权重之间的关联的结构信息以解决关于远程依赖性和混沌属性的问题。我们采取图形嵌入式以表示时间点之间的关联作为预测模型输入。节点重量被用作先验知识，以增强时间关注的学习。我们拟议的框架的有效性通过现实世界股票数据验证，我们的方法在几个最先进的基准中获得了最佳性能。此外，在进行的交易模拟中，我们的框架进一步获得了最高的累积利润。我们的结果补充了复杂网络方法在金融领域的现有应用，并为金融市场中决策支持的投资应用提供了富有识别的影响。

translated by 谷歌翻译

Neural Networks for Extreme Quantile Regression with an Application to Forecasting of Flood Risk

Olivier C. Pasche , Sebastian Engelke

分类： (统计)机器学习

2022-08-16

对极端事件的风险评估需要准确估算超出历史观察范围的高分位数。当风险取决于观察到的预测因子的值时，回归技术用于在预测器空间中插值。我们提出的EQRN模型将来自神经网络和极值理论的工具结合到能够在存在复杂预测依赖性的情况下外推的方法中。神经网络自然可以在数据中融合其他结构。我们开发了EQRN的经常性版本，该版本能够在时间序列中捕获复杂的顺序依赖性。我们将这种方法应用于瑞士AARE集水区中洪水风险的预测。它利用从时空和时间上的多个协变量中利用信息，以提供对回报水平和超出概率的一日预测。该输出从传统的极值分析中补充了静态返回水平，并且预测能够适应不断变化的气候中经历的分配变化。我们的模型可以帮助当局更有效地管理洪水，并通过预警系统最大程度地减少其灾难性影响。

translated by 谷歌翻译

Slow Momentum with Fast Reversion: A Trading Strategy Using Deep Learning and Changepoint Detection

Kieran Wood , Stephen Roberts , Stefan Zohren

分类： (统计)机器学习 | 机器学习

2021-05-28

动量策略是替代投资的重要组成部分，是商品交易顾问（CTA）的核心。然而，这些策略已被发现难以调整市场条件的快速变化，例如在2020年市场崩溃期间。特别是，在动量转向点之后，在趋势从上升趋势（下降趋势）逆转到下降趋势（上升趋势），时间序列动量（TSMOM）策略容易发生不良赌注。为了提高对政权变更的响应，我们介绍了一种新颖的方法，在那里我们将在线切换点检测（CPD）模块插入深势网络（DMN）[1904.04912]管道，它使用LSTM深度学习架构同时学习趋势估算与定位尺寸。此外，我们的模型能够优化它的平衡1）延迟延期的速度策略，它利用持续趋势，但没有过度反应到本地化价格移动，而且2）通过快速翻转其位置，这是一种快速平均转换策略制度，然后再次将其交换为利用本地化的价格。我们的CPD模块输出ChangePoint位置和严重性分数，允许我们的模型以数据驱动的方式学习响应变化的不平衡或更小，更局部化的变换点。在1995 - 2020年期间，在1995 - 2020年期间，添加CPD模块的添加导致夏普率的提高三分之一。该模块在显着的非间抗性期间特别有益，特别是在最近几年（2015-2020）中，性能提升大约三分之二。随着传统的动量策略在此期间的表现不佳，这很有趣。

translated by 谷歌翻译

Deep Partial Least Squares for Empirical Asset Pricing

Matthew F. Dixon , Nicholas G. Polson , Kemen Goicoechea

分类：机器学习 | (统计)机器学习

2022-06-20

我们使用深层部分最小二乘（DPL）来估算单个股票收益的资产定价模型，该模型以灵活而动态的方式利用调理信息，同时将超额回报归因于一小部分统计风险因素。新颖的贡献是解决非线性因子结构，从而推进经验资产定价中深度学习的当前范式，该定价在假设高斯资产回报和因素的假设下使用线性随机折现因子。通过使用预测的最小二乘正方形来共同投影公司特征和资产回报到潜在因素的子空间，并使用深度学习从因子负载到资产回报中学习非线性图。捕获这种非线性风险因素结构的结果是通过线性风险因素暴露和相互作用效应来表征资产回报中的异常情况。因此，深度学习捕获异常值的众所周知的能力，在潜在因素结构中的角色和高阶项在因素风险溢价上的作用。从经验方面来说，我们实施了DPLS因子模型，并表现出比Lasso和Plain Vanilla深度学习模型表现出卓越的性能。此外，由于DPL的更简约的架构，我们的网络培训时间大大减少了。具体而言，在1989年12月至2018年1月的一段时间内使用Russell 1000指数中的3290资产，我们评估了我们的DPLS因子模型，并生成比深度学习大约1.2倍的信息比率。 DPLS解释了变化和定价错误，并确定了最突出的潜在因素和公司特征。

translated by 谷歌翻译

Expert Aggregation for Financial Forecasting

Carl Remlinger , Brière Marie , Alasseur Clémence , Joseph Mikael

分类：机器学习

2021-11-25

致力于金融时序预测的机器学习算法在过去几年中获得了很多兴趣。一个难度在于在几种算法之间选择，因为它们的估计精度可能是不稳定的。在本文中，我们建议应用基于在线聚合的预测模型，组合了多种机器学习技术来构建动态地适应市场条件的投资组合。我们将该聚合技术应用于建设对其财务特征的长期股票的建设，我们展示了在性能和稳定性方面的聚集占单算法。

translated by 谷歌翻译

Adaptive Learning on Time Series: Method and Financial Applications

Parley Ruogu Yang , Ryan Lucas , Camilla Schelpe

分类： (统计)机器学习

2021-10-21

我们正式介绍了一个时序统计学习方法，称为自适应学习，能够在嘈杂的环境中处理模型选择，采样外预测和解释。通过仿真研究，我们证明该方法可以在条件切换的情况下呈现传统的模型选择技术，例如AIC和BIC，以及促进数据生成过程时的窗口尺寸确定是时变的。根据性地，我们使用该方法来预测S＆P 500跨越多个预测视野，从VIX曲线和产量曲线采用信息。我们发现自适应学习模型通常与，如果不是更好的话，如果不是更好的参数模型，在MSE方面评估，同时也在交叉验证下表现优于效果。我们在2020年市场崩盘期间提出了学习结果的财务应用和对学习制度的解释。这些研究可以在统计方向和金融应用方面延伸。

translated by 谷歌翻译

Ask "Who", Not "What": Bitcoin Volatility Forecasting with Twitter Data

M. Eren Akbiyik , Mert Erkul , Killian Kaempf , Vaiva Vasiliauskaite , Nino Antulov-Fantulin

分类：机器学习

2021-10-27

Understanding the variations in trading price (volatility), and its response to exogenous information, is a well-researched topic in finance. In this study, we focus on finding stable and accurate volatility predictors for a relatively new asset class of cryptocurrencies, in particular Bitcoin, using deep learning representations of public social media data obtained from Twitter. For our experiments, we extracted semantic information and user statistics from over 30 million Bitcoin-related tweets, in conjunction with 15-minute frequency price data over a horizon of 144 days. Using this data, we built several deep learning architectures that utilized different combinations of the gathered information. For each model, we conducted ablation studies to assess the influence of different components and feature sets over the prediction accuracy. We found statistical evidences for the hypotheses that: (i) temporal convolutional networks perform significantly better than both classical autoregressive models and other deep learning-based architectures in the literature, and (ii) tweet author meta-information, even detached from the tweet itself, is a better predictor of volatility than the semantic content and tweet volume statistics. We demonstrate how different information sets gathered from social media can be utilized in different architectures and how they affect the prediction results. As an additional contribution, we make our dataset public for future research.

translated by 谷歌翻译

Volatility Based Kernels and Moving Average Means for Accurate Forecasting with Gaussian Processes

Gregory Benton , Wesley J. Maddox , Andrew Gordon Wilson

分类：机器学习 | (统计)机器学习

2022-07-13

随机微分方程的系统定义了一系列随机波动率模型。尽管这些模型在金融和统计气候学等领域中取得了广泛的成功，但它们通常缺乏在历史数据上条件产生真正的后验分布的能力。为了解决这一基本限制，我们展示了如何将一类随机波动率模型重新塑造为具有专门协方差函数的层次高斯工艺（GP）模型。该GP模型保留了随机波动率模型的电感偏差，同时提供了GP推断给出的后验预测分布。在此框架内，我们从研究良好的域中汲取灵感，以引入新的型号，即Volt和Magpie，这些模型在库存和风速预测中的表现明显超过了基线，并且自然扩展到多任务设置。

translated by 谷歌翻译

Trading with the Momentum Transformer: An Intelligent and Interpretable Architecture

Kieran Wood , Sven Giegerich , Stephen Roberts , Stefan Zohren

分类：机器学习 | (统计)机器学习

2021-12-16

已经发现，已经发现深度学习架构，特别是深度动量网络（DMNS）[1904.04912]是一种有效的势头和平均逆转交易的方法。然而，近年来一些关键挑战涉及学习长期依赖，在考虑返回交易成本净净额并适应新的市场制度时，绩效的退化，特别是在SARS-COV-2危机期间。注意机制或基于变换器的架构是对这些挑战的解决方案，因为它们允许网络专注于过去和长期模式的重要时间步骤。我们介绍了势头变压器，一种基于关注的架构，胜过基准，并且本质上是可解释的，为我们提供更大的深入学习交易策略。我们的模型是基于LSTM的DMN的扩展，它通过在风险调整的性能度量上优化网络，直接输出位置尺寸，例如锐利比率。我们发现注意力LSTM混合解码器仅时间融合变压器（TFT）样式架构是最佳的执行模型。在可解释性方面，我们观察注意力模式的显着结构，在动量转点时具有重要的重要性。因此，时间序列被分段为制度，并且该模型倾向于关注以前的制度中的先前时间步骤。我们发现ChangePoint检测（CPD）[2105.13727]，另一个用于响应政权变化的技术可以补充多抬头的注意力，特别是当我们在多个时间尺度运行CPD时。通过添加可解释的变量选择网络，我们观察CPD如何帮助我们的模型在日常返回数据上主要远离交易。我们注意到该模型可以智能地切换和混合古典策略 - 基于数据的决定。

translated by 谷歌翻译

Understanding Cryptocoins Trends Correlations

Pasquale De Rosa , Valerio Schiavoni

分类：人工智能 | 机器学习

2022-11-30

Crypto-coins (also known as cryptocurrencies) are tradable digital assets. Notable examples include Bitcoin, Ether and Litecoin. Ownerships of cryptocoins are registered on distributed ledgers (i.e., blockchains). Secure encryption techniques guarantee the security of the transactions (transfers of coins across owners), registered into the ledger. Cryptocoins are exchanged for specific trading prices. While history has shown the extreme volatility of such trading prices across all different sets of crypto-assets, it remains unclear what and if there are tight relations between the trading prices of different cryptocoins. Major coin exchanges (i.e., Coinbase) provide trend correlation indicators to coin owners, suggesting possible acquisitions or sells. However, these correlations remain largely unvalidated. In this paper, we shed lights on the trend correlations across a large variety of cryptocoins, by investigating their coin-price correlation trends over a period of two years. Our experimental results suggest strong correlation patterns between main coins (Ethereum, Bitcoin) and alt-coins. We believe our study can support forecasting techniques for time-series modeling in the context of crypto-coins. We release our dataset and code to reproduce our analysis to the research community.

translated by 谷歌翻译

Forecasting Crude Oil Price Using Event Extraction

Jiangwei Liu , Xiaohong Huang

分类：机器学习 | 人工智能 | 自然语言处理

2021-11-14

原油价格预测研究由于其对全球经济的重大影响，从学者和政策制定者引起了巨大的关注。除供需外，原油价格在很大程度上受到各种因素的影响，如经济发展，金融市场，冲突，战争和政治事件。最先前的研究将原油价格预测视为时间序列或计量计量的可变预测问题。虽然最近已经考虑了考虑实时新闻事件的影响，但大多数作品主要使用原始新闻头条或主题模型来提取文本功能，而不会深刻探索事件信息。在这项研究中，提出了一种新的原油价格预测框架，Agesl，用于处理这个问题。在我们的方法中，利用开放域事件提取算法提取底层相关事件，并且文本情绪分析算法用于从大规模新闻中提取情绪。然后，一系列深度神经网络集成了新闻事件特征，感情特征和历史价格特征，以预测未来原油价格。实证实验是在西德克萨斯中间体（WTI）原油价格数据上进行的，结果表明，与几种基准方法相比，我们的方法获得了卓越的性能。

translated by 谷歌翻译

Estimating value at risk: LSTM vs. GARCH

Weronika Ormaniec , Marcin Pitera , Sajad Safarveisi , Thorsten Schmidt

分类： (统计)机器学习

2022-07-21

使用可能的异质动力学估算时间序列数据的价值风险是一项高度挑战的任务。通常，我们面临着一个小的数据问题，结合了高度的非线性，因此对于经典和机器学习估计算法造成了困难。在本文中，我们提出了使用长期记忆（LSTM）神经网络的新型价值估计器，并将其性能与基准GARCH估计器进行比较。我们的结果表明，即使在相对较短的时间序列中，LSTM也可以用于完善或监视风险估计过程，并以非参数方式正确识别潜在的风险动态。我们对模拟和市场数据的估计器进行了评估，重点是异方差，发现LSTM在模拟数据上表现出与GARCH估算器相似的性能，而在实际市场数据上，它对增加波动性或降低波动性更为敏感，并且优于所有现有的现有估计器在异常率和平均分位数评分方面，价值风险。

translated by 谷歌翻译

DeepVARwT: Deep Learning for a VAR Model with Trend

Xixi Li , Jingsong Yuan

分类：人工智能

2022-09-21

向量自回旋（VAR）模型已用于描述多个时间序列内部和跨多个时间序列的依赖性。这是一个固定时间序列的模型，可以扩展以允许每个系列的确定性趋势存在。在拟合VAR模型之前，在参数或非参数上逐步降低数据会导致后一部分的更多误差。在这项研究中，我们提出了一种称为DeepVarwt的新方法，该方法采用了深度学习方法，以最大程度地估计趋势和依赖性结构。为此目的使用了长期的短期内存（LSTM）网络。为了确保模型的稳定性，我们使用Ansley＆Kohn（1986）的转换来实施自回归系数的因果关系。我们提供模拟研究和对真实数据的应用。在仿真研究中，我们使用由真实数据产生的现实趋势函数，并将估计值与真实函数/参数值进行比较。在实际数据应用程序中，我们将该模型的预测性能与文献中的最新模型进行了比较。

translated by 谷歌翻译

Empirical Asset Pricing via Ensemble Gaussian Process Regression

Damir Filipović , Puneet Pasricha

分类：机器学习

2022-12-02

We introduce an ensemble learning method based on Gaussian Process Regression (GPR) for predicting conditional expected stock returns given stock-level and macro-economic information. Our ensemble learning approach significantly reduces the computational complexity inherent in GPR inference and lends itself to general online learning tasks. We conduct an empirical analysis on a large cross-section of US stocks from 1962 to 2016. We find that our method dominates existing machine learning models statistically and economically in terms of out-of-sample $R$-squared and Sharpe ratio of prediction-sorted portfolios. Exploiting the Bayesian nature of GPR, we introduce the mean-variance optimal portfolio with respect to the predictive uncertainty distribution of the expected stock returns. It appeals to an uncertainty averse investor and significantly dominates the equal- and value-weighted prediction-sorted portfolios, which outperform the S&P 500.

translated by 谷歌翻译

Learning Non-Stationary Time-Series with Dynamic Pattern Extractions

Xipei Wang , Haoyu Zhang , Yuanbo Zhang , Meng Wang , Jiarui Song , Tin Lai , Matloob Khushi

分类：机器学习 | 人工智能

2021-11-20

信息爆炸的时代促使累积巨大的时间序列数据，包括静止和非静止时间序列数据。最先进的算法在处理静止时间数据方面取得了体面的性能。然而，解决静止时间系列的传统算法不适用于外汇交易的非静止系列。本文调查了适用的模型，可以提高预测未来非静止时间序列序列趋势的准确性。特别是，我们专注于识别潜在模型，并调查识别模式从历史数据的影响。我们提出了基于RNN的\ Rebuttal {The} SEQ2Seq模型的组合，以及通过动态时间翘曲和Zigzag峰谷指示器提取的注重机制和富集的集合特征。定制损失函数和评估指标旨在更加关注预测序列的峰值和谷点。我们的研究结果表明，我们的模型可以在外汇数据集中预测高精度的4小时未来趋势，这在逼真的情况下至关重要，以协助外汇交易决策。我们进一步提供了对各种损失函数，评估指标，模型变体和组件对模型性能的影响的评估。

translated by 谷歌翻译

DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks

David Salinas , Valentin Flunkert , Jan Gasthaus

分类：

2017-04-13

Probabilistic forecasting, i.e. estimating the probability distribution of a time series' future given its past, is a key enabler for optimizing business processes. In retail businesses, for example, forecasting demand is crucial for having the right inventory available at the right time at the right place. In this paper we propose DeepAR, a methodology for producing accurate probabilistic forecasts, based on training an auto-regressive recurrent network model on a large number of related time series. We demonstrate how by applying deep learning techniques to forecasting, one can overcome many of the challenges faced by widely-used classical approaches to the problem. We show through extensive empirical evaluation on several real-world forecasting data sets accuracy improvements of around 15% compared to state-of-the-art methods.

translated by 谷歌翻译