欢迎来到中国化工信息杂志
基于深度学习的 区域液化石油气价格中短期预测
2024年6期 发行日期:2024-03-18
作者:■ 中国石化炼油销售有限公司 帅嘉伟

  以往对化工市场的研究以分析供需关系的基本面为主。近两年,基于机器学习的分析逐渐增多,如基于深度学习对原油价格的预测,基于深度学习对日度天然气价格的预测等。在液化气领域,迄今为止,还没有人将深度学习应用于液化气价格的预测。为增强市场研判能力,提升统计分析水平,深度挖掘数据,并为开展库存经营、期货等业务提供决策支持,本文基于深度学习框架下的时间序列预测模型,分析液化气民用气市场价格,比较各模型在该领域预测效果的优劣,以期丰富、增强企业的商情分析手段。

  液化石油气是原油炼制过程中由多种低沸点气体组成的一种副产品,主要成分为丙烷、丙烯、丁烷和丁烯等。作为一种清洁能源,液化气在下游有着广泛的应用。

  人工智能作为一门多领域交叉的技术科学,当前以深度学习为主要实现手段,包含多个研究方向,如计算机视觉(CV)、自然语言处理(NLP)等。时间序列指的是按照时间顺序先后发生的数据序列,广泛存在于生活中,如气温数据、股票价格和电力负荷等。在深度学习出现之前,统计学家基于统计方法发明了多种针对时间序列数据的分析技术,试图从历史宏观金融数据中窥见未来趋势,如ARIMA、指数平滑(ETS)和Theta等。近年,深度学习研究热潮兴起,时间序列预测领域被赋予了新的活力,大量基于神经网络的模型被应用于此。如亚马逊提出的基于循环神经网络的DeepAR,卡梅隆大学提出的基于多层感知机的N-HITS,直至近几年大量涌现的Transformer-based模型,时序预测模型以极快的速度更新着。如今,基于深度学习的时间序列预测技术已经被广泛用于各行各业,如极端气象预测、交通流量预测、期货价格预测、医学领域等,摩根大通在报告《大数据与人工智能战略:机器学习和其他投资数据分析方法》中对机器学习和大数据对金融领域的影响进行了全面的阐述,集中总结了机器学习在金融领域的应用,其中深度学习被认为是一种“针对时间序列数据更合适的方法”。

研究方法

  1.前期准备

  本研究收集了从2021年1月1日至2023年4月20日的各区域液化气民用气市场价,每个区域840天的样本,包括华南、华东、沿江、山东、华北和西部6个地区,共计5040条(天)样本。每条样本包含区域市场价、原油价格、预期CP、国际运费、下游二级站价格、乙烯价格、期货数据、冷冻货到岸价、各区域进口气价格等上下游数据,以及CPI、PPI、PMI等宏观数据共208条特征。训练集、验证集和测试集的划分为2:1:1,即1~420天、421~630天和631~840天。数据来源为金联创和万德数据库。

  本研究使用了11种时间序列模型,在30天、14天、7天和3天四种预测视野下,测试了各模型的预测效果,在测试集(631~840天)上评估模型的泛化效果,采用时间序列交叉验证。

  研究采用多标准综合评价模型,包括均方误差(MAE)、均方根误差(RMSE)和平均绝对百分比误差(MAPE),分别见式(1)、式(2)和式(3)。




  2.模型简介

  如表1所示,本研究采用的模型可大体分为三类,重点模型简介如下。

  (1)NBEATS

  NBEATS为2020年Element AI发布的时序预测模型,如图1。该模型继承了一部分MLP的结构,即Block中的全连接层,基于前向残差连接多个Block,并学习更新参数,将多个Block的输出求和作为Stack的输出。通过对不同Stack内gb(x)的设置捕捉不同的时序特征,该模型为M3、M4竞赛中的最优模型,准确率比ESRNN高了3%。研究中使用的模型实为改进后的NBEATSX,相比原模型增加了协变量输入的功能。

  (2)NHITS

  NHITS为2022年卡梅隆大学提出的时序预测模型(如图2),在NBEATS的架构上增添了分层插值和多速率输入,对模型的输入进行下采样,减少了计算量,并在输出中采用分层差值,使模型输出更为平滑。在长距预测任务中,NHITS比AAAI最佳论文奖的Informer准确率提高了25%,速度快了50倍。

实验结果

  实验结果如图3所示,由图可见,在 3~7 天的短期预测上,各方法预测效果均不佳。虽误差显著低于 Na ve 标准,但具体到每次预测,其给出的预测趋势与实际趋势相比,存在较大误差。而在 14~30天的中期预测上,NBEATS 与 NHITS 的预测精度显著高于其他模型,并在具体预测中展现出对未来整体趋势的预见性。整体上,结果符合误差累积的预期,即伴随着预测视野n的增加,误差不断累计,第t+n日预测误差不断增加。

  综上,对于国内液化气市场价格,部分深度学习模型在 14 天及以上的中期预测中,效果显著。而在 3~7 天的短期预测中,各模型均不理想。

  1. 30天预测结果

  相比之下,在30天的预测视野下,深度学习模型NBEATSX的表现最为突出,但不同区域间仍存在差异:模型在华南、华东、山东和华北地区表现最佳,在测试集中几乎每次都正确地预测了趋势。而在华中和西部地区,模型表现则差强人意,从图4中的表现来看,模型并未展现出对趋势的明显预测。值得一提的是,在几乎所有长度的视野中,模型在西部民用气价格预测上的表现普遍不理想。西部民用气价格的时序特征相比其他五个区域似乎存在较大差异,其现实原因有待探究。NBEATS在该视野下表现出非常不错的效果。但需要指出的是,在该视野下,短期的价格波动被当作噪声忽略了,在一些价格震荡的时期内,NBEATS并不能预测出价格震荡幅度和区间,仅能输出一条平滑的直线作为对未来整体趋势的预测。预测30天各模型误差见表2。

  2. 14天预测结果

  在14天的预测视野下,NHITS展现出了不俗的预测精度,且表现最佳的模型为单变量自回归。其误差如表3所示。如图5中红箭头所示,虽然NHITS在大多数情况下预测趋势都是正确的,但在一些时区内模型开始出现明显错误的趋势预测,而且出现错误预测的时区在各区域展现一定的分布规律,集中于640天与760天附近,对应2022年9月28日左右与2023年2月初,初步判断与国内节假日有关。

总结


  实验表明,对于液化气民用气市场价格,30天与14天均为良好的、可预测的时区,前馈神经网络的模型在整体上表现出更优的预测效果。而7天与3天的视野下,数据信噪比显著降低,以目前的模型难以做出有价值的判断。通过引入深度学习时序预测模型,可以帮助企业更好地判断未来趋势,更准确制定销售策略和生产计划。具体来说,提高对未来价格走势的判断准确度,可以协助企业确定采购时机,降低成本;准确预判市场供需情况,指导生产企业调整产销量,把握机会;利用模型预测不同区域价格差异,可以优化销售区域规划,实现更高利润。

  综上,应用深度学习提升液化气价格预测能力,将为企业的成本控制、资源配置、经营决策等带来积极作用,对增强企业的市场竞争力具有重要意义。

当前评论