Page 80 - 2024年第55卷第5期
P. 80
的学习能力,弥补传统 RNN不善于对较长时间序列进行模拟和预报的缺点 [30] 。其中,遗忘门决定细
胞状态向量中需要丢弃的信息,输入门决定用于更新当前细胞状态的信息及其更新程度,输出门决定
细胞状态中 流 至 新 隐 层 的 信 息。LSTM 的 模 型 结 构 和 参 数 设 定 参 考 文 献 [11,31 - 34]。本 研 究 中,
LSTM输入数据个数为开河日期年积日序列的最大自相关阶数,验证数据设定为各代表站开河日期年
积日序列的最后 5年(个)数据(2015—2019年),其余数据则作为训练数据。LSTM模型计算结果经反
归一化处理后得到 LSTM模型对开河日期年积日的预测值。
2.4 CEEMDAN - LSTM 模型 CEEMDAN - LSTM的基本思想是以经 CEEMDAN分解归一化处理后的
初始时间序列而得到的所有 IMFs和余量序列作为 LSTM模型输入数据,用于 LSTM模型的训练;为与
传统 LSTM模型的计算结果对比,CEEMDAN - LSTM验证数据亦设定为各代表站开河日期年积日序列
的最后 5个数据(2015—2019年),其余数据则作为训练数据;CEEMDAN - LSTM的预测值为经反归一
化处理后的各 IMFs和余量序列预测值之和。CEEMDAN - LSTM具体执行步骤如下:
(1)采用 CEEMDAN将历史开河日期年积日序列分解为多个 IMFs和 1个余量序列;
( 2)创建训练集和验证集,然后对各 IMFs和余量序列进行归一化;
( 3)计算各 IMFs及余量序列的最大自相关阶数,对各 IMFs和余量序列进行预测;
( 4)对步骤(3)的预测结果进行反归一化。
2.5 评价指标 采用平均绝对误差(MAE)、合格率(QR)和绝对误差(AE)共 3个指标评价开河日期预
报模型的预测精度,其计算公式:
1 K
MAE= ∑ x t t (9)
^-x
K t =1
n abs(AE) ≤7
QR = × 100 % (10)
K
AE = x - ^x (11)
t
t
式中:x为实测开河日期年积日; ^x为预测开河日期年积日;n 为绝对误差值小于等于 7d的个
t t abs(AE) ≤7
数(据 《水文情报预报规范》 ( GB?T2242—2008),对于预见期大于 15d的冰情预报,预报精度为 7
d );K为序列总长度。当 MAE = 0 ,QR = 100%,AE = 0 时,模型预测值等于观测值,模型表现最优。
3 结果分析与讨论
3.1 CEEMDAN分解开河日期序列的结果分析 以除最后 5年数据以外的各代表站开河日期年积日
序列作为 CEEMDAN待分解的原始序列,其 CEEMDAN分解结果如图 2所示。每个代表站的历史开河日
期年积日序列均被分解为若干个 IMFs和 1个余量序列。由图 2和表 1可知,宝清站、漠河站和牡丹江站
开河日期年积日原始序列长度相近,宝清站开河日期年积日序列标准差最大,经 CEEMDAN分解后得到
的子序列个数相对较多。
各代表站原始序列经 CEEMDAN分解后得到的各子序列表现出不同的振荡特征,其中 IMF 的振
1
幅和频率最大,随着序列进一步分解,振荡频率和幅度逐渐降低,最后的余量序列则接近线性;此
外,各原始序列分解得到的最终余量序列的样本值远大于 IMFs序列的样本值,且余量序列样本值的
量级与原始序列样本均值的量级相近,余量序列的变化趋势可代表开河日期年积日原始序列的总体变
化趋势线 [31] 。
3.2 LSTM 预报开河日期的结果分析 以各代表站开河日期年积日原始序列的最后 5个样本作为验证
数据,其余样本作为训练数据。直接采用 LSTM构建各代表站的开河日期模拟模型,模拟结果绝对误
差如图 3所示,预报精度评价指标值 MAE、合格率 QR及绝对误差范围如表 2所列。
如图 3所示,5个代表站中,仅牡丹江站的绝对误差落在 《水文情报预报规范》 允许预报精度范
围内。另由表 2可知,各站所有开河日期的模拟值与实测值绝对误差在 - 13~13d之间,训练期开河
日期模拟值与实测值绝对误差范围与所有模拟值绝对误差范围相同,验证期开河日期模拟值与实测值
0
— 5 8 —