Page 6 - 2023年第54卷第8期

P. 6

络构建了深度学习概率预报模型［８，１４－１６］。混合密度网络（ＭＤＮ）是一种可以估计目标变量条件概率分布
的神经网络。ＭＤＮ将神经网络与混合密度函数相结合，借助神经网络生成多个核函数的权重和参数，
将核函数按照权重相加组合为混合密度函数，理论上可以表示任意条件概率分布［１５］，在能源、气象等
领域获得广泛关注［１９－２１］，其损失函数依据最大似然估计法构建［１９］。当前，多数深度学习概率预报研
究主要集中在单个时间步长的概率预报中，无法在考虑预报洪水过程时间相关性的前提下获得不确定
性估计，缺乏可解释性和适用性。因此，有必要开展基于混合深度学习模型的多时段洪水过程概率预
报研究，实现实时量化预报洪水过程的不确定性，为水库防洪调度等决策提供更多的风险信息。
本文首先将ＸＡＪ模型的预报流量过程嵌入ＸＡＪ－ＬＳＴＭ－ＥＤＥ模型的解码过程；其次，将ＭＤＮ耦合
至ＸＡＪ－ＬＳＴＭ－ＥＤＥ模型解码过程的输出层以实现概率分布转换，构建ＸＡＪ－ＬＳＴＭ－ＥＤＥ－ＭＤＮ混合深
度学习模型；最后，依据最大似然估计法构建损失函数，以优化ＸＡＪ－ＬＳＴＭ－ＥＤＥ－ＭＤＮ模型的权重等
参数。本文以陆水和建溪两个流域为案例，对ＸＡＪ－ＬＳＴＭ、ＸＡＪ－ＬＳＴＭ－ＥＤＥ和ＸＡＪ－ＬＳＴＭ－ＥＤＥ－ＭＤＮ
模型进行对比验证，并分析了所提模型的不确定性量化性能。

２研究方法

２．１ＸＡＪ－ＬＳＴＭ模型长短期记忆（ＬＳＴＭ）神经网络由遗忘门、输入门、更新记忆单元状态和输出
门等４个计算结构构成。ＸＡＪ－ＬＳＴＭ模型结构见图１（ａ）。ＸＡＪ－ＬＳＴＭ模型是将ＸＡＪ模型的预报流量作
为ＬＳＴＭ神经网络在预报时刻的输入。其中，ＸＡＪ模型参数率定方法和结果见文献［１１］。ＸＡＪ模型预
报流量与目标输出变量（即每一预见期对应的实测流量）有较强的相关性，因此期望其可引导神经网络
产生较合理的预报流量过程。同时，ＸＡＪ模型预报流量增加了模型输入数量，可在一定程度上缓解过拟
合问题。ＸＡＪ－ＬＳＴＭ模型为单输出结构（与文献［３］相似），未在时间维度上考虑预报洪水间的相关性。
２．２ＸＡＪ－ＬＳＴＭ－ＥＤＥ模型基于外源输入编码－解码结构的ＸＡＪ－ＬＳＴＭ－ＥＤＥ模型由编码过程（图１（ｂ）－
（１））和解码过程（图１（ｂ）－（２））构成。为克服传统递归编码－解码结构的曝光偏差问题，将ＸＡＪ模型
的预报流量过程与解码过程相耦合（图１（ｂ）－（２）虚线框），以替代解码中的递归过程，使得解码过程
的输入始终为编码过程提取的重要信息（即图１（ｂ）－（２）中的中间向量Ｃ）和ＸＡＪ模型的预报流量。
ＸＡＪ－ＬＳＴＭ－ＥＤＥ模型可以在考虑输出变量时间相关性的前提下，实时预报多时段洪水过程，相对ＸＡＪ－
ＬＳＴＭ模型更具可解释性和适用性。ＸＡＪ－ＬＳＴＭ－ＥＤＥ模型未考虑预见期内预报降雨数据，为保持输入
变量一致，ＸＡＪ－ＬＳＴＭ模型同样未考虑预报降雨数据，即Ｐ～Ｐ为０ｍｍ。
ｔ＋ｍ＋１ｔ＋ｍ＋ｎ
２．３混合深度学习模型本文将ＭＤＮ耦合至ＸＡＪ－ＬＳＴＭ－ＥＤＥ模型解码过程的输出层，即将ＸＡＪ－
ＬＳＴＭ－ＥＤＥ模型解码过程隐含层输出Ｘ作为混合密度网络（ＭＤＮ）的输入，增加了概率预报过程（图１
（ｂ）－（３）），从而构建ＸＡＪ－ＬＳＴＭ－ＥＤＥ－ＭＤＮ混合深度学习模型。该模型可以在考虑输出变量时间相
关性的前提下，将解码过程产生的点估计转化为概率分布估计，能够反映预报过程的不确定性，提供
更多的风险信息。
ＸＡＪ－ＬＳＴＭ－ＥＤＥ－ＭＤＮ模型输出多个核函数的权重ｗ和参数 θ ，其中ｗ通过Ｓｏｆｔｍａｘ函数进行归
一化，以确保核函数形成有效的分布函数，其他输出值可通过适当的函数处理（如指数函数），以确保
其值在规定范围内。洪水预报序列一般为一维时间序列，给定ＸＡＪ－ＬＳＴＭ－ＥＤＥ模型隐含层输出Ｘ时，
目标变量Ｙ的条件概率密度函数ｆ（Ｙ θ ，Ｘ）为
ｍ
ｆ（Ｙ θ ，Ｘ）＝ ∑ ｗ（Ｘ） φ ｉ（ＹＸ）（１）
ｉ
ｉ＝１
ｍ
０ ｗ１， ∑ ｗ＝１（２）
ｉｉ
ｉ＝１
ｗ
ｅｘｐ（Ｙ）
ｉ
ｗ
ｗ＝ｓｏｆｔｍａｘ（Ｙ）＝（３）
ｉｉｍ
ｗ
∑ ｅｘｐ（Ｙ）
ｊ
ｊ＝１
０
— ８９ —

1 2 3 4 5 6 7 8 9 10 11