Page 66 - 水利学报2021年第52卷第6期
P. 66

4.1 各预见时刻径流预报误差分布求解                  基于 IGMM-Copula 模型中的分布拟合部分(此处称为 IGMM)
               对各预见时刻径流预报误差经验分布进行拟合,首先需要确定各时刻预报误差的最优高斯混合数,
               在原 GMM 模型中,由于没有相应的指标作为参考,作者偏向于参数较少,更容易求解的模型结构,
               因此最终选取的高斯混合数为 K=2。现以 K=2 为起点,根据逐一列举法计算不同 K 值下的 AIC 及 BIC
               的值。其计算结果如表 1。

                                表 1  不同高斯混合数下各预见时刻径流预报误差 IGMM 的 AIC 及 BIC 的值
                                             AIC                                     BIC
                     K
                               6h        12h      18h       24h       6h        12h      18h       24h
                      2      9607.04  9826.18   9636.05   9889.08   9633.13   9871.78  9672.53   9915.16
                      3      9573.79  9812.80   9627.70   9872.16   9615.52   9854.54  9669.43   9913.90
                      4      9578.30  9817.34   9632.83   9874.52   9647.88   9881.38  9700.24   9939.17
                      5      9588.31  9822.19   9642.83   9883.94   9659.87   9890.50  9718.69   9958.27

                   从表 1 可以看出,以 6 h、12 h、18 h、24 h 径流预报误差为基础建立的 IGMM 在 AIC 及 BIC 的值
               取得最小时,对应的最优高斯混合数为 K=3,据此可建立对应权重的 IGMM 对各预见时刻径流预报误
               差进行拟合,表 2 为基于 IGMM 的各预见时刻径流误差分布参数估计值。为体现 IGMM 在误差分布估
               计方面的优势,将原 GMM 与单高斯分布(SGM)作为比较模型。其中,GMM 高斯混合个数的选取及
               参数初始值的确定均按照原文献里介绍的方法进行计算。

                                       表 2  基于 IGMM 的各预见时刻径流误差分布参数估计值

                                                                                               2
                   预见时刻/h        K             权重(α)                均值(μ)                 方差(σ )
                                          α 1=0.4635,α 2=0.1769,  μ 1=0.9872,μ 2=-1.6250,  σ 1 =11.2367,σ 2 =268.2060,
                                                                                               2
                                                                                     2
                      6          3
                                                                                           2
                                               α 3=0.3596           μ 3=0.1835           σ 3 =84.7914
                                          α 1=0.3573,α 2=0.0021,  μ 1=-3.5116,μ 2=59.4452,  σ 1 =206.3921,σ 2 =23.6007,
                                                                                     2
                                                                                               2
                      12         3
                                                                                           2
                                               α 3=0.6406          μ 3=-0.6708           σ 3 =23.4097
                                          α 1=0.3350,α 2=0.0033,  μ 1=-0.6037,μ 2=-39.7471,  σ 1 =167.5890,σ 2 =17.4578,
                                                                                               2
                                                                                     2
                      18         3
                                                                                           2
                                              α 3=0.06617           μ 3=0.5424           σ 3 =27.2638
                                          α 1=0.6347,α 2=0.2540,  μ 1=0.8350,μ 2=-2.1944,  σ 1 =35.0500,σ 2 =122.9527,
                                                                                               2
                                                                                     2
                      24         3
                                                                                          2
                                               α 3=0.1113          μ 3=-0.8019           σ 3 =335.5607
                   图 3 是 3 种 模 型 对 不 同 预 见 时 刻 径 流 预 报 误 差 的 拟 合 效 果 图 , 其 中 实 测 预 报 误 差 样 本 个 数
               n ≥ 1000 ,据此做出的频率直方图总体呈现出对称的形状,误差数据大部分集中在 0 值附近,SGM
               拟合得到的概率密度函数较为矮胖,在峰部的集中度与频率直方图相差较远,而 IGMM 与 GMM 由于
               自适应性较强,两者的拟合结果在数据集中的位置更契合频率直方图,在图中体现为概率密度函数
               的形状更为尖瘦,因此能更大程度的反映实测预报误差样本所展现的规律,这也印证了高斯混合模
               型在概率密度估计中的优越性。同时,由于不同预见时刻的径流预报误差具有不同的特征,而人为
               确定 GMM 中高斯混合数与参数初始值难以达到最佳的拟合效果,尤其对于预报误差数据峰部的拟
               合,基于 IGMM 得到的拟合曲线的拟合效果明显优于 GMM,其原因主要在于 IGMM 对高斯混合数进
               行了优选,并对参数初始值进行了预计算,因此拟合曲线更贴近于频率直方图。
               4.2 模型适用性检验          适用性检验包括拟合优度检验与后验检验,拟合优度检验的目的是用历史数
                                                                          2
               据来检验模型是否能够反映径流误差的随机特性                       [23] ,具体包括 χ 检验、t-检验、K-S 检验等,其中
               K-S 检验是一种检验单个总体是否服从某一理论分布的非参数检验方法,相比于 χ 检验能够更充分
                                                                                           2
               地利用样本信息,适用于连续和定量数据                   [24] 。K-S 检验统计量 D 定义见下式:
                                                                         n
                                             D =  i ∈(1,2,⋯,n è æ çF e  ) - F e  ) ö ÷ ø              (12)
                                                    max
                                              n
                                                            n( x ( ) i t ( ) j
                                                                        t( x ( ) i t ( ) j
                                                          )
               式中: D 越小说明拟合优度越高; F (×) 为经验分布函数; F (×) 为假设的理论分布函数。
                       n
                                                 n
                                                                       t
                 — 694  —
   61   62   63   64   65   66   67   68   69   70   71