Page 63 - 2022年第53卷第6期
P. 63

N
                                                          ∑
                                                       X =   M + R                                     (10)
                                                               i
                                                          i =1
              2.4 随机森林算法 Breiman基于 Bagging算法改进
              回归树模型,创新地提出了随机森林算法                     [14] ,该算
              法主要由子训练样本集和子回归模型(决策树)组成,
              其通过 Bootstrap重抽样从原样本集中有放回地抽取多
              个样本组成样本容量与原样本集合一致的子训练样本
                                                                           图 2 随机森林模型计算流程图
              集,并对每个子训练样本集构建子回归模型,即组成
              随机森林模型,综合所有子回归模型的子模拟结果得到最终模拟结果。该算法在大量的理论和实例中
              均表现出较高模拟精准度,目前已得到广泛应用                       [26 - 28] ,模型计算流程见图 2。
                                                                                                    2
                  在随机森林模型构建后,选定均方根误差 R                       、平均相对误差绝对值 M              和决定系数 R三个指
                                                          RMSE                       MRE
              标来评估模型的模拟精度,当前两者越小、后者越大时模型模拟精度越好。各指标计算公式分别为:
                                                         n
                                                              i
                                                                 i
                                               M MRE = ( 1 ∑  x - y ) × 100%                           (11)
                                                       n i =1  y
                                                               i
                                                          1  n
                                                  R   =     ∑  (x- y ) 2                               (12)
                                                        槡
                                                   RMSE          i  i
                                                          n i =1
                                                      [(x- 珋    i  y)] 2
                                                            x)(y- 珋
                                                          i
                                                 2
                                                R =                                                    (13)
                                                     n          n
                                                              2
                                                    ∑  (x- 珋 ∑   (y- 珋  2
                                                                      y)
                                                           x)
                                                                    i
                                                         i
                                                    i =1       i =1
                                                                 x为模型拟合系列值的均值,mm; 珋
              式中:x为模型拟合值,mm;y为年降水实测值,mm; 珋                                                       y为年降水
                     i
                                           i
              实测系列值的均值,mm。
              2.5 数据资料 本次研究采用的数据资料是北京地
              区长时 序 面 降 水 序 列, 序 列 长 度 为 296年 (1724—
              2019)(见 图 3), 前 250年 (1724—1973)数 据 来 自
              1970年代我国气象学者依据古籍 《晴雨录》 记载数
              据并关联有仪器观测以来的北京气象站实测降水数据
              后推 算 延 伸 并 整 编 的 《北 京 250年 降 水 (1724—
                     ①
              1973)》 ,故认为此汇编数据具有一致性,另外从北
              京气象局获取北京气象站后续年份降水数据,依托北                                   图 3 北京地区 1724—2019年降水序列
              京气象站得到 296年北京地区 1724—2019年长降水
              序列数据,本研究主要集中于降水序列成分分析和随机模拟,旨在探明降水波动变化规律,而非精确
              量值变化,故该时序数据能够满足本次研究的需要,具有一定的空间一致性和可靠性。
              3 降水序列组成成分分析


              3.1 突变检验 首先采用 TFPW 检验北京地区 296年降水序列是否存在自相关并进行预处理,随后将
              序列代入 BS - Pettitt模型进行突变检验,检验结果初步表明北京地区 296年降水序列存在 7个突变点,
              突变点发生的年份分别是 1742年、1770年、1813年、1871年、1893年、1947年和 1999年。各时段
              内各突变点的 Pettitt统计量 U 变化过程如图 4(a)—(g)所示,根据突变检验的结果得到北京地区 296
                                         t,N
              年降水量序列的均值变化过程(见图 4(h)),可以看出降水序列分段均值变化与降水序列变化情况匹
              配良好,能较为完整地体现出降水序列变化趋势,较为充分表明 BS - Pettitt耦合模型具有较高准确性,
              并且结果与以往研究结论大致相同                 [29] 。



                 ①  中央气象局研究所.北京 250年降水(1724—1973).1975.
                                                                                                —  6 8 9 —
   58   59   60   61   62   63   64   65   66   67   68