Page 63 - 2022年第53卷第6期
P. 63
N
∑
X = M + R (10)
i
i =1
2.4 随机森林算法 Breiman基于 Bagging算法改进
回归树模型,创新地提出了随机森林算法 [14] ,该算
法主要由子训练样本集和子回归模型(决策树)组成,
其通过 Bootstrap重抽样从原样本集中有放回地抽取多
个样本组成样本容量与原样本集合一致的子训练样本
图 2 随机森林模型计算流程图
集,并对每个子训练样本集构建子回归模型,即组成
随机森林模型,综合所有子回归模型的子模拟结果得到最终模拟结果。该算法在大量的理论和实例中
均表现出较高模拟精准度,目前已得到广泛应用 [26 - 28] ,模型计算流程见图 2。
2
在随机森林模型构建后,选定均方根误差 R 、平均相对误差绝对值 M 和决定系数 R三个指
RMSE MRE
标来评估模型的模拟精度,当前两者越小、后者越大时模型模拟精度越好。各指标计算公式分别为:
n
i
i
M MRE = ( 1 ∑ x - y ) × 100% (11)
n i =1 y
i
1 n
R = ∑ (x- y ) 2 (12)
槡
RMSE i i
n i =1
[(x- 珋 i y)] 2
x)(y- 珋
i
2
R = (13)
n n
2
∑ (x- 珋 ∑ (y- 珋 2
y)
x)
i
i
i =1 i =1
x为模型拟合系列值的均值,mm; 珋
式中:x为模型拟合值,mm;y为年降水实测值,mm; 珋 y为年降水
i
i
实测系列值的均值,mm。
2.5 数据资料 本次研究采用的数据资料是北京地
区长时 序 面 降 水 序 列, 序 列 长 度 为 296年 (1724—
2019)(见 图 3), 前 250年 (1724—1973)数 据 来 自
1970年代我国气象学者依据古籍 《晴雨录》 记载数
据并关联有仪器观测以来的北京气象站实测降水数据
后推 算 延 伸 并 整 编 的 《北 京 250年 降 水 (1724—
①
1973)》 ,故认为此汇编数据具有一致性,另外从北
京气象局获取北京气象站后续年份降水数据,依托北 图 3 北京地区 1724—2019年降水序列
京气象站得到 296年北京地区 1724—2019年长降水
序列数据,本研究主要集中于降水序列成分分析和随机模拟,旨在探明降水波动变化规律,而非精确
量值变化,故该时序数据能够满足本次研究的需要,具有一定的空间一致性和可靠性。
3 降水序列组成成分分析
3.1 突变检验 首先采用 TFPW 检验北京地区 296年降水序列是否存在自相关并进行预处理,随后将
序列代入 BS - Pettitt模型进行突变检验,检验结果初步表明北京地区 296年降水序列存在 7个突变点,
突变点发生的年份分别是 1742年、1770年、1813年、1871年、1893年、1947年和 1999年。各时段
内各突变点的 Pettitt统计量 U 变化过程如图 4(a)—(g)所示,根据突变检验的结果得到北京地区 296
t,N
年降水量序列的均值变化过程(见图 4(h)),可以看出降水序列分段均值变化与降水序列变化情况匹
配良好,能较为完整地体现出降水序列变化趋势,较为充分表明 BS - Pettitt耦合模型具有较高准确性,
并且结果与以往研究结论大致相同 [29] 。
① 中央气象局研究所.北京 250年降水(1724—1973).1975.
— 6 8 9 —