Page 88 - 2025年第56卷第6期
P. 88

图 4 二维溃坝模型及 t = 7s 时的模拟结果验证

              3.2 大型水动力模型并行效率分析 为了进一步验证上文模型的有效性并分析其计算效率,本节选取
              了一座新建的大型水库(庄里水库)所在流域作为模拟对象,测试前述水动力模型在国产 CPU?GPU异
              构并行计算平台的计算效率。庄里水库位于山东省枣庄市境内,2015年开工建设,2020年投入使用,
                                                                   2
                               2
              流域面积为 746km ,其中坝址以上流域面积为 319.77km 。曼宁糙率系数为流域水动力模型主要参
              数,可根据土地利用资料设定合理的初始值并通过率定过程进行优化                                   [36] 。模型 DEM 分辨率为 7m,
                                                                      1?3
              网格剖分 4012行、4714列(见图 5(a)),初始糙率为 0.04s?m ,模拟期为 1h,时间步长为 0.5s,全
              流域上模拟期内发生 50mm均匀降雨。水库中初始水深取兴利水位并记为 0m。模拟期末(1h后)的
              水深分布计算结果见图 5(b)。定义加速比 R = T?T(T 为模型单个节点上的计算耗时,T 为模型在 k
                                                            k
                                                                                                k
                                                               1
                                                          1
              个节点上的并行计算耗时),本算例计算时间和加速比结果如图 6所示。从图中可以看出:本异构并
              行模型具有较强的并行扩展性,增加计算节点的数量可以有效地降低计算时间;加速比随着计算节点
              的数量增加而稳定提高。本算例中,使用 200个节点可以使计算时间降至 3min左右(200s),实现洪
              水演进过程的分钟级模拟。
                  美国橡树岭国家实验室基于 SUMMIT计算机发布的 TRITON同样采用结构化网格和区域分解策略,
              但采用了与本研究不同的 MPI + CUDA并行方案,最终在 64个计算节点上仅达到 6倍加速比。拖累其
              加速比性能的主要因素是 MPI通信与输入?输出造成的固定时间开销(累计大于 14min;见文献[22]中
              图 7)。与之相比,本研究基于数据传输能力更强的国产 CPU?GPU异构平台,同时在软件方面强化了
              数据交换,在类似应用场景下 MPI与输入?输出时间开销累计低于 1min,只用 7个节点即达到了 6倍
              加速比,表明本研究中并行计算模型和平台的有效性。


                     6
                —  7 7  —
   83   84   85   86   87   88   89   90   91   92   93