Page 7 - 2024年第55卷第3期
P. 7
研究数据部分由仓面边界及障碍物坐标、料源参数、压实质量评价结果等填筑仓面信息组成。
研究方法部分建立了基于元胞自动机的填筑仓面信息模型和基于强化学习的碾压作业路径规划模
型。首先,建立基于元胞自动机原理的填筑仓面信息模型,设置仓面信息为元胞的状态,提出一种条
带整体压实质量评价方法,实现压实质量等仓面信息的储存,通过自定义状态转移规则实现仓面质量
信息实时更新。然后,建立基于强化学习的碾压作业路径规划模型,结合碾压机位置和条带压实质量
构建碾压机状态集,引入 D 算法构建碾压机动作集,自定义奖励函数和探索利用策略。最后,耦合
上述两种模型实现堆石坝填筑仓面碾压作业动态路径规划。
工程应用部分将本方法应用于某堆石坝工程的堆石料仓面,选用搭接法作为碾压工艺规划碾压作
业路径,验证本方法能够在保证碾压质量的前提下提高碾压效率。
2.2 数学模型 结合本文的研究目标、研究方法以
及相关参数,建立堆石坝碾压作业路径规划的数学
模型,如图 2所示。
首先,本文的研究目标是在满足碾压工艺和保
障碾压质量的前提下提高碾压效率,由此可建立本
研究的目标函数。其次,通过分析碾压作业路径规
划模型的输入参数和输出参数定义本研究的参数集。 图 2 数学模型
最后,定义本研究中元胞自动机填筑仓面信息模型以及强化学习碾压机群路径规划模型两个主要研究
方法,并定义两个模型的主要研究内容。各部分参数定义如下:
( 1)定义了堆石坝碾压机群路径规划研究的目标函数,其表达式如式(1)所示。
Opt{T} (1)
式中 T代表大坝碾压施工的效率。
( 2)定义了堆石坝碾压机群路径规划研究的约束条件 C,其中包括碾压仓面的压实质量 Q、大坝
碾压施工工艺 RT,其表达式如式(2)所示。
C = {Q,RT} (2)
( 3)定义了堆石坝碾压机群路径规划研究的输入参数集合 P,输入参数集合分为碾压参数集 PR和
仓面信息集 PW,其中,碾压参数集 PR包括碾压机坐标 R、碾压遍数 N、碾压速度 V、碾压机激振力
E;仓面信息集 PW 包括仓面边界坐标 BC、障碍物边界坐标 OC、料源特性参数 MC、压实质量评估
结果 D,输入参数集合 P的表达式如式(3)所示。
P = {PR,PW} = {R,N,V,E,BC,OC,MC,D} (3)
( 4)定义了堆石坝碾压机群路径规划研究的方法集 M,其中包括碾压仓面信息元胞自动机模型 CA
和大坝碾压机群路径规划强化学习模型 RL,其表达式如式(4)所示。
M= {CA,RL} (4)
(5)定义了堆石坝碾压施工仓面的元胞自动机模型 CA,包括元胞的状态信息 s、元胞之间的状态
转移规则 ST、邻居的状态信息 NH,其中,状态转移规则 ST包括受碾压机影响的元胞CA 、元胞压
inf
实质量计算规则 W,则元胞自动机 CA的表达式如式(5)所示。
CA = {S,ST,NH} = {S,CA ,W,NH} (5)
inf
(6)定义了堆石坝碾压机群路径规划的强化学习模型 RL,其中包括碾压机械的状态集 SR、碾压
机械的动作集 MR、奖励函数集 RW、探索利用策略集 EU,其表达式如(6)所示。
RL = {SR,MR,RW,EU} (6)
3 基于元胞自动机原理的填筑仓面信息模型
3.1 仓面信息获取方法 应用于本研究的填筑仓面信息包括仓面边界及障碍物的坐标、料源参数、压
实质量评估结果。
— 2 5 5 —