Page 33 - 水利学报2025年第56卷第4期
P. 33
时精确率和召回率都较高。但当提高交并比时,Yolact、MaskR - CNN和 CascadeMaskR - CNN模型的精
确率和召回率都有明显下降。而基于深度学习的 QueryInst算法在交并比 0.5~0.95的平均精确率和平
均召回率均超过 90%,明显优于其他先进算法。结果表明,所使用的 QueryInst算法能够准确地根据标
注信息划分碾压混凝土坝坝面热升层施工状态,且漏识别的区域较少,能够满足施工现场应用需求。
表 1 网络结构基本参数设置
模型 参数 值 模型 参数 值
输入图像尺寸(宽× 高) 720 × 576(像素) 输入图像尺寸(宽× 高) 720 × 576(像素)
骨干网络 ResNet - 101 骨干网络 ResNet - 101
颈部网络 特征金字塔网络(4层) 颈部网络 特征金字塔网络(4层)
Yolact;
阶段数量 6个
MaskR - CNN; QueryInst
检测框数量 100个
CascadeMaskR - CNN
分类损失函数 交叉熵损失函数 分类损失函数 FocalLoss函数
检测框损失函数 SmoothL1损失函数 1) 检测框损失函数 绝对误差损失函数
分割损失函数 交叉熵损失函数 交并比损失函数 GIoU损失函数
注:1)MaskR - CNN模型的检测框损失函数使用的是 L1损失函数。
表 2 模型训练过程基本参数设置
模型 优化器 训练轮数 学习率(训练轮数)
Yolact SGD(带动量的随机梯度下降优化器) 20 0.001(1~15),0.0001(16~20)
MaskR - CNN SGD(带动量的随机梯度下降优化器) 12 0.02(1~8),0.002(9~11),0.0002(12)
CascadeMaskR - CNN SGD(带动量的随机梯度下降优化器) 12 0.02(1~8),0.002(9~11),0.0002(12)
QueryInst SGD(带动量的随机梯度下降优化器) 12 0.02(1~8),0.002(9~11),0.0002(12)
表 3 精确率和召回率实验结果
模型 交并比 平均精确率?% 平均召回率?%
0.5 99.4 92.5
Yolact 0.75 96.7 92.5
0.5~0.95 90.1 92.5
0.5 99.2 89.0
MaskR - CNN 0.75 94.7 89.0
0.5~0.95 86.2 89.0
0.5 99.4 91.5
CascadeMaskR - CNN 0.75 95.7 91.5
0.5~0.95 90.3 91.5
0.5 99.1 92.8
QueryInst 0.75 96.7 92.8
0.5~0.95 90.8 92.8
除定量研究外,测试集图像的碾压混凝土坝仓面施工状态部分可视化结果如图 7所示。图中每三
张图为一组,分别为原始图像、模型预测的结果以及人工标注的结果。其中,模型预测结果的浅蓝色
部分为摊铺作业区域,紫色部分为碾压作业区域;人工标注结果的深红色部分为摊铺作业区域,黄色
部分为碾压作业区域。针对不同的作业工况,本文使用的方法能够较好地识别施工状态。如图 7第二
行的两组例子均为仅进行摊铺作业的状态,其边界为复杂的多边形。本文所提方法能够较清晰和准确
— 4 5 1 —