Page 135 - 2025年第56卷第1期
P. 135
水 利 学 报
2025 年 1 月 SHUILI XUEBAO 第 56 卷 第 1 期
文章编号: 0559-9350(2025)01-0130-13
基于大语言模型的灌浆工程知识服务系统
张天鸿 , 王晓玲 , 余红玲 , 王佳俊 , 苏 哲 , 张 君 1
2
1
1
1
1
(1. 天津大学 水利工程智能建设与运维全国重点实验室, 天津 300072;
2. 中国农业大学 水利与土木工程学院, 北京 100091)
摘要: 目前灌浆工程各阶段专业知识信息获取均依赖人工对多领域文本进行分析, 人力成本高、 生产效率低。 为
解决上述问题, 需要构建基于大语言模型的知识服务系统。 提供大语言模型微调所需的高质量文本, 以及如何应
对特定工程文本所固有的时效性与信息安全风险是构建该服务系统的重点和难点。 为此, 本研究首先针对通用性
灌浆施工规范, 提出了基于混合策略的数据集构建方法, 并通过引入自我检查思维链与评分策略, 攻克了传统数
据生成质量不高的局限, 为大语言模型微调提供了所需的高质量数据; 其次采用 LangChain 构建了灌浆工程的检
索增强生成框架, 利用内嵌本地知识库实现了特定灌浆文本与模型的隔离, 保障了特定工程文本的信息安全; 最
后通过阶段更新满足了特定工程文本的时效性要求。 专业性测试表明, 利用上述方法进行微调的 Qwen-7B-Grout
模型, 在灌浆专业问题的判断与填空题的问答方面准确率分别达到了 100%和 80%。 本研究提出的基于大语言模
型构建的灌浆工程知识服务系统, 不仅实现了通用灌浆知识的问答, 而且能够对工程文档进行高效的检索增强生
成, 可有效提高生产效率并降低人力成本, 为灌浆设计与施工管理提供新的智能辅助手段。
关键词: 灌浆工程知识服务; 混合策略数据生成; 大语言模型; 检索增强生成; 灌浆工程
文献标识码: A doi: 10.13243∕j.cnki.slxb.20240164
中图分类号: TV52
1 研究背景
基础灌浆通过浆液作用改善基础力学特性, 并截断渗漏通道, 是保障水利枢纽工程施工与运行的
重要工程措施 [1] 。 然而, 灌浆施工工艺复杂, 施工对象隐蔽, 施工环境特殊, 涉及地质、 施工、 管
理、 材料和通信等多领域知识, 具有强系统性与专业性。 传统灌浆设计与施工管理不仅要求专业人员
具备综合知识, 而且需从繁复的多方材料中摄取相关信息, 进行大量重复性劳动。 长期以来, 灌浆工
程高度依赖领域专家经验, 人力成本高、 生产效率低等问题较为突出。 这些领域知识广泛分布于灌浆
工程相关的文本文件, 如施工规范、 施工大纲等, 可被用于建立基于通用大语言模型(Large Language
Model, LLM)的灌浆领域模型, 构建可私有化部署的灌浆工程知识服务系统, 提供安全且专业化的人
机交互方案, 从而打破原生领域知识壁垒, 提高智能辅助水平。
近年来, 人工智能技术的快速发展孵化了 BERT [2] (Bidirectional Encoder Representations from Trans⁃
[3] (Generative Pre-trained Transformer)等一大批大规模预训练语言模型, 形成了预训练
formers)、 GPT
与任务精调结合的范式。 为进一步挖掘模型在不同自然语言场景中的应用能力, 通过增加模型参数量、
[4-8] , 并在多种自然语言场景下取得了很好
扩大语料库、 优化学习范式, 工业界和学界推出一系列 LLM
的效果。 随着 ChatGPT (Chat Generative Pre-trained Transformer)的出现, 以大语言模型为基础的人工智
能技术, 掀起新的研究浪潮, 该模型在众多自然语言任务中显示出其近乎通用人工智能(Artificial General
收稿日期: 2024-03-23; 网络首发日期: 2025-01-09
网络首发地址: https:∕∕link.cnki.net∕urlid∕11.1882.TV.20250108.1610.001
基金项目: 国家自然科学基金项目(52379131); 华能集团总部科技项目(HNKJ20-H21TB)
作者简介: 张天鸿(1998-), 博士生, 主要从事水利工程智能灌浆研究。 E-mail: zhangtianhong@tju.edu.cn
通信作者: 余红玲(1994-), 博士后, 主要从事大坝渗流性态分析研究。 E-mail: yhlcau@163.com
— 1 3 0 —