Page 145 - 2025年第56卷第1期
P. 145

图 12  灌浆知识服务系统整体展示


              6  结论及展望


                  针对目前灌浆工程各阶段的专业信息获取依赖于手工处理多领域文本, 存在人力成本高、 生产效
              率低等问题, 提出一套基于大语言模型的灌浆工程知识服务系统, 取得了如下成果:
                  (1)针对灌浆领域可利用文本数量少、 质量低, 手动构建数据代价高的问题, 提出了一套基于混
              合策略的灌浆指令数据集构建方法。 该方法通过引入基于思维链的自我检查机制和评分策略, 改进了
              数据生成流程, 提供了构建灌浆领域模型所需的高质量微调数据。
                  (2)针对通用 LLM 领域知识不足, 且特定工程文本存在时效性与信息安全的问题, 首先, 利用
              LoRA 技术对通用模型基座进行领域有监督微调, 构建了灌浆领域模型; 其次, 运用 LangChain 技术构
              建了灌浆工程检索增强生成框架, 实现了特定灌浆工程文本与模型的隔离, 在保障信息安全的同时实

              现了知识的阶段性更新。
                  (3)应用 LoRA 微调技术在 3 个百亿参数内的中文大模型基座上进行了广泛的超参数实验, 成功构
              建了灌浆领域模型 Qwen-7B-Grout。 该模型在专门设计的灌浆专业知识测试集以及通用 C-Eval 基准
              上的测试结果显示, 在性能下降有限的情况下, 模型能够准确回答灌浆工程专业知识, 表明了所提出

              的微调策略既能有效捕获领域专业知识又能兼顾 LLM 的通用性。
                  (4)利用 LangChain-Chatchat 框架成功地将微调后的模型部署于 Web 环境, 构建了一个灌浆工程
              知识服务系统。 该系统不仅高效支撑了通用灌浆知识的问答交互功能, 还出色地完成了特定工程灌浆

              知识库的构建、 切换、 查询及更新操作, 并实现了知识文档的上传及向量化处理, 强化了检索效能,
              提升了灌浆文本信息提取分析效率与智能化水平, 为灌浆设计与施工管理提供了新的智能辅助手段。
                  本研究建立了基于大语言模型的灌浆工程知识服务系统, 可为水利工程其他领域知识服务系统构
              建提供新思路。 在后续研究中, 可进一步扩展模型参数量, 增加模型数据集规模, 并引入强化学习方
              法以进一步提升模型性能。 此外, 还可进一步研究多模态技术在垂直工程领域 LLM 的接入方法, 扩展
              LLM 的能力, 提高水利工程整体的智能化水平。

                —  1 4 0  —
   140   141   142   143   144   145   146   147   148   149   150