Page 138 - 2025年第56卷第1期
P. 138
浆领域指令数据时产生无效响应 [26] , 有关研究提出使用提示工程与思维链结合的方法来解决这一问
题 [24] 。 因此, 在数据自动化生成阶段, 为充分利用通用 LLM 模型的文本生成能力, 本文提出一个双
策略数据生成流程, 具体分为提示工程构建、 思维链策略数据生成与评分策略数据筛选三个步骤。
在构建提示工程时, 秉承 “条理清晰, 分层迭代, 示例跟随” 的原则, 构建提示文本, 如图 3 所
示。 完整的提示工程包含提示头、 结构化要求、 示例与输入。 提示头提供提示工程所需的角色和任务
的上下文, 保证 LLM 的跟随能力; 结构化要求部分表明任务的细节, 以及提供思考顺序的思维链, 保
证回答在思维链上的跟随性; 示例部分是思维链的延拓, 提供更为标准化的模板。 在提示工程的最
后, 为实际参与数据生成的输入文本。
图 3 提示工程结构
在思维链数据生成部分, 本文选取 Qwen-14B-Chat 模型作为数据抽取基座 [27] , 该模型是由阿里
巴巴开源的一个强大的通用 LLM, 具备良好的中文理解能力。 此外, 为处理幻觉现象与部分低质量回
答, 引入了思维链策略, 设计了一种基于思维链的自我检查机制, 对生成数据的数量、 格式和要求进
行检查。 自我检查时, 基于连续的链式思考, 对不符合要求的数据进行重新生成, 对满足要求的数据
以 Json 字符串的形式进行输出, 基于思维链策略的自我检查机制的示例如图 4 所示。
最后, 通过引入 LLM 评分策略, 对 Qwen-14B-Chat 所生成的中间语料进行再次筛选。 筛选数据
的 LLM 模型为 Baichuan 2-13B-Chat, 打分细节可参考文献[24]。
3.4 反馈策略修正 经过双策略数据自动化生成, 灌浆指令数据在逻辑层次上能够提供良好跟随性。
然而, 随着文本的增长, 《水工建筑物水泥灌浆施工技术规范》中部分数值数据在指令数据生成阶段会
出现数值篡改或滞后的现象。 因此, 最后的数据还需要经过人工反馈校正与修复, 从而提供可微调、
精确的灌浆指令数据集。
4 灌浆领域微调与工程文档检索增强生成
4.1 基于 LoRA 微调的灌浆知识注入 LoRA 方法通过假定模型在微调阶段存在低秩性, 将待优化模
— 1 3 3 —