Page 138 - 2025年第56卷第1期

P. 138

浆领域指令数据时产生无效响应［２６］，有关研究提出使用提示工程与思维链结合的方法来解决这一问
题［２４］。因此，在数据自动化生成阶段，为充分利用通用ＬＬＭ模型的文本生成能力，本文提出一个双
策略数据生成流程，具体分为提示工程构建、思维链策略数据生成与评分策略数据筛选三个步骤。
在构建提示工程时，秉承 “条理清晰，分层迭代，示例跟随” 的原则，构建提示文本，如图３所
示。完整的提示工程包含提示头、结构化要求、示例与输入。提示头提供提示工程所需的角色和任务
的上下文，保证ＬＬＭ的跟随能力；结构化要求部分表明任务的细节，以及提供思考顺序的思维链，保
证回答在思维链上的跟随性；示例部分是思维链的延拓，提供更为标准化的模板。在提示工程的最
后，为实际参与数据生成的输入文本。

图３提示工程结构

在思维链数据生成部分，本文选取Ｑｗｅｎ－１４Ｂ－Ｃｈａｔ模型作为数据抽取基座［２７］，该模型是由阿里
巴巴开源的一个强大的通用ＬＬＭ，具备良好的中文理解能力。此外，为处理幻觉现象与部分低质量回
答，引入了思维链策略，设计了一种基于思维链的自我检查机制，对生成数据的数量、格式和要求进
行检查。自我检查时，基于连续的链式思考，对不符合要求的数据进行重新生成，对满足要求的数据

以Ｊｓｏｎ字符串的形式进行输出，基于思维链策略的自我检查机制的示例如图４所示。
最后，通过引入ＬＬＭ评分策略，对Ｑｗｅｎ－１４Ｂ－Ｃｈａｔ所生成的中间语料进行再次筛选。筛选数据

的ＬＬＭ模型为Ｂａｉｃｈｕａｎ２－１３Ｂ－Ｃｈａｔ，打分细节可参考文献［２４］。
３．４反馈策略修正经过双策略数据自动化生成，灌浆指令数据在逻辑层次上能够提供良好跟随性。
然而，随着文本的增长，《水工建筑物水泥灌浆施工技术规范》中部分数值数据在指令数据生成阶段会

出现数值篡改或滞后的现象。因此，最后的数据还需要经过人工反馈校正与修复，从而提供可微调、
精确的灌浆指令数据集。

４灌浆领域微调与工程文档检索增强生成

４．１基于ＬｏＲＡ微调的灌浆知识注入ＬｏＲＡ方法通过假定模型在微调阶段存在低秩性，将待优化模

— １３３ —

133 134 135 136 137 138 139 140 141 142 143