Page 138 - 2025年第56卷第1期
P. 138

浆领域指令数据时产生无效响应               [26] , 有关研究提出使用提示工程与思维链结合的方法来解决这一问
              题 [24]  。 因此, 在数据自动化生成阶段, 为充分利用通用 LLM 模型的文本生成能力, 本文提出一个双
              策略数据生成流程, 具体分为提示工程构建、 思维链策略数据生成与评分策略数据筛选三个步骤。
                  在构建提示工程时, 秉承 “条理清晰, 分层迭代, 示例跟随” 的原则, 构建提示文本, 如图 3 所
              示。 完整的提示工程包含提示头、 结构化要求、 示例与输入。 提示头提供提示工程所需的角色和任务
              的上下文, 保证 LLM 的跟随能力; 结构化要求部分表明任务的细节, 以及提供思考顺序的思维链, 保
              证回答在思维链上的跟随性; 示例部分是思维链的延拓, 提供更为标准化的模板。 在提示工程的最
              后, 为实际参与数据生成的输入文本。





































                                                      图 3  提示工程结构

                  在思维链数据生成部分, 本文选取 Qwen-14B-Chat 模型作为数据抽取基座                            [27] , 该模型是由阿里
              巴巴开源的一个强大的通用 LLM, 具备良好的中文理解能力。 此外, 为处理幻觉现象与部分低质量回
              答, 引入了思维链策略, 设计了一种基于思维链的自我检查机制, 对生成数据的数量、 格式和要求进
              行检查。 自我检查时, 基于连续的链式思考, 对不符合要求的数据进行重新生成, 对满足要求的数据

              以 Json 字符串的形式进行输出, 基于思维链策略的自我检查机制的示例如图 4 所示。
                  最后, 通过引入 LLM 评分策略, 对 Qwen-14B-Chat 所生成的中间语料进行再次筛选。 筛选数据

              的 LLM 模型为 Baichuan 2-13B-Chat, 打分细节可参考文献[24]。
              3.4  反馈策略修正  经过双策略数据自动化生成, 灌浆指令数据在逻辑层次上能够提供良好跟随性。
              然而, 随着文本的增长, 《水工建筑物水泥灌浆施工技术规范》中部分数值数据在指令数据生成阶段会

              出现数值篡改或滞后的现象。 因此, 最后的数据还需要经过人工反馈校正与修复, 从而提供可微调、
              精确的灌浆指令数据集。

              4  灌浆领域微调与工程文档检索增强生成


              4.1  基于 LoRA 微调的灌浆知识注入  LoRA 方法通过假定模型在微调阶段存在低秩性, 将待优化模

                                                                                               —   1 3 3  —
   133   134   135   136   137   138   139   140   141   142   143