Page 139 - 2025年第56卷第1期

P. 139

图４基于思维链策略的自我检查机制

型与基座模型进行分离，并将待优化模型的参数矩阵经低秩分解后，再注入到基座模型的Ｔｒａｎｓｆｏｒｍｅｒ
结构中，使得可训练参数大幅下降，从而降低计算复杂度和内存需求。因此，ＬｏＲＡ能够在有限的计
算资源下实现ＬＬＭ的高效微调。具体而言，对于一个待微调的ＬＬＭ，其权重矩阵Ｗ ∈! ｄ × ｋ，参数优
０
化更新可表示如下：
Ｗｕｐｄａｔｅ＝Ｗ＋ Δ Ｗ（１）
０
Δ Ｗ＝ＢＡ（２）
式中：Ｗ为优化合并后的参数；Δ Ｗ为待优化模型的参数矩阵；Ｂ ∈! ｄ × ｒ和Ａ ∈! ｒ × ｋ分别为经过低秩
ｕｐｄａｔｅ
分解的参数矩阵，矩阵Ｂ和矩阵Ａ的秩ｒ ｍｉｎ（ｄ，ｋ）。在训练过程中，Ｗ被冻结，不发生参数更新，
０
而矩阵Ｂ和矩阵Ａ作为独立模型，包含所有的可更新的参数。此外，由于Ｗ和 Δ Ｗ相互分离，因此
０
其输入是一致的，对于输入ｘ，模型前向过程如下：
ｈ＝Ｗｘ＋ Δ Ｗｘ＝Ｗｘ＋ＢＡｘ（３）
００
在训练初始阶段，矩阵Ａ由随机高斯矩阵进行初始化，而矩阵Ｂ则初始化为零矩阵。更新过程中
通过引入常数 α （ＬｏＲＡＡｌｐｈａ）对 Δ Ｗｘ的计算值进行缩放，缩放表示如下：
α α
ｈ＝Ｗｘ＋ Δ Ｗｘ＝Ｗｘ＋ＢＡｘ（４）
００
ｒｒ
在使用Ａｄａｍ系列优化器时，需适当缩放初始化，调整 α的过程与调整学习率大致相同。一般情
况下 α值应大于ｒ（ＬｏＲＡＲａｎｋ）值，有助于在改变ｒ时减少重新调整超参数的需求。在使用阶段，可以
直接对模型层进行合并，获得完整的灌浆领域ＬＬＭ，完整流程如图５所示。
４．２基于ＬａｎｇＣｈａｉｎ的灌浆工程检索增强生成检索增强生成是ＬＬＭ应用于各垂直领域的落地解决
方案。通过构建本地知识库，可以提供更新式知识、降低模型幻觉，形成可隔离、安全的数据访问方
案。ＬａｎｇＣｈａｉｎ是一个用于建设ＬＬＭ驱动的应用程序的开源框架，依靠ＬＬＭ模型的强大能力，
ＬａｎｇＣｈａｉｎ可以根据上下文进行回答或实现知识检索，并完成推理，实现检索增强生成。本文以ＬｏＲＡ
微调后的灌浆领域ＬＬＭ模型作为ＬａｎｇＣｈａｉｎ的基座模型，同时耦合具有工程相关性的本地知识库，以
此搭建灌浆工程检索增强生成应用，从而形成知识服务内核。

— １３ —
４

134 135 136 137 138 139 140 141 142 143 144