Page 119 - 2023年第54卷第9期
P. 119

表 2 AI单元和模块的准确性
                          子模块                     准确率                  AI单元                   准确率
                       防汛实体抽取器                     87%               实体抽取单元                    87%
                                                                  防汛实体间关系决策 1                  82%
                    防汛实体间关系决策器                     86%            防汛实体间关系决策 2                  79%
                                                                  防汛实体间关系决策 3                  77%


                  实体抽取错误主要表现为无效实体与文本中不存在实体,具体案例如表 3。从第 1条文本中抽取
              出的 “土粒” 实体,与从第 2条文本中抽取出的 “填筑” 实体,其在日常生活和各个领域中被广泛使
              用,这类实体属于通用实体,对于大坝防汛抢险任务缺乏针对性,本文注释时将该类实体视为无效实
              体。从第 1条文本中抽取的 “堤坝” 实体,虽属于该领域内特定实体,但并不存在于文本中,这是由
              于 LLM有时可能会根据语义生成与当前文本语义较相似,但实际不存在于文本中的实体,本文中注释
              时将该实体视为错误实体。关系推断不正确主要由于进行实体相关知识挖掘时,LLM生成的防汛实体
              相关知识可能存在噪声,因为此模块所返回的答案是利用 LLM从广泛的世界知识中挖掘并生成的,所
              涉及知识并无标准答案,而本文设计的群体智能策略可以缓解噪声带来的挑战,提高关系推理结果的
              可靠性。总体来看,AI单元表现出的高准确率,证实了融合群体智能策略的 AI链能够有效地连接 AI
              单元完成大坝防汛抢险知识推理任务。

                                                   表 3 实体抽取错误案例

                                   文本                                  抽取总实体                    错误实体
                      堤外坡土粒容易被水流冲刷导致浪坎形成                     堤外坡;堤坝;土粒;水流冲刷;浪坎                 土粒;堤坝
                 临河填筑黏性土封堵隔渗,同时背河填筑砂石反滤导渗                   临河;填筑;封堵隔渗;背河;反滤导渗                   填筑

              4.2 防汛知识推理有效性检验结果 FCRKI和 WRERJE的对比结果如表 4。FCRKI和 WRERJE分别
              从随机抽取的 310条初始工程文本中推理得到 335条和 274条防汛实体关系三元组。对于简单文本,
              FCRKI能够正确推理出 192条防汛实体关系三元组,高 于 WRERJE提 取 的 169条,对于 复杂文本,
              FCRKI正确推理出 143条防汛实体关系三元组,多于 WRERJE提取的 105条关系三元组。因为简单文
              本的语义复杂度较低,对方法推理能力要求不高。复杂文本的语义复杂度较高,涉及到很多从句和代
              词指称,使得 WREEJE提取关系较为困难,因为 WRERJE仅从输入文本中提取表意明确关系三元组,
              推理能力弱。而 FCRKI利用 LLM具备的世界知识和强大的生成能力来推理出防汛实体间关系,不受
              文本来源和语义复杂度的限制,因此,FCRKI可以更好的地处理复杂文本中的实体与实体间关系。
                                              表 4 FCRKI和 WRERJE的验证结果

                                                   FCRKI                               WRERJE
                     抽取数量             抽取关系总数             正确关系数量            推理关系总数            正确推理数量
                   310(初始文本)              409               335                356               274
                   156 (简单文本)             235               192                220               169
                   154(复杂文本)              174               143                136               105


              4.3 AI链和群体智能策略有效性检验结果 6种方法的结果如表 5所示。从表中得知 FCRKI 准确
                                                                                                    w?oAI
              预测 180条关系三元组,少于 FCRKI的 335条,这表明即便 LLM 学习到海量互联网知识,但没有明
              确的任务提示,也很难直接推理出二者关系。FCRKI                           准确预测 198条关系三元组,这表明在单个
                                                              AI - CoT
              文本块中进行全部步骤的描述,LLM 很难将各部分的输入输出紧密联系起来,这两种方法验证了 AI
              链思想和子模块以及功能单元设计对 FCRKI鲁棒性的影响。FCRKI                               准确预测 361个关系,虽高于
                                                                           w?OMV
              FCRKI的 335个,但其准确率远低于 FCRKI,验证了多数投票的有效性。而对于独立的防汛实体间关

                                                                                                   1
                                                                                              —   1 2 9 —
   114   115   116   117   118   119   120   121   122   123   124