Page 62 - 2023年第54卷第7期
P. 62

都是长度适中,且与水利工程抢险知识相关的描述。
              2.2 数据模式定义 垂直领域数据模式(Schema)的定义需要依赖领域专业知识                                 [30] 。水利工程抢险任
              务涉及到的实体类型定义为 “部位、险情、方法、物料”,观察目标语句中的语义描述,定义出这些
              实体类型之间潜在的 6种关系类型。
                  “现象” 关系类型,即某一工程部位出现了某种险情,则将部位类型与险情类型之间定义为 “现
              象” 关系。
                  “连带” 关系类型,即某一工程险情的出现可能会导致另一种工程险情的发生,则将此类险情之
              间定义为连带关系。
                  “采取” 关系类型,即出现某一工程险情时需采取某种方法来进行抢护,则将险情类型与方法类
              型之间定义为采取的关系。
                  “功能相似” 关系类型,即两种方法的功能是相似的,当实施第一种方法比较困难时,可用另一
              种方法替代去实现相同的功能,则将此类方法之间定义为功能相似的关系。
                  “功能协作” 关系类型,即需要同时实施两种方法协作去完成一个任务,则将这类实体之间定义
              为功能协作关系。
                  “使用” 关系类型,即在险情抢护过程中实施某种方法时需要使用某种物料,则将方法类型与物
              料类型之间定义为使用关系。
                  以上关系类型的语句实例如表 1所示。

                                                    表 1 各关系类型实例

                   语义关系                                           语句描述
                     现象                                       当坝面出现裂缝后。
                     连带                           在水库溃坝时,可能引起水库沿岸山体出现崩塌现象。
                     采取                       当上游洪水超过校核水位仍继续上涨,应立即在坝顶上抢筑子埝。
                   功能相似                              当做土石戗台有困难时,做石撑临时稳定滑坡。
                   功能协作                                背水面导渗还坡,临水面采取帮戗措施。
                     使用                                  外部防渗使用透水性小的黏性土料。



              3 WRERJE框架原理及主干模型训练


                  根据信息抽取任务端到端结构生成思想,将异构的水利工程抢险实体抽取和关系抽取任务统一建
              模为序列到序列生成任务            [31] ,并提出了一种使用动态提示的水利工程抢险实体和关系联合抽取框架———
              WRERJE。该框架使用 “编码- 解码(E - D)” 思路进行工作,包含两部分核心组件组成,分别是动态
              提示生成器和实体关系联合抽取器,如图 1所示。动态提示生成器结合预先定义的 schema为当前输入
              语句生成动态提示序列,动态提示序列引导实体关系联合抽取器从当前输入语句中同时抽取出水利工
              程抢险实体和关系。
              3.1 动态提示生成器
              3.1.1 动态提示序列组成 动态提示序列由实体类型和关系类型结合当前输入语句共同构成,实体类
              型、关系类型与输入语句的标识分别定义为[ spot]、[asso]与[text],三类组成部分分别由相应标识进
              行标注。例如,“[ spot]部位[spot]险情[spot]方法[asso]现象[asso]采取[text]坝顶若有漫溢危险时,
              应及时抢筑子埝”,其中由[ spot]标注的 “部位、险情、方法” 指实体类型,[asso]标注的 “现象、
              采取” 指发生部位与险情之间的现象关系,以及险情与所用方法之间的采取关系。一个输入语句中有
              可能包含多种关系,动态提示序列能够指导抽取器同时抽取句子中存在的多个关系三元组。注意,例
              子中只展示了 Schema中定义的部分实体类型与关系类型。在实验部分第一个基准模型 WRERJE                                           的
                                                                                                      w?oDP
              实际输入中,提示序列应包含 2.2节定义的 Schema中全部关系类型。

                —  8 2  —
                     0
   57   58   59   60   61   62   63   64   65   66   67