Page 63 - 2023年第54卷第7期
P. 63
注:图中 E1,E2,E3,…,E24与 D1,D2,D3,…,D24分别为 24层编码与 24层解码。
图 1 WRERJE总体框架
3.1.2 动态提示序列生成 通常情况下,一个输入语句中不会同时包含全部的关系类型。静态的提示
序列包含 Schema中定义的所有关系类型,关系类型越多,实体关系联合抽取器接收到的噪声就越多。
这对确定输入语句中包含的水利工程抢险实体属于哪类关系造成了干扰,在面对较长且表达模糊的句子
时干扰更为严重。因此,通过动态提示去缩小提示范围,更具有指导意义。如图 1( Ⅱ )所示,动态提示序
列只包含当前输入语句中最可能存在的前 N个关系类型,前 N个关系类型通过动态提示生成器确定。
图 2 动态提示生成器
动态提示生成器的内核是基于 Bert的文本分类器 [32] ,因为 Bert中 CLS标记的隐藏向量可以更好的
表示句子特征,将该向量输入线性分类层,得到所有关系类别的概率 P,选取前 N个关系类型为当前输
入语句生成候选关系列表。基于 Bert实现的动态提示生成器如图 2。动态提示序列生成过程可表示为:
DG([x,x,…,x]) =[I,I,…,I] (1)
1 2 x 1 2 I
式中:DG为动态提示生成器(函数);X = [x,x,…,x]为当前输入语句;[I,I,…,I]为生成
1
x
2
I
2
1
的动态提示序列,其具体形式可表示为:
[[spot]entitytype1,[spot]entitytype2,…
[ I,I,…,I] = [ asso]relationtype1,[asso]relationtype2,… ( 2)
1 2 I
[text]x,x,…,x]
1
x
2
式中:entitytype为实体类型;relationtype为关系类型。
动态提示生成器旨在缩小指导范围并提供有可能的候选关系列表,而不做最终关系类型的确定。若
当前语句中包含的水利工程抢险实体之间不存在关系,抽取器并不会从不正确的候选关系类型中盲目选
择,并强制附加到实体。例如图 1(I)2语句,即使动态提示生成器为该语句生成了 “现象、连带、使用”
的候选关系列表,但该语句中包含的险情 “漏洞” 和部位 “附近堤坡” 之间并不存在实际关系,抽取
器不会为之强制附加关系。过多的候选关系依旧会造成干扰,过少的候选关系则很可能过滤掉正确的
关系类型,因此选取合适的 N是动态提示生成器的关键。
— 8 2 1 —