Page 68 - 2023年第54卷第7期
P. 68
预训练语言模型进行微调比仅针对单一任务进行微调更有效。联合抽取和动态提示使得 WRERJE可以
取得较之其他基准模型更优的表现。
表 5 基准模型性能对比实验结果
实体 关系
模型
P R F1 P R F1
WRERJE 79.41 77.46 78.42 77.00 79.47 78.22
80.15 77.29 78.69 73.54 69.27 71.34
WRERJE single
78.52 76.83 77.67 70.94 72.19 71.56
WRERJE w?oDP
76.93 75.38 76.15 71.24 70.36 70.8
WRERJE base
以某省 20个水库防洪预案文本为抽取对象,将 WRERJE最终生成的 SEL序列转化为三元组,各
关系类型部分三元组实例如表 6。
表 6 部分三元组实例展示
关系类型 抽取实例
〈坝下涵管,现象,断裂〉 〈背水坡,现象,漏水〉 〈坝面,现象,裂缝〉 〈堤岸,现象,崩塌〉 …… 〈堤内坡下部,现
现象
象,漏洞〉 〈堤内坡,现象,散浸〉 〈涵闸,现象,渗水〉 〈堤坝,现象,溃决〉 〈浸水区,现象,塌陷〉
〈浑水,连带,水位持续上涨〉 〈湿润变软,连带,浸润水流〉 〈渗水,连带,滑动〉 …… 〈跌窝,连带,管涌〉 〈非
连带
正常渗漏,连带,流土〉 〈管涌,连带,堤防溃口〉 〈裂缝,连带,涵管漏水〉 〈软弱层开裂,连带,纵向裂缝〉
〈漫溢,采取,抢筑子埝〉 〈坝面裂缝,采取,沥青麻丝嵌缝〉 〈跌窝,采取,填满〉 …… 〈涵闸洞身渗漏,采取,临
采取
河围堰〉 〈超标准洪水,采取,加高抢护〉 〈建筑物塌陷,采取,挡水围堰〉 〈塌坡,采取,打桩〉
〈谷坊,功能相似,拦挡坝〉 〈石灰石,功能相似,花岗岩〉 〈土石戗台,功能相似,石撑〉 …… 〈单向进占,功能相
功能相似
似,双向进占〉 〈块石,功能相似,混凝土块〉 〈填塘固基,功能相似,加戗台〉 〈铁丝,功能相似,麻绳〉
〈削坡减载,功能协作,固脚阻滑〉 〈地基加固,功能协作,沥青麻丝嵌缝〉 〈截挡,功能协作,护坡〉 …… 〈堵塞漏
功能协作
洞,功能协作,截断漏水来源〉 〈棉被,功能协作,土袋〉 〈消除渗水,功能协作,还坡加固〉
〈前堵,使用,篷布〉 〈反滤导渗,使用,砂石〉 〈护脚,使用,石笼〉 〈堤顶,使用,麻袋〉 …… 〈隔渗,使用,土工
使用
膜〉 〈止水闭气,使用,散土〉 〈堵塞漏洞,使用,针刺无纺布〉 〈护坡防浪,使用,土工织物布〉
6 结论
本文将异构的水利工程抢险实体抽取和关系抽取任务制定为序列到序列的生成任务,使用水利工
程抢险领域数据微调预训练语言模型 T5来进行领域内实体和关系的联合抽取;提出动态提示方法,
设计了动态提示生成器。基于此提出了使用动态提示引导 T5以进行目标领域内实体和关系联合抽取
的 WRERJE框架,用来 从水利 工程 抢险 领域的非 结构化文 本描 述中 同 时 抽 取 实 体 和 关 系。通 过 将
WRERJE与三个基准模型进行实验对比。结果表明,WRERJE通过微调之后在水利工程抢险实体和关
系联合抽取任务上具有较高的抽取精度,验证了 “联合抽取” 和 “动态提示” 的有效性。
本文以从无结构水利工程文本中同时提取出抢险实体和关系,并将其组织成三元组结构化形式,
以支撑应急预案智能生成任务为出发点。目前工作基本实现了实体和关系的智能抽取,但还存在两点
主要问题需进一步研究与改进。一是实验数据中水利工程类型覆盖不充分;二是数据模态单一。主要
以堤防和大坝为主要实验对象(考虑其在防洪抢险任务中的基础性与重要性),在使用描述堤防和大坝
等工程抢险措施的文本激活 T5对领域知识的认知后,其可以在一定程度上处理其他工程类型中具有
相似描述的文本。下一步工作将通过实验测试 WRERJE在其他工程类型的文本中抽取目标实体和关系
的准确率;同时丰富数据形态,利用 “图生文” 技术将水利工程抢险领域的视频、图像等转化为自然
语言描述,结合图像理解技术开展多模态的抢险知识抽取研究。未来可将其应用到任何需要进行水利
工程抢险实体关系抽取的工作中,构造以水利工程抢险为主题的多模态的知识库与知识引擎,推进水
利工程险情抢护的高效化与智能化。
— 8 2 —
6