Page 69 - 水利学报2025年第56卷第3期
P. 69
图 8 水利知识关联检索
图 9 共现险情推理结果
6 结论
针对防汛抢险领域数据偏少、数据质量偏低问题,提出了有效结合非结构化数据与半结构化数据
的领域知识图谱构建方法。综合利用大语言模型、文本知识抽取等手段,搭建了防汛抢险本体模型,
改进了针对领域小样本数据的实体知识抽取模型,构建了 FDR - KG,通过 3个典型案例展现了其应用
价值,主要结论如下:
( 1)结合 LLM的本体建模方法可有效利用其理解能力,快速获取领域专业知识,辅助研究人员
高效找出非结构化文 本 知识边 界、概括知识 主题、构建 领域 本 体,适 用 以 文 本 为 知 识 载 体 的 本 体
建模。
( 2)所提 BERT_BiLSTM_CNN模型性能优异,在实体类型较多的防汛抢险知识抽取任务获得了最
佳表现,与基线模型相比 F1值提升了 10.89%。实体数据增强后,模型 F1值进一步提升了 4.73%,适
用于领域小样本数据的实体抽取任务。
( 3)外源知识补全可充分利用领域半结构化数据与百科数据,扩展知识覆盖面,提升图谱质量。
构建的 FDR - KG可准确高效地提供抢险措施查询、水利知识关联引导、险情知识推理等知识支持,以
辅助抢险决策,提升抢险效率,为数字孪生水利知识平台建设提供参考。
(4)未来需收集更多水利领域文本数据,研究图谱融合技术,寻找更智能的实体关系抽取方法,
进一步扩大知识图谱覆盖范围。同时挖掘 LLM 在水利行业的 应用 潜 力,结 合 知识 图 谱 提升其回答
准确度,以更低代价更充分地挖掘水利行业知识,为数字孪生水利建设与行业高质量发展提供技术
支撑。
— 3 5 1 —