多特征融合的油气勘探领域命名实体识别与应用

袁满, 赵兴雨, 袁靖舒, 马茁然

吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (02) : 401-411. DOI: 10.19292/j.cnki.jdxxp.2025.02.022

多特征融合的油气勘探领域命名实体识别与应用

  • 袁满, 赵兴雨, 袁靖舒, 马茁然
作者信息 +
History +

摘要

针对现有命名实体识别方法在识别油气勘探文本中涉及多元素组合的实体以及嵌套实体时存在一定局限性的问题,提出了一种多特征融合的BERT-CNN-BiGRU-Attention-CRF(Bidirectional Encoder Representations from Transformers-Convolutional Neural Network-Bidirectional Gated Recurrent Unit-Attention-Conditional Random Field)命名实体识别方法。模型利用BERT的语义提取能力获取句子具有全局特征的字向量;并利用CNN局部特征捕获能力消除了BERT字向量的局限性得到词语字符级向量;通过自建油气勘探领域词典,使用双向最大长度匹配方法获取了词典特征向量。将这3种向量拼接作为BiGRU-Attention-CRF模型的输入。实验结果表明,在自主构建的小规模油气勘探领域数据集上,模型的F1值为91.10%,相较于其他主流的命名实体识别方法,该模型具有更好的识别性能,并为油气勘探领域知识图谱构建提供了有利帮助。

关键词

命名实体识别 / 油气勘探 / 知识图谱 / BERT预训练模型 / 卷积神经网络 / 词典特征

中图分类号

P618.13 / TP391.1

引用本文

导出引用
袁满, 赵兴雨, 袁靖舒, 马茁然. 多特征融合的油气勘探领域命名实体识别与应用. 吉林大学学报(信息科学版). 2025, 43(02): 401-411 https://doi.org/10.19292/j.cnki.jdxxp.2025.02.022

基金

海南省哲学社会科学规划课题基金资助项目(HNSK(QN)24-53)

评论

Accesses

Citation

Detail

段落导航
相关文章

/