结合全局信息增强的医学领域命名实体识别研究

要媛媛, 付潇, 杨东瑛, 王洁宁, 郑文

PDF(914 KB)
PDF(914 KB)
电子科技大学学报 ›› 2024, Vol. 53 ›› Issue (03) : 431-439.

结合全局信息增强的医学领域命名实体识别研究

  • 要媛媛, 付潇, 杨东瑛, 王洁宁, 郑文
作者信息 +
History +

摘要

中文医疗问诊文本中,由于口语化的不规则表达和专业术语的频繁出现,药物名称等实体难以被精准地识别出来。为了充分利用中文句子词间关系的重要作用,提出了一种用于增强全局信息的医学命名实体识别模型。模型利用注意力机制增强了词嵌入表征,并在使用双向长短时记忆网络的序列处理能力获取上下文信息的基础上,同时从两个方面丰富了句子的全局信息表示。其一是根据句法关系获取词语之间额外依赖关系构建了图卷积网络层用于丰富词间的依赖;其二是构建了辅助任务用于预测词间句法依赖关系的类别。在中文医疗问诊数据集上的实验结果表明,模型具有很好的竞争力,F1值达到94.54%。与其他模型相比,在药物和症状等实体类别的识别上取得了明显提高。在微博公开数据集上的实验也表明,模型具有通用领域的应用价值。

关键词

注意力机制 / 双向长短时记忆网络 / 图卷积网络 / 医疗问诊 / 命名实体识别

中图分类号

R-05 / TP391.1

引用本文

导出引用
要媛媛, 付潇, 杨东瑛, 王洁宁, 郑文. 结合全局信息增强的医学领域命名实体识别研究. 电子科技大学学报. 2024, 53(03): 431-439

基金

国家自然科学基金(11702289); 山西省关键核心技术和共性技术研发攻关专项(2020XXX013)

评论

PDF(914 KB)

Accesses

Citation

Detail

段落导航
相关文章

/