融入事件知识的新闻事件对比聚类方法

梁晨, 余正涛, 高盛祥, 朱恩昌

PDF(2071 KB)
PDF(2071 KB)
山西大学学报(自然科学版) ›› 2024, Vol. 47 ›› Issue (04) : 727-736. DOI: 10.13451/j.sxu.ns.2023065

融入事件知识的新闻事件对比聚类方法

  • 梁晨, 余正涛, 高盛祥, 朱恩昌
作者信息 +
History +

摘要

新闻事件聚类旨在从海量新闻文本中挖掘若干个不同主题的事件簇。目前事件聚类大多基于文本语义表征,忽略了事件知识的指导作用,且由于表征学习和目标聚类的迭代进行,不仅容易造成误差累积,还只能处理离线任务,限制了对实时新闻数据的处理。针对上述问题,该文提出一种融入事件知识的新闻事件对比聚类方法,该方法在文本表征的基础上,融入事件关键信息丰富事件表征;将聚类标签作为表示,同时在实例级和簇群级进行对比学习;以端到端的方式联合学习表示和簇群分配,实现对数据流的聚类。实验结果表明,该方法相较于其他基线模型,提高了3%。

关键词

事件聚类 / 事件表征 / 对比学习 / 深度聚类

中图分类号

TP391.1

引用本文

导出引用
梁晨, 余正涛, 高盛祥, 朱恩昌. 融入事件知识的新闻事件对比聚类方法. 山西大学学报(自然科学版). 2024, 47(04): 727-736 https://doi.org/10.13451/j.sxu.ns.2023065

基金

国家自然科学基金(61972186;61732005;U21B2027); 云南高新技术产业发展项目(201606); 云南省重大科技专项计划(202103AA080015;202002AD080001-5); 云南省基础研究计划(202001AS070014); 云南省学术和技术带头人后备人才(202105AC160018)

评论

PDF(2071 KB)

Accesses

Citation

Detail

段落导航
相关文章

/