低资源场景下基于联合训练与自训练的跨语言摘要方法

程绍欢, 唐煜佳, 刘峤, 陈文宇

PDF(1377 KB)
PDF(1377 KB)
电子科技大学学报 ›› 2024, Vol. 53 ›› Issue (05) : 762-770.

低资源场景下基于联合训练与自训练的跨语言摘要方法

  • 程绍欢, 唐煜佳, 刘峤, 陈文宇
作者信息 +
History +

摘要

随着全球化的不断发展,跨语言摘要任务已成为自然语言处理领域的一项重要课题。在低资源场景下,现有方法存在表征转换受限和数据利用不充分等问题。为此,该文提出了一种基于联合训练与自训练的跨语言摘要方法。该方法使用两个模型分别建模翻译任务和跨语言摘要任务,以统一输出端的语言向量空间,从而避免模型间表征转换受限的问题。此外,通过对齐平行训练对的输出特征和概率进行联合训练,增强模型间的语义共享。同时,在联合训练的基础上引入自训练技术,利用额外的单语摘要数据生成合成数据,有效缓解了低资源场景下数据稀缺的问题。实验结果表明,该方法在多个低资源场景下均优于现有对比方法,实现了ROUGE分数的显著提升。

关键词

跨语言摘要 / 联合训练 / 低资源场景 / 机器翻译 / 自训练

中图分类号

TP391.1

引用本文

导出引用
程绍欢, 唐煜佳, 刘峤, 陈文宇. 低资源场景下基于联合训练与自训练的跨语言摘要方法. 电子科技大学学报. 2024, 53(05): 762-770

基金

国家自然科学基金企业联合基金重点项目(U22B2061)

评论

PDF(1377 KB)

Accesses

Citation

Detail

段落导航
相关文章

/