融合抽取式和抽象式的藏文摘要算法

高一鸣, 魏志恒, 多拉, 王文强, 左祥建, 贾星星

重庆邮电大学学报(自然科学版) ›› 2024, Vol. 36 ›› Issue (06) : 1215-1222.

融合抽取式和抽象式的藏文摘要算法

  • 高一鸣, 魏志恒, 多拉, 王文强, 左祥建, 贾星星
作者信息 +
History +

摘要

为了推动文本摘要技术在藏文领域的发展,采用两阶段微调的方法,构建了一种融合抽取式和抽象式的藏文摘要模型(BERT-ext-abs),保留了摘要的流畅性和语义一致性。训练抽取式藏文摘要模型BERT-ext,在此基础上进行第二次微调,得到抽象式藏文摘要模型BERT-ext-abs。从训练模型结构和数据规模两个角度分别设置对比实验,结果表明,相较于未经过二次微调的抽象式藏文摘要模型BERT-abs, BERT-ext-abs模型在ROUGE-1分数上提高了3.23%,在BERT Score分数上提高了0.95%。此外,与BERT-abs相比,BERT-ext-abs的模型参数量和训练数据量更少,能更高效地生成流畅且语义一致的摘要。

关键词

抽取式摘要 / 抽象式摘要 / 预训练模型 / 双向编码器表征法 / 藏文

中图分类号

TP391.1 / H214

引用本文

导出引用
高一鸣, 魏志恒, 多拉, 王文强, 左祥建, 贾星星. 融合抽取式和抽象式的藏文摘要算法. 重庆邮电大学学报(自然科学版). 2024, 36(06): 1215-1222

基金

国家自然科学基金项目(61902164); 藏文文本分类关键技术研究项目(2023-Z-004)

评论

Accesses

Citation

Detail

段落导航
相关文章

/