结合皮尔逊重构的文本到图像生成模型

莫建文, 徐凯亮

桂林电子科技大学学报 ›› 2020, Vol. 40 ›› Issue (01) : 54-61. DOI: 10.16725/j.cnki.cn45-1351/tn.2020.01.011

结合皮尔逊重构的文本到图像生成模型

  • 莫建文, 徐凯亮
作者信息 +
History +

摘要

针对堆叠式生成对抗网络中生成样本细节表述质量不高,多样性不足的问题,提出一种结合最大化皮尔逊相关系数的文本到图像生成模型。该模型通过改进判别器,使其能进行编码和判别,利用判别器对生成样本进行特征提取,计算输入向量与特征向量之间的皮尔逊相关系数,并将其作为重构项加入损失中进行最大化优化。另外,为增强不同尺度生成样本间的编码一致性,提出了多尺度联合损失。在CUB数据集上的实验验证了该方法能有效提高生成样本的多样性和图像质量。

关键词

图像生成 / 堆叠式网络 / 编码器 / 皮尔逊相关系数

中图分类号

TP391.41

引用本文

导出引用
莫建文, 徐凯亮. 结合皮尔逊重构的文本到图像生成模型. 桂林电子科技大学学报. 2020, 40(01): 54-61 https://doi.org/10.16725/j.cnki.cn45-1351/tn.2020.01.011

基金

国家自然科学基金(61661017); 广西自然科学基金(2016GXNSFAA380149)

评论

Accesses

Citation

Detail

段落导航
相关文章

/