基于变分自编码器与流形特征的聚类算法

陈俊芬, 韩金池, 谢博鋆, 谢政豪

PDF(4493 KB)
PDF(4493 KB)
山西大学学报(自然科学版) ›› 2024, Vol. 47 ›› Issue (01) : 69-80. DOI: 10.13451/j.sxu.ns.2023139

基于变分自编码器与流形特征的聚类算法

  • 陈俊芬, 韩金池, 谢博鋆, 谢政豪
作者信息 +
History +

摘要

深度神经网络因具有优良的非线性映射能力和在不同场景下的灵活性而成为一种很有前景的聚类方法。为了得到易于聚类的特征,许多深度聚类方法从原始数据中提取特征是通过将原始数据映射到一个更低维的空间方式,而聚类指派依然假设是在欧式空间进行。为了探究特征提取和流形空间对聚类性能的影响,本文提出了一种基于变分自编码器与流形特征的聚类算法—MFVC(Clustering Algorithm Based on Variational Autoencoder and Manifold Features)。该方法通过具有残差连接层及无参数注意力机制SimAM(A Simple, Parameter-Free Attention Module for Convolutional Neural Networks)组成的β-VAE(Learning Basic Visual Concepts with a Constrained Variational Framework)做特征提取器提取图像特征,采用流形UMAP(Uniform Manifold Approximation and Projection for Dimension Reduction)方法提高特征的可分离性,然后用K-Means方法进行聚类学习。在6个基准数据集的实验结果表示该方法能够提供较好的性能,MFVC在MNIST(Mixed NationalInstitute of Standards and Technology database)数据集上能够达到0.981的精度,在Fashion-MNIST数据集上能够达到0.681的精度。

关键词

变分自编码器 / 残差连接 / UMAP / K-Means / 流形学习

中图分类号

TP311.13 / TP18

引用本文

导出引用
陈俊芬, 韩金池, 谢博鋆, 谢政豪. 基于变分自编码器与流形特征的聚类算法. 山西大学学报(自然科学版). 2024, 47(01): 69-80 https://doi.org/10.13451/j.sxu.ns.2023139

基金

河北省引进留学人员资助项目(C20200302); 河北省教育教学改革研究与实践项目(2020GJJG007)

评论

PDF(4493 KB)

Accesses

Citation

Detail

段落导航
相关文章

/