基于改进PSO-Means算法的大数据聚类处理方法

蒋大锐, 徐胜超

吉林大学学报(信息科学版) ›› 2024, Vol. 42 ›› Issue (03) : 430-437. DOI: 10.19292/j.cnki.jdxxp.20231128.002

基于改进PSO-Means算法的大数据聚类处理方法

  • 蒋大锐, 徐胜超
作者信息 +
History +

摘要

针对大数据聚类处理存在不同类型数据聚类效果差、聚类耗时长的问题,提出了基于改进PSO-Means(Particle Swarm Optimization Means)算法的大数据聚类处理方法。该方法采用粒子群算法确定一次聚类过程中单位粒子的飞行时间和飞行方向,预先设定初始聚类中心的选择范围,并适当调整单位粒子的惯性权重,以消除粒子振荡造成的聚类缺陷,成功获取基于大规模数据的聚类中心。结合生成树算法,通过从样本偏差和质心偏度两个方面对PSO算法进行优化,并将优化后的聚类中心输入到k-means聚类算法中,实现大数据聚类处理。实验结果表明,改进的PSO-Means方法可以有效地聚类不同类型的数据,并且聚类耗时仅为0.3 s,验证了该方法具备较好的聚类性能和聚类效率。

关键词

大规模数据 / 粒子群算法 / 寻优 / k-means聚类算法 / 数据聚类

中图分类号

TP311.13 / TP18

引用本文

导出引用
蒋大锐, 徐胜超. 基于改进PSO-Means算法的大数据聚类处理方法. 吉林大学学报(信息科学版). 2024, 42(03): 430-437 https://doi.org/10.19292/j.cnki.jdxxp.20231128.002

基金

国家自然科学基金资助项目(61772221); 广州华商学院校内导师制科研基金资助项目(2023HSDS08); 广州华商学院2023年创新创业教育专项研究课题基金资助项目(HS2023CXCY04)

评论

Accesses

Citation

Detail

段落导航
相关文章

/