基于簇中心预选策略的三支决策密度峰值聚类算法

罗舒文, 万仁霞, 苗夺谦

PDF(2666 KB)
PDF(2666 KB)
山西大学学报(自然科学版) ›› 2024, Vol. 47 ›› Issue (01) : 30-39. DOI: 10.13451/j.sxu.ns.2023140

基于簇中心预选策略的三支决策密度峰值聚类算法

  • 罗舒文, 万仁霞, 苗夺谦
作者信息 +
History +

摘要

本文针对密度峰值聚类算法(CFSFDP)无法自动选取簇中心的不确定性问题,通过引入三支决策理论对其进行优化,提出了一种基于簇中心预选策略的三支决策密度峰值聚类算法(TDPC)。首先利用密度和距离两参数的统计特性将数据对象划分核心域、边界域与琐碎域,符合条件的聚类中心被置于核心域,难以判定的疑似聚类中心点则被置于边界域,然后通过定义的k-可达域和判别准则对疑似聚类中心进行分析,选取出实际聚类中心。所提出算法有效解决了密度峰值聚类算法聚类中心自动确定问题。在2个人工数据集和4个UCI(University of California, lrvine)公共数据集上对TDPC进行测试。与CFSFDP算法和DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法进行聚类性能比较,所提出算法TDPC在轮廓系数、DB(Davies-Bouldin)指数、调整互信息、调整兰德系数、FM(Fowlkes-Mallows)指数、同质性、完整性等聚类评价指标方面均达到最优或与最优算法结果相近,表明TDPC综合聚类性能优于比较算法,具有良好的聚类可行性与有效性。

关键词

聚类算法 / 聚类中心 / 边界域 / 三支聚类 / 密度聚类 / k-可达域

中图分类号

TP311.13

引用本文

导出引用
罗舒文, 万仁霞, 苗夺谦. 基于簇中心预选策略的三支决策密度峰值聚类算法. 山西大学学报(自然科学版). 2024, 47(01): 30-39 https://doi.org/10.13451/j.sxu.ns.2023140

基金

国家自然科学基金(61662001); 中央高校基本科研业务费专项资金(FWNX04); 宁夏自然科学基金(2021AAC03203)

评论

PDF(2666 KB)

Accesses

Citation

Detail

段落导航
相关文章

/