基于多相似度模糊C均值聚类的不均衡流数据检索方法

韩云娜

吉林大学学报(信息科学版) ›› 2024, Vol. 42 ›› Issue (04) : 726-732. DOI: 10.19292/j.cnki.jdxxp.2024.04.013

基于多相似度模糊C均值聚类的不均衡流数据检索方法

  • 韩云娜
作者信息 +
History +

摘要

针对在不均衡流数据在检索过程中,由于数据流中存在不均衡性,且易受差异性数据、边缘数据的影响,导致数据检索性能下降的问题,提出了基于多相似度模糊C均值聚类的不均衡流数据检索方法。该方法计算出不均衡流数据之间的多相似度,针对不同相似度的数据,采用模糊C均值算法对其聚类处理。通过构建八叉树检索模型,对聚类后的数据进行存储、编码和判断,完成不均衡流数据的检索。实验结果表明,所提方法的检索时间低于20 s,查全率和查准率保持在80%以上,且NDCG(Normalized Discounted Cumulative Gain)数值高。

关键词

标准特征矩阵 / 交叉类簇 / 数据编码筛选 / 不均衡度量 / 三维坐标 / 判断编码

中图分类号

TP311.13

引用本文

导出引用
韩云娜. 基于多相似度模糊C均值聚类的不均衡流数据检索方法. 吉林大学学报(信息科学版). 2024, 42(04): 726-732 https://doi.org/10.19292/j.cnki.jdxxp.2024.04.013

基金

陕西省教育厅专项科研基金资助项目(20JK0950)

评论

Accesses

Citation

Detail

段落导航
相关文章

/