基于改进ID3算法的非结构化大数据分类优化方法

唐锴令, 郑皓

吉林大学学报(信息科学版) ›› 2024, Vol. 42 ›› Issue (05) : 894-900. DOI: 10.19292/j.cnki.jdxxp.2024.05.009

基于改进ID3算法的非结构化大数据分类优化方法

  • 唐锴令, 郑皓
作者信息 +
History +

摘要

针对非结构化大数据在分类过程中,由于其数据中存在大量的冗余数据,若不能及时清洗大数据中的冗余数据,会降低数据分类精度的问题,提出一种基于改进ID3(Iterative Dichotomiser 3)算法的非结构化大数据分类优化方法。该方法针对非结构化大数据集合中冗余数据多以及维度繁杂的问题,对数据进行清洗处理,并结合有监督辨识矩阵完成数据降维;根据数据降维结果,采用改进ID3算法建立用于数据分类的决策树分类模型,通过该模型对非结构化大数据进行分类处理,从而实现数据的精准分类。实验结果表明,使用该方法对非结构化大数据分类时,分类效果好,精度高。

关键词

改进ID3算法 / 数据清洗 / 数据降维 / 非结构化大数据 / 数据分类方法

中图分类号

TP311.13

引用本文

导出引用
唐锴令, 郑皓. 基于改进ID3算法的非结构化大数据分类优化方法. 吉林大学学报(信息科学版). 2024, 42(05): 894-900 https://doi.org/10.19292/j.cnki.jdxxp.2024.05.009

基金

湖南省自然科学基金资助项目(2022JK60058)

评论

Accesses

Citation

Detail

段落导航
相关文章

/