一种自适应核SMOTE- SVM算法用于不平衡数据分类

吴海燕, 陈晓磊, 范国轩

北京化工大学学报(自然科学版) ›› 2023, Vol. 50 ›› Issue (02) : 97-104. DOI: 10.13543/j.bhxbzr.2023.02.012

一种自适应核SMOTE- SVM算法用于不平衡数据分类

  • 吴海燕, 陈晓磊, 范国轩
作者信息 +
History +

摘要

面向不平衡样本集,提出一种自适应核人工合成过采样-支持向量机(synthetic minority oversampling technique-support vector machine, SMOTE-SVM)分类算法。首先通过支持向量机将数据集投影到核空间,找出类边界样本—支持向量(SV),然后基于核距离对少数类样本集的支持向量(SV+)计算其近邻,再根据近邻样本类别分布自适应地选择内插或外推两种方式合成新样本。由于核空间中映射函数无法具体得知,新样本无法用显式表示,因此将生成样本与原始样本一起形成增广Gram矩阵,最终利用SVM实现分类。该算法中样本生成、近邻计算以及SVM分类均统一在同一核空间中,提高了新样本的可信性;同时自适应插值方式改善了传统人工合成过采样技术(SMOTE)线性生成算法不适用于非线性分类的问题,提高了新样本的多样性。在多个数据集上的实验结果表明,所提算法可以改善不平衡数据的分类准确率,具有更好的稳健性。

关键词

不平衡数据分类 / 人工合成过采样技术(SMOTE) / 核空间 / 支持向量机

中图分类号

TP181

引用本文

导出引用
吴海燕, 陈晓磊, 范国轩. 一种自适应核SMOTE- SVM算法用于不平衡数据分类. 北京化工大学学报(自然科学版). 2023, 50(02): 97-104 https://doi.org/10.13543/j.bhxbzr.2023.02.012

评论

Accesses

Citation

Detail

段落导航
相关文章

/