基于模糊隶属度函数的SVM样本约简算法

张代俐, 汪廷华, 朱兴淋

PDF(4388 KB)
PDF(4388 KB)
山西大学学报(自然科学版) ›› 2024, Vol. 47 ›› Issue (01) : 18-29. DOI: 10.13451/j.sxu.ns.2023138

基于模糊隶属度函数的SVM样本约简算法

  • 张代俐, 汪廷华, 朱兴淋
作者信息 +
History +

摘要

支持向量机(Support vector machine,SVM)具有良好的学习泛化性能,但其学习效率随着训练样本数量的增加而显著降低,对于大规模训练集,采用标准优化方法的传统SVM面临着内存需求过大、执行速度慢等问题。为了缓解这个问题,由于不同的数据点对决策平面的贡献程度不同,本文通过模糊隶属度函数计算每个样本的隶属度,利用模糊隶属度评估每个样本的重要程度,从而将隶属度值低的样本进行约简。基于三种不同的模糊隶属度函数,分别提出了基于类中心距离、核目标对齐和中心核对齐模糊隶属度函数的SVM样本约简算法。在UCI(University of California, lrvine)和kaggle数据集上与传统的SVM和最近提出的基于牛顿法稀疏化SVM(Newtontype Sparse SVM, NSSVM)进行了大量的对比实验,实验结果验证了所提出的基于模糊隶属度函数的SVM样本约简算法在准确率、F-度量和Hinge损失这几个分类性能指标方面的优势。例如,基于中心核对齐模糊隶属度的SVM约简算法在diabetes数据集上取得了最高的准确率、F-度量和最小的Hinge损失。与SVM相比,准确率和F-度量分别提高了13.71%和9.55%,Hinge损失降低了3.28%;与NSSVM相比,准确率和F-度量分别提高了24.54%和9.38%,Hinge损失降低了21.54%。

关键词

机器学习 / 支持向量机 / 样本约简 / 模糊隶属度函数

中图分类号

TP181

引用本文

导出引用
张代俐, 汪廷华, 朱兴淋. 基于模糊隶属度函数的SVM样本约简算法. 山西大学学报(自然科学版). 2024, 47(01): 18-29 https://doi.org/10.13451/j.sxu.ns.2023138

基金

国家自然科学基金(61966002); 江西省研究生创新专项资金(YC2022-s944)

评论

PDF(4388 KB)

Accesses

Citation

Detail

段落导航
相关文章

/