基于Stacking集成和偏探索贝叶斯优化的特征选择

孙林, 郭嘉琪, 朱雨晨, 陈森

PDF(1564 KB)
PDF(1564 KB)
山西大学学报(自然科学版) ›› 2024, Vol. 47 ›› Issue (01) : 93-102. DOI: 10.13451/j.sxu.ns.2023143

基于Stacking集成和偏探索贝叶斯优化的特征选择

  • 孙林, 郭嘉琪, 朱雨晨, 陈森
作者信息 +
History +

摘要

针对高维基因数据集的最优特征子集不易确定,以及传统的贝叶斯优化算法容易陷入局部最优,导致无法快速筛选出最优参数等问题,本文提出了一种基于Stacking集成和偏探索贝叶斯优化的基因选择方法。首先,使用卡方过滤法剔除原始特征空间中的冗余基因,获得相关性较高的基因,通过贝叶斯优化算法的采集函数进行改进,引入跳出系数,使得贝叶斯优化算法能够自适应地跳出局部最优,降低开销并加快寻优的效率;然后,使用偏探索贝叶斯优化寻找随机森林的最优参数,使用优化后随机森林模型筛选最优基因子集;最后,设计了一种Stacking集成模型框架来构建分类器,并对最优基因子集进行分类,进而构建了基于Stacking集成和偏探索贝叶斯优化的基因选择算法。在9个公开的基因表达谱数据集上进行仿真实验,结果表明所提算法可以快速筛选出最优的基因子集,且具有较高的分类精度。

关键词

基因选择 / Stacking算法 / 贝叶斯优化算法 / 随机森林模型

中图分类号

TP18 / Q811.4

引用本文

导出引用
孙林, 郭嘉琪, 朱雨晨, 陈森. 基于Stacking集成和偏探索贝叶斯优化的特征选择. 山西大学学报(自然科学版). 2024, 47(01): 93-102 https://doi.org/10.13451/j.sxu.ns.2023143

基金

国家自然科学基金(61772176); 河南省科技攻关项目(212102210136)

评论

PDF(1564 KB)

Accesses

Citation

Detail

段落导航
相关文章

/