一种可解释的相对贫困识别与预警模型

史颖, 丁天琪, 祁晓博, 亓慧

PDF(2419 KB)
PDF(2419 KB)
山西大学学报(自然科学版) ›› 2024, Vol. 47 ›› Issue (01) : 155-165. DOI: 10.13451/j.sxu.ns.2023099

一种可解释的相对贫困识别与预警模型

  • 史颖, 丁天琪, 祁晓博, 亓慧
作者信息 +
History +

摘要

构建相对贫困人口识别体系和监测预警机制,增强监测预警机制的针对性和有效性,是相对贫困长效治理的必要条件。由于相对贫困识别的理论和算法研究相对较少,本文提出了一种可解释的相对贫困识别与预警模型,即IEWRP模型。该模型以2018—2020年中国家庭追踪调查问卷(CFPS2018)数据为研究对象,运用方差分析技术对原始数据集进行特征选择。然后通过Gradient Boosting构建IEWRP模型,并与决策树(Classification and Regression Tree,CART)、XGBoost、LightGBM等机器学习算法进行实验对比。最后,结合SHapley Additive exPlanation模型对影响相对贫困识别的相关特征的必要性和重要度进行了可解释性分析,识别出影响相对贫困识别的主要特征。实验结果显示,IEWRP模型的预测准确率、精确率、召回率、F1值、AUC(Area Under Curve)值分别为89.4%、90.6%、95.3%、92.9%、0.95,在准确率、精确率、F1值、AUC值四个方面分别提升了0.15%、0.28%、0.09%、0.23%。

关键词

Gradient Boosting模型 / SHAP模型 / 相对贫困预测 / 特征分析

中图分类号

F126 / TP18

引用本文

导出引用
史颖, 丁天琪, 祁晓博, 亓慧. 一种可解释的相对贫困识别与预警模型. 山西大学学报(自然科学版). 2024, 47(01): 155-165 https://doi.org/10.13451/j.sxu.ns.2023099

基金

山西省哲学社会科学规划课题(2021YJ078); 国家自然科学基金(62276161); 山西省基础研究计划(自由探索)项目(20210302123334); 山西省高等学校科技创新项目(2021L443)

评论

PDF(2419 KB)

Accesses

Citation

Detail

段落导航
相关文章

/