随机生存森林在结直肠癌患者基因数据预后分析中的应用研究

穆华夏, 卜伟晓, 高梦瑶, 苏维强, 韩梅, 徐雅琪, 陶子琨, 杨希, 石福艳, 王清华, 孔雨佳, 王素珍

PDF(6548 KB)
PDF(6548 KB)
中国卫生统计 ›› 2024, Vol. 41 ›› Issue (04) : 532-538.

随机生存森林在结直肠癌患者基因数据预后分析中的应用研究

  • 穆华夏, 卜伟晓, 高梦瑶, 苏维强, 韩梅, 徐雅琪, 陶子琨, 杨希, 石福艳, 王清华, 孔雨佳, 王素珍
作者信息 +
History +

摘要

目的 应用随机生存森林模型探讨基因数据中结直肠癌患者预后影响因素。方法 利用TCGA数据库中结直肠癌基因表达数据,对差异表达基因进行筛选,结合临床与生存信息构建RSF模型,并与传统Lasso-Cox回归模型进行比较。结果 通过RSF模型得到包括HAND1(VIMP=0.090)和PCOLCE2(VIMP=0.075)基因表达在内的13个影响结直肠癌患者预后的重要因素,并分析了病理学N分期、PCOLCE2基因及IGSF9基因变量之间的交互作用。与Lasso-Cox模型比较结果显示,尽管RSF模型预测错误率略高(1-C-index:训练集:0.296 vs. 0.213;测试集:0.369 vs. 0.332),但具有更好的模型校准度(IBS:训练集:0.205 vs. 0.214;测试集:0.210 vs. 0.221)。结论 RSF模型在处理右删失生存数据的分析时具有良好的表现,能发现重要的影响因素以及变量之间的交互作用,为结直肠癌患者预后状况的改善和生命质量的提升提供了科学依据。

关键词

随机生存森林 / Lasso-Cox回归 / 结直肠癌 / 基因数据 / 预后分析

中图分类号

R735.34

引用本文

导出引用
穆华夏, 卜伟晓, 高梦瑶, 苏维强, 韩梅, 徐雅琪, 陶子琨, 杨希, 石福艳, 王清华, 孔雨佳, 王素珍. 随机生存森林在结直肠癌患者基因数据预后分析中的应用研究. 中国卫生统计. 2024, 41(04): 532-538

基金

国家自然科学基金(82003560);; 山东省自然科学基金(ZR2020MH340,ZR2023MH313);; 山东省教育厅教改项目(M2021174,M2021327)

评论

PDF(6548 KB)

Accesses

Citation

Detail

段落导航
相关文章

/