基于距离度量的癌症预测分类算法研究

殷丽凤, 刘浩琦

大连交通大学学报 ›› 2025, Vol. 46 ›› Issue (02) : 106-112. DOI: 10.13291/j.cnki.djdxac.2025.02.015

基于距离度量的癌症预测分类算法研究

  • 殷丽凤, 刘浩琦
作者信息 +
History +

摘要

为了提高分类算法的效率及准确性,提出一种基于距离度量的二分类算法模型并应用于癌症识别领域。首先,利用k-means聚类找到数据集的聚类中心,计算每个样本点到聚类中心的曼哈顿距离、余弦相似度和马氏距离。其次,采用距离度量替换原有属性放入GBM和XGBoost分类器进行学习的方式来压缩数据属性,以减少分类器的训练压力、提高训练效率,并用训练好的模型对测试集进行预测。最后,设计3组不同训练方式进行对比试验,用分类评估标准评估模型性能,并控制参数从多个角度验证TCDM的合理性。试验结果表明,TCDM相较于其他分类模型在癌症识别领域中有更高的性能和准确率。

关键词

分类算法 / 余弦相似度 / 马氏距离 / 曼哈顿距离 / k-means聚类

中图分类号

R730.4 / TP181

引用本文

导出引用
殷丽凤, 刘浩琦. 基于距离度量的癌症预测分类算法研究. 大连交通大学学报. 2025, 46(02): 106-112 https://doi.org/10.13291/j.cnki.djdxac.2025.02.015

基金

国家自然科学基金项目(61771087)

评论

Accesses

Citation

Detail

段落导航
相关文章

/