基于CNN和Bi-LSTM模型的蛋白质甲基化位点识别

马驰卓, 周文静, 雷志超, 王楚正

哈尔滨理工大学学报 ›› 2025, Vol. 30 ›› Issue (02) : 82-90. DOI: 10.15938/j.jhust.2025.02.009

基于CNN和Bi-LSTM模型的蛋白质甲基化位点识别

  • 马驰卓, 周文静, 雷志超, 王楚正
作者信息 +
History +

摘要

甲基化是一种调节细胞功能的蛋白质翻译后修饰(PTM),能对基因调控和疾病预测等领域的研究提供指导和帮助。当前,甲基化位点识别研究存在标注数据集少,正样本数据不足和甲基化研究识别准确率低等问题。为了解决这些问题,提出了一种基于CNN和Bi-LSTM模型的蛋白质甲基化位点识别方法。模型分为两个分支,CNN分支采用密集连接的方式使每一层的特征信息充分地传递和共享,堆叠的Bi-LSTM分支获得序列中双向的长期依赖关系,然后对两个分支特征融合用于甲基化识别。实验结果表明,利用该模型识别甲基化位点得到的准确率(ACC)、F1值(F1-score)和马修斯相关系数(MCC)分别为0.851 9、0.849 4和0.728 4,相对比其他方法,本文提出的模型具有良好性能。

关键词

甲基化 / 卷积神经网络 / 双向长短时记忆网络 / 特征融合 / 位点识别

中图分类号

TP183 / Q811.4

引用本文

导出引用
马驰卓, 周文静, 雷志超, 王楚正. 基于CNN和Bi-LSTM模型的蛋白质甲基化位点识别. 哈尔滨理工大学学报. 2025, 30(02): 82-90 https://doi.org/10.15938/j.jhust.2025.02.009

基金

国家自然科学基金(62202505)

评论

Accesses

Citation

Detail

段落导航
相关文章

/