基于质谱熵的小分子化合物相似性计算方法研究

吴丽萍, 向诚, 张海强, 李勇

北京化工大学学报(自然科学版) ›› 2024, Vol. 51 ›› Issue (04) : 115-124. DOI: 10.13543/j.bhxbzr.2024.04.013

基于质谱熵的小分子化合物相似性计算方法研究

  • 吴丽萍, 向诚, 张海强, 李勇
作者信息 +
History +

摘要

在二级质谱(MS2)数据检索中,通常利用质谱数据之间的相似性进行检索。针对质谱数据相似性计算中数据不整齐导致的检索效率和准确性不高以及商用软件相似性计算方法单一的问题,研究提出了“拼接填充”与“匹配填充”两种MS2数据对齐方法,并基于信息熵采用质谱熵相似性计算方法进行相似性检索。首先对归一化后的原始质谱数据进行特征提取,保留能突出质谱数据特征的数据,再分别采用两种数据对齐方法对质谱数据进行预处理;然后基于信息熵方法,分别计算未知质谱与已知质谱混合后的虚拟质谱与两者质谱的熵差,获得未知质谱与已知质谱的相关系数即相似性;最后选择小分子化合物的质谱数据集进行实例验证。结果表明:两种质谱数据预处理方法能够解决相似性计算中质谱长度不等的问题,基于质谱熵的相似性计算方法稳定且结果可靠,适用于小分子化合物的相似性检索,同时也为商用软件的谱图相似性计算提供了新的方案。

关键词

小分子化合物 / 相似性计算 / 二级质谱数据 / 信息熵 / 质谱熵

中图分类号

O657.63

引用本文

导出引用
吴丽萍, 向诚, 张海强, 李勇. 基于质谱熵的小分子化合物相似性计算方法研究. 北京化工大学学报(自然科学版). 2024, 51(04): 115-124 https://doi.org/10.13543/j.bhxbzr.2024.04.013

基金

国家自然科学基金(82160787); 贵州金石斜与铁皮石制化学物质基础的质量标准化研究(20025800400)

评论

Accesses

Citation

Detail

段落导航
相关文章

/