基于VMD的双通道构音障碍语音特征图谱提取算法

薛珮芸, 白静, 张楠, 赵建星

PDF(1149 KB)
PDF(1149 KB)
东北大学学报(自然科学版) ›› 2024, Vol. 45 ›› Issue (06) : 793-801.

基于VMD的双通道构音障碍语音特征图谱提取算法

  • 薛珮芸, 白静, 张楠, 赵建星
作者信息 +
History +

摘要

针对在提取构音障碍患者语音有效特征信息不足,导致语音识别率低的问题,提出一种基于变分模态分解(VMD)的多尺度双通道滤波器组(MBCFbank)特征图谱提取算法.首先,为了更好地提取符合人耳听觉结构特性的声学特征,提出一种双通道滤波器组(BCFbank)特征提取算法,该算法采用Mel滤波后做对数变换,同时采用Gammatone滤波后作非线性响度变换;其次,采用VMD来优化BCFbank特征,对分解后的多个语音信号分量筛选出相关系数较高的3个,分别提取其BCFbank特征及其差分特征,同时对未分解的语音信号提取BCFbank特征,从而构成MBCFbank特征图谱;最后,在双路语音识别模型上进行训练和识别.实验结果表明,基于BCFbank特征、MBCFbank特征图谱的语音识别模型准确率最高分别达到了87.82%,94.34%,优于Fbank特征的识别效果.

关键词

构音障碍语音识别 / 变分模态分解 / 卷积神经网络 / MBCFbank特征

中图分类号

TN912.3

引用本文

导出引用
薛珮芸, 白静, 张楠, 赵建星. 基于VMD的双通道构音障碍语音特征图谱提取算法. 东北大学学报(自然科学版). 2024, 45(06): 793-801

基金

山西省应用基础研究计划项目(201901D111094); 山西省基础研究项目(青年)(20210302124544)

评论

PDF(1149 KB)

Accesses

Citation

Detail

段落导航
相关文章

/