融合自注意力机制的YOLOv5交通标志检测算法

那万达, 张向利

桂林电子科技大学学报 ›› 2025, Vol. 45 ›› Issue (01) : 41-48. DOI: 10.16725/j.1673-808X.202315

融合自注意力机制的YOLOv5交通标志检测算法

  • 那万达, 张向利
作者信息 +
History +

摘要

针对YOLOv5网络模型在复杂环境下对交通标志检测提取全局特征信息不足、特征融合不充分和检测效率低的问题,提出一种融合自注意力机制的YOLOv5交通标志检测算法。该算法在主干网络特征提取部分将基于自注意力机制的Swin-Transformer模块与可降低模型计算量的C3模块融合来增加特征图像之间的信息交互,以获取多尺度图像特征。模型的特征图像处理部分利用视觉Transformer模型,并结合Swin-Transformer模块进行特征图像的融合,得到待测图像的全局特征信息,提高了模型的检测精度。最后,将原有特征图像拼接方式进行赋权处理,重要交通标志特征信息可以优先检测,提高了模型的检测效率。在TT100K数据集进行测试后,最终平均检测精度均值达83.51%,相对于原始YOLOv5网络模型提高了2.50个百分点,单张特征图像检测速率提高了0.037 s。实验结果表明,融合自注意力机制的YOLOv5模型有效提高了对交通标志检测的全局特征提取能力、检测准确率与检测效率。

关键词

交通标志检测 / 自注意力机制 / 特征融合 / YOLOv5 / Swin-Transformer

中图分类号

TP391.41 / U463.6

引用本文

导出引用
那万达, 张向利. 融合自注意力机制的YOLOv5交通标志检测算法. 桂林电子科技大学学报. 2025, 45(01): 41-48 https://doi.org/10.16725/j.1673-808X.202315

基金

广西无线宽带通信与信号处理重点实验室主任基金(GXKL06200104); 广西云计算与大数据协同创新中心(YD1904)

评论

Accesses

Citation

Detail

段落导航
相关文章

/