融合自注意力机制的YOLOv5交通标志检测算法

doi:10.16725/j.1673-808X.202315

桂林电子科技大学学报 ›› 2025, Vol. 45 ›› Issue (01) : 41-48. DOI: 10.16725/j.1673-808X.202315

那万达, 张向利

作者信息 +

History +

摘要

针对YOLOv5网络模型在复杂环境下对交通标志检测提取全局特征信息不足、特征融合不充分和检测效率低的问题，提出一种融合自注意力机制的YOLOv5交通标志检测算法。该算法在主干网络特征提取部分将基于自注意力机制的Swin-Transformer模块与可降低模型计算量的C3模块融合来增加特征图像之间的信息交互，以获取多尺度图像特征。模型的特征图像处理部分利用视觉Transformer模型，并结合Swin-Transformer模块进行特征图像的融合，得到待测图像的全局特征信息，提高了模型的检测精度。最后，将原有特征图像拼接方式进行赋权处理，重要交通标志特征信息可以优先检测，提高了模型的检测效率。在TT100K数据集进行测试后，最终平均检测精度均值达83.51%，相对于原始YOLOv5网络模型提高了2.50个百分点，单张特征图像检测速率提高了0.037 s。实验结果表明，融合自注意力机制的YOLOv5模型有效提高了对交通标志检测的全局特征提取能力、检测准确率与检测效率。