基于改进YOLOv5的快速水平文本检测算法

孙巧榆, 张静, 刘珍兵

PDF(4476 KB)
PDF(4476 KB)
江苏海洋大学学报(自然科学版) ›› 2024, Vol. 33 ›› Issue (01) : 75-81.

基于改进YOLOv5的快速水平文本检测算法

  • 孙巧榆, 张静, 刘珍兵
作者信息 +
History +

摘要

基于深度学习的文本检测算法具有强大的特征学习能力和泛化能力,但推理速度通常较慢。针对此问题,提出了基于改进YOLOv5的快速水平文本检测算法T-YOLOv5,通过在SPPF(spatial pyramid pooling-fast)模块中嵌入改进的CAM(channel attention module)提高网络的特征提取能力,并在CIoU(complete IoU)损失中增加形状损失提高损失函数的收敛速度。所提算法在公共数据集ICDAR2013上F值达到86.5,推理速度达112 FPS。实验结果表明,在检测结果和推理速度上,所提算法T-YOLOv5与现有基于深度学习的文本检测算法相比具有一定的竞争力。

关键词

文本检测 / 深度学习 / YOLOv5 / 场景文本

中图分类号

TP391.41 / TP183

引用本文

导出引用
孙巧榆, 张静, 刘珍兵. 基于改进YOLOv5的快速水平文本检测算法. 江苏海洋大学学报(自然科学版). 2024, 33(01): 75-81

基金

江苏海洋大学研究生科研创新项目(DZXS202106)

评论

PDF(4476 KB)

Accesses

Citation

Detail

段落导航
相关文章

/