基于链接关系预测的弯曲密集型商品文本检测

耿磊, 李嘉琛, 刘彦北, 李月龙, 李晓捷

PDF(2281 KB)
PDF(2281 KB)
天津工业大学学报 ›› 2024, Vol. 43 ›› Issue (04) : 50-59+74.

基于链接关系预测的弯曲密集型商品文本检测

  • 耿磊, 李嘉琛, 刘彦北, 李月龙, 李晓捷
作者信息 +
History +

摘要

针对商品包装文本检测任务中弯曲密集型文本导致的错检、漏检问题,提出了一种由2个子网络组成的基于链接关系预测的文本检测框架(text detection network based on relational prediction,RPTNet)。在文本组件检测网络中,下采样采用卷积神经网络和自注意力并行的双分支结构提取局部和全局特征,并加入空洞特征增强模块(DFM)减少深层特征图在降维过程中信息的丢失;上采样采用特征金字塔与多级注意力融合模块(MAFM)相结合的方式进行多级特征融合以增强文本特征间的潜在联系,通过文本检测器从上采样输出的特征图中检测文本组件;在链接关系预测网络中,采用基于图卷积网络的关系推理框架预测文本组件间的深层相似度,采用双向长短时记忆网络将文本组件聚合为文本实例。为验证RRNet的检测性能,构建了一个由商品包装图片组成的文本检测数据集(text detection dataset composed of commodity packaging,CPTD1500)。实验结果表明:RPTNet不仅在公开文本数据集CTW-1500和Total-Text上取得了优异的性能,而且在CPTD1500数据集上的召回率和F值分别达到了85.4%和87.5%,均优于当前主流算法。

关键词

文本检测 / 卷积神经网络 / 自注意力 / 特征融合 / 图卷积网络 / 双向长短时记忆网络

中图分类号

TP391.41 / TP18

引用本文

导出引用
耿磊, 李嘉琛, 刘彦北, 李月龙, 李晓捷. 基于链接关系预测的弯曲密集型商品文本检测. 天津工业大学学报. 2024, 43(04): 50-59+74

基金

国家自然科学基金资助项目(61771340); 天津市科技计划资助项目(20YDTPJC00110)

评论

PDF(2281 KB)

Accesses

Citation

Detail

段落导航
相关文章

/