基于Wasserstein距离的航拍图像小目标检测模型

蔡泽宇, 刘远兴, 李文炽, 吴湘宁, 杨翼, 胡远江

吉林大学学报(信息科学版) ›› 2025, Vol. 43 ›› Issue (01) : 65-76. DOI: 10.19292/j.cnki.jdxxp.20240517.018

基于Wasserstein距离的航拍图像小目标检测模型

  • 蔡泽宇, 刘远兴, 李文炽, 吴湘宁, 杨翼, 胡远江
作者信息 +
History +

摘要

针对无人机航拍具有多角度、大视角、大规模场景的特点,使无人机航拍图像存在小目标对象较多、背景复杂和特征提取困难的问题,提出了一种新的模型CA-NWD-YOLOv5(Coordinate Attention-Normalized Wasserstein Distance-You Only Look Once v5)。该模型以YOLOv5模型为基础,在头部网络添加了多尺度检测层以提取小目标特征,同时在骨干网络加入了CA注意力机制,避免模型忽略目标的位置信息。最后,使用归一化Wasserstein距离损失函数代替基于交并比的损失函数,加强了模型对微小目标的敏感程度。在VisDrone2019数据集上的实验表明,相比改进前的YOLOv5模型,CA-NWD-YOLOv5模型可有效提升无人机航拍图像中小目标的检测精度,改进后算法的mAP_0.5达到了50%,可以有效应用于航拍小目标的检测。

关键词

航拍图像 / 小目标检测 / 注意力机制 / Wasserstein距离

中图分类号

TP391.41

引用本文

导出引用
蔡泽宇, 刘远兴, 李文炽, 吴湘宁, 杨翼, 胡远江. 基于Wasserstein距离的航拍图像小目标检测模型. 吉林大学学报(信息科学版). 2025, 43(01): 65-76 https://doi.org/10.19292/j.cnki.jdxxp.20240517.018

基金

国家自然科学基金重点资助项目(U21A2013); 智能地学信息处理湖北省重点实验室开放基金资助项目(KLIGIP-2018B14)

评论

Accesses

Citation

Detail

段落导航
相关文章

/