基于注意力机制的树木叶片分类识别方法研究

赵新瑞, 张雯悦, 徐竞怡, 闫飞

PDF(3654 KB)
PDF(3654 KB)
高原农业 ›› 2024, Vol. 8 ›› Issue (04) : 393-403. DOI: 10.19707/j.cnki.jpa.2024.04.005

基于注意力机制的树木叶片分类识别方法研究

  • 赵新瑞, 张雯悦, 徐竞怡, 闫飞
作者信息 +
History +

摘要

本文将注意力机制分类模型——Vision Transformer(ViT)应用于树种分类识别任务,旨在探索更高精度和更高效率的树种识别模型。本研究共设计了三组对比实验:(1)用ViT和ResNet50在实验环境的数据集上进行训练、验证和测试,(2)为Vi T模型设置不同的深度进行训练,(3)用ViT和ResNet50在真实环境的数据集上进行训练、验证和测试。结果表明,无论是实验环境的数据集,还是真实环境的数据集,ViT模型都达到了与ResNet50模型相当的分类性能,并且ViT模型的时间效率明显优于ResNet50。此外,本研究还展示了Vi T对真实环境的图像进行分类时的类激活热力图,发现ViT模型更关注树叶本身尤其是树叶边缘而忽略了复杂的背景,从而有效提高了分类精度。结果说明,两个模型分类精度相当,但ViT的收敛速度明显更快,学习特征的能力更强,泛化能力也更强。本研究是将ViT应用在树种分类识别这一具体任务上的一次有益尝试,为后续融合ViT与CNN优势,以更高的效率、更小的数据需求、在更复杂的高原林业数据集上进行树种识别研究奠定基础。

关键词

树种识别 / 注意力机制 / 卷积神经网络 / 可视化

中图分类号

TP391.41 / S757.2

引用本文

导出引用
赵新瑞, 张雯悦, 徐竞怡, 闫飞. 基于注意力机制的树木叶片分类识别方法研究. 高原农业. 2024, 8(04): 393-403 https://doi.org/10.19707/j.cnki.jpa.2024.04.005

基金

西藏自治区科技厅中央引导地方项目(XZ202301YD0043C),多源激光雷达结合数字孪生的藏东南优势树种固碳能力研究

评论

PDF(3654 KB)

Accesses

Citation

Detail

段落导航
相关文章

/