编号:SBJS00988
篇名:细粒度图像分类综述
作者:申志军 穆丽娜 高静 史远航 刘志强
关键词: 细粒度图像分类 深度学习 卷积神经网络 注意力机制 计算机视觉
机构: 阜阳师范大学计算机与信息工程学院 内蒙古农业大学计算机与信息工程学院
摘要: 细粒度图像具有类内方差大、类间方差小的特点,致使细粒度图像分类(FGIC)的难度远高于传统的图像分类任务。介绍了FGIC的应用场景、任务难点、算法发展历程和相关的常用数据集,主要概述相关算法:基于局部检测的分类方法通常采用连接、求和及池化等操作,模型训练较为复杂,在实际应用中存在较多局限;基于线性特征的分类方法模仿人类视觉的两个神经通路分别进行识别和定位,分类效果相对较优;基于注意力机制的分类方法模拟人类观察外界事物的机制,先扫描全景,后锁定重点关注区域并形成注意力焦点,分类效果有进一步的提高。最后针对目前研究的不足,展望FGIC下一步的研究方向。