Bootstrap

轻量级混合注意力网络(L-HAN)在移动端图像分类中的应用


轻量级混合注意力网络(L-HAN)在移动端图像分类中的应用

摘要

在当前深度学习应用中,模型参数量和计算复杂度始终是制约应用于移动端或资源受限环境的重要因素。本文提出了一种全新的轻量级混合注意力网络(Lightweight Hybrid Attention Network, L-HAN),其核心思想在于利用深度可分离卷积、组卷积、通道混洗技术降低模型参数量,同时结合轻量级的通道和空间注意力机制,动态调整特征响应,提升模型对关键特征的捕捉能力。模型在保证较低参数量的同时,实现了较高的分类准确率和快速收敛,适合在各种内置数据集上进行训练和应用。

本文详细阐述了模型背景、设计目标、创新亮点、网络结构设计、数据集预处理、代码实现、训练过程、评估指标可视化以及模型保存等各个环节,并提供了一整套完整代码。代码中利用 GPU 加速计算,确保各个张量形状一致,训练过程中每隔 10 个 epoch 输出一次评估指标,最终将训练好的模型保存在本地 model 目录下。


1. 模型背景与研究意义

随着深度学习在图像识别、目标检测等任务中的广泛应用,越来越多的研究聚焦于如何在保证模型精度的前提下降低计算复杂度和参数规模。传统的大规模卷积神经网络(CNN)通常需要大量计算资源

;