Bootstrap

基于ConvNeXt网络的图像识别

1、前言

ConvNeXt 网络基于传统的卷积神经网络,与当下 transformer当道而言简直是一股清流

ConvNeXt并没有特别复杂或者创新的结构

ConvNeXt 网络有五种大小,可以参考下面

 

2、项目实现

完整的项目如下:

 

这里参考了网上的ConvNeXt 模型,训练脚本、预测脚本全部自己实现。

这里简单介绍

2.1 ConvNeXt 模型

因为ConvNeXt 模型有tiny、base等等五个版本,这里为了方便,定义了五种模型,只需要在train的训练参数里面更改即可

 

优化器可以在SGD或者Adam中选择

其余的参数就是字面意思,其中学习率衰减是cos余弦退火算法,lr是初始学习率,lrf是衰减的比例

2.2 迁移学习

这里并没有使用官方的预训练权重,当然需要的话,可以在model下面的链接中下载。训练之前删去分类的部分,然后导入即可进行迁移学习

需要注意的是,迁移学习最好保证数据分布相同,这样效果最好。

也就是说迁移学习的话,最好保证数据归一化的mean和std一样,这里使用compute-gray控制。

True的话,代码会自动计算数据集的mean和std,在归一化的时候自动载入计算好的mean和std

而要是迁移学习的话,需要设置为False,这样代码会载入默认的官方的mean和std

 因为本人测试的时候没有进行迁移学习,所以这里设置为True,也就是自动计算数据的均值和方差

2.3 训练生成的东西

生成的全部在runs目录下

json 文件是分类项目的索引和类别,通过这个json文件自动为ConvNeXt 模型定义输出

loss accuracy 就是分别在训练集和验证集上的loss和acc曲线

这里有时候test曲线高于train曲线,因为数据集划分不足导致,可以将验证集加的再多点

 

然后除了训练集和验证集的混淆矩阵图像外,还有一个训练数据预处理的可视化,就是trainSet图像,里面存放的是数据经过预处理后的图像,如下:

 

2.4 训练过程的打印

开始:

中间过程:

 

结束:

 

 2.5 推理

推理的时候,需要更改下面的参数

然后将推理的数据放在 inference\inference_test 目录下,代码会自动将推理结果放在 inference\ret 中

3、代码使用

项目下载:基于ConvNeXt网络对4种苹果叶片病害识别【包含数据集、完整代码、训练的结果、混淆矩阵结果等等】资源-CSDN文库

这里使用的python版本是3.8,里面的库文件参考requirements文件

训练自定义数据集很简单,也可以参考README文件

首先摆放好数据集,格式如下,数据按照目录摆放

本人习惯test就是验证集

然后选择参数,训练即可

最后推理:

;