【1】构建图像分类数据集
前言
主要简述图像采集与整理、可视化采集图像、划分训练集验证集、统计各类别图像数量
一、图像采集与整理
1.1. 图像采集
三叶青块根图片主要是通过自己拍照来采集的
具体信息,请参考【8】相关补充——三叶青实验记录
未知类别照片
将这些照片充当未知类别,另外还将本地相册中的照片也作为未知类别。(有点建议:或许我要挑选一些与三叶青块根相似的其它药材作为未知类别,这样更能区分出三叶青块根)
1.2. 图片数据集的处理
前面获得了三叶青块根照片和其它任意图片的数据集。
但是数据集的格式、图片大小并未统一。
包括:
- 复制原始图片,生成图片的标签文件
- 根据labels.csv文件整理为labels_2.csv或labels_5.csv或lebels_未知.csv
- 图片压缩为统一尺寸
1.3. 图片数据集的混合
将三叶青的块根照片与未知照片混合
1.4.测试集划分
设置自定义的划分比例,这里为0.2
二、可视化采集图像
随机读取一定数量的图片并可视化
三、划分训练集验证集
将之前剩下的图片划分为训练集和验证集,按8:2比例
四、统计各类别图像数量
将各类别图像数量表格可视化为柱状图
总结
本文主要介绍了如何构建我的图像分类数据集,数据集的构建是比较重要的,这里数据集图像的获取也不知道合不合格,这一步或许有点问题,考虑再完善。
2024/6/12
十一年前南渡客,四千里外北归人。