name: 数据集名字
dexcription: 对数据集的描述
modality: 模态,0表示CT数据,1表示MR数据。nnU-Net会根据不同模态进行不同的预处理(nnunet-v2版本改为channel_names)
labels: label中,不同的数值代表的类别(v1版本和v2版本的键值对刚好是反过来的)
file_ending: nnunet v2新加的
numTraining: 训练集数量
numTest: 测试集数量
training: 训练集的image 和 label 地址对
test: 只包含测试集的image. 这里跟Training不一样
“”"
json_dict[‘name’] = “KiTS”
json_dict[‘description’] = “kidney and kidney tumor segmentation”
json_dict[‘tensorImageSize’] = “4D”
json_dict[‘reference’] = “KiTS data for nnunet”
json_dict[‘licence’] = “”
json_dict[‘release’] = “0.0”
json_dict[‘channel_names’] = {
“0”: “CT”,
}
json_dict[‘labels’] = {
“background”: “0”,
“Kidney”: “1”,
“Tumor”: “2”
}
json_dict[‘numTraining’] = len(cases) # 应该是210例
json_dict[‘file_ending’] = “.nii.gz”
json_dict[‘numTest’] = 0
json_dict[‘training’] = [{‘image’: “./imagesTr/%s.nii.gz” % i, “label”: “./labelsTr/%s.nii.gz” % i} for i in cases]
#json_dict[‘test’] = []
save_json(json_dict, os.path.join(out, “dataset.json”))
结构化处理的结果是在nnUNet\_raw/Dataset040\_KiTS文件下,生成四个文件。
![](https://img-blog.csdnimg.cn/d47af19c4dfb4bbe9134f6b70e617fdd.png)
分别是,训练数据(应该是210条),测试数据(90),训练标签(210),数据说明。
![](https://img-blog.csdnimg.cn/d1b9f2e74ba7445a93cbc8f7e6570f52.png)
![](https://img-blog.csdnimg.cn/e0dc4451ddb9483e8dd80c7e4d2f7f36.png)
![](https://img-blog.csdnimg.cn/d92ad87dcc97434f895817b5197e9e95.png)
![](https://img-blog.csdnimg.cn/2d2ac0c5ac5d4a00abeec1bd92fd5aee.png)
## 3、设置数据路径
命令行,确保在nnunet激活环境下,输入vim ~/.bashrc,然后点击键盘insert开始插入,在bashrc文末,添加如下三行代码。然后按Esc键,输入:wq,就可以保存退出。
vim ~/.bashrc
‘’’
说明,这里是路径是你自己的路径,就是上一步创建的三个文件夹的路径(这部分说明不需要写进去,只需要以下三行代码)
‘’’
export nnUNet_raw=“/root/data/wt/nnUNet/dataset/nnUNet_raw”
export nnUNet_preprocessed=“/root/data/wt/nnUNet/dataset/nnUNet_preprocessed”
export nnUNet_results=“/root/data/wt/nnUNet/dataset/nnUNet_trained_models”
![](https://img-blog.csdnimg.cn/d49349905e9d4031b4eb2036be345090.png)
然后命令行输入source ~/.bashrc,确保激活路径。
source ~/.bashrc
**重点:**然后分别键入三个echo $nnUNet\_results,验证是否可以识别。不能识别,后续无法进行数据预处理。
![](https://img-blog.csdnimg.cn/2c3c80e05eb6490cb54f999f1162dc55.png)
最好三个都验证一下,避免后续出现问题。
## 4、数据集预处理
输入下面这行命令:
nnUNetv2_plan_and_preprocess -d 040 --verify_dataset_integrity
新旧版本不同,有的此处为t,有的为d,新版本应该用d,用t会发现显示没有此命令。
040表示KiTS分割任务在nnunet中,为第40个任务,代号040。
注意:可能会出现如下错误,不识别背景标签0。原因是v1和v2版本不同,dataset.json文件做出了改动。具体解决办法,见我的另一篇博客[RuntimeError: Background label not declared (remeber that this should be label 0!)\_路人八荒的博客-CSDN博客](https://bbs.csdn.net/topics/618545628)_路人八荒的博客-CSDN博客")
![](https://img-blog.csdnimg.cn/ec2ffd9bfe2b41b69c6e71e791137646.png)
除了上述错误,可能由于V1和V2的区别,有很多错误,具体区别见我的博客:
[nnUNet v2和v1版本在dataset.json的区别(KiTS19数据集)\_路人八荒的博客-CSDN博客](https://bbs.csdn.net/topics/618545628)
预处理结果会在nnUNet\_preprocessed文件夹下生成一个Dataset040\_KiTS文件夹,里边会包含如下几个文件:
![](https://img-blog.csdnimg.cn/bc3d2f132e4f47f5967e2ce4eb64b81e.png)
预处理结果分析:
gt\_segmentations为标签
dataset.json就是上一步数据结构化处理生成的
## 5、参考博客
1、[nnU-Net v2的环境配置到训练自己的数据集(详细步骤)\_小萝北hh的博客-CSDN博客](https://bbs.csdn.net/topics/618545628)
2、[nn-UNet使用记录--开箱即用\_kits数据集\_宁远x的博客-CSDN博客](https://bbs.csdn.net/topics/618545628)
![img](https://img-blog.csdnimg.cn/img_convert/05cd49f795afe18b527494a297579897.png)
![img](https://img-blog.csdnimg.cn/img_convert/005840efeb401e322fefa054d75431d7.png)
**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**
**[需要这份系统化资料的朋友,可以戳这里获取](https://bbs.csdn.net/topics/618545628)**
**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**
需要这份系统化资料的朋友,可以戳这里获取](https://bbs.csdn.net/topics/618545628)**
**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**