三者区别:
把数据集随机分为训练集,验证集和测试集
1. 训练集训练模型(很多模型)
2. 验证集验证模型,根据情况不断调整模型,选择出其中最好的模型(最优模型)
3. 训练集和验证集训练出一个最终的模型(最终模型)
4. 测试集评估最终的模型(评估最终模型)
由于数据集分为了训练集和测试集,现在我们需要从测试集再分出一个数据集,用于模型选择和调整。因为已经有一个测试集了,所以叫它验证集,以防止混淆。
训练集(Training Set):用于训练模型。
验证集(Validation Set):用于调整和选择模型。
测试集(Test Set):用于评估最终的模型。