上一章主要是讲了分类的过程,这一章主要是讲一些优化问题
主要是对于训练的模型,要保存下结果,而不用重复的训练.
import split_jieba2
from sklearn.externals import joblib
def train():
tfidf_train_2 = tv.fit_transform(train_data);
//在训练中训练完tfidf,保存一下tfidf模型,生成tfidf_model.m文件,在test中直接load文件就OK。
joblib.dump(tv,"tfidf_mo