基于scikit-learn(sklearn)做分类--3.优化--保存模型
2016-04-27 17:25
471 查看
上一章主要是讲了分类的过程,这一章主要是讲一些优化问题
主要是对于训练的模型,要保存下结果,而不用重复的训练.
import split_jieba2
from sklearn.externals
import joblib
def train():
tfidf_train_2 = tv.fit_transform(train_data);
//在训练中训练完tfidf,保存一下tfidf模型,生成tfidf_model.m文件,在test中直接load文件就OK。
joblib.dump(tv,"tfidf_model.m")
clf = MultinomialNB(alpha=0.01)
clf.fit(tfidf_train_2,train_target)
//同样训练完MultinomialNB模型后,保存成clf_model.m文件。
joblib.dump(clf,"clf_model.m")
//上面训练完模型后,后面就可以直接load文件进行测试了。
def test(line):
test_data = []
content = split_jieba2.split_jieba(line)
test_data.append(content.strip())
//加载模型
tv = joblib.load("tfidf_model.m")
tfidf_test_2 = tv.transform(test_data);
clf = joblib.load("clf_model.m")
ls = []
proba=clf.predict_proba(tfidf_test_2)
for i
in range(len(proba[0])):
lk = str(i) +":"+str( proba[0][i] )
ls.append(lk)
return ls
//最后返回各个类和对应的概率
主要是对于训练的模型,要保存下结果,而不用重复的训练.
import split_jieba2
from sklearn.externals
import joblib
def train():
tfidf_train_2 = tv.fit_transform(train_data);
//在训练中训练完tfidf,保存一下tfidf模型,生成tfidf_model.m文件,在test中直接load文件就OK。
joblib.dump(tv,"tfidf_model.m")
clf = MultinomialNB(alpha=0.01)
clf.fit(tfidf_train_2,train_target)
//同样训练完MultinomialNB模型后,保存成clf_model.m文件。
joblib.dump(clf,"clf_model.m")
//上面训练完模型后,后面就可以直接load文件进行测试了。
def test(line):
test_data = []
content = split_jieba2.split_jieba(line)
test_data.append(content.strip())
//加载模型
tv = joblib.load("tfidf_model.m")
tfidf_test_2 = tv.transform(test_data);
clf = joblib.load("clf_model.m")
ls = []
proba=clf.predict_proba(tfidf_test_2)
for i
in range(len(proba[0])):
lk = str(i) +":"+str( proba[0][i] )
ls.append(lk)
return ls
//最后返回各个类和对应的概率
相关文章推荐
- nodejs实现获取某宝商品分类
- php通过分类列表产生分类树数组的方法
- asp飞飞无限级分类v1.0 Asp+sql+存储过程+ajax提供下载
- Oracle表的分类以及相关参数的详解
- Jquery+Ajax+PHP+MySQL实现分类列表管理(上)
- WordPress中用于获取文章信息以及分类链接的函数用法
- 详解WordPress中分类函数wp_list_categories的使用
- php实现无限级分类查询(递归、非递归)
- PHP实现无限级分类(不使用递归)
- PHP实现递归无限级分类
- Jquery+Ajax+PHP+MySQL实现分类列表管理(下)
- php+mysql实现无限分类实例详解
- thinkphp实现无限分类(使用递归)
- WordPress中获取指定分类及其子分类下的文章数目
- 详解WordPress开发中用于获取分类及子页面的函数用法
- JavaScript+CSS无限极分类效果完整实现方法
- ACM程序设计大赛题目分类
- 关于SVM的那点破事
- PHP超牛逼无限极分类生成树方法
- ThinkPHP无限级分类原理实现留言与回复功能实例