sklearn---分类模型评估
2018-08-11 10:56
211 查看
前几天刚学了sklearn的分类,接下来就说说我的学习笔记
1、交叉验证最简单的方法
cross_val_score函数
from sklearn.model_selection import cross_val_score score = cross_val_score(clf, X_train, y_train, cv=5) #X_train, y_train是训练数据集 #cv=5表示5次不同的分割
也可以传入一个交叉验证迭代器
from sklearn.model_selection import cross_val_score from sklearn.model_selection import ShuffleSplit cv = ShuffleSplit(n_splits=3, test_size=0.3, random_state=0) score = cross_val_score(clf, X_train, y_train, cv=cv) #n_splits是train/test对的组数,默认为10
还有Pipeline的用法
from sklearn.model_selection import cross_val_score from sklearn.model_selection import ShuffleSplit from sklearn.pipeline import make_pipeline cv = ShuffleSplit(n_splits=3, test_size=0.3, random_state=0) clf = make_pipeline(preprocessing, StandardScaler(), svm.SVC()) score = cross_val_score(clf, X_train, y_train, cv=cv)
2、多度量评估
返回一个字典,包含测试得分、讯练得分、拟合次数和得分次数
from sklearn.model_selection import cross_validate from sklearn.metrics import recall_score scoring = ['precision_macro', 'recall_macro'] scores = cross_validate(clf, X_train, y_train, scoring=scoring, cv=5, return_train_score=False) #return_train_score的值通常设为0,不返回训练得分,减少计算量。
3、评估报告
返回准确率、召回率、f1和support
“
from sklean.metrics import classification_report
scores = classification_report(y_test, y_pre, digits=3)#digits:返回值的小数位数
“`
除了上面提到的方法,sklearn还提供了两种评估方法,但个人还是比较喜欢上面说到的几种方法。
相关文章推荐
- 分类模型的性能评估——以SAS Logistic回归为例(3): Lift和Gain
- 笔记︱风控分类模型种类(决策、排序)比较与模型评估体系(ROC/gini/KS/lift)
- 分类模型的性能评估——以SAS Logistic回归为例(2): ROC和AUC
- sklearn特征选择和分类模型
- 分类模型评估之ROC-AUC曲线和PRC曲线
- 分类模型的性能评估——以SAS Logistic回归为例(1): 混淆矩阵
- 分类模型评估指标
- 数据挖掘导论(4)——分类:基本概念、决策树与模型评估
- 二分类模型评估之AUC ROC
- 分类模型的性能评估——Lift和Gain
- 风控分类模型种类(决策、排序)比较与模型评估体系(ROC/gini/KS/lift)
- sklearn中的模型评估
- 机器学习实战笔记(Python实现)-07-模型评估与分类性能度量
- 转:sklearn中的模型评估
- sklearn特征选择和分类模型
- 分类模型的性能评估——以SAS Logistic回归为例(1): 混淆矩阵
- 风控分类模型种类(决策、排序)比较与模型评估体系(ROC/gini/KS/lift)
- 数据挖掘---分类:基本概念、决策树、与模型评估
- 笔记︱风控分类模型种类(决策、排序)比较与模型评估体系(ROC/gini/KS/lift)
- 1.5 KNN算法学习——KNN算法分类模型的实现与分类准确度评估