您的位置：首页 > 其它

机器学习模型评价指标总结

2018-01-08 16:55 344 查看

评价	指标	介绍
分类模型	准确率	Accuracy=N（correct）/N(total) 准确率评价没有对不同类别进行区分。此外，数据分布不平衡，即有的类别下样本过多，有的类别下样本少，两个类个数相差较大，这样样本占大部分的类别主导了准确率的计算。
平均准确率	举例，类别0的准确率为80%，类别1下的准确率为97.5%，那么平均准确率为(80%+97.5%)/2=88.75%
对数损失函数（log-loss）
精确率-召回率（Precision-Recall）	精确率(Precision)：分类正确的正样本个数占分类器所有预测为正样本的个数的比例；召回率(Recall)：分类正确的正样本个数占全部实际正样本个数的比例。
AUC（ROC曲线下面积）	ROC曲线的x轴便是FPR，y轴便是TPR。
混淆矩阵（Confusion Matrix）	由混淆矩阵可以计算以下评价指标: 1.准确率（Accuracy）：分类正确的样本数占所有样本数的比例 2. 平均准确率(Average per-class accuracy)：每个类别下的准确率的算术平均 3.精确率(Precision)：分类正确的正样本个数占分类器所有预测为正样本的个数的比例 4.召回率(Recall)：分类正确的正样本个数占全部实际正样本个数的比例 5.F1-Score：精确率与召回率的[b]调和平均值[/b]，它的值更接近于Precision与Recall中较小的值 6.ROC曲线：ROC曲线的x轴便是FPR，y轴便是TPR。
回归模型	平方根误差（RMSE）	RMSE虽然广为使用，但是其存在一些缺点，因为它是使用平均误差，而平均值对异常点（outliers）较敏感，如果回归器对某个点的回归值很不理性，那么它的误差则较大，从而会对RMSE的值有较大影响，即平均值是[b]非鲁棒[/b]的。
Quantiles of Errors	为了改进RMSE的缺点，提高评价指标的鲁棒性，使用[b][u]误差的分位[/u][/b]数来代替，如[u]中位数来代替平均数[/u][b]。[/b] 假设100个数，最大的数再怎么改变，中位数也不会变，因此其对异常点具有鲁棒性。在现实数据中，往往会存在异常点，并且模型可能对异常点拟合得并不好，因此提高评价指标的鲁棒性至关重要，于是可以使用中位数来替代平均数，如MAPE[b]。[/b]
Almost Correct Predictions
排序评价指标	精确率-召回率（Precision-Recall）
Precision-Recall Curve 和 F1 Score
NDCG

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

添加评论
分享网址
分享文章
返回顶部