您的位置:首页 > 大数据 > 人工智能

WEKA “Detailed Accuracy By Class”和“Confusion Matrix”含义

2015-07-23 16:17 507 查看
原文

=== Summary ===(总结)

Correctly Classified Instances(正确分类的实例) 45 90 %
Incorrectly Classified Instances (错误分类的实例) 5 10 %
Kappa statistic(Kappa统计量)   0.792
Mean absolute error(均值绝对误差)   0.1
Root mean squared error(均方根误差)  0.3162
Relative absolute error(相对绝对误差)   20.7954 %
Root relative squared error(相对均方根误差) 62.4666 %
Coverage of cases (0.95 level) 90 %
Mean rel. region size (0.95 level) 50 %
Total Number of Instances(实验的实例总数) 50





第一行“Detailed Accuracy By Class”:

一个数据库有500个文档,其中有50个文档符合定义的问题。系统检索到75个文档,但是只有45个符合定义的问题。

1.TP Rate(真正元比率):45/50=90%
2.FP Rate(假正元比率):35/50=70%

3.Precision(精准度):P=45/75=60%
4.Recall(查全率):R=45/50=90%

5.F-Measure:是查准率和查全率的调和平均数
6.ROC Area:一般大于0.5,这个值越接近1,说明模型的诊断效果越好。这个值在0.5~0.7时有较低准确性,在0.7~0.9时有一定准确性,在0.9以上时有较高准确性。如果这个值等于0.5,说明诊断方法完全不起作用,无诊断价值,而小于0.5不符合真实情况,在实际中极少出现。

第二行:混淆矩阵“Confusion Matrix”
行:预测
列:真实
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: