精准度,召回率,准确率:机器学习中关于样本和预测的几个概念
2017-12-28 14:30
369 查看
先看一个简单的应用场景:
查询的图片编号为 :c1,c2,c3,c9,c0
样本库中的编号为:s1,s2,s3,s4,s5,s6,s7,s8,
实际情况对应为:
c1–s1 , c2–s2 , c3–s3
c9和c0 没有对应
通过模型判定的情况是:
情况A : 查c1 ,模型给出 s1 , —-> 能查到的图片,查到了,—-> 术语 TP
情况B: 查c2 ,模型给出 s7 , —-> 能查到的图片,没查到,—-> 术语 FP
情况C :查c9 ,模型没有输出 —-> 不能查到的图片,没查到 —-> 术语 TN
情况D :查c0 ,模型给出s8 , —-> 不能查到的图片,查到了—–> 术语 FN
True Negative(TN): “真负” 指被model预测为负的负样本,即判断为假的正确率
False Positive(FP): “假正” 指被模型预测为正的负样本,即误报率
False Negative(FN): “假负” 指被模型预测为负的正样本,即漏报率
理解方式:
1. Positive/Negative是用来形容样本的
以图片查找为例,能在图片中查找到为 Positive(c1,c2,c3) ,不能查到到为Negative(c9,c0)
2. True/False 是用来形容模型发的预测结果的
以图片查找为例:
- 能在图片中查到,通过模型也查到了,为True,情况A
- 不能在图片中 查到,通过模型也没有查到,为True ,情况C
- 能在图片中查到,通过模型却没有查到,为False,情况B
- 不能在图片中查到,通过模型却查到了,为False ,情况D
P = TP/(TP+FP) 指被分类器判定正例中的正样本的比重。
都是针对正样本,正样本中通过模型判定正确的比例。
在样本中能够查询到图片中,通过模型真的能查询到的比例。
召回率(Recall):
R=TP/(TP+FN) = 1- FN/T 指的是被预测为正例的占总的正例的比重。
通过模型预测为正的结果中,有多少实际为正的比例。
准确率(Accuracy):
A = (TP + TN)/(P+N) = (TP + TN)/(TP + FN + FP + TN); 反映了分类器对整个样本的判定能力。
也就是说能将正的判定为正,负的判定为负占整个样本的比例。
本文同步发行在简书上 https://www.jianshu.com/p/3444f24eea51
查询的图片编号为 :c1,c2,c3,c9,c0
样本库中的编号为:s1,s2,s3,s4,s5,s6,s7,s8,
实际情况对应为:
c1–s1 , c2–s2 , c3–s3
c9和c0 没有对应
通过模型判定的情况是:
情况A : 查c1 ,模型给出 s1 , —-> 能查到的图片,查到了,—-> 术语 TP
情况B: 查c2 ,模型给出 s7 , —-> 能查到的图片,没查到,—-> 术语 FP
情况C :查c9 ,模型没有输出 —-> 不能查到的图片,没查到 —-> 术语 TN
情况D :查c0 ,模型给出s8 , —-> 不能查到的图片,查到了—–> 术语 FN
术语的详解 TP/TN/FP/FN (形容样本属性 和预测结果的判定 )
True Positive (TP): “真正” 指被model预测为正的正样本,即判断为真的正确率True Negative(TN): “真负” 指被model预测为负的负样本,即判断为假的正确率
False Positive(FP): “假正” 指被模型预测为正的负样本,即误报率
False Negative(FN): “假负” 指被模型预测为负的正样本,即漏报率
理解方式:
1. Positive/Negative是用来形容样本的
以图片查找为例,能在图片中查找到为 Positive(c1,c2,c3) ,不能查到到为Negative(c9,c0)
2. True/False 是用来形容模型发的预测结果的
以图片查找为例:
- 能在图片中查到,通过模型也查到了,为True,情况A
- 不能在图片中 查到,通过模型也没有查到,为True ,情况C
- 能在图片中查到,通过模型却没有查到,为False,情况B
- 不能在图片中查到,通过模型却查到了,为False ,情况D
三个衡量指标
精准度(precision):P = TP/(TP+FP) 指被分类器判定正例中的正样本的比重。
都是针对正样本,正样本中通过模型判定正确的比例。
在样本中能够查询到图片中,通过模型真的能查询到的比例。
召回率(Recall):
R=TP/(TP+FN) = 1- FN/T 指的是被预测为正例的占总的正例的比重。
通过模型预测为正的结果中,有多少实际为正的比例。
准确率(Accuracy):
A = (TP + TN)/(P+N) = (TP + TN)/(TP + FN + FP + TN); 反映了分类器对整个样本的判定能力。
也就是说能将正的判定为正,负的判定为负占整个样本的比例。
本文同步发行在简书上 https://www.jianshu.com/p/3444f24eea51
相关文章推荐
- 几个易混淆的概念(准确率-召回率,击中率-虚警率,PR曲线和mAP,ROC曲线和AUC)
- Airbnb欺诈预测机器学习模型设计:准确率和召回率的故事 发表于2015-07-15 16:14| 3926次阅读| 来源AirBNB/Data| 1 条评论| 作者Ariana Radianto
- 几个易混淆的概念(准确率-召回率,击中率-虚警率,PR曲线和mAP,ROC曲线和AUC)
- Airbnb欺诈预测机器学习模型设计:准确率和召回率的故事
- Airbnb欺诈预测机器学习模型设计:准确率和召回率的故事
- 关于软件测试的几个相关概念
- 关于MRP的几个概念
- 关于数据挖掘的几个概念
- 关于MRP的几个概念
- 关于地图学的几个基本概念
- 机器学习几个重要概念的区别
- 关于J2EE Tranaction的几个基本概念
- 关于“事件”,“事件对象”,“事件源”等几个概念的理解
- 好记性不如烂笔头——关于精确度、召回率、F值、准确率
- 关于容量:容易误解的几个技术概念
- 关于准确率,精确率,召回率,f-值等
- 关于“重定位”及其相关的几个概念
- 几个概念——关于人工智能、大数据、深度学习
- Forecast预测交货计划里几个概念
- 关于MRP的几个概念