Precision/Recall和ROC曲线原理以及Matlab源码
2014-03-02 10:47
423 查看
查准率和查全率是信息检索效率评价的两个定量指标,不仅可以用来评价每次检索的准确性和全面性,也是在信息检索系统评价中衡量系统检索性能的重要方面。
查准率(Precision ratio,简称为P),是指检出的相关文献数占检出文献总数的百分比。查准率反映检索准确性,其补数就是误检率。
查全率(Recall ratio,简称为R),是指检出的相关文献数占系统中相关文献总数的百分比。查全率反映检索全面性,其补数就是漏检率。
查全率=(检索出的相关信息量/系统中的相关信息总量)*100%
查准率=(检索出的相关信息量/检索出的信息总量)*100%
前者是衡量检索系统和检索者检出相关信息的能力,后者是衡量检索系统和检索者拒绝非相关信息的能力。两者合起来,即表示检索效率。
利用查准率和查全率指标,可以对每一次检索进行检索效率的评价,为检索的改进调整提供依据。利用这两个量化指标,也可以对信息检索系统的性能水平进行评价。要评价信息检索系统的性能水平,就必须在一个检索系统中进行多次检索。每进行一次检索,都计算其查准率和查全率,并以此作为坐标值,在平面坐标图上标示出来。通过大量的检索,就可以得到检索系统的性能曲线。实验证明,在查全率和查准率之间存在着相反的相互依赖关系--如果提高输出的查全率,就会降低其查准率,反之亦然。
网上源码有很多,这里找到了一个是Stefan Schroedl写的,跟大家分享一下:
帮助
相关文章推荐
- Precision/Recall和ROC曲线原理以及Matlab源码
- Precision/Recall和ROC曲线原理以及Matlab源码
- 【人工智能】算法--Precision/Recall和ROC曲线原理以及Matlab源码
- 精度(Precision)与召回率(Recall) 以及ROC曲线
- ROC曲线以及评估指标F1-Score, recall, precision-整理版
- ROC曲线原理及其matlab实现源码
- springboot源码分析3-springboot之banner类架构以及原理
- softirq原理以及源码分析
- 网易编程题暗黑字符串原理解析以及Java源码
- LockSupport的源码实现原理以及应用
- jQuery源码分析以及从jQuery对象创建的角度理解extend方法的原理
- 准确率(Precision)、召回率(Recall)以及F值(F-Measure)
- 主成分分析(PCA)原理与故障诊断(SPE、T^2以及结合二者的综合指标)-MATLAB实现
- softirq原理以及源码分析
- wp7 不重启程序之动态换肤实现原理以及源码
- dubbo源码分析(二):超时原理以及应用场景
- ROC曲线和PR(Precision-Recall)曲线的联系
- 调试JDK源码-Hashtable实现原理以及线程安全的原因
- softirq原理以及源码分析
- 多分类问题中每一类的Precision-Recall Curve曲线以及ROC的Matlab画法