分类问题
2015-09-20 20:49
183 查看
分类问题是监督学习中的一个问题。
当输出变量Y取有限个离散值时,预测问题就成为分类问题。此时X可以是离散的也可以是连续的。
分类器是从数据中学习到的一个分类模型或者分类决策函数。可能的输出称为类。
分类问题的两个过程:学习和分类。
分类器的性能指标,准确率:分类器正确分类的样本数比上总样本数。
二分类问题的评价指标:
精确率:(正类预测为正类)/(正类预测为正类+负类预测为正类)
召回率:(正类预测为正类)/(正类预测为正类+正类预测为负类)
分类的应用:
1在银行领域构建客户分类模型,对客户按照贷款风险的大小进行分类。
2利用日志数据的分类对非法入侵进行检测。
3图像领域,利用分类检测图像中是否有人脸出现。
4手写识别,分类识别手写的数字。
5搜索领域,分类用于网页的抓取,排序和索引。
当输出变量Y取有限个离散值时,预测问题就成为分类问题。此时X可以是离散的也可以是连续的。
分类器是从数据中学习到的一个分类模型或者分类决策函数。可能的输出称为类。
分类问题的两个过程:学习和分类。
分类器的性能指标,准确率:分类器正确分类的样本数比上总样本数。
二分类问题的评价指标:
精确率:(正类预测为正类)/(正类预测为正类+负类预测为正类)
召回率:(正类预测为正类)/(正类预测为正类+正类预测为负类)
分类的应用:
1在银行领域构建客户分类模型,对客户按照贷款风险的大小进行分类。
2利用日志数据的分类对非法入侵进行检测。
3图像领域,利用分类检测图像中是否有人脸出现。
4手写识别,分类识别手写的数字。
5搜索领域,分类用于网页的抓取,排序和索引。
相关文章推荐
- 转 java类的装载(Loading)、链接(Linking)和初始化(Initialization)
- Eclipse快捷键大全
- 我所认知的git
- iOS项目开发实战——使用CALayer实现图片的淡入淡出效果
- ORA-00257: archiver error. Connect internal only, until freed 归档日志满处理方法
- MySql 之 join 相关(1)
- 【A了两道题的沈阳赛】2015 ACM/ICPC Asia Regional Shenyang Online
- 如何保证黑盒测试的覆盖率(转)
- eclipse的环境变量的配置
- java__反射、批处理、对象拷贝
- C++ primer 5 笔记3 chapter 3 字符串, 向量和数组
- memcache知识梳理
- 线程池中使用条件变量和信号量的性能比较
- 人际关系
- Android应用——用LayoutTransition在View动态显示和隐藏时候加上动画
- Centos下安装jdk8、tomcat8
- Linux 基础入门(新版)”实验报告一~十二
- DOM 操作方法的简单归纳
- 转 一次完整地http请求
- DNS相关概念