机器学习之-支持向量机-具体怎么实现及应用
2017-03-14 17:05
549 查看
1、支持向量机的优缺点及适用数据类型:
优点:泛化错误率低,计算开销不大,结果易于解释。
缺点:对参数调节和核函数的选择敏感,原始分类器不加修改仅适用于处理二类问题。
适用数据类型:数值型和标称型数据。
2、为什么叫做超平面?这是个让人尴尬的问题!!!!
如果数据点都在二维平面上,那么分隔超平面就是一条直线,如果所给的数据点集是三维的,那么分隔数据的就是一个平面,更高维的以此类推,如果数据集是1024维的,那么需要一个1023维的某某对象来对数据进行分隔,而这个1023维的某某对象被称为超平面。
3、SVM的一般流程:
收集数据:可以使用任意方法。
准备数据:需要数值型数据。
分析数据:有助于可视化分隔超平面
训练算法:SVM的大部分时间都源自训练,该过程主要实现两个参数的调优。
测试算法:十分简单的计算过程就可以实现。
使用算法:几乎所有分类问题都可以使用SVM,值得一提的是,SVM本身是一个二类分类器,对多类问题应用SVM需要对代码做一些修改。
4、基于SVM的数字识别:
a)收集数据:提供的文本文件。
b)准备数据:基于二值图像构造向量。
c)分析数据:对图像向量进行目测。
d)训练算法:采用两种不同的核函数,并对径向基核函数采用不同的设置来运行SMO算法。
e)测试算法:编写一个函数来测试不同的核函数并计算错误率。
f)使用算法。
优点:泛化错误率低,计算开销不大,结果易于解释。
缺点:对参数调节和核函数的选择敏感,原始分类器不加修改仅适用于处理二类问题。
适用数据类型:数值型和标称型数据。
2、为什么叫做超平面?这是个让人尴尬的问题!!!!
如果数据点都在二维平面上,那么分隔超平面就是一条直线,如果所给的数据点集是三维的,那么分隔数据的就是一个平面,更高维的以此类推,如果数据集是1024维的,那么需要一个1023维的某某对象来对数据进行分隔,而这个1023维的某某对象被称为超平面。
3、SVM的一般流程:
收集数据:可以使用任意方法。
准备数据:需要数值型数据。
分析数据:有助于可视化分隔超平面
训练算法:SVM的大部分时间都源自训练,该过程主要实现两个参数的调优。
测试算法:十分简单的计算过程就可以实现。
使用算法:几乎所有分类问题都可以使用SVM,值得一提的是,SVM本身是一个二类分类器,对多类问题应用SVM需要对代码做一些修改。
4、基于SVM的数字识别:
a)收集数据:提供的文本文件。
b)准备数据:基于二值图像构造向量。
c)分析数据:对图像向量进行目测。
d)训练算法:采用两种不同的核函数,并对径向基核函数采用不同的设置来运行SMO算法。
e)测试算法:编写一个函数来测试不同的核函数并计算错误率。
f)使用算法。
相关文章推荐
- 机器学习之-用k-均值聚类算法对未标注数据分组-具体怎么实现及应用
- 机器学习之-Adaboost元算法-具体怎么实现及应用
- 机器学习之-使用FP-growth算法来高效发现频繁项集-具体怎么实现及应用
- 机器学习之-决策树-具体怎么实现及应用
- 机器学习之-朴素贝叶斯-具体怎么实现及应用
- 机器学习之-预测数值型数据:回归-具体怎么实现及应用
- 机器学习之-使用Apriori算法进行关联并分析-具体怎么实现及应用
- 机器学习之-用k-均值聚类算法对未标注数据分组-具体怎么实现及应用
- 机器学习之-逻辑回归-具体怎么实现及应用
- 机器学习之-回归树-具体怎么实现及应用
- 机器学习之-knn-具体怎么实现与应用
- MySQL数据库接口的VC具体实现与应用
- 具体该怎么来实现呢
- heartbeat2.1.4 实现监控应用服务(httpd)具体步骤
- PF_NETLINK应用实例NETLINK_KOBJECT_UEVENT具体实现--udev实现原理
- PF_NETLINK应用实例NETLINK_KOBJECT_UEVENT具体实现--udev实现原理
- java怎么实现导出excel表(poi包的应用)
- win8怎么固定应用到Metro的开始屏幕具体步骤
- Silverlight企业应用快速开发平台框架设计(二)分析-平台实现重点是什么,要怎么做?
- IAP应用内付费怎么实现?