您的位置:首页 > 编程语言 > Python开发

机器学习之-支持向量机-具体怎么实现及应用

2017-03-14 17:05 549 查看
1、支持向量机的优缺点及适用数据类型:

优点:泛化错误率低,计算开销不大,结果易于解释。

缺点:对参数调节和核函数的选择敏感,原始分类器不加修改仅适用于处理二类问题。

适用数据类型:数值型和标称型数据。

2、为什么叫做超平面?这是个让人尴尬的问题!!!!

如果数据点都在二维平面上,那么分隔超平面就是一条直线,如果所给的数据点集是三维的,那么分隔数据的就是一个平面,更高维的以此类推,如果数据集是1024维的,那么需要一个1023维的某某对象来对数据进行分隔,而这个1023维的某某对象被称为超平面。

3、SVM的一般流程:

收集数据:可以使用任意方法。

准备数据:需要数值型数据。

分析数据:有助于可视化分隔超平面

训练算法:SVM的大部分时间都源自训练,该过程主要实现两个参数的调优。

测试算法:十分简单的计算过程就可以实现。

使用算法:几乎所有分类问题都可以使用SVM,值得一提的是,SVM本身是一个二类分类器,对多类问题应用SVM需要对代码做一些修改。

4、基于SVM的数字识别:

a)收集数据:提供的文本文件。

b)准备数据:基于二值图像构造向量。

c)分析数据:对图像向量进行目测。

d)训练算法:采用两种不同的核函数,并对径向基核函数采用不同的设置来运行SMO算法。

e)测试算法:编写一个函数来测试不同的核函数并计算错误率。

f)使用算法。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python ml svm 应用