您的位置：首页 > 其它

分类算法----线性可分支持向量机（SVM）算法的原理推导

2017-06-05 16:51 423 查看

支持向量机（support vector machines, SVM）是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器，

其目标是在特征空间中找到一个分离超平面，能将实例分到不同的类，分离超平面将特征空间划分为两部分，正类和负类，法向量

指向的为正类，

1.几何间隔和函数间隔

如下图，有红色和绿色两类，假设红色为正，绿色为负类，数据集线性可分，这是有许多直线将两类数据正确分开，线性可分支持向量机

对应着将两类数据正确划分并且间隔最大的直线

函数间隔

对于给定的训练数据集T和超平面（w,b）定义函数间隔为

函数间隔可以表示分类预测的正确性及确信度，但是选择分离超平面时只有函数间隔是不够的，

因为只要成比例的改变w和b，超平面并没有改变，但是函数间隔却相应改变，因此需要对分离超平面进行约束，

使得间隔是确定的，这时函数间隔就变成几何间隔。

则定义超平面（w,b）关于训练数据T的几何间隔为超平面（w,b）关于T中所有样本点(xi,yi）的几何间隔之最小值，即

由上面式子可得函数间隔和几何间隔存在如下关系式

对于线性可分支持向量机，线性可分分离超平面有无穷多个，但集合间隔最大的分离超超平面是唯一的

到此线性可分支持向量机基本推到完毕，总计其过程如下

（1）构造并求解约束最优化问题

（2）计算w*和b*

（3）求得分离超平面和分离决策函数

后续线性支持向量机和线性不可分支持向量机以及SMO算法

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 数据挖掘算法 SVM 支持向量机

相关文章推荐

新的分享

章节导航