分类算法----线性可分支持向量机(SVM)算法的原理推导
2017-06-05 16:51
423 查看
支持向量机(support vector machines, SVM)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,
其目标是在特征空间中找到一个分离超平面,能将实例分到不同的类,分离超平面将特征空间划分为两部分,正类和负类,法向量
指向的为正类,
1.几何间隔和函数间隔
如下图,有红色和绿色两类,假设红色为正,绿色为负类,数据集线性可分,这是有许多直线将两类数据正确分开,线性可分支持向量机
对应着将两类数据正确划分并且间隔最大的直线
函数间隔
对于给定的训练数据集T和超平面(w,b)定义函数间隔为
函数间隔可以表示分类预测的正确性及确信度,但是选择分离超平面时只有函数间隔是不够的,
因为只要成比例的改变w和b,超平面并没有改变,但是函数间隔却相应改变,因此需要对分离超平面进行约束,
使得间隔是确定的,这时函数间隔就变成几何间隔。
则定义超平面(w,b)关于训练数据T的几何间隔为超平面(w,b)关于T中所有样本点(xi,yi)的几何间隔之最小值,即
由上面式子可得函数间隔和几何间隔存在如下关系式
到此线性可分支持向量机基本推到完毕,总计其过程如下
(1)构造并求解约束最优化问题
(2)计算w*和b*
(3)求得分离超平面和分离决策函数
后续线性支持向量机和线性不可分支持向量机以及SMO算法
其目标是在特征空间中找到一个分离超平面,能将实例分到不同的类,分离超平面将特征空间划分为两部分,正类和负类,法向量
指向的为正类,
1.几何间隔和函数间隔
如下图,有红色和绿色两类,假设红色为正,绿色为负类,数据集线性可分,这是有许多直线将两类数据正确分开,线性可分支持向量机
对应着将两类数据正确划分并且间隔最大的直线
函数间隔
对于给定的训练数据集T和超平面(w,b)定义函数间隔为
函数间隔可以表示分类预测的正确性及确信度,但是选择分离超平面时只有函数间隔是不够的,
因为只要成比例的改变w和b,超平面并没有改变,但是函数间隔却相应改变,因此需要对分离超平面进行约束,
使得间隔是确定的,这时函数间隔就变成几何间隔。
则定义超平面(w,b)关于训练数据T的几何间隔为超平面(w,b)关于T中所有样本点(xi,yi)的几何间隔之最小值,即
由上面式子可得函数间隔和几何间隔存在如下关系式
2.间隔最大化
对于线性可分支持向量机,线性可分分离超平面有无穷多个,但集合间隔最大的分离超超平面是唯一的1.最大间隔分离超平面
2 拉格朗日对偶算法解最优化问题
到此线性可分支持向量机基本推到完毕,总计其过程如下
(1)构造并求解约束最优化问题
(2)计算w*和b*
(3)求得分离超平面和分离决策函数
后续线性支持向量机和线性不可分支持向量机以及SMO算法
相关文章推荐
- 分类算法3----线性判别分析(LDA)原理和推导过程
- 分类算法 之 支持向量机--原理+案例+代码
- 数据挖掘---分类算法之支持向量机SVM
- 分类算法-支持向量机(SVM)
- 支持向量机SVM原理详解+白板推导
- [分类算法] :SVM支持向量机
- 使用支持向量机(SVM) 算法进行分类
- 【机器学习】支持向量机SVM原理及推导
- 支持向量机SVM 原理、推导与Matlab实现
- 支持向量机SVM 原理、推导与Matlab实现(2)-对偶问题
- 支持向量机SVM算法原理笔记2
- SVM支持向量机原理(三)线性不可分支持向量机与核函数
- 支持向量机SVM算法原理笔记1
- 支持向量机 SVM 算法推导优缺点 代码实现 in Python
- 数据挖掘---分类算法之支持向量机SVM
- 分类算法SVM(支持向量机)
- SVM(支持向量机)算法原理和实际应用
- 2.1 线性回归算法学习——简单线性回归算法的原理及推导过程
- 从零开始学习SVM(四)---SMO算法线性分类与代码精解析
- SVM(支持向量机)分类算法