复习:支持向量机的理论基础—学习算法的实现方法
2010-04-14 10:15
573 查看
上节叙述了算法的构造方法,本节将进行学习算法的实现方法。
上节已经说明,我们使用SRM原则通过同时最小化经验风险和置信范围而最小化理论(2)中的界,也就是通过选择某个合适的结构然后在其中运行ERM原则,有两种途径可以实现这个过程:(1)固定置信范围,最小化经验风险。这看起来跟我们的算法构造过程是一致的,不过需要好的策略能够保证选择合适的结构以固定置信范围;(2)固定经验风险,最小化置信范围 ,这看起来与算法构造过程在直觉上是有点违背的。不过两种方法在一定实际意义上都能最小化理论(2)中的界。
从上面的分析得出,要实现学习算法,第一步要做的是如何表示经验风险和置信范围。对于线性函数集,
决定了它的VC维,如果将函数集进行形式化处理,表示为以下形式:
=1,若
1;
=-1,若
-1。此时
=1/
(
为
的范数),所以
就决定了线性函数集的结构,也就决定了置信范围的大小,而且是与任何分布无关的。现在来考虑经验风险的表示, 我们使用上面形式化的函数集:
=1,若
1;
=-1,若
-1。
对于线性可分问题,因为目标函数为线性函数,经验风险可以为0,这种情况下,我们可以采用固定经验风险(为0),然后最小化置信范围的方法,其实就是在给定条件下(数据集)最小化
的问题。
对于线性不可分问题,使用线性函数来区分两类,经验风险不可能为0,这种情况下,就得寻求经验风险的具体表示。在这种情况下的经验风险可以通过引入一个非负变量来表示,关于其中的具体表示以及这种表示的数学原理在这里由于公式的负责性不予介绍。当有了经验风险的表示后,我们就可以同时最小化它与置信范围,从而完成学习。
接下来的一步就是如何将上述两种情况下的学习过程表示为数学求解问题,这是学习算法走向实用的最关键一步,也是本文最主要的部分——支持向量机的介绍,这一部分将在下节介绍。
上节已经说明,我们使用SRM原则通过同时最小化经验风险和置信范围而最小化理论(2)中的界,也就是通过选择某个合适的结构然后在其中运行ERM原则,有两种途径可以实现这个过程:(1)固定置信范围,最小化经验风险。这看起来跟我们的算法构造过程是一致的,不过需要好的策略能够保证选择合适的结构以固定置信范围;(2)固定经验风险,最小化置信范围 ,这看起来与算法构造过程在直觉上是有点违背的。不过两种方法在一定实际意义上都能最小化理论(2)中的界。
从上面的分析得出,要实现学习算法,第一步要做的是如何表示经验风险和置信范围。对于线性函数集,
决定了它的VC维,如果将函数集进行形式化处理,表示为以下形式:
=1,若
1;
=-1,若
-1。此时
=1/
(
为
的范数),所以
就决定了线性函数集的结构,也就决定了置信范围的大小,而且是与任何分布无关的。现在来考虑经验风险的表示, 我们使用上面形式化的函数集:
=1,若
1;
=-1,若
-1。
对于线性可分问题,因为目标函数为线性函数,经验风险可以为0,这种情况下,我们可以采用固定经验风险(为0),然后最小化置信范围的方法,其实就是在给定条件下(数据集)最小化
的问题。
对于线性不可分问题,使用线性函数来区分两类,经验风险不可能为0,这种情况下,就得寻求经验风险的具体表示。在这种情况下的经验风险可以通过引入一个非负变量来表示,关于其中的具体表示以及这种表示的数学原理在这里由于公式的负责性不予介绍。当有了经验风险的表示后,我们就可以同时最小化它与置信范围,从而完成学习。
接下来的一步就是如何将上述两种情况下的学习过程表示为数学求解问题,这是学习算法走向实用的最关键一步,也是本文最主要的部分——支持向量机的介绍,这一部分将在下节介绍。
相关文章推荐
- 复习:支持向量机的理论基础-学习算法的构造
- 深度学习基础模型算法原理及编程实现--04.改进神经网络的方法
- [置顶] 《机器学习实战》学习笔记(五)之支持向量机(上)基础理论及算法推导
- PCA算法学习_2(PCA理论的matlab实现)
- 强化学习之最基础篇(算法实现及基础案例学习)
- 算法学习四:算法性能分析理论基础——函数增长与渐进分析
- 深度学习基础模型算法原理及编程实现--02.线性单元
- 机器学习&深度学习基础(tensorflow版本实现的算法概述0)
- 复习:支持向量机的理论基础-统计学习理论
- PCA算法学习_2(PCA理论的matlab实现)
- 基础算法学习之排序篇(js实现)
- Js基础学习之-- 利用GET方法实现ajax请求
- 深度学习基础模型算法原理及编程实现--06.循环神经网络
- PCA算法学习_2(PCA理论的matlab实现)
- 深度学习基础模型算法原理及编程实现--05.卷积神经网络
- Java虚拟机垃圾回收(一) 基础:回收哪些内存/对象 引用计数算法 可达性分析算法 finalize()方法 HotSpot实现分析
- .Net学习笔记----2015-07-22(C#基础复习09,虚方法、抽象方法、接口复习)
- 算法学习-二叉树节点和两种实现方法,递归非递归
- 基于OpenCV的 SVM算法实现数字识别(一)---理论基础
- 加密和解密基础知识、linux上的私有CA实现方法、学习总结