您的位置：首页 > 其它

林轩田之机器学习课程笔记（why can machines learn之theory of generalization）（32之6）

2017-12-24 09:25 555 查看

概要

断点的限制

简单条件下的边界函数

一般情况下的边界函数

简单证明
第一步

第二步

第三步

欢迎转载，可以关注博客：http://blog.csdn.net/cqy_chen

概要

本节主要讲解机器学习的一般化理论。上节中讲到由于在很多的假设空间中，M会变得越来越大，就会导致机器学习无法工作，我们就想通过一个小的m来替代，提出增长函数。那么本节在上节的基础上展开。

断点的限制

上节中我们知道了集中简单的情况下的成长函数：

这里再加入一个概念，shatter （粉碎），就是当我们的假设空间可以完全的拆分资料的时候，称之为shatter。比如在二维的PLA中，由于断点是4，在3个资料点的时候，假设空间是可以shatter这些资料的。但是当有4个点的时候，就不能shatter了。

举一个简单例子，这里我们定义任意两个点不能被shatter。就会说断点为2，如果出现如下三个点，那么它的假设空间有多大呢？

当我们设定资料量的个数，同时设定断点为2。

那么有如下结论：

N=1的时候，假设空间只有两种类型。

N=2的时候，假设空间只有3种，因为任意两个点不能被shatter。

N=3的时候，假设空间只有4种。

所以我们可以看如果存在断点，好像就限制了假设空间的成长函数。这里来猜想下，假设空间的大小 mH(N)≤poly(N)

就是假设空间的成长函数应该是一个多项式的，而不是指数的，这样就可以证明机器学习是可行的了。

简单条件下的边界函数

这里定义一个概念，边界函数，如B(N,K): 当断点为k的时候，假设空间的最大值，mH(N) 。这样就不用去关注一些问题的细节，比如2D 的pla。我们只集中精力去关注这个边界函数。

如下举个简单例子：

当N=2，k=2的时候，我们证明了假设空间最多只有3种，当N=3，k=2，假设空间最多只有4种。

当K=1的时候，那么B(N,k)=1.以为1个点都没法shatter。

如果k>N，就是N还不够塞牙缝的，那肯定是2k种，

当K=N的时候，由于k个点不能被shatter，最大是2k−1种。

所以我们得到如下图所示：