您的位置：首页 > 其它

Stanford Online Machine Learning 学习笔记1——单变量线性回归

2012-12-30 13:56 337 查看

TomMitchell 对机器学习的定义是：Acomputer program is said to learn from experience E, with respect to some taskT, and some performance measure P, if its performance on T, as measuredby P, improves with experience E. 很押韵，诗情画意。简单说就是指程序可以从经验E中学习，让任务T的性能提高，性能通过P来度量。

机器学习分为监督学习（Supervised learning）、无监督学习（Unsupervised learning），以及增强学习（Reinforcement learning）和推荐系统（Recommender system）。监督学习是指在训练的时候就知道正确结果，比如教小孩子给水果分类，先给他一个苹果，然后告诉他，这是苹果，再给他一个苹果，接着告诉他，这是苹果，经过这样反复的训练学习，如果再给他苹果的时候，问他，这是什么？他应该告诉你，这是苹果。如果给他一个梨，他应该告诉你，这不是苹果。监督学习分为两类：回归（Regression）和分类（Classification），如果机器学习算法的输出值是连续值，则属于回归问题，如果是离散值，则属于分类问题。和监督学习不同，无监督学习在训练的时候并不知道正确结果，继续上面的例子，给小孩子一堆水果，比如有苹果、橘子、梨三种，小孩子一开始不知道这些水果是什么，让小孩子对这堆水果进行分类。等小孩子分类完后，给他一个苹果，他应该他这个苹果放到刚刚分好的苹果堆中去。无监督学习常用的方法是聚类（Clustering）。增强学习是在机器学习算法程序运行的过程中，我们对他的行为作出评价，评价有正面和负面两种，通过学习评价程序应该做出更有可能得到好评价的行为。

这次主要讲线性回归中的单变量线性回归，先给几个定义：

m：表示训练集中样本的个数。

x：输入变量，也就是特征，可以有多个，对于单变量线性回归只有一个输入。

y：输出变量，即目标值。

(x, y)：训练样本集。

(x(i), y(i))：第i个训练样本。

线性回归的目标是根据给定的训练样本集合，训练得到一个线性目标函数h，通过这个函数，对其他未知输入可以预测出正确结果，目标函数表示为：