您的位置：首页 > 其它

机器学习入门——单变量线性回归

2014-05-09 21:01 381 查看

线性回归的概念，在高中数学书里就出现过。

给你一些样本点，如何找出一条直线，使得最逼近这些样本点。

给出一个例子：假设 x 是房子面积，y是房子价格，确定一条直线需要theta0和theta1.

给出x,我们就可以计算出房子的价格 h(x) = theta0+theta1*x

关键是如何计算出theta0和theta1,也就是如何找出这么一条直线呢？

在这里，引入一个概念，叫做cost function.m表示样本个数，也就是训练样本数目

这是一个square error，学过统计的应该经常见到

因此，我们的目的i就变成如何最小化这个J，意味着这条直线最逼近我们的样本点

先简化一下问题，假设theta0 = 0,那么我们的目标就是最小化J(theta1)

假设目前有3个样本点（1,1）(2,2) (3,3)

J(0) = 1/(2*3)*((1-0)^2+(2-0)^2+(3-0)^2)

当theta1取不同的值时，J(theta1)就形成了一个二次函数，当theta1 = 1是极小值也是最小值。

问题回到2元函数theta0,theta1

容易想像，这肯定是一个平面函数了