您的位置：首页 > 其它

干货|机器学习零基础？不要怕，吴恩达课程笔记第三周！逻辑回归与正则

2018-02-19 00:00 405 查看

吴恩达Coursera机器学习课系列笔记课程笔记|吴恩达Coursera机器学习 Week1 笔记-机器学习基础
干货|机器学习零基础？不要怕，吴恩达机器学习课程笔记2-多元线性回归

1Logistic Regression

1.1 Logistic Regression (Classification) Model

之前对房价的预测，其预测结果是一个连续变量，属于回归模型（Linear regression）。接下来要讲的是分类模型（Logistic regression），即其预测结果是一个离散变量，有固定的取值分布。分类问题，又分成了“二分类”和“多分类”，先讲简单的“二分类”。例子：判断一个病人是否罹患癌症。一个二分类问题，是或者否。

sigmoid函数形状如下：

现在可以用这个[0，1]之间的值来表示罹患癌症的概率了，设定一个阈值(threshold)，如果h(x)>threshold，则罹患癌症，反之。
注意：这里的sigmoid只是起到了映射到(0, 1)范围的作用。逻辑回归的边界依然是： θ^(T)x==threshold从这个边界中看到，这样的逻辑回归是一个线性分类器。
用等高线图画出来就是这样的：

三维图是这样的：

画图的代码如下：% Here is the grid range
u = linspace(30, 100, 100);
v = linspace(30, 100, 100);

z = zeros(length(u), length(v));
% Evaluate z = theta*x over the grid
for i = 1:length(u)
for j = 1:length(v)
t = [1, u(i), v(j)];
z(i,j) = sigmoid(t * theta);
end
end
z = z'; % important to transpose z before calling contour
% Plot z = 0
% Notice you need to specify the range [0, 0]
contour(u, v, z, [0.5, 0.5], 'LineWidth', 2)
xlabel('Exam 1 score')
ylabel('Exam 2 score')
hold off;

figure;
surf(u, v, z)接下来就是loss function的设置了。在logistic regression中，不再使用平方差来表示error了，转而使用negative log来表示error：