深度学习:感知机perceptron
2017-04-22 20:58
246 查看
http://blog.csdn.net/pipisorry/article/details/70477057
感知机是二分类的线性分类模型,输入是特征向量,输出是类别,取值+1,-1。
感知机学习旨在求出将训练数据进行线性划分的分离超平面wx + b = 0,其中w是超平面的法向量,b是超平面的截距。
感知机模型
1.分离超平面将样本点分成两部分,位于法向量w所指向的一面是正样本,另一面则是负样本;
2.由输入空间到输出空间的模型函数如下:
策略
1.特征空间中任意一个样本点x0到分离超平面的距离可以记为:
2.感知机的模型策略是最小化误分类样本点到分离超平面的总距离(引入yi是为了消除距离公式中的绝对值,方便后续优化算法):
不考虑||w||的影响,最终的损失函数可以记为:
(四)算法
1.感知机算法的最优化问题如下:
采用的最优化方法是随机梯度下降法(stochastic gradient descent,SGD);
PS:
2.算法过程:
(1)选取初值w0,b0;
(2)在训练样本中随机选取数据(xi,yi);
(3)如果样本点(xi,yi)属于误分类点,也就是满足:
那么对w,b进行更新:
其中
是步长,也称为学习率;
(4)转至(2),直至训练集中没有误分类点;
PS:(1)感知机学习算法由于采用不同的初值或选取不同的误分类点,解可以不同,也就是求出的分离超平面不止一种;
(2)感知机学习算法适用于线性可分数据集,当训练数据集线性不可分时,感知机学习算法不收敛;
from: http://blog.csdn.net/pipisorry/article/details/70477057
ref:
感知机是二分类的线性分类模型,输入是特征向量,输出是类别,取值+1,-1。
感知机学习旨在求出将训练数据进行线性划分的分离超平面wx + b = 0,其中w是超平面的法向量,b是超平面的截距。
感知机模型
1.分离超平面将样本点分成两部分,位于法向量w所指向的一面是正样本,另一面则是负样本;
2.由输入空间到输出空间的模型函数如下:
策略
1.特征空间中任意一个样本点x0到分离超平面的距离可以记为:
2.感知机的模型策略是最小化误分类样本点到分离超平面的总距离(引入yi是为了消除距离公式中的绝对值,方便后续优化算法):
不考虑||w||的影响,最终的损失函数可以记为:
(四)算法
1.感知机算法的最优化问题如下:
采用的最优化方法是随机梯度下降法(stochastic gradient descent,SGD);
PS:
2.算法过程:
(1)选取初值w0,b0;
(2)在训练样本中随机选取数据(xi,yi);
(3)如果样本点(xi,yi)属于误分类点,也就是满足:
那么对w,b进行更新:
其中
是步长,也称为学习率;
(4)转至(2),直至训练集中没有误分类点;
PS:(1)感知机学习算法由于采用不同的初值或选取不同的误分类点,解可以不同,也就是求出的分离超平面不止一种;
(2)感知机学习算法适用于线性可分数据集,当训练数据集线性不可分时,感知机学习算法不收敛;
from: http://blog.csdn.net/pipisorry/article/details/70477057
ref:
相关文章推荐
- 【深度学习笔记】多层感知机,非权值共享型卷积神经网络,权值共享型卷积神经网络之间的关系
- 深度学习概述:从感知机到深度网络
- 从感知机到深度神经网络,带你入坑深度学习
- 干货丨从感知机到深度神经网络,带你入坑深度学习
- 深度学习概述:从感知机到深度网络
- 深度学习概述:从感知机到深度网络
- 深度学习概述:从感知机到深度网络
- 深度学习概述:从感知机到深度网络
- 利用Theano理解深度学习——Multilayer Perceptron
- 深度学习概述:从感知机到深度网络
- 【转载】深度学习概述:从感知机到深度网络
- 深度学习概述:从感知机到深度网络 (英文版)
- 深度学习基础模型算法原理及编程实现--01.感知机
- 深度学习Deeplearning4j 入门实战(5):基于多层感知机的Mnist压缩以及在Spark实现
- 【1】深度学习之饮水思源:从感知机到深度网络
- 神经网络和深度学习简史(第一部分):从感知机到BP算法
- 深度学习:多层感知机MLP数字识别的代码实现
- 深度学习概述:从感知机到深度网络
- Digression:The perceptron learning algorithm(感知机学习算法)
- 深度学习入门之从感知机开始