机器学习笔记3——朴素贝叶斯算法(分类)
2018-03-26 20:32
731 查看
1、贝叶斯公式
贝叶斯公式众所周知,推到也比较简单,这里直接写出结果p(A|B)=p(A)p(B|A)p(B)其中p(A)称为先验概率,p(A|B)称为后验概率。贝叶斯公式的意义就在于,事件B的发生对事件A的概率产生了影响,影响系数就是p(B|A)p(B)
2、朴素贝叶斯
2.1 训练数据集
训练数据集(x⃗ k,yk),yk∈c1,c2,⋯,cK2.2 模型
输入:x⃗ =(a1,a2,⋯,an)要判断其分类,需要找出使得p(y=ck|x⃗ ) 最大的ck,k=1,2,⋯,K
根据贝叶斯公式可知,p(y=ck|x⃗ )=p(y=ck)p(x⃗ |y=ck)p(x⃗ )
朴素贝叶斯的“朴素”二字的意义在于,假设输入x⃗ i中的各个特征a1,a2,⋯,an都是相互独立的。因此,p(x⃗ |y=ck)=p(a1|y=ck)p(a2|y=ck)⋯p(an|y=ck)贝叶斯公式的求解将变得简单,其中p(x⃗ )可以用全概率公式求解。剩下的问题就是求解p(y=ck)和p(ai|y=ck),常用的方法有极大似然估计和贝叶斯估计。
2.3.1 极大似然估计
假设样本总数为N,那么先验概率p(y=ck)即属于ck的样本数/总样本数Np(y=ck)=∑Ni=1I(yi=ck)N而p(ai|y=ck)即 ck类的样本中ai出现的次数/ck类的样本数
p(ai|y=ck)=∑Ni=1I(yi=ck,xki=ai)∑Ni=1I(yi=ck)
3.实例python实现
相关文章推荐
- 【斯坦福---机器学习】复习笔记之朴素贝叶斯算法
- 王小草【机器学习】笔记--分类算法之朴素贝叶斯
- 机器学习实战笔记-K近邻算法1(分类动作片与爱情片)
- Coursera台大机器学习课程笔记3 – 机器学习的分类和机器学习的可能性
- 【机器学习笔记四】分类算法 - 逻辑回归
- 多类别分类-机器学习(machine learning)笔记(Andrew Ng)
- 台大林轩田机器学习课程笔记2----机器学习的分类
- [台大机器学习笔记整理]机器学习问题与算法的基本分类&由霍夫丁不等式论证机器学习的可行性
- 【机器学习笔记之八】使用朴素贝叶斯进行文本的分类
- [机器学习笔记] 什么是分类,什么是回归?
- 机器学习笔记5——朴素贝叶斯算法
- 机器学习实战 笔记一:kNN分类算法
- [机器学习笔记]二:Classification and logistic regression(分类和逻辑回归)
- 听课笔记(第十一讲): 线性分类模型 (台大机器学习)
- 机器学习笔记1——机器学习算法分类整理
- Coursera台大机器学习基础课程学习笔记2 -- 机器学习的分类
- python机器学习——数据的分类(knn,决策树,贝叶斯)代码笔记
- 程序员的机器学习入门笔记(五):文本分类的入门介绍
- 机器学习实战笔记-利用AdaBoost元算法提高分类性能
- 分类问题-机器学习(machine learning)笔记(Andrew Ng)