【机器学习数学基础之概率论与统计04】非参数估计
2018-03-07 20:52
411 查看
非参数估计指不知道分布类型,对样本进行模型估计。一般只用在一维和二维。
直方图与初高中所理解的直方图没什么不同,直方图估计就是采用直方图的方式来对数据进行拟合。显然地,"箱子"的宽度1/M能够更准确更细致地展示数据的分布;但如果1/M过小,导致有些箱子里没有数据,这个时候p(x)将会出现较大波动。所以,如何选择M十分关键,通常采用交叉验证的方法确定M。
其中核函数的参数(x-xi)/h即是距离的权重。
在核密度估计中,带宽h比较重要,核函数影响较小。
直方图估计
具体概念详见课件:直方图与初高中所理解的直方图没什么不同,直方图估计就是采用直方图的方式来对数据进行拟合。显然地,"箱子"的宽度1/M能够更准确更细致地展示数据的分布;但如果1/M过小,导致有些箱子里没有数据,这个时候p(x)将会出现较大波动。所以,如何选择M十分关键,通常采用交叉验证的方法确定M。
核密度估计
核密度估计针对直方图的缺点进行了改动。在直方图中,由于在同一个箱子里出现的样本点,它们都是对于以中心点B(xi)形成的宽度为h的区域有相同的贡献。核密度估计是希望对这些点做距离的权重,从而使得分布更加平滑。其中核函数的参数(x-xi)/h即是距离的权重。
常见的核函数
在核密度估计中,带宽h比较重要,核函数影响较小。
相关文章推荐
- 【机器学习数学基础之概率论与统计05】多元随机向量及其分布
- 机器学习数学基础(二)概率论(下)
- 机器学习(一)- 数学基础之统计概率
- 机器学习笔记_数学基础_2-概率论
- 机器学习之数学基础(概率与统计推断、矩阵、凸优化)
- 机器学习之参数估计与矩阵运算基础
- 机器学习数学|概率论基础常见概型分布期望与方差
- 数学篇----参数估计之最大似然估计法[概率论]
- 机器学习基础01-数学分析与概率论
- 机器学习基础(十四)—— 统计计数、majority count 与其数学记号
- 【数理统计基础】 03 - 参数估计
- 机器学习笔记_数学基础_3-数理统计
- 【Scikit-Learn 中文文档】模型选择:选择估计量及其参数 - 关于科学数据处理的统计学习教程 - scikit-learn 教程 | ApacheCN
- 机器学习的数学基础(1)——常见的函数与分布
- 机器学习数学基础之概率论
- (未完待续)概率论之参数估计
- 机器学习需要的数学基础
- 【Scikit-Learn 中文文档】模型选择:选择估计量及其参数 - 关于科学数据处理的统计学习教程 - scikit-learn 教程 | ApacheCN
- 机器学习1.3--机器学习所需要的基础数学知识
- 机器学习基础-概率论知识点