数据分析(1)--概率论基础
2012-02-06 11:01
190 查看
随机变量的分布及数字特征
1.常见分布
------二项分布------泊松分布
------概率密度函数
若对于随机变量X的分布函数,存在非负函数f(x),使得对于任意实数X有:
其中f(x)称为X的概率密度函数。
------指数分布
---------正态分布,也称作高斯分布
2.随机变量的数字特征
--------数学期望----------方差
----------协方差
----------相关系数
------------期望的性质
E(cX)=cE(X)
------------方差的性质
D(cX)=c^2D(X)
3 随机向量
-------联合分布1.联合分布
X=(X1,X2,....Xp)是p维随机变量,则称
为X的联合分布函数。
----------随机向量X的均值向量
1.随机向量X的均值向量
若E(Xi)=Ui存在,则称
为随机向量X的均值向量
2.随机向量X的协方差阵
若Xi和Xj的协方差Cov(Xi,Xj)存在(i,j=1,2,....p),则称
为随机向量X的协方差阵。
3.随机向量X和Y的协方差阵
若Xi和Yj的协方差Cov(Xi,Yj)存在(i=1,,,p;j=1,....,q),则称
为随机向量X和Y的协方差阵,若
COV(X,Y)=O (其中O表示零矩阵)
则称X与Y不相关。
4.中心极限定理
是概率论中讨论随机变量和的分布以正态分布为极限的一组定理,指出了大量随机变量之和近似服从正态分布的条件。
设随机变量X1, X2,...,Xn独立同分布, 且具有有限的数学期望和方差E(Xi)
= µ,D(Xi) = σ² ≠ 0 (i=1,2,...n)。记
,
,则
其中Φ(z)是标准正态分布的分布函数。
5.大数定律
指数量越多,则其结果就越趋近正态分布,发生误差的机率与数值也会越小。
人们发现,在一个随机事件中,随着试验次数的增加,事件发生的频率趋于一个稳定值;人们同时也发现,在对物理量的测量实践中,测定值的算术平均也具有稳定性。
相关文章推荐
- Python 数据分析包:pandas 基础
- 系统运行日志基础数据分析
- 利用 Python 进行数据分析(四)NumPy 基础:ndarray 简单介绍
- Python数据分析之pandas基础
- Python学习笔记(0)——编程0基础数据分析进阶之路
- 《分析服务从入门到精通读书笔记》第一章、数据分析基础(1)
- 数据分析:pandas 基础
- MySQL系列:innodb源码分析之基础数据结构
- 性能测试用户模型(三):基础数据分析、场景数据
- nginx源码分析2———基础数据结构二(链表和双向链表)
- 数据分析复盘——基础之机器学习算法概览
- 数学之路(2)-数据分析-R基础(21)
- 阿里云clouder认证—使用Quick BI 制作企业数据分析报表(基础理论篇)
- APP运营数据分析基础
- 产品经理不得不知的APP数据分析&报表设计基础
- 利用Python数据分析:Numpy基础(三)
- java核心基础--jdk源码分析学习--基本数据类型
- python数据分析系列教程(1) —— 基础数据类型和内置容器
- Python数据分析基础(二)——NumPy基础
- Python 数据分析包:pandas 基础