MATLAB数据统计和分析:常用统计量和随机数生成
常用统计量和随机数生成
常用统计量
1. 平均值
1. mean(X) 2. mean(A) 3. mean(A,dim)
- X 为向量,返回 X 中各元素平均值
- A 为矩阵,返回 A 中各列元素的平均值所构成的向量
- 在给出的维度内的中位数
2. 中位数
1. median(X) 2. median(A 3. median(A,dim)
- X 为向量,返回 X 中各元素中位数
- A 为矩阵,返回 A 中各列元素的中位数所构成的向量
- 求给出的维度内的中位数
3. 标准差、方差和极差
1. D = var(X) 2. D = var(A 3. D = var(X,1) 4. D = var(X,w)
- 若 X 为向量,则返回向量的样本方差。
- 若 A 为矩阵,则返回 A 的列向量的样本方差构成的行向量。
- 返回向量 X 的简单方差。
- 返回向量 X 的以 w 为权重的方差。
1. std(X) 2. std(x,1) 3. std(x,flag,dim)
- 返回向量 X 的样本标准差。
- 返回向量的标准差。
- 返回向量中维数为 dimdimdim 的标准差值,其中 flag=0flag = 0flag=0 时置前因子为 1/(n−1)1/(n-1)1/(n−1); 否则置前因子为 1/n1/n1/n.
4. 偏度和峰度
偏度:
g1=1s3∑i=1n(Xi−X‾)3g_{1} = \frac{1}{s^{3}}\sum^{n}_{i = 1}(X_{i} - \overline{X})^{3}g1=s31i=1∑n(Xi−X)3
峰度:
g2=1s4∑i=1n(Xi−X‾)4g_{2} = \frac{1}{s^{4}}\sum^{n}_{i = 1}(X_{i} - \overline{X})^{4}g2=s41i=1∑n(Xi−X)4
偏度是反映数据对称性的量。g1>0g_{1}>0g1>0 称为 右偏态 ,此时数据位于均值右边的比位于左边的多;g1<0g_{1}<0g1<0 称为 左偏态 ,所反映的情况相反。 g1g_{1}g1 接近于 000 ,则可认为数据是对称的.
峰度是反映数据分布形状的量:正态分布的峰度为 333 ,若 g2g_{2}g2 比 333 大很多,表示样本中有较多远离均值的数据,分布有沉重的尾巴。因此,峰度可用于衡量偏离正态分布的尺度.
峰度-偏度检验又称为 Jarque−BeraJarque-BeraJarque−Bera 检验,该检验基于数据样本的偏度和峰度,评价给定数据是否服从未知均值和方差的正态分布的假设。对于正态分布数据,样本偏度接近于 000 ,样本峰度接近于 333.
在 MATLABMATLABMATLAB 中,我们使用 jbtestjbtestjbtest 函数进行 Jarque−BeraJarque-BeraJarque−Bera 检验,测试数据对正态分布的似合程度:
1. h = jbtest(X) 2. h = jbtest(X,alpha) 3. [H,P,JBSTAT,CV] = jbtest(X,alpha)
- 对输入数据向量 X 进行 Jarque−BeraJarque-BeraJarque−Bera 检验,返回检验结果 hhh. 若 h=1h = 1h=1,则在显著性水平 0.050.050.05 下拒绝 XXX 服从正态分布的假设,若 h=0h = 0h=0,则可认为 XXX 服从正态分布。
- 在显著性水平 alphaalphaalpha 下进行 Jarque−BeraJarque-BeraJarque−Bera 检验。
- 函数同时返回三个其他输出: PPP 为检验的 ppp 值,JBSTATJBSTATJBSTAT 为检验统计量,CVCVCV 为确定是否拒绝零假设的临界值。
随机数
下面介绍几种常用的随机数生成方法:
1 二项分布随机数
在概率论和统计学中,二项分布指 nnn 个独立的是/非试验中成功的次数的离散概率分布,其中没次试验成功的概率为 ppp. 这样的单次成功/失败试验又称为 BernoulliBernoulliBernoulli 试验。
在 MATLABMATLABMATLAB 中,我们使用 binorndbinorndbinornd 函数产生二项分布随机数:
1. R = binornd(N,P) 2. R = binornd(N,P,m) 3. R =binornd(N,P,m,n)
- N,PN,PN,P 为二项分布的两个参数,返回服从参数为 N,PN,PN,P 的二项分布的随机数,且 N,P,RN,P,RN,P,R 的形式相同。
- mmm 是一个 1x21x21x2 向量,它为指定随机数的个数。其中 N,PN,PN,P 分别代表返回值 RRR 中行与列的维数。
- m,nm,nm,n 分别表示 RRR 的行数和列数。
2 PoissonPoissonPoisson 分布随机数
PoissonPoissonPoisson 分布表达式为:
f(x∣λ)=λxx!e−λ, x=0,1,⋯ ,∞.f(x|\lambda) = \frac{\lambda^{x}}{x!}e^{-\lambda}, \ \ \ x = 0,1,\cdots, \infty.f(x∣λ)=x!λxe−λ, x=0,1,⋯,∞.
在 MATLABMATLABMATLAB 中,我们使用 poisspdfpoisspdfpoisspdf 函数获取 PoissonPoissonPoisson 分布随机数:
y = poisspdf(x,Labmda)
求取参数为 LambdaLambdaLambda 的 PoissonPoissonPoisson 分布的概率密度函数值。
3 均匀分布随机数
在 MATLABMATLABMATLAB 中,我们使用 unifrndunifrndunifrnd 函数获取均匀分布随机数:
1. R = unifrnd(A,B) 2. R = unifrnd(A,B,m,n,……)
- 生成被 AAA 和 BBB 指定上下端点 [A,B][A,B][A,B] 的连续均匀分布的随机数组 RRR .若 A,BA,BA,B 是数组,R(i,j)R(i,j)R(i,j) 是生成的被 A,BA,BA,B 对应元素指定连续均匀分布的随机数。若 NNN 和 PPP 是标量,则被扩展为和另一个输入有相同维度的数组。
- 返回 m∗n∗⋯m * n*\cdotsm∗n∗⋯ 数组。若 AAA 和 BBB 是标量, RRR 中所有元素是相同分布产生的随机数。若 AAA 和 BBB 是数组,则必须是 m∗n∗⋯m * n * \cdotsm∗n∗⋯ 数组。
4 正态分布随机数
MATLABMATLABMATLAB 中提供正态分布函数 normrndnormrndnormrnd:
1. R = normrnd(mu,sigma) 2. R = normrnd(mu,sigma,m,n,……)
- 返回均值为 mumumu ,标准差为 sigmasigmasigma 的正态分布的随机数据,RRR 可以是向量或矩阵。
- m,nm,nm,n 分别表示 RRR 的行数和列数。
- 点赞
- 收藏
- 分享
- 文章举报
- MATLAB 多元数据统计分析
- 数据统计分析常用指标
- java生成随机数的常用方法分析
- MATLAB数据统计和分析:绘制统计图表
- 数据统计分析——常用统计检验方法
- 数据统计分析时常用sql语句 (split , row_number , group by, max 等 )
- MATLAB数据统计和分析:参数估计和假设检验
- (六篇长图带你数据特征分析入门)数据分析入门_PART4统计基础_CH03数据常用统计指标
- 数据统计分析常用指标
- 常用的数据统计分析软件
- 使用mex C生成MATLAB的股票数据分析接口
- 使用mex C生成MATLAB的股票数据分析接口
- 7057-2.Python数据分析:统计与图表生成
- 使用mex C生成MATLAB的股票数据分析接口
- 毕设 - A股常用指标生成+财务数据分析与研究
- JQuery EasyUI 根据数据动态生成datagrid,统计常用
- R语言 | 数据挖掘中的常用统计分析知识
- JQuery EasyUI 根据数据动态生成datagrid,统计常用
- Python数据分析实战基础 | 清洗常用4板斧
- Python数据分析:手把手教你用Pandas生成可视化图表的教程