您的位置:首页 > 编程语言 > MATLAB

MATLAB数据统计和分析:常用统计量和随机数生成

2020-02-05 12:43 417 查看

常用统计量和随机数生成


常用统计量

1. 平均值

1.  mean(X)
2. mean(A)
3. mean(A,dim)
  1. X 为向量,返回 X 中各元素平均值
  2. A 为矩阵,返回 A 中各列元素的平均值所构成的向量
  3. 在给出的维度内的中位数

2. 中位数

1.  median(X)
2. median(A
3. median(A,dim)
  1. X 为向量,返回 X 中各元素中位数
  2. A 为矩阵,返回 A 中各列元素的中位数所构成的向量
  3. 求给出的维度内的中位数

3. 标准差、方差和极差

1. D = var(X)
2. D = var(A
3. D = var(X,1)
4. D = var(X,w)
  1. 若 X 为向量,则返回向量的样本方差。
  2. 若 A 为矩阵,则返回 A 的列向量的样本方差构成的行向量。
  3. 返回向量 X 的简单方差。
  4. 返回向量 X 的以 w 为权重的方差。
1. std(X)
2. std(x,1)
3. std(x,flag,dim)
  1. 返回向量 X 的样本标准差。
  2. 返回向量的标准差。
  3. 返回向量中维数为 dimdimdim 的标准差值,其中 flag=0flag = 0flag=0 时置前因子为 1/(n−1)1/(n-1)1/(n−1); 否则置前因子为 1/n1/n1/n.

4. 偏度和峰度

偏度:
g1=1s3∑i=1n(Xi−X‾)3g_{1} = \frac{1}{s^{3}}\sum^{n}_{i = 1}(X_{i} - \overline{X})^{3}g1​=s31​i=1∑n​(Xi​−X)3

峰度:
g2=1s4∑i=1n(Xi−X‾)4g_{2} = \frac{1}{s^{4}}\sum^{n}_{i = 1}(X_{i} - \overline{X})^{4}g2​=s41​i=1∑n​(Xi​−X)4

偏度是反映数据对称性的量。g1>0g_{1}>0g1​>0 称为 右偏态 ,此时数据位于均值右边的比位于左边的多;g1<0g_{1}<0g1​<0 称为 左偏态 ,所反映的情况相反。 g1g_{1}g1​ 接近于 000 ,则可认为数据是对称的.

峰度是反映数据分布形状的量:正态分布的峰度为 333 ,若 g2g_{2}g2​ 比 333 大很多,表示样本中有较多远离均值的数据,分布有沉重的尾巴。因此,峰度可用于衡量偏离正态分布的尺度.

峰度-偏度检验又称为 Jarque−BeraJarque-BeraJarque−Bera 检验,该检验基于数据样本的偏度和峰度,评价给定数据是否服从未知均值和方差的正态分布的假设。对于正态分布数据,样本偏度接近于 000 ,样本峰度接近于 333.


在 MATLABMATLABMATLAB 中,我们使用 jbtestjbtestjbtest 函数进行 Jarque−BeraJarque-BeraJarque−Bera 检验,测试数据对正态分布的似合程度:

1. h = jbtest(X)
2. h = jbtest(X,alpha)
3. [H,P,JBSTAT,CV] = jbtest(X,alpha)
  1. 对输入数据向量 X 进行 Jarque−BeraJarque-BeraJarque−Bera 检验,返回检验结果 hhh. 若 h=1h = 1h=1,则在显著性水平 0.050.050.05 下拒绝 XXX 服从正态分布的假设,若 h=0h = 0h=0,则可认为 XXX 服从正态分布。
  2. 在显著性水平 alphaalphaalpha 下进行 Jarque−BeraJarque-BeraJarque−Bera 检验。
  3. 函数同时返回三个其他输出: PPP 为检验的 ppp 值,JBSTATJBSTATJBSTAT 为检验统计量,CVCVCV 为确定是否拒绝零假设的临界值。

随机数

下面介绍几种常用的随机数生成方法:

1 二项分布随机数

在概率论和统计学中,二项分布指 nnn 个独立的是/非试验中成功的次数的离散概率分布,其中没次试验成功的概率为 ppp. 这样的单次成功/失败试验又称为 BernoulliBernoulliBernoulli 试验。

在 MATLABMATLABMATLAB 中,我们使用 binorndbinorndbinornd 函数产生二项分布随机数:

1. R = binornd(N,P)
2. R = binornd(N,P,m)
3. R  =binornd(N,P,m,n)
  1. N,PN,PN,P 为二项分布的两个参数,返回服从参数为 N,PN,PN,P 的二项分布的随机数,且 N,P,RN,P,RN,P,R 的形式相同。
  2. mmm 是一个 1x21x21x2 向量,它为指定随机数的个数。其中 N,PN,PN,P 分别代表返回值 RRR 中行与列的维数。
  3. m,nm,nm,n 分别表示 RRR 的行数和列数。

2 PoissonPoissonPoisson 分布随机数

PoissonPoissonPoisson 分布表达式为:
f(x∣λ)=λxx!e−λ,   x=0,1,⋯ ,∞.f(x|\lambda) = \frac{\lambda^{x}}{x!}e^{-\lambda}, \ \ \ x = 0,1,\cdots, \infty.f(x∣λ)=x!λx​e−λ,   x=0,1,⋯,∞.

在 MATLABMATLABMATLAB 中,我们使用 poisspdfpoisspdfpoisspdf 函数获取 PoissonPoissonPoisson 分布随机数:

y = poisspdf(x,Labmda)

求取参数为 LambdaLambdaLambda 的 PoissonPoissonPoisson 分布的概率密度函数值。


3 均匀分布随机数

在 MATLABMATLABMATLAB 中,我们使用 unifrndunifrndunifrnd 函数获取均匀分布随机数:

1. R = unifrnd(A,B)
2. R = unifrnd(A,B,m,n,……)
  1. 生成被 AAA 和 BBB 指定上下端点 [A,B][A,B][A,B] 的连续均匀分布的随机数组 RRR .若 A,BA,BA,B 是数组,R(i,j)R(i,j)R(i,j) 是生成的被 A,BA,BA,B 对应元素指定连续均匀分布的随机数。若 NNN 和 PPP 是标量,则被扩展为和另一个输入有相同维度的数组。
  2. 返回 m∗n∗⋯m * n*\cdotsm∗n∗⋯ 数组。若 AAA 和 BBB 是标量, RRR 中所有元素是相同分布产生的随机数。若 AAA 和 BBB 是数组,则必须是 m∗n∗⋯m * n * \cdotsm∗n∗⋯ 数组。

4 正态分布随机数

MATLABMATLABMATLAB 中提供正态分布函数 normrndnormrndnormrnd:

1. R = normrnd(mu,sigma)
2. R = normrnd(mu,sigma,m,n,……)
  1. 返回均值为 mumumu ,标准差为 sigmasigmasigma 的正态分布的随机数据,RRR 可以是向量或矩阵。
  2. m,nm,nm,n 分别表示 RRR 的行数和列数。

  • 点赞
  • 收藏
  • 分享
  • 文章举报
齐次线性方程组 发布了28 篇原创文章 · 获赞 10 · 访问量 5603 私信 关注
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: