您的位置：首页 > 其它

R语言中描述统计量的多种方法summary()、describe()、str()等

2016-07-11 10:57 525 查看

1. summary()函数可以获取描述性统计量

可以提供最小值、最大值、四分位数和数值型变量的均值，以及因子向量和逻辑型向量的频数统计

2. misc包中的describe()函数

可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数，以及五个最大的值和五个最小的值

3.psych包中的describe()函数

psych包也拥有一个名为describe()的函数，它可以计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误

4.pastecs包中的stat.desc()的函数

可以计算种类繁多的描述性统计量。使用格式为：stat.desc（x,basic=TRUE,desc=TRUE,norm=FALSE,p=0.95）

其中的x是一个数据框或时间序列。若basic=TRUE（默认值），则计算其中所有值、空值、缺失值的数量，以及最小值、最大值、值域，还有总和。若desc=TRUE（同样也是默认值），则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数。最后，若norm=TRUE（不是默认的），则返回正态分布统计量，包括偏度和峰度（以及它们的统计显著程度）和Shapiro–Wilk正态检验结果

5.str()函数

以简洁的方式显示对象的数据结构及内容，可以查看数据框中每个变量的属性

6. attributes()函数

可以提取对象除长度和模式以外的各种属性

##以上是为整体的数据计算描述性统计量，下面关注各组的描述性统计信息

7.aggregate()函数

仅允许在每次调用中使用平均数、标准差这样的单返回值函数，它无法一次返回若干个统计量

8.by()函数

格式为：by(data,INDICES,FUN)，其中data是一个数据框或矩阵，INDICES是一个因子或因子组成的列表，定义了分组，FUN是任意函数。

9.doBy包中的summaryBy()函数

10.psych包中的describe.by()函数

#总结待补充

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： r语言

相关文章推荐

新的分享

章节导航