Khan公开课 - 统计学学习笔记:(一)中间值和统计图表
2012-09-06 21:22
507 查看
一、求中间值
对于一堆数的中间值有很多种方法:
1、mean,也就是average,求平均数
2、median,就中位数,将数排序,找出中间的数据,如果是偶数,中间的两个数平均
3、mode,众数。频率出现最多。
4、mid-range。range=maz-min,就是最大值减去最小值,数分布的范围。而mid-rand则是(max+min)/2,就是范围的中间值。
这说明用不同方式求中间值,有不同结果,很可能会出现误导。例如在平均收入上,mean和media就可以有很大的差距。
二、统计图
介绍了不同统计图所适合的场景
1)象形图
2)柱状图;3)线形图;4)饼图;
5)折线图
有时刻度不同会带来错觉,放在同一图中可以避免scale带来的误导。
6)茎叶图
Stem-leaf,stem表示不同的层次,leaf表示层次中的数据。例如一支篮球队球员的得分数,可以更具十位数划分不同的层次,stem中的0,1,2,表示球员的得分个位数的数值,得1x分或者2十几分。leaf,则表示具体的个位数分值。
7)盒须图 Box-and-whisher
这种图我们比较少使用,不会被均值的方式所误导。将数据范围4个Quarter,每个Q的样本数相同,先找出median,例如此图中的21,再找出前一半的median(14),和后一半的meida(33)。我觉得采用这种方式算平均收入才准确,不会因为二八原则,求均得到与实际感觉完全不同的数值。
相关链接:我的四方书库
相关文章推荐
- Khan公开课 - 统计学学习笔记:(十二)逻辑
- Khan公开课 - 统计学学习笔记:(七)伯努利分布、置信区间、t分布、p-value和第一型错误
- Khan公开课 - 统计学学习笔记:(八)样本均值之差
- Khan公开课 - 统计学学习笔记:(十)Chi-square分布
- Khan公开课 - 统计学学习笔记:(十一)平方之和、F统计
- Khan公开课 - 统计学学习笔记:(六)中心极限定理
- Khan公开课 - 统计学学习笔记:(九)线性回归公式,决定系数和协方差
- Khan公开课 - 统计学学习笔记:(二)总本、样本、集中趋势、离中趋势
- Khan公开课 - 统计学学习笔记:(三)随机变量、概率密度、二项分布、期望值
- Khan公开课 - 统计学学习笔记:(四)泊松分布、大数定理
- Khan公开课 - 统计学学习笔记:(五)正态分布
- Khan公开课 - 概率学习笔记(二)无顺序独立事件、数学符号、Bayes's Law、非公平概率计算
- Khan公开课 - 概率学习笔记(一)独立事件、相依事件和排列组合
- 应用统计学与R语言实现学习笔记(八)——方差分析
- 统计学学习笔记
- 公开课学习笔记-[哈佛]计算机科学CS50(六)
- 黑马程序员---移动用户资费统计系统学习笔记
- Hadoop学习笔记—20.网站日志分析项目案例(三)统计分析
- 《机器学习》(Machine Learning)——Andrew Ng 斯坦福大学公开课学习笔记(二)
- 哈佛公开课《Positive Pyschology 1504》学习笔记 -- Change