您的位置:首页 > 移动开发

R语言--tapply,sapply(因子和列表的操作)

2015-12-15 00:15 162 查看
最近参加了一个小比赛,其中的tapply,sapply(lapply)函数可以快速实现我的目的和有效减少代码量

f说明
tapply(x,f,g)x为向量,f为因子列,g为操作函数,相对数据框进行类似操作可以用by函数
sapply(list,g)g为操作函数,返还结果为向量,而lapply返还结果为list形式。常与split结合使用

example

数据为980路公交车不同站点上车人数统计

线路名称车牌号到达站点上车人数开始上车时间结束上车时间
980粤BM847514112014-06-09 07:082014-06-09 07:13
980粤BM84751332014-06-09 07:142014-06-09 07:15
980粤BM847512102014-06-09 07:172014-06-09 07:17
980粤BM84751052014-06-09 07:202014-06-09 07:20
980粤BM8475812014-06-09 07:222014-06-09 07:22
统计不同站点的上车人数

(Freq <- tapply(data[,4], data[,3], sum))
1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16
120 257 325 164 174 186 205  80 118 267 259 130  77 541 704 133


按照车牌号分类,分别统计不同站点上车人数

data <- split(data, data$车牌号)   ##对数据按照车牌号分组
Freq <- sapply(data, function(data){
tapply(data$上车人数, data$到达站点, sum)
})  ##按照车牌号统计不同站点上车人数
Freq[1] ##查看结果
$粤BM8475
1   2   3   4   5   7   8   9  10  12  13  14  15
14  34  12   6  15   2   4  39   7  34   3  27   1


总结

对因子,列表这两个数据类型的熟练应用,会对R的强大有更深一步理解
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: