MongoDB MapReduce学习笔记
2015-10-22 00:00
716 查看
MapReduce应该算是MongoDB操作中比较复杂的了,自己开始理解的时候还是动了动脑子的,所以记录在此!
命令语法:详细看
测试数据:
现在我要统计同一age的name,也就是像如下的结果:
第一步是写映射(Map)函数,可以简单的理解成分组吧~
emit的第一个参数是key,就是分组的依据,这是自然是age了,后一个是value,可以是要统计的数据,下面会说明,value可以是JSON对象。
这样m就会把送过来的数据根据key分组了,可以想象成如下结构:
组中的key其实就是age的值了,values是个数组,数组内的成员都有相同的age!!。
第二步就是简化了,编写reduce函数:
reduce函数会处理每一个分组,参数也正好是我们想像分组里的key和values。
这里reduce函数只是简单的把key和values包装了一下,因为不用怎么处理就是我们想要的结果了,然后返回一个对象。对象结构正好和我们想象的相符!:
最后,还可以编写finalize函数对reduce的返回值做最后处理:
这里的key还是上面的key,也就是还是age,rval是reduce的返回值,所以rval的一个实例如:{age:0,names:["name_6","name_12","name_18"]},
这里判断key是不是0,如果是而在rval对象上加msg属性,显然也可以判断rval.age==0,因为key和rval.age是相等的嘛!!
这里其他的选项就不说了,一看就知道。
运行:
结果导入到t_age_names集合中,查询出来正是我想要的结果,看一下文档的结构,不难发现,_id就是key,value就是处理后的返回值。
命令语法:
现在我要统计同一age的name,也就是像如下的结果:
{age:0,names:["name_6","name_12","name_18"]} {age:1,names:["name_1","name_7","name_13","name_19"]} ......
第一步是写映射(Map)函数,可以简单的理解成分组吧~
m=(){
emit(.age,.name);
}
emit的第一个参数是key,就是分组的依据,这是自然是age了,后一个是value,可以是要统计的数据,下面会说明,value可以是JSON对象。
这样m就会把送过来的数据根据key分组了,可以想象成如下结构:
第一组
{key:0,values:["name_6","name_12","name_18"]
第二组
{key:1,values:["name_1","name_7","name_13","name_19"]
......
组中的key其实就是age的值了,values是个数组,数组内的成员都有相同的age!!。
第二步就是简化了,编写reduce函数:
r=(key,values){
ret={age:key,names:values};
&n
7ff0
bsp;ret;
}
reduce函数会处理每一个分组,参数也正好是我们想像分组里的key和values。
这里reduce函数只是简单的把key和values包装了一下,因为不用怎么处理就是我们想要的结果了,然后返回一个对象。对象结构正好和我们想象的相符!:
{age:对应的age,names:[名字1,名字2..]}
最后,还可以编写finalize函数对reduce的返回值做最后处理:
f=(key,rval){
(key==0){
rval.msg="anewlife,baby!";
}
rval
}
这里的key还是上面的key,也就是还是age,rval是reduce的返回值,所以rval的一个实例如:{age:0,names:["name_6","name_12","name_18"]},
这里判断key是不是0,如果是而在rval对象上加msg属性,显然也可以判断rval.age==0,因为key和rval.age是相等的嘛!!
这里其他的选项就不说了,一看就知道。
运行:
db.runCommand({ mapreduce:"t", map:m, reduce:r, finalize:f, out:"t_age_names" } )
结果导入到t_age_names集合中,查询出来正是我想要的结果,看一下文档的结构,不难发现,_id就是key,value就是处理后的返回值。
相关文章推荐
- Mongodb总结3-稍微封装一下
- Mongodb总结1-启动和Shell脚本
- MongoDB的基本使用
- 学习Mongodb(一)
- MongoDB WriteConcern
- php mongodb实现分页操作
- 解决com.mongodb.MongoException$CursorNotFound: cursor 0 not found on server
- 解决com.mongodb.MongoException$CursorNotFound: cursor 0 not found on server
- Mongodb存储过程使用
- centos6.5 配置mongodb3
- MongoDB在windows服务器安装部署及远程连接MongoDB
- MongoDB基本操作命令
- MongoDB可以歇菜了吗
- mongo启动异常-mongodb exception in initAndListen: 7026old lock file, terminating
- MongoDB基本使用
- MongoDB分片搭建
- MongoDB增删改查
- mongodb数据文件格式(二)
- [置顶] MongoDB中的分组聚合在java中的用法
- MongoDB基本使用