您的位置:首页 > 数据库 > Mongodb

mongoDB高级操作

2014-01-25 09:39 218 查看
在关系型数据库中有一些较为高级查询操作,比如说SUM,COUNT等,这些被称作为聚合操作,当然在NoSQL数据库中也应该存在这样的聚合操作。

在MongoDB数据库中常见的聚合操作有:count,distinct,group,mapReduce。现在将它们一一的记录下来:

一、count操作

这个操作顾名思义就是达到统计的效果啦,用来统计符合某一种查询条件的总数。

1
/**统计所有记录的总数*/
2
db.user.count()
3
4
/**统计名字为hanmeimei的记录数*/
5
db.user.count({
"name"
:
"hanmeimei"
})




二、distinct操作

在SQL中这个单词的作用是去除重复的意思,在NoSQL数据库中也可以达到同样的效果。

1
/**去除重复的年龄*/
2
db.person.distinct(
"age"
)




三、group操作

在关系型数据库中,group表示的是分租,在noSQL数据库中也是表示同样的意思,但是它的操作会比较麻烦一些。归根到底,group的操作就是形成了一种“k-v”模型。

1
/**按照年龄age来进行分组然后将name放在user里面*/
2
3
>db.person.group({
"key"
:{
"age"
:
true
},
"initial"
:{
"user"
:[]},
"$reduce"
:
function
(cur,prev){prev.user.push(cur.name);}})
key:这个就是分组的key,我们这里是对年龄分组。

initial:每组都分享一个”初始化函数“,特别注意:是每一组,比如这个的age=20的value的list分享一个initial函数,age=22同样也分享一个initial函数。

$reduce:这个函数的第一个参数是当前的文档对象,第二个参数是上一次function操作的累计对象,第一次为initial中的{”perosn“:[]}。有多少个文档,$reduce就会调用多少次。

1
/**按照年龄age来进行分组同时要求年龄大于21岁,并且统计每一组查询出来的记录条数*/
2
>db.person.group({
"key"
:{
"age"
:
true
},
"initial"
:{
"user"
:[]},
"$reduce"
:
function
(cur,prev){prev.user.push(cur.name);},
"finalize"
:
function
(out){out.count=out.user.length},
"condition"
:{
"age"
:{$gt:21}}})
condition:这个就是过滤条件。

finalize:这是个函数,每一组文档执行完后,多会触发此方法,那么在每组集合里面加上count也就是它的活了。









四、mapReduce操作

mapReduce操作是MongoDB聚合操作中最复杂的操作,同时它也是最灵活。mapReduce其实是一种编程模型,用在分布式计算中,其中有一个“map”函数,一个”reduce“函数。mapReduce是hadoop的核心之一。

1、map:

这个称为映射函数,里面会调用emit(key,value),集合会按照你指定的key进行映射分组。

2、reduce:

这个称为简化函数,会对map分组后的数据进行分组简化,注意:在reduce(key,value)中的key就是emit中的key,vlaue为emit分组后的emit(value)的集合,这里也就是很多{"count":1}的数组。

3、mapReduce:

这个就是最后执行的函数了,参数为map,reduce和一些可选参数

1
/**map函数*/
2
var
map=
function
(){emit(
this
.name,{count:1})}
3
4
/**reduce函数*/
5
var
reduce=
function
(key,value){
var
result={count:0};
for
(
var
i=0;i<value.length;i++){result.count+=value[i].count;}
return
result}
6
7
/**mapReduce操作*/
8
db.person.mapReduce(map,reduce,{
"out"
:
"collection"
})




从图中我们可以看到如下信息:

result:"存放的集合名“;

input:传入文档的个数。

emit:此函数被调用的次数。

reduce:此函数被调用的次数。

output:最后返回文档的个数。

同时我们也可以看看最后根据name分组的结果:





这些都是MongoDB中常用的聚合操作了。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: