您的位置:首页 > 数据库 > Oracle

Jarno详解Oracle高级分组函数(ROLLUP, CUBE, GROUPING SETS)

2015-01-04 10:51 621 查看
本文主要讲解 ROLLUP, CUBE, GROUPING SETS的主要用法,这些函数可以理解为GroupBy分组函数封装后的精简用法,相当于多个union all 的组合显示效果,但是要比 多个union all的效率要高。
其实这些函数在时间的程序开发中应用的并不多,至少在我工作的多年时间中没用过几次,因为现在的各种开发工具/平台都自带了这些高级分组统计功能,使用的方便性及美观性都比这些要好。但如果临时查下数据,用这些函数还是不错的。

创建测试环境

1.      创建表

createtable EMP2
(
ID       NUMBER,  -- 员工编号
NAME     VARCHAR2(20), --姓名
SEX     VARCHAR2(2),  --性别
HIREDATE DATE,         --入职日期
BASE    VARCHAR2(20), --工作母地
DEPT    VARCHAR2(20), --所在部门
SAL     NUMBER        --月工资
);


2.      插入测试数据

insert into emp2 (ID, NAME, SEX, HIREDATE,BASE, DEPT, SAL)
values (107, '小月', '女', to_date('01-09-2013', 'dd-mm-yyyy'), '北京','营运', 9000);
insert into emp2 (ID, NAME, SEX, HIREDATE,BASE, DEPT, SAL)
values (108, '小美', '女', to_date('01-06-2011', 'dd-mm-yyyy'), '上海','营运', 11000);
insert into emp2 (ID, NAME, SEX, HIREDATE,BASE, DEPT, SAL)
values (101, '张三', '男', to_date('01-01-2011', 'dd-mm-yyyy'), '北京','财务', 8000);
insert into emp2 (ID, NAME, SEX, HIREDATE,BASE, DEPT, SAL)
values (102, '李四', '男', to_date('01-01-2012', 'dd-mm-yyyy'), '北京','营运', 15000);
insert into emp2 (ID, NAME, SEX, HIREDATE,BASE, DEPT, SAL)
values (103, '王五', '男', to_date('01-01-2013', 'dd-mm-yyyy'), '上海','营运', 6000);
insert into emp2 (ID, NAME, SEX, HIREDATE,BASE, DEPT, SAL)
values (104, '赵六', '男', to_date('01-01-2014', 'dd-mm-yyyy'), '上海','财务', 10000);
insert into emp2 (ID, NAME, SEX, HIREDATE,BASE, DEPT, SAL)
values (105, '小花', '女', to_date('01-08-2014', 'dd-mm-yyyy'), '上海','财务', 4000);
insert into emp2 (ID, NAME, SEX, HIREDATE,BASE, DEPT, SAL)
values (106, '小静', '女', to_date('01-01-2015', 'dd-mm-yyyy'), '北京','财务', 6000);
commit;


 
3.     查看一下刚才插入的数据

select * from emp2;



 
 
4.      先看下普通分组的效果

按照地区统计每个部门的总工资

select base,dept ,sum(sal) from emp2
group by base,dept;


查看结果如下:

 


 

ROLLUP(累计累加)

ROLLUP是对group by的扩展,因此,它只能出现在group by子句中,依赖于分组的列,对每个分组会生成汇总数据, rollup和group by联合一起使用,达到了按group by列顺序分组,并且实现小计和合计的功能。rollup分组还是有序的,先全部分组,然后对每个分组小计,最后合计。

rollup中列的顺序不同,则统计的结果不同。因为它是按列从右递减分组的。

比如 Group by  ROLLUP(A, B, C),首先会对(A、B、C)进行GROUP BY,然后对(A、B)进行GROUP BY,然后是(A)进行GROUP BY,最后对全表进行GROUP BY操作

 

按照地区统计每个部门的总工资,按工作母地汇总,再合计

select base,dept,sum(sal) from emp2
groupbyrollup(base,dept);


 


 
结果相当于

select base,dept,sum(sal) from emp2
group by base,dept
unionall
select base,null,sum(sal) from emp2
group by base,null
unionall
selectnull,null,sum(sal) from emp2
group by null,null
order by 1,2


 

 

如果颠倒下rollup顺序则结果如下:

select base,dept,sum(sal) from emp2
group by rollup(dept,base);




 

 

如果在实际查询中,有的小计或合计我们不需要,那么就要使用局部rollup,局部rollup就是将需要固定统计的列放在group by中,而不是放在rollup中。

 

select base,dept,sum(sal) from emp2
group by dept,rollup(base);




 

与group by rollup(dept,base)相比:去掉了最后一行的汇总,因为每次汇总要么是dept,base,要么是dept,null ,dept是固定的。

 

 

如果只希望看到合计则可以这样写:

select base,dept ,sum(sal) from emp2
group by rollup((base,dept));


 

 


 

 

CUBE(交叉列表)

CUBE也是对group by运算的一种扩展,它比rollup扩展更加精细,组合类型更多,rollup是按组合的列从右到左递减分组计算,而CUBE则是对所有可能的组合情况进行分组,这样分组的情况更多,覆盖所有的可能分组,并计算所有可能的分组的小计。
 
对于CUBE来说,列的名字只要一样,那么顺序无所谓,结果都是一样的,因为cube是各种可能情况的组合,只不过统计的结果顺序不同而已。但是对于rollup来说,列的顺序不同,则结果不同。
 
 
比如对工作母地和部门的交叉统计

select base,dept,sum(sal) from emp2
group by cube(base,dept)
order by 1,2;


 


 
 
部分CUBE和部分ROLLUP类似,把需要固定统计的列放到group by中,不放到cube中就可以了。

如果cube中只有一个列,那么和rollup的结果一致

 

select base,dept,sum(sal) from emp2
group by dept,cube(base)
order by1,2;


 


 

rollup和cube区别:

如果是ROLLUP(A,B, C)的话,GROUP BY顺序

(A、B、C)

(A、B)

(A)

最后对全表进行GROUPBY操作。

如果是GROUP BY CUBE(A, B, C),GROUP BY顺序

(A、B、C)

(A、B)

(A、C)

(A),

(B、C)

(B)

(C),

最后对全表进行GROUPBY操作。

 

GROUPING SETS

对group by的另一个扩展,专门对分组列分别进行小计计算,不包括合计。使用方式和rollup和cube一样,都是放在group by中。
  

比如需要分别统计工作母地与部门的合计:

 

select base,dept,sum(sal) from emp2
group by grouping sets(base,dept);


结果为:

<
a8ae
p>
 


等价于

select base,null,sum(sal) from emp2
group by  base,null
unionall
select null,dept,sum(sal) from emp2
group by  null,dept;


 

理解了groupingsets的原理我们用他实现rollup的功能也是可以的:

select base,dept,sum(sal) from emp2
group by grouping sets ((base,dept),dept,null);


效果如下:

 


 

 

 

grouping函数

在以上例子中,是用rollup和cube函数都会对结果集产生null,这时候可用grouping函数来确认该记录是由哪个字段得出来的

grouping函数用法,带一个参数,参数为字段名,结果是根据该字段得出来的就返回1,反之返回0

例如:

select decode(grouping(base),1,'所有地区',base) base,
decode(grouping(dept),1,'所有部门',dept)dept ,sum(sal) from emp2
group by rollup(dept,base);


 



 

 

更多ROLLUP,CUBE, GROUPING SETS与GROUP BY的关系可以参考Oracle官方文档中的例子

 

http://docs.oracle.com/cd/E11882_01/server.112/e25554/aggreg.htm#DWHSG8608
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息