转:sql语句中GROUP BY 和 HAVING和使用 count()
2014-02-11 13:27
609 查看
在开发时,我们经常会遇到以“累计(count)”或是“累加(sum)”为条件的查询。比如user_num表:
例1:查询出现过2次的user。
往往初学者会错误地认为在where 语句里直接使用count()算法,很显然这个想法是错误的,count()方法并不能被用在where子句中,为了解决问题,我们可以在group by子句后面使用HAVING来做条件限制。
错误做法:select * from user_num where count(user)>=2 group by user;
正确做法:select * from user_num group by user HAVING count(user)>=2 ;
解释说明:HAVING 与 WHERE 类似,可用来决定选择哪些记录。HAVING 子句在SELECT语句中指定,显示哪些已用 GROUP BY 子句分组的记录。在GROUP BY组合了记录后, HAVING会显示 GROUP BY 子句分组的任何符合 HAVING 子句的记录。
例2:查询单一用户的num总和大于10的用户。
有前面的经验,把sum()方法写在HAVING子句中。
正确做法:select * from user_num group by user HAVING sum(num)>10 ;
注意:一个HAVING子句最多只能包含40个表达式,HAVING子句的表达式之间可以用AND和OR分割。
下面的参考:http://sqlzoo.net/wiki/SELECT_.._GROUP_BY
http://sqlzoo.net/wiki/SUM_and_COUNT
在介绍GROUP BY 和 HAVING 子句前,我们必需先讲讲sql语言中一种特殊的函数:聚合函数,
例如SUM, COUNT, MAX, AVG等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。
SELECT SUM(population) FROM bbc
这里的SUM作用在所有返回记录的population字段上,结果就是该查询只返回一个结果,即所有
国家的总人口数。
通过使用GROUP BY 子句,可以让SUM 和 COUNT 这些函数对属于一组的数据起作用。
当你指定 GROUP BY region 时, 属于同一个region(地区)的一组数据将只能返回一行值.
也就是说,表中所有除region(地区)外的字段,只能通过 SUM, COUNT等聚合函数运算后返回一个值.
HAVING子句可以让我们筛选成组后的各组数据.
WHERE子句在聚合前先筛选记录.也就是说作用在GROUP BY 子句和HAVING子句前.
而 HAVING子句在聚合后对组记录进行筛选。
让我们还是通过具体的实例来理解GROUP BY 和 HAVING 子句,还采用第三节介绍的bbc表。
SQL实例:
一、显示每个地区的总人口数和总面积.
SELECT region, SUM(population), SUM(area)
FROM bbc# `& e4 k' X* n1 v% ?+ |
GROUP BY region
先以region把返回记录分成多个组,这就是GROUP BY的字面含义。分完组后,然后用聚合函数对每组中的不同字段(一或多条记录)作运算。# B* i' z `, }* S, E5 i
二、 显示每个地区的总人口数和总面积.仅显示那些面积超过1000000的地区。
SELECT region, SUM(population), SUM(area)7 ]; Z& I! t% i
FROM bbc8 F4 w2 v( P- f
GROUP BY region
HAVING SUM(area)>1000000# y" P z. O7 D9 `# X
在这里,我们不能用where来筛选超过1000000的地区,因为表中不存在这样一条记录。
相反,HAVING子句可以让我们筛选成组后的各组数据
三、查询CUSTOMER 和ORDER表中用户的订单数
select c.name, count(order_number) as count from orders o,customer c where c.id=o.customer_id group by customer_id;
+--------+-------+
| name | count |
+--------+-------+
| d | 9 |
| cc | 6 |
| 菩提子 | 1 |
| cccccc | 2 |
+--------+-------+
增加HAVING过滤
select c.name, count(order_number) as count from orders o,customer c where c.id=o.customer_id group by customer_id having count(order_number)>5;
+------+-------+
| name | count |
+------+-------+
| d | 9 |
| cc | 6 |
+------+-------+
四、我在多举一些例子
SQL> select * from sc;
SNO PNO GRADE
---------- ----- ----------
1 YW 95
1 SX 98
1 YY 90
2 YW 89
2 SX 91
2 YY 92
3 YW 85
3 SX 88
3 YY 96
4 YW 95
4 SX 89
SNO PNO GRADE
---------- ----- ----------
4 YY 88
这个表所描述的是4个学生对应每科学习成绩的记录,其中SNO(学生号)、PNO(课程名)、GRADE(成绩)。
1、显示90分以上学生的课程名和成绩
//这是一个简单的查询,并没有使用分组查询
SQL> select sno,pno,grade from sc where grade>=90;
SNO PNO GRADE
---------- ----- ----------
1 YW 95
1 SX 98
1 YY 90
2 SX 91
2 YY 92
3 YY 96
4 YW 95
已选择7行。
2、显示每个学生的成绩在90分以上的各有多少门
//进行分组显示,并且按照where条件之后计数
SQL> select sno,count(*) from sc where grade>=90 group by sno;
SNO COUNT(*)
---------- ----------
1 3
2 2
4 1
3 1
3、这里我们并没有使用having语句,接下来如果我们要评选三好学生,条件是至少有两门课程在90分以上才能有资格,列出有资格的学生号及90分以上的课程数。
//进行分组显示,并且按照where条件之后计数,在根据having子句筛选分组
SQL> select sno,count(*) from sc where grade>=90 group by sno having count(*)>=2;
SNO COUNT(*)
---------- ----------
1 3
2 2
这个结果是我们想要的,它列出了具有评选三好学生资格的学生号,跟上一个例子比较之后,发现这是在分组后进行的子查询。
4、学校评选先进学生,要求平均成绩大于90分的学生都有资格,并且语文课必须在95分以上,请列出有资格的学生
//实际上,这个查询先把语文大于95分的学生号提取出来,之后求平均值,分组显示后根据having语句选出平均成绩大于90的
SQL> select sno,avg(grade) from sc where SNO IN (SELECT SNO FROM SC WHERE GRADE>=95 AND PNO='YW') group by sno having avg(grade)>=90;
SNO AVG(GRADE)
---------- ----------
1 94.3333333
4 90.6666667
5、查询比平均成绩至少比学号是3的平均成绩高的学生学号以及平均分数
//having子句中可进行比较和子查询
SQL> select sno,avg(grade) from sc
group by sno
having avg(grade) > (select avg(grade) from sc where sno=3);
注意:
个人在tbl_user表进行如下查询:
id username pwd
1 demo a
2 user1 user1
3 user2 user2
4 user1 pwe
5 user2 pwe
SELECT * FROM `tbl_user` group by username;
结果如下:
id username pwd
1 demo a
2 user1 user1
3 user2 user2
可以看到,group by columnName,这个columnName值一定是唯一的,重复的忽略掉。
mysql筛选GROUP BY多个字段组合
想实现这样一种效果
如果使用group by一个条件的话,得到的结果会少了很多,如何多个条件组合筛选呢
复制代码代码如下:
group by fielda,fieldb,fieldc...
循环的时候可以通过判断后一个跟前面一个是否相同来分组,一个示例
转自:/article/1241923.html
[align=center]id[/align] | [align=center]user[/align] | [align=center]num[/align] |
[align=center]1[/align] | [align=center]a[/align] | [align=center]3[/align] |
[align=center]2[/align] | [align=center]a[/align] | [align=center]4[/align] |
[align=center]3[/align] | [align=center]b[/align] | [align=center]5[/align] |
[align=center]4[/align] | [align=center]b[/align] | [align=center]7[/align] |
往往初学者会错误地认为在where 语句里直接使用count()算法,很显然这个想法是错误的,count()方法并不能被用在where子句中,为了解决问题,我们可以在group by子句后面使用HAVING来做条件限制。
错误做法:select * from user_num where count(user)>=2 group by user;
正确做法:select * from user_num group by user HAVING count(user)>=2 ;
解释说明:HAVING 与 WHERE 类似,可用来决定选择哪些记录。HAVING 子句在SELECT语句中指定,显示哪些已用 GROUP BY 子句分组的记录。在GROUP BY组合了记录后, HAVING会显示 GROUP BY 子句分组的任何符合 HAVING 子句的记录。
例2:查询单一用户的num总和大于10的用户。
有前面的经验,把sum()方法写在HAVING子句中。
正确做法:select * from user_num group by user HAVING sum(num)>10 ;
注意:一个HAVING子句最多只能包含40个表达式,HAVING子句的表达式之间可以用AND和OR分割。
下面的参考:http://sqlzoo.net/wiki/SELECT_.._GROUP_BY
http://sqlzoo.net/wiki/SUM_and_COUNT
在介绍GROUP BY 和 HAVING 子句前,我们必需先讲讲sql语言中一种特殊的函数:聚合函数,
例如SUM, COUNT, MAX, AVG等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。
SELECT SUM(population) FROM bbc
这里的SUM作用在所有返回记录的population字段上,结果就是该查询只返回一个结果,即所有
国家的总人口数。
having是分组(group by)后的筛选条件,分组后的数据组内再筛选 where则是在分组前筛选
通过使用GROUP BY 子句,可以让SUM 和 COUNT 这些函数对属于一组的数据起作用。
当你指定 GROUP BY region 时, 属于同一个region(地区)的一组数据将只能返回一行值.
也就是说,表中所有除region(地区)外的字段,只能通过 SUM, COUNT等聚合函数运算后返回一个值.
HAVING子句可以让我们筛选成组后的各组数据.
WHERE子句在聚合前先筛选记录.也就是说作用在GROUP BY 子句和HAVING子句前.
而 HAVING子句在聚合后对组记录进行筛选。
让我们还是通过具体的实例来理解GROUP BY 和 HAVING 子句,还采用第三节介绍的bbc表。
SQL实例:
一、显示每个地区的总人口数和总面积.
SELECT region, SUM(population), SUM(area)
FROM bbc# `& e4 k' X* n1 v% ?+ |
GROUP BY region
先以region把返回记录分成多个组,这就是GROUP BY的字面含义。分完组后,然后用聚合函数对每组中的不同字段(一或多条记录)作运算。# B* i' z `, }* S, E5 i
二、 显示每个地区的总人口数和总面积.仅显示那些面积超过1000000的地区。
SELECT region, SUM(population), SUM(area)7 ]; Z& I! t% i
FROM bbc8 F4 w2 v( P- f
GROUP BY region
HAVING SUM(area)>1000000# y" P z. O7 D9 `# X
在这里,我们不能用where来筛选超过1000000的地区,因为表中不存在这样一条记录。
相反,HAVING子句可以让我们筛选成组后的各组数据
三、查询CUSTOMER 和ORDER表中用户的订单数
select c.name, count(order_number) as count from orders o,customer c where c.id=o.customer_id group by customer_id;
+--------+-------+
| name | count |
+--------+-------+
| d | 9 |
| cc | 6 |
| 菩提子 | 1 |
| cccccc | 2 |
+--------+-------+
增加HAVING过滤
select c.name, count(order_number) as count from orders o,customer c where c.id=o.customer_id group by customer_id having count(order_number)>5;
+------+-------+
| name | count |
+------+-------+
| d | 9 |
| cc | 6 |
+------+-------+
四、我在多举一些例子
SQL> select * from sc;
SNO PNO GRADE
---------- ----- ----------
1 YW 95
1 SX 98
1 YY 90
2 YW 89
2 SX 91
2 YY 92
3 YW 85
3 SX 88
3 YY 96
4 YW 95
4 SX 89
SNO PNO GRADE
---------- ----- ----------
4 YY 88
这个表所描述的是4个学生对应每科学习成绩的记录,其中SNO(学生号)、PNO(课程名)、GRADE(成绩)。
1、显示90分以上学生的课程名和成绩
//这是一个简单的查询,并没有使用分组查询
SQL> select sno,pno,grade from sc where grade>=90;
SNO PNO GRADE
---------- ----- ----------
1 YW 95
1 SX 98
1 YY 90
2 SX 91
2 YY 92
3 YY 96
4 YW 95
已选择7行。
2、显示每个学生的成绩在90分以上的各有多少门
//进行分组显示,并且按照where条件之后计数
SQL> select sno,count(*) from sc where grade>=90 group by sno;
SNO COUNT(*)
---------- ----------
1 3
2 2
4 1
3 1
3、这里我们并没有使用having语句,接下来如果我们要评选三好学生,条件是至少有两门课程在90分以上才能有资格,列出有资格的学生号及90分以上的课程数。
//进行分组显示,并且按照where条件之后计数,在根据having子句筛选分组
SQL> select sno,count(*) from sc where grade>=90 group by sno having count(*)>=2;
SNO COUNT(*)
---------- ----------
1 3
2 2
这个结果是我们想要的,它列出了具有评选三好学生资格的学生号,跟上一个例子比较之后,发现这是在分组后进行的子查询。
4、学校评选先进学生,要求平均成绩大于90分的学生都有资格,并且语文课必须在95分以上,请列出有资格的学生
//实际上,这个查询先把语文大于95分的学生号提取出来,之后求平均值,分组显示后根据having语句选出平均成绩大于90的
SQL> select sno,avg(grade) from sc where SNO IN (SELECT SNO FROM SC WHERE GRADE>=95 AND PNO='YW') group by sno having avg(grade)>=90;
SNO AVG(GRADE)
---------- ----------
1 94.3333333
4 90.6666667
5、查询比平均成绩至少比学号是3的平均成绩高的学生学号以及平均分数
//having子句中可进行比较和子查询
SQL> select sno,avg(grade) from sc
group by sno
having avg(grade) > (select avg(grade) from sc where sno=3);
注意:
个人在tbl_user表进行如下查询:
id username pwd
1 demo a
2 user1 user1
3 user2 user2
4 user1 pwe
5 user2 pwe
SELECT * FROM `tbl_user` group by username;
结果如下:
id username pwd
1 demo a
2 user1 user1
3 user2 user2
可以看到,group by columnName,这个columnName值一定是唯一的,重复的忽略掉。
mysql筛选GROUP BY多个字段组合
想实现这样一种效果
如果使用group by一个条件的话,得到的结果会少了很多,如何多个条件组合筛选呢
复制代码代码如下:
group by fielda,fieldb,fieldc...
循环的时候可以通过判断后一个跟前面一个是否相同来分组,一个示例
foreach($list as $k=>$v) { if((!isset($list[$k+1])) || $list[$k+1]['platform_id']!=$list[$k]['platform_id']) { echo "分割" } }
转自:/article/1241923.html
相关文章推荐
- 一次oracle数据库数据块损坏的处理过程
- Ubuntu安装配置MySQL数据库
- Quora上的一个哥们对mongodb由爱转恨
- Mybatis SqlSessionTemplate 源码解析
- SQLyog Enterprise导入导出数据库
- mysql简介
- 《Oracle从入门到精通》读书笔记第八章 管理表空间和数据文件之二
- 《Oracle从入门到精通》读书笔记第八章 管理表空间和数据文件之一
- MySql Note 1
- 主从数据库架构
- PL/SQL系列3-PL/SQL块结构
- oracle job 及存储过程案例
- Oracle 基础知识入门
- windows下一键配置nginx+php+mysql+memcache
- T-SQL百万记录中分组取最大值方法ROW_NUMBER() OVER()
- oracle临时表空间使用分析
- Linux 下OCCI( Oracle C++ Call Interface )安装和使用
- sql置顶固定的某一条数据
- MongoDB设置访问权限、设置用户
- mysql 时间相关函数