第一篇博文之mysql表表连接查询和行列置换问题
2011-08-02 11:41
706 查看
刚毕业工作一个月,进了家小公司,在看公司的代码过程中经常看到一些N长的sql语句,瞪着看半天都看不懂,本来接触数据库就少,而且也几年没碰过了,于是乎,便上网查了查,原来是关于表表连接查询和行列置换的。
于是乎,便在csdn上发了个帖子求助。然后问题顺利解决,接下来简单总结一下,方便自己以后要忘了还能回顾一下。
两个表:
表一:业绩表
+--------+------+------+
| mon | dep | yj |
+--------+------+------+
| 一月份 | 1 | 10 |
| 一月份 | 2 | 10 |
| 一月份 | 3 | 5 |
| 二月份 | 2 | 8 |
| 二月份 | 4 | 9 |
| 三月份 | 3 | 8 |
+--------+------+------+
表2:部门表
+------+--------+
| dep | dname |
+------+--------+
| 1 | 一部 |
| 2 | 二部 |
| 3 | 三部 |
| 4 | 国际部 |
+------+--------+
要得到如下结果:
dep dname 一月份 二月份 三月份
--------------------------------------
01 国内业务一部 10 null null
02 国内业务二部 10 8 null
03 国内业务三部 null 5 8
04 国际业务部 null null 9
问题解决了,我最大的感受就是,了解sql的执行顺序很重要,也许是我很长时间没碰过数据库了,貌似以前学数据库的时候这种知识点是最基础的东东,唉,竟然还有一点印象我。哈哈。下面具体说下我的思维过程:
第一步:首先两个表肯定是要连接查询的,所以我进行了连接查询的结果如下:
sql:select b.dep,b.dname,a.mon,a.yj from table1 a,table2
b where a.dep = b.dep;
第二步:进行初步的行列置换:
sql:
第三步:第二步中有重复数据,所以我们要做的就是去重,当然不是用distinct关键字,而是想group by 然后相加sum(),这里要注意的是:group
by是在select 之前执行,也就是会在sum之前执行,所以,先按部门号dep分组,然后组内相加,就可以去重了。
sql:
顺便补充点刚才上网查才知道的知识(是我解决此问题的关键):
SQL 不同于与其他编程语言的最明显特征是处理代码的顺序。在大数编程语言中,代码按编码顺序被处理,但是在SQL语言中,第一个被处理的子句是FROM子句,尽管SELECT语句第一个出现,但是几乎总是最后被处理。
每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者(客户端应用程序或者外部查询)不可用。只是最后一步生成的表才会返回 给调用者。如果没有在查询中指定某一子句,将跳过相应的步骤。下面是对应用于SQL server 2000和SQL Server 2005的各个逻辑步骤的简单描述。
(8)SELECT (9)DISTINCT (11)<Top Num> <select list>
(1)FROM [left_table]
(3)<join_type> JOIN <right_table>
(2) ON <join_condition>
(4)WHERE <where_condition>
(5)GROUP BY <group_by_list>
(6)WITH <CUBE | RollUP>
(7)HAVING <having_condition>
(10)ORDER BY <order_by_list>
逻辑查询处理阶段简介
FROM:对FROM子句中的前两个表执行笛卡尔积(Cartesian product)(交叉联接),生成虚拟表VT1
ON:对VT1应用ON筛选器。只有那些使<join_condition>为真的行才被插入VT2。
OUTER(JOIN):如 果指定了OUTER JOIN(相对于CROSS JOIN 或(INNER JOIN),保留表(preserved table:左外部联接把左表标记为保留表,右外部联接把右表标记为保留表,完全外部联接把两个表都标记为保留表)中未找到匹配的行将作为外部行添加到 VT2,生成VT3.如果FROM子句包含两个以上的表,则对上一个联接生成的结果表和下一个表重复执行步骤1到步骤3,直到处理完所有的表为止。
WHERE:对VT3应用WHERE筛选器。只有使<where_condition>为true的行才被插入VT4.
GROUP BY:按GROUP BY子句中的列列表对VT4中的行分组,生成VT5.
CUBE|ROLLUP:把超组(Suppergroups)插入VT5,生成VT6.
HAVING:对VT6应用HAVING筛选器。只有使<having_condition>为true的组才会被插入VT7.
SELECT:处理SELECT列表,产生VT8.
DISTINCT:将重复的行从VT8中移除,产生VT9.
ORDER BY:将VT9中的行按ORDER BY 子句中的列列表排序,生成游标(VC10).
TOP:从VC10的开始处选择指定数量或比例的行,生成表VT11,并返回调用者。
注:步骤10,按ORDER BY子句中的列列表排序上步返回的行,返回游标VC10.这一步是第一步也是唯一一步可以使用SELECT列表中的列别名的步骤。这一步不同于其它步骤的 是,它不返回有效的表,而是返回一个游标。SQL是基于集合理论的。集合不会预先对它的行排序,它只是成员的逻辑集合,成员的顺序无关紧要。对表进行排序 的查询可以返回一个对象,包含按特定物理顺序组织的行。ANSI把这种对象称为游标。理解这一步是正确理解SQL的基础。
因为这一步不返回表(而是返回游标),使用了ORDER BY子句的查询不能用作表表达式。表表达式包括:视图、内联表值函数、子查询、派生表和共用表达式。它的结果必须返回给期望得到物理记录的客户端应用程序。例如,下面的派生表查询无效,并产生一个错误:
下面的视图也会产生错误
在SQL中,表表达式中不允许使用带有ORDER BY子句的查询,而在T—SQL中却有一个例外(应用TOP选项)。
所以要记住,不要为表中的行假设任何特定的顺序。换句话说,除非你确定要有序行,否则不要指定ORDER BY 子句。排序是需要成本的,SQL Server需要执行有序索引扫描或使用排序运行符。
唉,还是我太菜了,这么个简单问题我都能弄一天。加油!!!哈哈哈!!!
于是乎,便在csdn上发了个帖子求助。然后问题顺利解决,接下来简单总结一下,方便自己以后要忘了还能回顾一下。
两个表:
表一:业绩表
+--------+------+------+
| mon | dep | yj |
+--------+------+------+
| 一月份 | 1 | 10 |
| 一月份 | 2 | 10 |
| 一月份 | 3 | 5 |
| 二月份 | 2 | 8 |
| 二月份 | 4 | 9 |
| 三月份 | 3 | 8 |
+--------+------+------+
表2:部门表
+------+--------+
| dep | dname |
+------+--------+
| 1 | 一部 |
| 2 | 二部 |
| 3 | 三部 |
| 4 | 国际部 |
+------+--------+
要得到如下结果:
dep dname 一月份 二月份 三月份
--------------------------------------
01 国内业务一部 10 null null
02 国内业务二部 10 8 null
03 国内业务三部 null 5 8
04 国际业务部 null null 9
问题解决了,我最大的感受就是,了解sql的执行顺序很重要,也许是我很长时间没碰过数据库了,貌似以前学数据库的时候这种知识点是最基础的东东,唉,竟然还有一点印象我。哈哈。下面具体说下我的思维过程:
第一步:首先两个表肯定是要连接查询的,所以我进行了连接查询的结果如下:
sql:select b.dep,b.dname,a.mon,a.yj from table1 a,table2
b where a.dep = b.dep;
第二步:进行初步的行列置换:
sql:
第三步:第二步中有重复数据,所以我们要做的就是去重,当然不是用distinct关键字,而是想group by 然后相加sum(),这里要注意的是:group
by是在select 之前执行,也就是会在sum之前执行,所以,先按部门号dep分组,然后组内相加,就可以去重了。
sql:
顺便补充点刚才上网查才知道的知识(是我解决此问题的关键):
SQL 不同于与其他编程语言的最明显特征是处理代码的顺序。在大数编程语言中,代码按编码顺序被处理,但是在SQL语言中,第一个被处理的子句是FROM子句,尽管SELECT语句第一个出现,但是几乎总是最后被处理。
每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者(客户端应用程序或者外部查询)不可用。只是最后一步生成的表才会返回 给调用者。如果没有在查询中指定某一子句,将跳过相应的步骤。下面是对应用于SQL server 2000和SQL Server 2005的各个逻辑步骤的简单描述。
(8)SELECT (9)DISTINCT (11)<Top Num> <select list>
(1)FROM [left_table]
(3)<join_type> JOIN <right_table>
(2) ON <join_condition>
(4)WHERE <where_condition>
(5)GROUP BY <group_by_list>
(6)WITH <CUBE | RollUP>
(7)HAVING <having_condition>
(10)ORDER BY <order_by_list>
逻辑查询处理阶段简介
FROM:对FROM子句中的前两个表执行笛卡尔积(Cartesian product)(交叉联接),生成虚拟表VT1
ON:对VT1应用ON筛选器。只有那些使<join_condition>为真的行才被插入VT2。
OUTER(JOIN):如 果指定了OUTER JOIN(相对于CROSS JOIN 或(INNER JOIN),保留表(preserved table:左外部联接把左表标记为保留表,右外部联接把右表标记为保留表,完全外部联接把两个表都标记为保留表)中未找到匹配的行将作为外部行添加到 VT2,生成VT3.如果FROM子句包含两个以上的表,则对上一个联接生成的结果表和下一个表重复执行步骤1到步骤3,直到处理完所有的表为止。
WHERE:对VT3应用WHERE筛选器。只有使<where_condition>为true的行才被插入VT4.
GROUP BY:按GROUP BY子句中的列列表对VT4中的行分组,生成VT5.
CUBE|ROLLUP:把超组(Suppergroups)插入VT5,生成VT6.
HAVING:对VT6应用HAVING筛选器。只有使<having_condition>为true的组才会被插入VT7.
SELECT:处理SELECT列表,产生VT8.
DISTINCT:将重复的行从VT8中移除,产生VT9.
ORDER BY:将VT9中的行按ORDER BY 子句中的列列表排序,生成游标(VC10).
TOP:从VC10的开始处选择指定数量或比例的行,生成表VT11,并返回调用者。
注:步骤10,按ORDER BY子句中的列列表排序上步返回的行,返回游标VC10.这一步是第一步也是唯一一步可以使用SELECT列表中的列别名的步骤。这一步不同于其它步骤的 是,它不返回有效的表,而是返回一个游标。SQL是基于集合理论的。集合不会预先对它的行排序,它只是成员的逻辑集合,成员的顺序无关紧要。对表进行排序 的查询可以返回一个对象,包含按特定物理顺序组织的行。ANSI把这种对象称为游标。理解这一步是正确理解SQL的基础。
因为这一步不返回表(而是返回游标),使用了ORDER BY子句的查询不能用作表表达式。表表达式包括:视图、内联表值函数、子查询、派生表和共用表达式。它的结果必须返回给期望得到物理记录的客户端应用程序。例如,下面的派生表查询无效,并产生一个错误:
select * from(select orderid,customerid from orders order by orderid) as d
下面的视图也会产生错误
create view my_view as select * from orders order by orderid
在SQL中,表表达式中不允许使用带有ORDER BY子句的查询,而在T—SQL中却有一个例外(应用TOP选项)。
所以要记住,不要为表中的行假设任何特定的顺序。换句话说,除非你确定要有序行,否则不要指定ORDER BY 子句。排序是需要成本的,SQL Server需要执行有序索引扫描或使用排序运行符。
唉,还是我太菜了,这么个简单问题我都能弄一天。加油!!!哈哈哈!!!
相关文章推荐
- JSP连接MYSQL查询编码问题解决
- Mysql连接查询时索引失效,字符集问题
- 有关ssh连接linux服务器后在mysql查询后输出中文结果乱码的的问题
- PHP连接MySQL查询结果中文显示乱码问题
- mysql jdbc 查询连接问题
- MyBatis 【问题】解决java连接mysql查询含中文无数据的问题
- 连接mysql查询时的中文编码问题
- 关于php pdo连接mysql,查询超时问题
- 关于数据库查询语句SqlDataReader的连接释放问题的解决办法
- MySql远程客户端连接不上的问题
- springMvc&Mysql上传到远程服务器连接超时问题
- mysql 将查询到的记录,按一行,按元祖,将字段用逗号连接起来。
- 十六、Mysql 连接查询
- Linux mysql连接问题
- MySQL数据高级查询之连接查询、联合查询、子查询
- mysql查询优化--临时表和文件排序(Using temporary; Using filesort问题解决)
- mysql数据查询大小写敏感问题
- Eclipse与Mysql连接中遇到的一个问题,让我苦恼好久....(记录自己的菜鸟经历)
- mysql 关于查询时间的中工作中遇到的一些问题 有代表性的
- 解决树莓派安装mysql后外部无法连接问题