TOP N的一些问题,可以实现取得表中最大的一行ID的数据。
2006-08-28 17:03
471 查看
SELECT TOP N 问题 |
作者: unknown 来源: unknown |
Hi, everyone: 本贴讨论SELECT TOP N问题. 现在正在一家计算机公司兼职,开发ASP应用. 在最近的一个商业项目里有这样一个需求:用户在查询时,只需要按照某(些)列排序后TOP 20的纪录. SQL SERVER 7很好地支持了TOP N 操作,但考虑到系统移植问题, 我又考虑在其他几个主流DBMSs中如何实现. 鉴于只有DB2 UDB 7,ORACLE 8i,SQL SERVER 7,本贴仅讨论这三个DBMS. 简单地说,TOP N问题就是:在SELECT中,仅选择按照某(些)列排序后TOP N的纪录. 考虑到等值问题,又可以分为两种: 一是仅仅返回N条纪录(M 1), 二是还包括所有于第N条等值的纪录(M 2). 当然最内层的子查询也可以有其他的子句, 或者TOP N也可以应用在没有ORDER BY的情况下,这样更简单. 1. SQL SERVER 7: 用 TOP N (WITH TIES) M1: SELECT TOP N * FROM MYTABLE ORDER BY ORD_COL; M2: SELECT TOP N WITH TIES * FROM MYTABLE ORDER BY ORD_COL; 注: SQL SERVER 7提供了PERCENT N WITH TIES, ACCESS 中提供了TOP N,但含义是M 2. 2. ORACLE 8i: 用 ROWNUM<=N M1: SELECT * FROM ( SELECT * FROM MYTABLE ORDER BY ORD_COL DESC) WHERE ROWNUM<=N M2: SELECT * FROM MYTABLE WHERE ORD_COL>= (SELECT MIN(ORD_COL) FROM ( SELECT * FROM MYTABLE ORDER BY ORD_COL DESC) WHERE ROWNUM<=N) ORDER BY ORD_COL DESC 注意以下两种错误用法: WRONG 1: SELECT * FROM MYTABLE WHERE ROWID<=N ORDER BY ORD_COL DESC; WRONG 2:(因为WHERE ROWNUM<=N 在ORDER BY 前执行) SELECT * FROM MYTABLE WHERE ROWNUM<=N ORDER BY ORD_COL DESC; 3: DB2 用FETCH FIRST N ROWS ONLY M1: SELECT * FROM MYTABLE ORDER BY ORD_COL DESC FETCH FIRST N ROWS ONLY M2: 没有找到,因为DB2不允许在FROM中嵌套有ORDER BY子句的子查询. 还不清楚ORACLE的M 2有没有更好的办法,以及其他的DBMS如何实现TOP N操作,请其他朋友补充. ---------------------------------------------------------------------------------- 各语句已经测试过, EXAMPLE: create table mytable(mykey int, ord_col int); insert into mytable values(1, 100); insert into mytable values(2, 100); insert into mytable values(3, 99); insert into mytable values(4, 101); insert into mytable values(5, 101); 今天继续讨论SELECT TOP N问题. 1. DB2的M 2 在前一篇讨论中提到,由于DB2的SUBQUERY不支持ORDER BY子句,因此无法构造M2. 实际上,DB2提供了一组新的函数,称为 OLAP FUNCTIONS, 可以很好的支持TOP N问题. M2: SELECT * FROM ( SELECT MYKEY,RANK() OVER (ORDER BY ORD_COL DESC) AS MYRANK FROM MYTABLE ) AS RANKED_TABLE WHERE MYRANK<=N 利用OLAP函数,除了上一篇中所提方法,DB2的M1又可以表示为: SELECT * FROM ( SELECT MYKEY,ROW_NUMBER() OVER (ORDER BY ORD_COL DESC) AS MYRANK FROM MYTABLE ) AS RANKED_TABLE WHERE MYRANK<=N 2. 除了M1, M2两种TOP N外,还有一种被DB2称为 DENSE_RANK, (M3). 通过下例分别说明. M1: TOP 3 -- 1(4,101), 2(5,101), 3(1, 100) 或者1(4,101), 2(5,101), 3(2, 100) M2: TOP 3 -- 1(4,101), 1(5,101), 3(1, 100), 3(2, 100) M3: TOP 3 -- 1(4,101), 1(5,101), 2(1, 100), 2(2, 100), 3(3,99) 在DB2中, M3如此实现: SELECT * FROM ( SELECT MYKEY,DENSE_RANK() OVER (ORDER BY ORD_COL DESC) AS MYRANK FROM MYTABLE ) AS RANKED_TABLE WHERE MYRANK<=N 3. 为避免DBMSs的方言问题, M2,M3可以有如下标准(SQL 92)表示: M2: SELECT * FROM MYTABLE M1 WHERE N> ( SELECT COUNT(*) FROM MYTABLE M2 WHERE M2.ORD_COL>M1.ORD_COL); 注意: 两个比较符都是 > M3: SELECT * FROM MYTABLE M1 WHERE N> ( SELECT COUNT(DISTINCT M2.ORD_COL) FROM MYTABLE M2 WHERE M2.ORD_COL>M1.ORD_COL); 注意: 与M2的不同在于DISTINCT的使用 至于M1, 我目前还没有想到合适的标准写法,请补充. 4. 关于MYSQL 相对于各主流RDBMS来说,MYSQL要简单,幼稚地多. 在运行MYSQL时发现居然不支持SUBQUERY. 因此MYSQL中的TOP N问题要复杂一些. SELECT * FROM MYTABLE, MYTABLE M2 WHERE M2.ORD_COL>=M1.ORD_COL GROUP BY M1.MYKEY HAVING COUNT(M2.ORD_COL) <=N 但是,这个语句是有问题的. 一个极端的例子: 当所有的ORD_COL的数值都一样时. 如果哪位想到了如何解决这个问题,请补充. ---------------------------------------------------------------------------------- 各语句已经测试过, EXAMPLE: create table mytable(mykey int, ord_col int); insert into mytable values(1, 100); insert into mytable values(2, 100); insert into mytable values(3, 99); insert into mytable values(4, 101); insert into mytable values(5, 101) |
相关文章推荐
- TOP N的一些问题,可以实现取得表中最大的一行ID的数据。
- sql实现id(key)自增一些细节问题
- Mysql实现数据的不重复写入(insert if not exists)以及新问题:ID自增不连续的解答
- sql根据一条数据ID取得上一条和下一条的问题
- 数据挖掘中的DBSCAN聚类算法CSharp实现及一些问题
- 直方图内最大矩形:用栈实现一些之前可以确定的值。
- 一条SQL语句实现:一行多个字段数据的最大值。
- Mysql实现数据的不重复写入(insert if not exists)以及新问题:ID自增不连续的解答
- 关于如何只取得每组数据中的一个最大值的问题?
- 我有一个想法,组建一个网页搜索采集的team,实现一些有价值的数据,有兴趣的朋友可以联系我
- mysql插入一行数据,其中一个值为当前该列的最大值,怎么实现?
- 取得数据库某个表的最大id 可以用以下方法
- Mysql实现数据的不重复写入(insert if not exists)以及新问题:ID自增不连续的解答
- 数据挖掘中的DBSCAN聚类算法CSharp实现及一些问题
- 在使用 <s:iterator value="#request.students"></s:iterator> 无法显示数据,而 ${request.students[0].id} 却可以显示时问题
- Mysql实现数据的不重复写入(insert if not exists)以及新问题:ID自增不连续的解答
- Android通过sharedUserId机制实现APK间共享数据,App的换肤可以通过此机制实现
- 按照一定的规格形式导出需要的数据(导出功能实现和一些需要注意的问题)
- 如何实现将数据同时保存到两个数据表,使得同一次提交多个文件的文件ID号相同
- Pandas实现数据类型转换的一些小技巧汇总