您的位置：首页 > 数据库 > Oracle

oracle_SQL中ROWID与ROWNUM的使用

2015-04-18 10:48 260 查看

1.ROWNUM的使用——TOP-N分析

使用SELECT语句返回的结果集，若希望按特定条件查询前N条记录，可以使用伪列ROWNUM。

ROWNUM是对结果集加的一个伪列，即先查到结果集之后再加上去的一个列 (强调：先要有结果集)。简单的说ROWNUM是符合条件结果的序列号。它总是从1开始排起的。

使用ROWNUM时，只能使用<、<=、!=符号。

举例：

student(学生)表，表结构为：

ID　　　 char(6)　　　　　 --学号

name　　　　VARCHAR2(10)　　　--姓名

--建表

create table student(ID char(6), name VARCHAR2(10));

--添加测试记录

insert into studentvalues('200001','张一');

insert into studentvalues('200002','王二');

insert into studentvalues('200003','李三');

insert into studentvalues('200004','赵四');

commit;

--测试

SQL> select * fromstudent;

ID NAME

------------------------------

200001 张一

200002 王二

200003 李三

200004 赵四

⑴ rownum对于等于某值的查询条件

如果希望找到学生表中第一条学生的信息，可以使用rownum=1作为条件。但是想找到学生表中第二条学生的信息，使用rownum=2结果查不到数据。因为rownum都是从1开始，但是1以上的自然数在rownum做等于判断时认为都是false条件，所以无法查到rownum
= n（n>1的自然数）。

SQL> selectrownum,id,name from student where rownum=1;

ROWNUM ID NAME

---------- ---------------------------------------------------------

1 200001 张一

SQL> selectrownum,id,name from student where rownum =2;

未选定行

⑵rownum对于大于某值的查询条件

如果想找到从第二行记录以后的记录，当使用rownum>2是查不出记录的，原因是由于rownum是一个总是从1开始的伪列，Oracle 认为rownum> n（n>1的自然数）这种条件依旧不成立，所以查不到记录。

SQL> selectrownum,id,name from student where rownum >2;

未选定行

那如何才能找到第二行以后的记录呢？可以使用子查询方法来解决。注意子查询中的rownum必须要有别名，否则还是不会查出记录来，这是因为rownum不是某个表的列，如果不起别名的话，无法知道rownum是子查询的列还是主查询的列。

SQL>select *from(select rownum no ,id,name from student) where no>2;

NO ID NAME

---------- ---------------------------------------------------------

3 200003 李三

4 200004 赵四

SQL> select *from(select rownum,id,name from student)where rownum>2;

未选定行

⑶ rownum对于小于某值的查询条件

如果想找到第三条记录以前的记录，当使用rownum<3是能得到两条记录的。显然rownum对于rownum<n（n>1的自然数）的条件认为是成立的，所以可以找到记录。

SQL> selectrownum,id,name from student where rownum <3;

ROWNUM ID NAME

-------------------------- ---------------------------------------------------

1 200001 张一

2200002 王二

综上几种情况，可能有时候需要查询rownum在某区间的数据，可以看出rownum对小于某值的查询条件是为true的，rownum对于大于某值的查询条件直接认为是false的，但是可以间接的让它转为认为是true的。那就必须使用子查询。例如要查询rownum在第二行到第三行之间的数据，包括第二行和第三行数据，那么我们可以写以下语句，先让它返回小于等于3的记录行，然后在主查询中判断新的rownum的别名列大于等于2的记录行。但是这样的操作会在大数据集中影响速度。

SQL> select * from(select rownum no,id,name from student where rownum<=3 ) where no >=2;

NO ID NAME

---------- ------ ---------------------------------------------------

2 200002 王二

3 200003 李三

⑷ rownum和排序

Oracle中的rownum是在取数据的时候产生的序号，所以想对指定排序的数据指定rowmun行数据就必须注意了。

SQL> select rownum,id,name from student order by name;

ROWNUM ID NAME

---------- ---------------------------------------------------------

3 200003 李三

2 200002 王二

1 200001 张一

4 200004 赵四

可以看出，rownum并不是按照name列来生成的序号。系统是按照记录插入时的顺序给记录排的号，rowid也是顺序分配的。为了解决这个问题，必须使用子查询

SQL> select rownum,id,name from (select * from student order by name);

ROWNUM ID NAME

---------- ---------------------------------------------------------

1 200003 李三

2 200002 王二

3 200001 张一

4 200004 赵四

这样就成了按name排序，并且用rownum标出正确序号（由小到大）。order by name 如果name是主键或有索引，查询出来的rownum完全按照1,2,3.....的次序。

SQL> alter tablestudent add constraint pk_stu primary key(name);

SQL> select rownum,id,name from student order by name;

ROWNUM ID NAME

---------- ---------------------------------------------------------

1 200003 李三

2 200002 王二

3 200001 张一

4 200004 赵四

2.ROWID的使用——快速删除重复的记录

ROWID是数据的详细地址，通过rowid，oracle可以快速的定位某行具体的数据的位置。

ROWID可以分为物理rowid和逻辑rowid两种。普通的表中的rowid是物理rowid，索引组织表(IOT)的rowid是逻辑rowid。

当表中有大量重复数据时，可以使用ROWID快速删除重复的记录。

举例：

--建表tbl

SQL> create table stu(no number,name varchar2(10),sexchar(2));

--添加测试记录

SQL> insert into stu values(1, 'ab',’男’);

SQL> insert into stu values(1, 'bb',’女’);

SQL> insert into stu values(1, 'ab',’男’);

SQL> insert into stu values(1, 'ab',’男’);

SQL>commit;

删除重复记录方法很多，列出两种。

⑴ 通过创建临时表

可以把数据先导入到一个临时表中，然后删除原表的数据，再把数据导回原表，SQL语句如下：

SQL>create table stu_tmpas select distinct* from stu;

SQL>truncate tablesut; //清空表记录

SQL>insert into stuselect * from stu_tmp; //将临时表中的数据添加回原表

这种方法可以实现需求，但是很明显，对于一个千万级记录的表，这种方法很慢，在生产系统中，这会给系统带来很大的开销，不可行。

⑵ 利用rowid结合max或min函数

使用rowid快速唯一确定重复行结合max或min函数来实现删除重复行。

SQL>delete from stua a where rowid not in (select max(b.rowid) from stu b where a.no=b.no and a.name= b.name and a.sex = b.sex); //这里max使用min也可以

或者用下面的语句

SQL>delete from stua where rowid < (select max(b.rowid) from stu b where a.no=b.no and a.name =b.name and a.sex = b.sex); //这里如果把max换成min的话，前面的where子句中需要把"<"改为">"

跟上面的方法思路基本是一样的，不过使用了group by，减少了显性的比较条件，提高效率。

SQL>delete from stuwhere rowid not in (select max(rowid) from stu t group by t.no, t.name, t.sex);

max(rowid)每一个分组中的max(rowid)值，不是某一个

思考：若在stu表中唯一确定任意一行数据（1,'ab',’男’），把sex字段更新为”女”，怎么做？

SQL>update stu set sex=’女’where rowid=(select min(rowid) from stu where no=1 and name=’ab’ and sex=’男’);

oracle伪列 rowid和rownum

一，什么是伪列RowID？

1,首先是一种数据类型，唯一标识一条记录物理位置的一个id，基于64位编码的18个字符显示。

2,未存储在表中，可以从表中查询，但不支持插入，更新，删除它们的值。

二，RowID的用途

1,在开发中使用频率应该是挺多的，特别在一些update语句中使用更加频繁。所以oracleERP中大部份的视图都会加入rowid这个字段。

在一些cursor定义时也少不了加入rowid。但往往我们在开发过程中，由于连接的表很多，再加上程序的复制，有时忽略了rowid对应的是那一个表中rowid，所以有时过程出错，

往往花上很多时间去查错，最后查出来既然是update时带的rowid并非此表的rowid,所以在发现很多次的错误时，重视rowid起来了，开发中一定要注意rowid的匹配

2，能以最快的方式访问表中的一行。

3，能显示表的行是如何存储的。

4，作为表中唯一标识。

三，RowID的组成

rowid确定了每条记录是在Oracle中的哪一个数据对象，数据文件、块、行上。

ROWID 的格式如下：

数据对象编号文件编号块编号行编号

OOOOOO FFF BBBBBB RRR

由 data_object_id# + rfile# + block#+ row# 组成，占用10个bytes的空间，

32bit的data_object_id#,

10 bit 的 rfile#,

22bit 的 block#,

16 bit 的 row#.

所以每个表空间不能超过1023个数据文件。

四，RowID的应用

1，查找和删除重复记录

当试图对库表中的某一列或几列创建唯一索引时，

系统提示 ORA-01452 ：不能创建唯一索引，发现重复记录。

/*conn scott/tiger

Create table empa as select * from emp;

插入重复记录

insert into empa select * from emp where empno = 7369;

insert into empa select * from emp where empno = 7839;

insert into empa select * from emp where empno = 7934;

*/

查找重复记录的几种方法：

查找大量重复记录

select empno from empa group by empno having count(*) >1;

Select * From empa Where ROWID Not In(Select Min(ROWID) From empa GroupBy empno);

查找少量重复记录

select * from empa a where rowid<>(select max(rowid) from empawhere empno=a.empno );

删除重复记录的几种方法：

(1).适用于有大量重复记录的情况(列上建有索引的时候，用以下语句效率会很高)：

Delete empa Where empno In (Select empno From empa Group By empno HavingCount(*) > 1)

And ROWID Not In (Select Min(ROWID) From empa Group By empno HavingCount(*) > 1);

Delete empa Where ROWID Not In(Select Min(ROWID) From empa Group Byempno);

(2).适用于有少量重复记录的情况(注意，对于有大量重复记录的情况，用以下语句效率会很低)：

Delete empa a where rowid<>(select max(rowid) from empa where empno=a.empno );

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航