关系数据库如何快速查询表的记录数
2017-05-09 15:58
281 查看
在数据库中,很多人员习惯使用SELECTCOUNT(*)、SELECTCOUNT(1)、SELECTCOUNT(COL)来查询一个表有多少记录,对于小表,这种SQL的开销倒不是很大,但是对于大表,这种查询表记录数的做法就是一个非常消耗资源了,而且效率很差。下面介绍一下SQLServer、Oracle、MySQL中如何快速获取表的记录数。SQLSERVER数据库在SQLServer数据库中,对象目录视图sys.partitions中有一个字段rows会记录表的记录数。我们以AdventureWorks2014为测试数据库。
那么我们还有一些疑问,我们先来看看这些问题吧!
1:没有索引的表是否也可以使用上面脚本?
2:只有非聚集索引的堆表是否可以使用上面脚本?
3:有多个索引的表,是否记录数会存在不一致的情况?
4:统计信息不准确的表,是否rows也会不准确
5:分区表的情况又是怎么样?
6:对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确。
如下所示,我们先构造测试案例:
关于问题1、问题2,都可以使用上面脚本,如下测试所示:
在表dbo.TEST_TAB_ROW上创建非聚集索引后,查询结果如下所示:
我们插入500条记录,此时,这个数据量不足以触发统计信息更新,如下所示,RowsSampled还是1000000
如下所示,发现sys.partitions中的记录变成了100500了,可见rows这个值的计算不依赖统计信息。
当然,如果你用sp_spaceused,发现这里面的记录也是100500
sp_spaceused'dbo.TEST_TAB_ROW'
关于问题3:有多个索引的表,是否记录数会存在不一致的情况?
答案:个人测试以及统计来看,暂时发现多个索引的情况下,sys.partitions中的rows记录数都是一致的。暂时没有发现不一致的情况,当然也不排除有特殊情况。
关于问题5:分区表的情况又是怎么样?
答案:分区表和普通表没有任何区别。
关于问题6:对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确?
答案:对象目录视图sys.partitions与sp_spaceused获取的表记录数是准确的。
ORACLE数据库
在ORACLE数据库中,可以通过DBA_TABLES、ALL_TABLES、USER_TABLES视图查看表的记录数,不过这个值(NUM_ROWS)跟统计信息有很大的关系,有时候统计信息没有更新或采样比例会导致这个值不是很准确。
更新统计信息后,就能得到准确的行数。所以如果需要得到正确的数据,最好更新目标表的统计信息,进行100%采样分析。对于分区表,那么就需要从dba_tab_partitions里面查询相关数据了。
SQL>executedbms_stats.gather_table_stats(ownname=>'username',tabname=>'tablename',estimate_percent=>100,cascade=>true);
MySQL数据库
在MySQL中比较特殊,虽然INFORMATION_SCHEMA.TABLES也可以查到表的记录数,但是非常不准确。如下所示,即使使用ANALYZETABLE更新了统计信息,从INFORMATION_SCHEMA.TABLES中获取的记录依然不准确。
如上所示,MySQL这种查询表记录数的方法看来还是有缺陷的。当然如果不是要求非常精确的值,这个方法也是不错的。
当然,上面介绍的SQLServer、Oracle、MySQL数据库中的方法,还是有一些局限性的。例如,只能查询整张表的记录数,对于那些查询记录数带有查询条件(WHERE)这类SQL。还是必须使用SELECTCOUNT(*)这种方法。
SELECTOBJECT_NAME(object_id)ASObject_Name,
i.nameASIndex_Name,
p.rowsASTable_Rows
FROMsys.partitionsp
LEFTJOINsys.sysindexesiONp.object_id=i.idANDp.index_id=i.indid
WHERE
object_id=OBJECT_ID('TableName')
那么我们还有一些疑问,我们先来看看这些问题吧!
1:没有索引的表是否也可以使用上面脚本?
2:只有非聚集索引的堆表是否可以使用上面脚本?
3:有多个索引的表,是否记录数会存在不一致的情况?
4:统计信息不准确的表,是否rows也会不准确
5:分区表的情况又是怎么样?
6:对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确。
如下所示,我们先构造测试案例:
IFEXISTS(SELECT1FROMsys.objectsWHEREtype='U'ANDname='TEST_TAB_ROW')
BEGIN
DROPTABLETEST_TAB_ROW;
END
IFNOTEXISTS(SELECT1FROMsys.objectsWHEREtype='U'ANDname='TEST_TAB_ROW')
BEGIN
CREATETABLETEST_TAB_ROW
(
IDINT,
NAMECHAR(200)
)
END
GO
SETNOCOUNTON;
BEGINTRAN
DECLARE@IndexINT=1;
WHILE@Index<=100000
BEGIN
INSERTINTOTEST_TAB_ROW
VALUES(@Index,NEWID());
SET@Index+=1;
IF(@Index%5000)=0
BEGIN
IF@@TRANCOUNT>0
BEGIN
COMMIT;
BEGINTRAN
END
END
END
IF@@TRANCOUNT>0
BEGIN
COMMIT;
END
GO
关于问题1、问题2,都可以使用上面脚本,如下测试所示:
SELECTOBJECT_NAME(object_id)ASObject_Name,
i.nameASIndex_Name,
p.rowsASTable_Rows
FROMsys.partitionsp
LEFTJOINsys.sysindexesiONp.object_id=i.idANDp.index_id=i.indid
WHERE
object_id=OBJECT_ID('dbo.TEST_TAB_ROW')
在表dbo.TEST_TAB_ROW上创建非聚集索引后,查询结果如下所示:
CREATEINDEXIX_TEST_TAB_ROWONTEST_TAB_ROW(ID);
我们插入500条记录,此时,这个数据量不足以触发统计信息更新,如下所示,RowsSampled还是1000000
DECLARE@IndexINT=1;
WHILE@Index<=500
BEGIN
INSERTINTOTEST_TAB_ROW
VALUES(100000+@Index,NEWID());
SET@Index+=1;
END
如下所示,发现sys.partitions中的记录变成了100500了,可见rows这个值的计算不依赖统计信息。
当然,如果你用sp_spaceused,发现这里面的记录也是100500
sp_spaceused'dbo.TEST_TAB_ROW'
关于问题3:有多个索引的表,是否记录数会存在不一致的情况?
答案:个人测试以及统计来看,暂时发现多个索引的情况下,sys.partitions中的rows记录数都是一致的。暂时没有发现不一致的情况,当然也不排除有特殊情况。
关于问题5:分区表的情况又是怎么样?
答案:分区表和普通表没有任何区别。
关于问题6:对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确?
答案:对象目录视图sys.partitions与sp_spaceused获取的表记录数是准确的。
ORACLE数据库
在ORACLE数据库中,可以通过DBA_TABLES、ALL_TABLES、USER_TABLES视图查看表的记录数,不过这个值(NUM_ROWS)跟统计信息有很大的关系,有时候统计信息没有更新或采样比例会导致这个值不是很准确。
SELECTOWNER,
TABLE_NAME,
NUM_ROWS,
LAST_ANALYZED
FROMDBA_TABLES
WHEREOWNER='&OWNER'
ANDTABLE_NAME='&TABLE_NAME';
SELECTOWNER,
TABLE_NAME,
NUM_ROWS,
LAST_ANALYZED
FROMALL_TABLES
WHEREOWNER='&OWNER'
ANDTABLE_NAME='&TABLE_NAME';
SELECTTABLE_NAME,
NUM_ROWS,
LAST_ANALYZED
FROMUSER_TABLES
WHERETABLE_NAME='&TABLE_NAME'
更新统计信息后,就能得到准确的行数。所以如果需要得到正确的数据,最好更新目标表的统计信息,进行100%采样分析。对于分区表,那么就需要从dba_tab_partitions里面查询相关数据了。
SQL>executedbms_stats.gather_table_stats(ownname=>'username',tabname=>'tablename',estimate_percent=>100,cascade=>true);
MySQL数据库
在MySQL中比较特殊,虽然INFORMATION_SCHEMA.TABLES也可以查到表的记录数,但是非常不准确。如下所示,即使使用ANALYZETABLE更新了统计信息,从INFORMATION_SCHEMA.TABLES中获取的记录依然不准确。
SELECTTABLE_ROWS
FROMINFORMATION_SCHEMA.TABLES
WHERETABLE_NAME='table_name'
mysql>SELECTTABLE_ROWS
->FROMINFORMATION_SCHEMA.TABLES
->WHERETABLE_NAME='jiraissue'
->;
+------------+
|TABLE_ROWS|
+------------+
|36487|
+------------+
1rowinset(0.01sec)
mysql>selectcount(*)fromjiraissue;
+----------+
|count(*)|
+----------+
|36973|
+----------+
1rowinset(0.05sec)
mysql>analyzetablejiraissue;
+----------------+---------+----------+----------+
|Table|Op|Msg_type|Msg_text|
+----------------+---------+----------+----------+
|jira.jiraissue|analyze|status|OK|
+----------------+---------+----------+----------+
1rowinset(1.41sec)
mysql>SELECTTABLE_ROWS
->FROMINFORMATION_SCHEMA.TABLES
->WHERETABLE_NAME='jiraissue';
+------------+
|TABLE_ROWS|
+------------+
|34193|
+------------+
1rowinset(0.00sec)
mysql>
如上所示,MySQL这种查询表记录数的方法看来还是有缺陷的。当然如果不是要求非常精确的值,这个方法也是不错的。
当然,上面介绍的SQLServer、Oracle、MySQL数据库中的方法,还是有一些局限性的。例如,只能查询整张表的记录数,对于那些查询记录数带有查询条件(WHERE)这类SQL。还是必须使用SELECTCOUNT(*)这种方法。
相关文章推荐
- 数据库查询优化方案(处理上百万级记录如何提高处理查询速度)
- 数据库查询优化方案(处理上百万级记录如何提高处理查询速度)
- 数据库查询优化方案(处理上百万级记录如何提高处理查询速度)
- 查询数据库返回cursor,如何判断没有符合条件的记录。判断条件不是cursor==null 哦
- Sql2012如何将远程服务器数据库及表、表结构、表数据导入本地数据库 自定义日志记录功能,按日记录,很方便 C#常量和字段以及各种方法的语法总结 类型,对象,线程栈,托管堆在运行时的关系,以及clr如何调用静态方法,实例方法,和虚方法 asp.net webapi 自定义身份验证
- 数据库查询优化方案(处理上百万级记录如何提高处理查询速度)
- 如何将数据库中查询的两列n条记录初始化到html的select控件中!
- sqlserver 连接查询的问题,a表无重复记录,与b表中的记录为1对N关系,如何在查得a表信息时统计b表记录数
- [数据库]数据库查询优化方案(处理上百万级记录如何提高处理查询速度)
- 数据库查询优化方案(处理上百万级记录如何提高处理查询速度)(转载)
- Mybatis关联查询,查询出的记录数量与数据库直接查询不一致,如何解决?
- [转载]数据库查询优化方案(处理上百万级记录如何提高处理查询速度)
- 数据库查询优化方案(处理上百万级记录如何提高处理查询速度)总结不好之处请指点----
- 关于单表5-10亿行记录如何快速查询的问题,欢迎童鞋们都进来讨论
- 如何查询一个数据库表中某字段相同记录的数据
- 数据库查询优化方案(处理上百万级记录如何提高处理查询速度)
- 数据库查询优化方案(处理上百万级记录如何提高处理查询速度)
- 如何用SQL语句,查询数据库(日期+时间字段)中等于某一天的记录
- Mybatis关联查询,查询出的记录数量与数据库直接查询不一致,如何解决?
- Oracle数据库快速查询重复记录的方法;