您的位置：首页 > 数据库

关系数据库如何快速查询表的记录数

2017-05-09 15:58 281 查看

在数据库中，很多人员习惯使用SELECTCOUNT（*）、SELECTCOUNT（1)、SELECTCOUNT(COL)来查询一个表有多少记录，对于小表，这种SQL的开销倒不是很大，但是对于大表，这种查询表记录数的做法就是一个非常消耗资源了，而且效率很差。下面介绍一下SQLServer、Oracle、MySQL中如何快速获取表的记录数。SQLSERVER数据库在SQLServer数据库中,对象目录视图sys.partitions中有一个字段rows会记录表的记录数。我们以AdventureWorks2014为测试数据库。

SELECTOBJECT_NAME(object_id)ASObject_Name,

i.nameASIndex_Name,

p.rowsASTable_Rows

FROMsys.partitionsp

LEFTJOINsys.sysindexesiONp.object_id=i.idANDp.index_id=i.indid

WHERE

object_id=OBJECT_ID('TableName')

那么我们还有一些疑问，我们先来看看这些问题吧！
1：没有索引的表是否也可以使用上面脚本？
2：只有非聚集索引的堆表是否可以使用上面脚本？
3：有多个索引的表，是否记录数会存在不一致的情况？
4：统计信息不准确的表，是否rows也会不准确
5:分区表的情况又是怎么样？
6：对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确。
如下所示，我们先构造测试案例：

IFEXISTS(SELECT1FROMsys.objectsWHEREtype='U'ANDname='TEST_TAB_ROW')

BEGIN

DROPTABLETEST_TAB_ROW;

END

IFNOTEXISTS(SELECT1FROMsys.objectsWHEREtype='U'ANDname='TEST_TAB_ROW')

BEGIN

CREATETABLETEST_TAB_ROW

IDINT,

NAMECHAR(200)

END

GO

SETNOCOUNTON;

BEGINTRAN

DECLARE@IndexINT=1;

WHILE@Index<=100000

BEGIN

INSERTINTOTEST_TAB_ROW

VALUES(@Index,NEWID());

SET@Index+=1;

IF(@Index%5000)=0

BEGIN

IF@@TRANCOUNT>0

BEGIN

COMMIT;

BEGINTRAN

END

END

END

IF@@TRANCOUNT>0

BEGIN

COMMIT;

END

GO

关于问题1、问题2，都可以使用上面脚本，如下测试所示：

SELECTOBJECT_NAME(object_id)ASObject_Name,

i.nameASIndex_Name,

p.rowsASTable_Rows

FROMsys.partitionsp

LEFTJOINsys.sysindexesiONp.object_id=i.idANDp.index_id=i.indid

WHERE

object_id=OBJECT_ID('dbo.TEST_TAB_ROW')

在表dbo.TEST_TAB_ROW上创建非聚集索引后，查询结果如下所示：

CREATEINDEXIX_TEST_TAB_ROWONTEST_TAB_ROW(ID);

我们插入500条记录，此时，这个数据量不足以触发统计信息更新，如下所示，RowsSampled还是1000000

DECLARE@IndexINT=1;

WHILE@Index<=500

BEGIN

INSERTINTOTEST_TAB_ROW

VALUES(100000+@Index,NEWID());

SET@Index+=1;

END

如下所示，发现sys.partitions中的记录变成了100500了，可见rows这个值的计算不依赖统计信息。

当然，如果你用sp_spaceused，发现这里面的记录也是100500
sp_spaceused'dbo.TEST_TAB_ROW'

关于问题3：有多个索引的表，是否记录数会存在不一致的情况？
答案：个人测试以及统计来看，暂时发现多个索引的情况下，sys.partitions中的rows记录数都是一致的。暂时没有发现不一致的情况，当然也不排除有特殊情况。
关于问题5:分区表的情况又是怎么样？
答案：分区表和普通表没有任何区别。
关于问题6：对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确？
答案：对象目录视图sys.partitions与sp_spaceused获取的表记录数是准确的。
ORACLE数据库
在ORACLE数据库中，可以通过DBA_TABLES、ALL_TABLES、USER_TABLES视图查看表的记录数，不过这个值（NUM_ROWS）跟统计信息有很大的关系，有时候统计信息没有更新或采样比例会导致这个值不是很准确。

SELECTOWNER,

TABLE_NAME,

NUM_ROWS,

LAST_ANALYZED

FROMDBA_TABLES

WHEREOWNER='&OWNER'

ANDTABLE_NAME='&TABLE_NAME';

SELECTOWNER,

TABLE_NAME,

NUM_ROWS,

LAST_ANALYZED

FROMALL_TABLES

WHEREOWNER='&OWNER'

ANDTABLE_NAME='&TABLE_NAME';

SELECTTABLE_NAME,

NUM_ROWS,

LAST_ANALYZED

FROMUSER_TABLES

WHERETABLE_NAME='&TABLE_NAME'

更新统计信息后，就能得到准确的行数。所以如果需要得到正确的数据，最好更新目标表的统计信息，进行100%采样分析。对于分区表，那么就需要从dba_tab_partitions里面查询相关数据了。

SQL>executedbms_stats.gather_table_stats(ownname=>'username',tabname=>'tablename',estimate_percent=>100,cascade=>true);
MySQL数据库
在MySQL中比较特殊，虽然INFORMATION_SCHEMA.TABLES也可以查到表的记录数，但是非常不准确。如下所示，即使使用ANALYZETABLE更新了统计信息，从INFORMATION_SCHEMA.TABLES中获取的记录依然不准确。

SELECTTABLE_ROWS

FROMINFORMATION_SCHEMA.TABLES

WHERETABLE_NAME='table_name'

mysql>SELECTTABLE_ROWS

->FROMINFORMATION_SCHEMA.TABLES

->WHERETABLE_NAME='jiraissue'

->;

+------------+

|TABLE_ROWS|

+------------+

|36487|

+------------+

1rowinset(0.01sec)

mysql>selectcount(*)fromjiraissue;

+----------+

|count(*)|

+----------+

|36973|

+----------+

1rowinset(0.05sec)

mysql>analyzetablejiraissue;

+----------------+---------+----------+----------+

|Table|Op|Msg_type|Msg_text|

+----------------+---------+----------+----------+

|jira.jiraissue|analyze|status|OK|

+----------------+---------+----------+----------+

1rowinset(1.41sec)

mysql>SELECTTABLE_ROWS

->FROMINFORMATION_SCHEMA.TABLES

->WHERETABLE_NAME='jiraissue';

+------------+

|TABLE_ROWS|

+------------+

|34193|

+------------+

1rowinset(0.00sec)

mysql>

如上所示，MySQL这种查询表记录数的方法看来还是有缺陷的。当然如果不是要求非常精确的值，这个方法也是不错的。
当然，上面介绍的SQLServer、Oracle、MySQL数据库中的方法，还是有一些局限性的。例如，只能查询整张表的记录数，对于那些查询记录数带有查询条件（WHERE）这类SQL。还是必须使用SELECTCOUNT(*）这种方法。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航