测试分析SQL语句执行时,SQL Server内存的变化情况
2010-02-04 15:03
357 查看
<!--
/* Font Definitions */
@font-face
{font-family:SimSun;
panose-1:2 1 6 0 3 1 1 1 1 1;
mso-font-alt:宋体;
mso-font-charset:134;
mso-generic-font-family:auto;
mso-font-pitch:variable;
mso-font-signature:3 135135232 16 0 262145 0;}
@font-face
{font-family:新細明體;
panose-1:2 2 3 0 0 0 0 0 0 0;
mso-font-alt:PMingLiU;
mso-font-charset:136;
mso-generic-font-family:roman;
mso-font-pitch:variable;
mso-font-signature:3 137232384 22 0 1048577 0;}
@font-face
{font-family:"/@新細明體";
panose-1:2 2 3 0 0 0 0 0 0 0;
mso-font-charset:136;
mso-generic-font-family:roman;
mso-font-pitch:variable;
mso-font-signature:3 137232384 22 0 1048577 0;}
@font-face
{font-family:"/@SimSun";
panose-1:2 1 6 0 3 1 1 1 1 1;
mso-font-charset:134;
mso-generic-font-family:auto;
mso-font-pitch:variable;
mso-font-signature:3 135135232 16 0 262145 0;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{mso-style-parent:"";
margin:0cm;
margin-bottom:.0001pt;
mso-pagination:none;
font-size:12.0pt;
font-family:"Times New Roman";
mso-fareast-font-family:新細明體;
mso-font-kerning:1.0pt;}
h2
{mso-margin-top-alt:auto;
margin-right:0cm;
mso-margin-bottom-alt:auto;
margin-left:0cm;
mso-pagination:widow-orphan;
mso-outline-level:2;
font-size:18.0pt;
font-family:新細明體;
mso-bidi-font-family:新細明體;
font-weight:bold;}
h3
{mso-margin-top-alt:auto;
margin-right:0cm;
mso-margin-bottom-alt:auto;
margin-left:0cm;
mso-pagination:widow-orphan;
mso-outline-level:3;
font-size:13.5pt;
font-family:新細明體;
mso-bidi-font-family:新細明體;
font-weight:bold;}
p
{mso-margin-top-alt:auto;
margin-right:0cm;
mso-margin-bottom-alt:auto;
margin-left:0cm;
mso-pagination:widow-orphan;
font-size:12.0pt;
font-family:新細明體;
mso-bidi-font-family:新細明體;}
/* Page Definitions */
@page
{mso-page-border-surround-header:no;
mso-page-border-surround-footer:no;}
@page Section1
{size:595.3pt 841.9pt;
margin:72.0pt 90.0pt 72.0pt 90.0pt;
mso-header-margin:42.55pt;
mso-footer-margin:49.6pt;
mso-paper-source:0;
layout-grid:18.0pt;}
div.Section1
{page:Section1;}
-->
众所周知,SQL Server
执行SQL
语句的性能判定标准主要是IO
读取数大小。本文在不违反这一原则情况下,同时来分析一下部分
SQL
语句执行时,
SQL Server
内存的变化情况。
首先简述一下SQL Server
内存占用的特点。SQL Server
所占用的内存除程序(即SQL Server
引擎)外,主要包括缓存的数据(Buffer
)和执行计划(Cache
)。SQL Server
以8KB
大小的页为单位存储数据。这个和SQL Server
数据在磁盘上的存储页大小相同。当
SQL Server
执行
SQL
语句时,如果需要的数据已经在其内存中,则直接从内存缓冲区读取并进行必要的运算然后输出执行结果。如果数据还未在内存中,则首先将数据从磁盘上读入内存
Buffer
中。而我们通常评价
SQL
性能指标中的
IO
逻辑读取数对应的正是从内存缓冲区读取的页数,而
IO
物理读取数则对应数据从磁盘读取的页数。
注:以下的试验在多人共享的开发测试服务器上也可以进行,因为实际上可以分别看到某个表所占用的内存情况。但为了方便,笔者在做此试验时,在一个单独的、确认没有其它并发任务的数据库上进行,因此所看到的内存变化正是每一次所执行的
SQL
语句引起的。
我们首先来看一个简单的实例。创建下表:
Create Table P_User
(
UserMobileStatus int NOT NULL,
MobileNo int NOT NULL,
LastOpTime DateTime Not NULL
)
然后为该表插入一定的数据:
Declare @i int
Set @i=28000
WHILE @i<29000
BEGIN
Insert Into P_User
Select @i % 2,@i,GetUTCDate()
Set @i=@i+1
END
然后我们在查询分析器中首先执行:
Set Statistics IO ON
并按下Ctrl+M
以显示实际的执行计划。
此时,可以开始进行我们的试验了。为了准确观察每一次
SQL
语句变化情况,在执行第一条
SQL
语句以前,我们首先清空
SQL
Server
所占用的数据内存:
CHECKPOINT
GO
DBCC DROPCLEANBUFFERS
这将清空SQL Server
所占用的数据缓冲区(此语句在生产服务器上慎用,因为将导致一段时间内后续的SQL
语句执行变慢)。
测试
1.1
Select * From P_User
从SQL
执行计划可以看到,由于此时表中没有任何索引,因此将产生Table
Scan
。而IO
统计结果如下:
(1000 row(s) affected)
表'P_User'
。扫描计数1
,逻辑读取4
次,物理读取4
次,预读0
次,lob
逻辑读取0
次,lob
物理读取0
次,lob
预读0
次。
我们看一下数据库内存中的情况。
首先查询到我们所操作database
的database_id
:
Select database_id From sys.databases Where name='TestGDB'
然后使用该database_id
从表中查看内存情况:
SELECT * FROM sys.dm_os_buffer_descriptors bd
WHERE database_id=5
order by allocation_unit_id,page_id
得到结果如下:
得到的结果中可以看到,除了必要的管理页(一个
PFS_Page
和一个
IAM_Page
)外,内存中总共出现了
4
个
Data_Page
页。这和刚才
IO
统计中看到的结果:逻辑读为
4
,物理读为
4
相同。由于是全表读取,表明
P_User
表全部数据所占用的数据页数也正是
4
,将这
4
个数据页的
row_count
数加起来也可以验证其总数据行
=1000
。
[Page]
在上例中,如果不清空数据缓冲区,再执行一遍
SQL
,可以看到内存毫无变化,而逻辑读也不变,只是物理读变为
0
,因为已经不需要再从磁盘读入数据。
1.2
另外,在没有索引的情况下,如果将上例修改为:
Select Top 1 * From P_Order
或者Select
* From P_Order Where MobileNo=28502
可以看到,系统同样要读取全部的数据页到内存。
如果使用Select Top 1 * From P_Order Where MobileNo=28502
这样的选取方式,有可能会出现只读取部分数据页到内存的情况。但由于在没有索引情况下,数据实际上是无序存放在堆上,所以结 果很不稳定,也有可能发生读取所有的数据页到内存。
测试
2.1
修改表结构,在MobileNo
字段上建立聚集索引。然后再次执行刚才的SQL
语句。得到的执行计划变为聚集索引扫描。
IO
统计消息为:
(1000 row(s) affected)
表'P_User'
。扫描计数
1
,逻辑读取
6
次,物理读取
1
次,预读
4
次,
lob
逻辑读取
0
次,
lob
物理读取
0
次,
lob
预读
0
次。
这里的逻辑读取变为
6
次。
内存情况如下:
内存中的变化是增加了一个非叶级的聚集索引页,而叶级的聚集索引则会和数据放在一起。
另外,可以查看该表索引的级别:
SELECT database_id,object_id,index_id,index_level,page_count,record_count
FROM sys.dm_db_index_physical_stats
(DB_ID(N'TestGDB'),
OBJECT_ID(N'dbo.P_User'), NULL, NULL , 'DETAILED');
从结果可以看到该表的聚集索引总共分
2
级。
因而逻辑读增加了
2——
(由于发生
Clustered Index Scan
,除了根级别的聚集索引页占用
1
次外,从根级别聚集索引定位到叶级别的聚集索引也将额外占用
1
次逻辑读)。
另外一个变化是只发生了一次物理读,即读取根级别的聚集索引页,另外
4
个数据页则通过预读方式而不是物理读从磁盘装入内存
Buffer
。这使得有聚集索引的情况下,执行
SQL
所直接花费的代价实际上更小。
2.2
在建立聚集索引情况下,对性能有益的变化是:
对于Select Top 1 * From P_Order
或者Select
* From P_Order Where MobileNo=28702
这样的语句,在有聚集索引情况下,只会将最终记录所在的页读入内存。
测试
3.1
如果将表中同一字段的聚集索引换成非聚集索引,则可以看到如下特点:
执行全表扫描将和没有任何索引的情况相似,将读取所有的数据页到内存。此时
,SQL Server
的查询引擎实际上无法使用非聚集索引。
3.2
将只读取最终数据所在的页到内存。通过查询计划可以看到,
SQL Server
在非聚集索引上使用
INDEX SEEK
,然后通过
lookup
得到数据实际所在行(索引覆盖情况下例外,因为不需要定位到实际数据行)。
测试4
在进行测试前,
我们先准备另外一张表和数据。
Create Table P_Order
( UserStatus int NOT NULL,[Page]
MobileNo int NOT NULL,
Sid int Not NULL,
LastSubTime DateTime
)
插入数据:
Declare @i int
Set @i=20000
WHILE @i<30000
BEGIN
Insert Into P_Order
Select @i % 2,@i,@i-19999,GetUTCDate()
set @i=@i+1
END
可以看到,在执行全表扫描情况下,该表10000
条数据总共占用38
个内存数据页。
4.1
Select * From P_Order A
Inner Loop JOIN P_User B
ON A.MobileNo=B.MobileNo
对于此种高选择性选择,默认情况下SQL Server
不会执行Loop
Join
。因此,使用了强制性的联接提示。
在两个表都没有任何索引的情况下,可以看到:
两个表所有的数据页都将被加载到内存。逻辑读取代价高达
6
万多次
——
对于
P_Order
表中的每一条记录,都将在
P_User
表中进行遍历。
在其中一个表有聚集索引情况下,尽管逻辑读取相比刚才的
6
万多次已经大大下降,但仍然达到
2
万次。而且联接的次序对查询性能影响很大。因为其实际执行的是将
SQL
语句中前面的表作为联接的外部输入,而后面的表作为联接的内部输入。
在两个表都有聚集索引情况下,相比较而言,逻辑读仍然达到数千次(取决于最终输出的数据大小),但相比较已经大大改善。而且表中的数据只有最终需要输出的部分才会被读入内存
Buffer
中。
4.2
执行如下的
SQL
语句:
Select * From P_Order A
Inner merge JOIN P_User B ON A.MobileNo=B.MobileNo
Where A.MobileNo=28913
在两个表都没有任何索引情况下,两张表都将执行全表扫描。要读入所有的数据页到内存。总体逻辑读取决于两表的数据页数。
在一个表有聚集索引或者非聚集索引情况下,该表将执行
Index Seek
,另一个表将出现全表扫描。内存数据缓冲区中,将有一张表只读入最终数据所在的数据页、一张表读入全部数据页。逻辑读数取决于表在联接中的秩序、以及无索引表的数据页数。
在两个表都有聚集索引情况下,逻辑读最小,每个表只有
2
到
3
次。而且只有实际需要输出的数据才会被读入内存页。两个表都有非聚集索引情况下,消耗的逻辑读和内存资源近似。
测试
5.1
执行SQL:
Select * From P_Order A
Inner merge JOIN P_User B ON A.MobileNo=B.MobileNo
如果两张表都没有任何索引,则两张表都要进行全表扫描。所有的数据都要读入内存页。
逻辑读数近似等于两张表的数据页总和。
SQL Server
处理过程中将使用到临时表。
只有一张表有聚集索引的情形类似,
SQL Server
处理过程中将使用到临时表。并且读入所有的数据页到内存。
如果两张表都有聚集索引,尽管两表的数据都会被读入内存页,但逻辑读数已经大大减少,等于其中一张表总数据内存页数加上最终输出的数据页数。而且
SQL Server
处理过程中将不需要再使用临时表。
5.2
对于这样的高选择性
SQL
语句,
SQL Server
将提示无法生成执行计划。
[Page]
Select * From P_Order A
Inner merge JOIN P_User B ON A.MobileNo=B.MobileNo
Where A.MobileNo=28913
但可以执行:
Select * From P_Order A
Inner merge JOIN P_User B ON A.MobileNo=B.MobileNo
Where
A.MobileNo<=28001
(注:最终结果只有
2
条)
这样的属于低选择性语句,但最终结果也很少的语句。如前面所述,这种情况下,采用
netsted loop
联接效率可能更高。
测试
6.1
对于两表联接,如果两张表都没有索引,不写明联接提示的情况下,SQL Server
默认使用hash join
。而对于两表联接,如果两张表都有聚集索引,则SQL Server
默认使用Merge Join
。
执行SQL:
Select * From P_Order A
Inner hash JOIN P_User B ON A.MobileNo=B.MobileNo
在使用hash join
情况下,无论两张表有无索引,都将读取所有的数据页到内存,SQL Server
将使用临时表进行处理。逻辑读数近似等于两张表的数据页总和。
6.2
和
merge join
执行高选择性选取情况类似,也无法直接执行:
Select * From P_Order A
Inner merge JOIN P_User B ON A.MobileNo=B.MobileNo
Where A.MobileNo=28913
但可以执行这样的结果很少的低选择性脚本:
Select * From P_Order A
Inner merge JOIN P_User B ON A.MobileNo=B.MobileNo
Where A.MobileNo<=28001
(注:最终结果只有2
条)
但此情况下,采用netsted loop
联接效率更高。
测试总结
本次测试的主要意义在于,通过分析具体的内存变化结合执行计划、
IO
读取等信息,可以更清楚地了解
SQL Server
执行
SQL
语句过程。
另外,也验证了一些通过分析
SQL
语句的
IO
读取、执行计划曾经得到的经验:
(
1
)
在执行单表查询时,如果是高选择查询,要建立非聚集索引或者聚集索引(推荐非聚集索引,是独立于数据存放的)。如果是低选择性查询,则需要建立聚集索引。
(
2
)
在执行联接查询时,如果最终输出结果很少,则适宜使用
nested loop join
;如果输出结果较多,则通过建立聚集索引,而以
merge join
方式查询能得到好的性能。对于性能较低的
hash join
,最好通过转换成
merge join
或者
nested loop join
方式提高查询性能。
/* Font Definitions */
@font-face
{font-family:SimSun;
panose-1:2 1 6 0 3 1 1 1 1 1;
mso-font-alt:宋体;
mso-font-charset:134;
mso-generic-font-family:auto;
mso-font-pitch:variable;
mso-font-signature:3 135135232 16 0 262145 0;}
@font-face
{font-family:新細明體;
panose-1:2 2 3 0 0 0 0 0 0 0;
mso-font-alt:PMingLiU;
mso-font-charset:136;
mso-generic-font-family:roman;
mso-font-pitch:variable;
mso-font-signature:3 137232384 22 0 1048577 0;}
@font-face
{font-family:"/@新細明體";
panose-1:2 2 3 0 0 0 0 0 0 0;
mso-font-charset:136;
mso-generic-font-family:roman;
mso-font-pitch:variable;
mso-font-signature:3 137232384 22 0 1048577 0;}
@font-face
{font-family:"/@SimSun";
panose-1:2 1 6 0 3 1 1 1 1 1;
mso-font-charset:134;
mso-generic-font-family:auto;
mso-font-pitch:variable;
mso-font-signature:3 135135232 16 0 262145 0;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{mso-style-parent:"";
margin:0cm;
margin-bottom:.0001pt;
mso-pagination:none;
font-size:12.0pt;
font-family:"Times New Roman";
mso-fareast-font-family:新細明體;
mso-font-kerning:1.0pt;}
h2
{mso-margin-top-alt:auto;
margin-right:0cm;
mso-margin-bottom-alt:auto;
margin-left:0cm;
mso-pagination:widow-orphan;
mso-outline-level:2;
font-size:18.0pt;
font-family:新細明體;
mso-bidi-font-family:新細明體;
font-weight:bold;}
h3
{mso-margin-top-alt:auto;
margin-right:0cm;
mso-margin-bottom-alt:auto;
margin-left:0cm;
mso-pagination:widow-orphan;
mso-outline-level:3;
font-size:13.5pt;
font-family:新細明體;
mso-bidi-font-family:新細明體;
font-weight:bold;}
p
{mso-margin-top-alt:auto;
margin-right:0cm;
mso-margin-bottom-alt:auto;
margin-left:0cm;
mso-pagination:widow-orphan;
font-size:12.0pt;
font-family:新細明體;
mso-bidi-font-family:新細明體;}
/* Page Definitions */
@page
{mso-page-border-surround-header:no;
mso-page-border-surround-footer:no;}
@page Section1
{size:595.3pt 841.9pt;
margin:72.0pt 90.0pt 72.0pt 90.0pt;
mso-header-margin:42.55pt;
mso-footer-margin:49.6pt;
mso-paper-source:0;
layout-grid:18.0pt;}
div.Section1
{page:Section1;}
-->
众所周知,SQL Server
执行SQL
语句的性能判定标准主要是IO
读取数大小。本文在不违反这一原则情况下,同时来分析一下部分
SQL
语句执行时,
SQL Server
内存的变化情况。
首先简述一下SQL Server
内存占用的特点。SQL Server
所占用的内存除程序(即SQL Server
引擎)外,主要包括缓存的数据(Buffer
)和执行计划(Cache
)。SQL Server
以8KB
大小的页为单位存储数据。这个和SQL Server
数据在磁盘上的存储页大小相同。当
SQL Server
执行
SQL
语句时,如果需要的数据已经在其内存中,则直接从内存缓冲区读取并进行必要的运算然后输出执行结果。如果数据还未在内存中,则首先将数据从磁盘上读入内存
Buffer
中。而我们通常评价
SQL
性能指标中的
IO
逻辑读取数对应的正是从内存缓冲区读取的页数,而
IO
物理读取数则对应数据从磁盘读取的页数。
注:以下的试验在多人共享的开发测试服务器上也可以进行,因为实际上可以分别看到某个表所占用的内存情况。但为了方便,笔者在做此试验时,在一个单独的、确认没有其它并发任务的数据库上进行,因此所看到的内存变化正是每一次所执行的
SQL
语句引起的。
我们首先来看一个简单的实例。创建下表:
Create Table P_User
(
UserMobileStatus int NOT NULL,
MobileNo int NOT NULL,
LastOpTime DateTime Not NULL
)
然后为该表插入一定的数据:
Declare @i int
Set @i=28000
WHILE @i<29000
BEGIN
Insert Into P_User
Select @i % 2,@i,GetUTCDate()
Set @i=@i+1
END
然后我们在查询分析器中首先执行:
Set Statistics IO ON
并按下Ctrl+M
以显示实际的执行计划。
此时,可以开始进行我们的试验了。为了准确观察每一次
SQL
语句变化情况,在执行第一条
SQL
语句以前,我们首先清空
SQL
Server
所占用的数据内存:
CHECKPOINT
GO
DBCC DROPCLEANBUFFERS
这将清空SQL Server
所占用的数据缓冲区(此语句在生产服务器上慎用,因为将导致一段时间内后续的SQL
语句执行变慢)。
测试
1
:在没有索引的表上执行
SQL
语句
1.1
执行全表选取或者低选择性选取
Select * From P_User从SQL
执行计划可以看到,由于此时表中没有任何索引,因此将产生Table
Scan
。而IO
统计结果如下:
(1000 row(s) affected)
表'P_User'
。扫描计数1
,逻辑读取4
次,物理读取4
次,预读0
次,lob
逻辑读取0
次,lob
物理读取0
次,lob
预读0
次。
我们看一下数据库内存中的情况。
首先查询到我们所操作database
的database_id
:
Select database_id From sys.databases Where name='TestGDB'
然后使用该database_id
从表中查看内存情况:
SELECT * FROM sys.dm_os_buffer_descriptors bd
WHERE database_id=5
order by allocation_unit_id,page_id
得到结果如下:
得到的结果中可以看到,除了必要的管理页(一个
PFS_Page
和一个
IAM_Page
)外,内存中总共出现了
4
个
Data_Page
页。这和刚才
IO
统计中看到的结果:逻辑读为
4
,物理读为
4
相同。由于是全表读取,表明
P_User
表全部数据所占用的数据页数也正是
4
,将这
4
个数据页的
row_count
数加起来也可以验证其总数据行
=1000
。
[Page]
在上例中,如果不清空数据缓冲区,再执行一遍
SQL
,可以看到内存毫无变化,而逻辑读也不变,只是物理读变为
0
,因为已经不需要再从磁盘读入数据。
1.2
执行高选择性选取
另外,在没有索引的情况下,如果将上例修改为:Select Top 1 * From P_Order
或者Select
* From P_Order Where MobileNo=28502
可以看到,系统同样要读取全部的数据页到内存。
如果使用Select Top 1 * From P_Order Where MobileNo=28502
这样的选取方式,有可能会出现只读取部分数据页到内存的情况。但由于在没有索引情况下,数据实际上是无序存放在堆上,所以结 果很不稳定,也有可能发生读取所有的数据页到内存。
测试
2
:建立聚集索引情况下,执行
SQL
语句
2.1
执行全表选取或者低选择性选取
修改表结构,在MobileNo字段上建立聚集索引。然后再次执行刚才的SQL
语句。得到的执行计划变为聚集索引扫描。
IO
统计消息为:
(1000 row(s) affected)
表'P_User'
。扫描计数
1
,逻辑读取
6
次,物理读取
1
次,预读
4
次,
lob
逻辑读取
0
次,
lob
物理读取
0
次,
lob
预读
0
次。
这里的逻辑读取变为
6
次。
内存情况如下:
内存中的变化是增加了一个非叶级的聚集索引页,而叶级的聚集索引则会和数据放在一起。
另外,可以查看该表索引的级别:
SELECT database_id,object_id,index_id,index_level,page_count,record_count
FROM sys.dm_db_index_physical_stats
(DB_ID(N'TestGDB'),
OBJECT_ID(N'dbo.P_User'), NULL, NULL , 'DETAILED');
从结果可以看到该表的聚集索引总共分
2
级。
因而逻辑读增加了
2——
(由于发生
Clustered Index Scan
,除了根级别的聚集索引页占用
1
次外,从根级别聚集索引定位到叶级别的聚集索引也将额外占用
1
次逻辑读)。
另外一个变化是只发生了一次物理读,即读取根级别的聚集索引页,另外
4
个数据页则通过预读方式而不是物理读从磁盘装入内存
Buffer
。这使得有聚集索引的情况下,执行
SQL
所直接花费的代价实际上更小。
2.2
执行高选择性选取
在建立聚集索引情况下,对性能有益的变化是:对于Select Top 1 * From P_Order
或者Select
* From P_Order Where MobileNo=28702
这样的语句,在有聚集索引情况下,只会将最终记录所在的页读入内存。
测试
3
:建立非聚集索引情况下,执行
SQL
语句
3.1
执行全表选取或者低选择性选取
如果将表中同一字段的聚集索引换成非聚集索引,则可以看到如下特点:执行全表扫描将和没有任何索引的情况相似,将读取所有的数据页到内存。此时
,SQL Server
的查询引擎实际上无法使用非聚集索引。
3.2
执行高选择性选取
将只读取最终数据所在的页到内存。通过查询计划可以看到,SQL Server
在非聚集索引上使用
INDEX SEEK
,然后通过
lookup
得到数据实际所在行(索引覆盖情况下例外,因为不需要定位到实际数据行)。
测试4
:执行Nested Loop Join
在进行测试前,我们先准备另外一张表和数据。
Create Table P_Order
( UserStatus int NOT NULL,[Page]
MobileNo int NOT NULL,
Sid int Not NULL,
LastSubTime DateTime
)
插入数据:
Declare @i int
Set @i=20000
WHILE @i<30000
BEGIN
Insert Into P_Order
Select @i % 2,@i,@i-19999,GetUTCDate()
set @i=@i+1
END
可以看到,在执行全表扫描情况下,该表10000
条数据总共占用38
个内存数据页。
4.1
执行全表选取或者低选择性选取
Select * From P_Order AInner Loop JOIN P_User B
ON A.MobileNo=B.MobileNo
对于此种高选择性选择,默认情况下SQL Server
不会执行Loop
Join
。因此,使用了强制性的联接提示。
在两个表都没有任何索引的情况下,可以看到:
两个表所有的数据页都将被加载到内存。逻辑读取代价高达
6
万多次
——
对于
P_Order
表中的每一条记录,都将在
P_User
表中进行遍历。
在其中一个表有聚集索引情况下,尽管逻辑读取相比刚才的
6
万多次已经大大下降,但仍然达到
2
万次。而且联接的次序对查询性能影响很大。因为其实际执行的是将
SQL
语句中前面的表作为联接的外部输入,而后面的表作为联接的内部输入。
在两个表都有聚集索引情况下,相比较而言,逻辑读仍然达到数千次(取决于最终输出的数据大小),但相比较已经大大改善。而且表中的数据只有最终需要输出的部分才会被读入内存
Buffer
中。
4.2
执行高选择性选取
执行如下的SQL
语句:
Select * From P_Order A
Inner merge JOIN P_User B ON A.MobileNo=B.MobileNo
Where A.MobileNo=28913
在两个表都没有任何索引情况下,两张表都将执行全表扫描。要读入所有的数据页到内存。总体逻辑读取决于两表的数据页数。
在一个表有聚集索引或者非聚集索引情况下,该表将执行
Index Seek
,另一个表将出现全表扫描。内存数据缓冲区中,将有一张表只读入最终数据所在的数据页、一张表读入全部数据页。逻辑读数取决于表在联接中的秩序、以及无索引表的数据页数。
在两个表都有聚集索引情况下,逻辑读最小,每个表只有
2
到
3
次。而且只有实际需要输出的数据才会被读入内存页。两个表都有非聚集索引情况下,消耗的逻辑读和内存资源近似。
测试
5
:执行
Merge Join
5.1
执行全表选取或者低选择性选取
执行SQL:Select * From P_Order A
Inner merge JOIN P_User B ON A.MobileNo=B.MobileNo
如果两张表都没有任何索引,则两张表都要进行全表扫描。所有的数据都要读入内存页。
逻辑读数近似等于两张表的数据页总和。
SQL Server
处理过程中将使用到临时表。
只有一张表有聚集索引的情形类似,
SQL Server
处理过程中将使用到临时表。并且读入所有的数据页到内存。
如果两张表都有聚集索引,尽管两表的数据都会被读入内存页,但逻辑读数已经大大减少,等于其中一张表总数据内存页数加上最终输出的数据页数。而且
SQL Server
处理过程中将不需要再使用临时表。
5.2
执行高选择性选取
对于这样的高选择性SQL
语句,
SQL Server
将提示无法生成执行计划。
[Page]
Select * From P_Order A
Inner merge JOIN P_User B ON A.MobileNo=B.MobileNo
Where A.MobileNo=28913
但可以执行:
Select * From P_Order A
Inner merge JOIN P_User B ON A.MobileNo=B.MobileNo
Where
A.MobileNo<=28001
(注:最终结果只有
2
条)
这样的属于低选择性语句,但最终结果也很少的语句。如前面所述,这种情况下,采用
netsted loop
联接效率可能更高。
测试
6
:执行
Hash Join
6.1
执行全表选取或者低选择性选取
对于两表联接,如果两张表都没有索引,不写明联接提示的情况下,SQL Server默认使用hash join
。而对于两表联接,如果两张表都有聚集索引,则SQL Server
默认使用Merge Join
。
执行SQL:
Select * From P_Order A
Inner hash JOIN P_User B ON A.MobileNo=B.MobileNo
在使用hash join
情况下,无论两张表有无索引,都将读取所有的数据页到内存,SQL Server
将使用临时表进行处理。逻辑读数近似等于两张表的数据页总和。
6.2
执行高选择性选取
和merge join
执行高选择性选取情况类似,也无法直接执行:
Select * From P_Order A
Inner merge JOIN P_User B ON A.MobileNo=B.MobileNo
Where A.MobileNo=28913
但可以执行这样的结果很少的低选择性脚本:
Select * From P_Order A
Inner merge JOIN P_User B ON A.MobileNo=B.MobileNo
Where A.MobileNo<=28001
(注:最终结果只有2
条)
但此情况下,采用netsted loop
联接效率更高。
测试总结
本次测试的主要意义在于,通过分析具体的内存变化结合执行计划、IO
读取等信息,可以更清楚地了解
SQL Server
执行
SQL
语句过程。
另外,也验证了一些通过分析
SQL
语句的
IO
读取、执行计划曾经得到的经验:
(
1
)
在执行单表查询时,如果是高选择查询,要建立非聚集索引或者聚集索引(推荐非聚集索引,是独立于数据存放的)。如果是低选择性查询,则需要建立聚集索引。
(
2
)
在执行联接查询时,如果最终输出结果很少,则适宜使用
nested loop join
;如果输出结果较多,则通过建立聚集索引,而以
merge join
方式查询能得到好的性能。对于性能较低的
hash join
,最好通过转换成
merge join
或者
nested loop join
方式提高查询性能。
相关文章推荐
- SQL Server执行SQL语句时内存占用特点
- SQL Server执行SQL语句时内存占用特点
- 应用Druid监控SQL语句的执行情况(测试数据表明,Druid性能比DBCP、C3P0、Proxool、JBoss都好)
- 基于SqlServer分析sql语句执行情况
- SQL Server执行SQL语句时内存占用特点(2)
- SQL Server执行SQL语句时内存占用特点(1)
- 检测Sql Server服务器SQL语句执行情况
- HibernateCallback中的session对sql语句执行情况分析.
- 使用SQL Server Profiler跟踪“金蝶K3ERP“后台sql语句执行情况
- 监控SQL Server正在执行的SQL语句和死锁情况
- 检测Sql Server服务器SQL语句执行情况
- SQL SERVER 中构建执行动态SQL语句
- [基础]SQL语句执行效率及分析
- 通过分析SQL语句的执行计划优化SQL
- 查看sql语句执行时间/测试sql语句性能
- 整理:sql server 中sql语句执行顺序
- 查看mysql正在执行的SQL语句,使用profile分析SQL执行状态
- MyBatis源码分析-SQL语句执行的完整流程
- 关于 sql server 客户端执行多条sql语句事务的问题
- SQL语句的执行原理分析