您的位置：首页 > 数据库 > Oracle

Oracle sql语句优化５３个规则详解(三)（www.jiedichina.com）

2007-11-06 12:14 525 查看

南京捷帝 http://www.jiedichina.com

38. 避免在索引列上使用IS NULL和IS NOT NULL

　避免在索引中使用任何可以为空的列，ORACLE将无法使用该索引。对于单列索引，如果列包含空值，索引中将不存在此记录。对于复合索引，如果每个列都为空，索引中同样不存在此记录。　如果至少有一个列不为空，则记录存在于索引中。

举例：

　如果唯一性索引建立在表的A列和B列上，并且表中存在一条记录的A，B值为（123，null）， ORACLE将不接受下一条具有相同A，B值（123，null）的记录（插入）。然而如果所有的索引列都为空，ORACLE将认为整个键值为空而空不等于空。因此你可以插入1000条具有相同键值的记录，当然它们都是空！

因为空值不存在于索引列中，所以WHERE子句中对索引列进行空值比较将使ORACLE停用该索引。

举例：

低效：（索引失效）

SELECT …
FROM DEPARTMENT
　WHERE DEPT_CODE IS NOT NULL；

高效：（索引有效）

SELECT …
FROM DEPARTMENT
　WHERE DEPT_CODE >=0；

　39. 总是使用索引的第一个列

　如果索引是建立在多个列上，只有在它的第一个列（leading column）被where子句引用时，优化器才会选择使用该索引。

译者按：这也是一条简单而重要的规则。见以下实例。

SQL> create table multiindexusage （ inda number ， indb number ， descr varchar2（10））；
　Table created.
　SQL> create index multindex on multiindexusage（inda，indb）；
　Index created.
　SQL> set autotrace traceonly
SQL> select * from multiindexusage where inda = 1；
　Execution Plan

　----------------------------------------------------------

0 SELECT STATEMENT Optimizer=CHOOSE
　1 0 TABLE ACCESS （BY INDEX ROWID） OF 'MULTIINDEXUSAGE'
　2 1 INDEX （RANGE SCAN） OF 'MULTINDEX' （NON-UNIQUE）

SQL> select * from multiindexusage where indb = 1；
　Execution Plan

　----------------------------------------------------------

0 SELECT STATEMENT Optimizer=CHOOSE
　1 0 TABLE ACCESS （FULL） OF 'MULTIINDEXUSAGE'

很明显，当仅引用索引的第二个列时，优化器使用了全表扫描而忽略了索引

40. ORACLE内部操作

　当执行查询时，ORACLE采用了内部的操作。下表显示了几种重要的内部操作。

[align=left]ORACLE Clause[/align]	[align=left]内部操作[/align]
[align=left]ORDER BY[/align]	[align=left]SORT ORDER BY[/align]
[align=left]UNION[/align]	[align=left]UNION-ALL[/align]
[align=left]MINUS[/align]	[align=left]MINUS[/align]
[align=left]INTERSECT[/align]	[align=left]INTERSECT[/align]
[align=left]DISTINCT,MINUS,INTERSECT,UNION[/align]	[align=left]SORT UNIQUE[/align]
[align=left]MIN,MAX,COUNT[/align]	[align=left]SORT AGGREGATE[/align]
[align=left]GROUP BY[/align]	[align=left]SORT GROUP BY[/align]
[align=left]ROWNUM[/align]	[align=left]COUNT or COUNT STOPKEY[/align]
[align=left]Queries involving Joins[/align]	[align=left]SORT JOIN,MERGE JOIN,NESTED LOOPS[/align]
[align=left]CONNECT BY[/align]	[align=left]CONNECT BY[/align]

41. 用UNION-ALL 替换UNION （如果有可能的话）

当SQL语句需要UNION两个查询结果集合时，这两个结果集合会以UNION-ALL的方式被合并，然后在输出最终结果前进行排序。

如果用UNION ALL替代UNION，这样排序就不是必要了。效率就会因此得到提高。

举例：

　低效：

　SELECT ACCT_NUM， BALANCE_AMT
　FROM DEBIT_TRANSACTIONS
　WHERE TRAN_DATE = ‘31-DEC-95’
　UNION
　SELECT ACCT_NUM， BALANCE_AMT
　FROM DEBIT_TRANSACTIONS
　WHERE TRAN_DATE = ‘31-DEC-95’

　高效：

　SELECT ACCT_NUM， BALANCE_AMT
　FROM DEBIT_TRANSACTIONS
　WHERE TRAN_DATE = ‘31-DEC-95’
　UNION ALL
　SELECT ACCT_NUM， BALANCE_AMT
　FROM DEBIT_TRANSACTIONS
　WHERE TRAN_DATE = ‘31-DEC-95’

译者按：需要注意的是，UNION ALL 将重复输出两个结果集合中相同记录。因此各位还是要从业务需求分析使用UNION ALL的可行性。

UNION 将对结果集合排序，这个操作会使用到SORT_AREA_SIZE这块内存。对于这块内存的优化也是相当重要的。下面的SQL可以用来查询排序的消耗量

Select substr（name，1，25） "Sort Area Name"，
　substr（value，1，15） "Value"
　from v$sysstat
　where name like 'sort%'

42. 使用提示（Hints）

对于表的访问，可以使用两种Hints.

　FULL 和 ROWID

FULL hint 告诉ORACLE使用全表扫描的方式访问指定表。

例如：

　SELECT /*+ FULL（EMP） */ *
　FROM EMP
　WHERE EMPNO = 7893；

ROWID hint 告诉ORACLE使用TABLE ACCESS BY ROWID的操作访问表。

通常，你需要采用TABLE ACCESS BY ROWID的方式特别是当访问大表的时候，使用这种方式，你需要知道ROIWD的值或者使用索引。

如果一个大表没有被设定为缓存（CACHED）表而你希望它的数据在查询结束是仍然停留在SGA中，你就可以使用CACHE hint 来告诉优化器把数据保留在SGA中。通常CACHE hint 和 FULL hint 一起使用。

例如：

　SELECT /*+ FULL（WORKER） CACHE（WORKER）*/ *
　FROM WORK；

索引hint 告诉ORACLE使用基于索引的扫描方式。你不必说明具体的索引名称

　例如：

　SELECT /*+ INDEX（LODGING） */ LODGING
　FROM LODGING
　WHERE MANAGER = ‘BILL GATES’；

在不使用hint的情况下，以上的查询应该也会使用索引，然而，如果该索引的重复值过多而你的优化器是CBO，优化器就可能忽略索引。在这种情况下，你可以用INDEX hint强制ORACLE使用该索引。

ORACLE hints 还包括ALL_ROWS， FIRST_ROWS， RULE，USE_NL， USE_MERGE， USE_HASH 等等。

译者按：使用hint ，表示我们对ORACLE优化器缺省的执行路径不满意，需要手工修改。这是一个很有技巧性的工作。我建议只针对特定的，少数的SQL进行hint的优化。对ORACLE的优化器还是要有信心（特别是CBO）

43. 用WHERE替代ORDER BY

　ORDER BY 子句只在两种严格的条件下使用索引。

ORDER BY中所有的列必须包含在相同的索引中并保持在索引中的排列顺序。

ORDER BY中所有的列必须定义为非空。

WHERE子句使用的索引和ORDER BY子句中所使用的索引不能并列。

例如：

　表DEPT包含以下列：

DEPT_CODE PK NOT NULL
　DEPT_DESC NOT NULL
　DEPT_TYPE NULL

非唯一性的索引（DEPT_TYPE）

低效：（索引不被使用）

SELECT DEPT_CODE
　FROM DEPT
　ORDER BY DEPT_TYPE

EXPLAIN PLAN：
　　SORT ORDER BY
　　　　TABLE ACCESS FULL

　高效：（使用索引）

SELECT DEPT_CODE
　FROM DEPT
　WHERE DEPT_TYPE > 0

　EXPLAIN PLAN：
　　TABLE ACCESS BY ROWID ON EMP
　　　INDEX RANGE SCAN ON DEPT_IDX

　译者按：ORDER BY 也能使用索引！这的确是个容易被忽视的知识点。我们来验证一下：

SQL> select * from emp order by empno；
Execution Plan

----------------------------------------------------------

0 SELECT STATEMENT Optimizer=CHOOSE
　1 0 TABLE ACCESS （BY INDEX ROWID） OF 'EMP'
　2 1 INDEX （FULL SCAN） OF 'EMPNO' （UNIQUE）

44. 避免改变索引列的类型。

当比较不同数据类型的数据时， ORACLE自动对列进行简单的类型转换。

假设 EMPNO是一个数值类型的索引列。

SELECT …
FROM EMP
　WHERE EMPNO = ‘123’

　实际上，经过ORACLE类型转换，语句转化为：

　SELECT …
FROM EMP
　WHERE EMPNO = TO_NUMBER（‘123’）

幸运的是，类型转换没有发生在索引列上，索引的用途没有被改变。

现在，假设EMP_TYPE是一个字符类型的索引列。

SELECT …
FROM EMP
WHERE EMP_TYPE = 123

　这个语句被ORACLE转换为：

　SELECT …
FROM EMP
　WHERE TO_NUMBER（EMP_TYPE）=123

　因为内部发生的类型转换，这个索引将不会被用到！

译者按：为了避免ORACLE对你的SQL进行隐式的类型转换，最好把类型转换用显式表现出来。注意当字符和数值比较时， ORACLE会优先转换数值类型到字符类型。

45. 需要当心的WHERE子句

　某些SELECT 语句中的WHERE子句不使用索引。这里有一些例子。

在下面的例子里， ‘！=’ 将不使用索引。记住，索引只能告诉你什么存在于表中，而不能告诉你什么不存在于表中。

不使用索引：

　SELECT ACCOUNT_NAME
　FROM TRANSACTION
　WHERE AMOUNT ！=0；

　使用索引：

　SELECT ACCOUNT_NAME
　FROM TRANSACTION
　WHERE AMOUNT >0；

　下面的例子中， ‘||’是字符连接函数。就象其他函数那样，停用了索引。

不使用索引：

　SELECT ACCOUNT_NAME，AMOUNT
　FROM TRANSACTION
　WHERE ACCOUNT_NAME||ACCOUNT_TYPE=‘AMEXA’；

　使用索引：

　SELECT ACCOUNT_NAME，AMOUNT
　FROM TRANSACTION
　WHERE ACCOUNT_NAME = ‘AMEX’AND ACCOUNT_TYPE=‘ A’；

　下面的例子中， ‘+’是数学函数。就象其他数学函数那样，停用了索引。

不使用索引：

　SELECT ACCOUNT_NAME， AMOUNT
　FROM TRANSACTION
　WHERE AMOUNT + 3000 >5000；

　使用索引：

　SELECT ACCOUNT_NAME， AMOUNT
　FROM TRANSACTION
　WHERE AMOUNT > 2000 ；

　下面的例子中，相同的索引列不能互相比较，这将会启用全表扫描。

不使用索引：

　SELECT ACCOUNT_NAME， AMOUNT
　FROM TRANSACTION
　WHERE ACCOUNT_NAME = NVL（：ACC_NAME，ACCOUNT_NAME）；

　使用索引：

　SELECT ACCOUNT_NAME， AMOUNT
　FROM TRANSACTION
　WHERE ACCOUNT_NAME LIKE NVL（：ACC_NAME，‘%’）；

　译者按：如果一定要对使用函数的列启用索引， ORACLE新的功能：基于函数的索引（Function-Based Index）也许是一个较好的方案。

CREATE INDEX EMP_I ON EMP （UPPER（ename））； /*建立基于函数的索引*/
　SELECT * FROM emp WHERE UPPER（ename） = ‘BLACKSNAIL’； /*将使用索引*/

　46. 连接多个扫描

　如果你对一个列和一组有限的值进行比较，优化器可能执行多次扫描并对结果进行合并连接。

举例：

　SELECT *
　FROM LODGING
　WHERE MANAGER IN （‘BILL GATES’，‘KEN MULLER’）；

　优化器可能将它转换成以下形式

　SELECT *
　FROM LODGING
　WHERE MANAGER = ‘BILL GATES’OR MANAGER = ‘KEN MULLER’；

　当选择执行路径时，优化器可能对每个条件采用LODGING$MANAGER上的索引范围扫描。返回的ROWID用来访问LODGING表的记录（通过TABLE ACCESS BY ROWID 的方式）。最后两组记录以连接（CONCATENATION）的形式被组合成一个单一的集合。

Explain Plan ：
　SELECT STATEMENT Optimizer=CHOOSE
　CONCATENATION
　　TABLE ACCESS （BY INDEX ROWID） OF LODGING
　　　INDEX （RANGE SCAN ） OF LODGING$MANAGER （NON-UNIQUE）
　 TABLE ACCESS （BY INDEX ROWID） OF LODGING
　　　INDEX （RANGE SCAN ） OF LODGING$MANAGER （NON-UNIQUE）

译者按：本节和第37节似乎有矛盾之处。

47. CBO下使用更具选择性的索引

　基于成本的优化器（CBO， Cost-Based Optimizer）对索引的选择性进行判断来决定索引的使用是否能提高效率。

如果索引有很高的选择性，那就是说对于每个不重复的索引键值，只对应数量很少的记录。

比如，表中共有100条记录而其中有80个不重复的索引键值。这个索引的选择性就是80/100 = 0.8 . 选择性越高，通过索引键值检索出的记录就越少。

如果索引的选择性很低，检索数据就需要大量的索引范围查询操作和ROWID 访问表的操作。也许会比全表扫描的效率更低。

译者按：

　下列经验请参阅：

　a. 如果检索数据量超过30%的表中记录数。使用索引将没有显著的效率提高。
b. 在特定情况下，使用索引也许会比全表扫描慢，但这是同一个数量级上的区别。而通常情况下，使用索引比全表扫描要快几倍乃至几千倍！

48. 避免使用耗费资源的操作

　带有DISTINCT，UNION，MINUS，INTERSECT，ORDER BY的SQL语句会启动SQL引擎执行耗费资源的排序（SORT）功能。 DISTINCT需要一次排序操作，而其他的至少需要执行两次排序。

例如，一个UNION查询，其中每个查询都带有GROUP BY子句， GROUP BY会触发嵌入排序（NESTED SORT）；这样，每个查询需要执行一次排序，然后在执行UNION时，又一个唯一排序（SORT UNIQUE）操作被执行而且它只能在前面的嵌入排序结束后才能开始执行。嵌入的排序的深度会大大影响查询的效率。

通常，带有UNION， MINUS ， INTERSECT的SQL语句都可以用其他方式重写。

译者按：如果你的数据库的SORT_AREA_SIZE调配得好，使用UNION ， MINUS， INTERSECT也是可以考虑的，毕竟它们的可读性很强

49. 优化GROUP BY

　提高GROUP BY 语句的效率，可以通过将不需要的记录在GROUP BY 之前过滤掉。下面两个查询返回相同结果但第二个明显就快了许多。

低效：

　SELECT JOB ， AVG（SAL）
FROM EMP
　GROUP by JOB
　HAVING JOB = ‘PRESIDENT’
　OR JOB = ‘MANAGER’

　高效：

　SELECT JOB ， AVG（SAL）
FROM EMP
　WHERE JOB = ‘PRESIDENT’
　OR JOB = ‘MANAGER’GROUP by JOB

　译者按：本节和14节相同。可略过。

50. 使用日期当

　使用日期是，需要注意如果有超过5位小数加到日期上，这个日期会进到下一天！

例如：

　1.

　SELECT TO_DATE（‘01-JAN-93’+.99999）
FROM DUAL；
　Returns：“01-JAN-93 23：59：59‘

　2.

　SELECT TO_DATE（’01-JAN-93‘+.999999）
FROM DUAL；
Returns：“02-JAN-93 00：00：00‘

　译者按：虽然本节和SQL性能优化没有关系，但是作者的功力可见一斑

　51. 使用显式的游标（CURSORs）

使用隐式的游标，将会执行两次操作。第一次检索记录，第二次检查TOO MANY ROWS 这个exception . 而显式游标不执行第二次操作。

52. 优化EXPORT和IMPORT

　使用较大的BUFFER（比如10MB ， 10，240，000）可以提高EXPORT和IMPORT的速度。

ORACLE将尽可能地获取你所指定的内存大小，即使在内存不满足，也不会报错。这个值至少要和表中最大的列相当，否则列值会被截断。

译者按：可以肯定的是，增加BUFFER会大大提高EXPORT ， IMPORT的效率。（曾经碰到过一个CASE，增加BUFFER后，IMPORT/EXPORT快了10倍！）

作者可能犯了一个错误： “这个值至少要和表中最大的列相当，否则列值会被截断。 ”其中最大的列也许是指最大的记录大小。

关于EXPORT/IMPORT的优化，CSDN论坛中有一些总结性的贴子，比如关于BUFFER参数， COMMIT参数等等，详情请查。

53. 分离表和索引

　总是将你的表和索引建立在不同的表空间内（TABLESPACES）。决不要将不属于ORACLE内部系统的对象存放到SYSTEM表空间里。同时，确保数据表空间和索引表空间置于不同的硬盘上。

译者按：“同时，确保数据表空间和索引表空间置与不同的硬盘上。”可能改为如下更为准确 “同时，确保数据表空间和索引表空间置与不同的硬盘控制卡控制的硬盘上。”

南京捷帝 http://www.jiedichina.com

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航