您的位置:首页 > 数据库

SQL语句优化的一般方法(一)

2013-12-30 20:55 134 查看
1、使用索引提高查询效率:对于大数据量的表,对经常查询的字段建立索引,能够很大程度上提高查询效率,如果将表看作一本书,索引的作用就类似于书中的目录。在没有目录的情况下,要在书中查找制定的内容(即查询条件),必须查阅全书;而有了目录之后,只需要通过目录就可以快速地找到包含所需内容的页。但是使用索引也是一把双刃剑,索引需要空间来存储,也需要定期维护,
每当有记录在表中增减或索引列被修改时, 索引本身也会被修改。这意味着每条记录的INSERT 、DELETE、UPDATE将为此多付出4 、 5 次的磁盘I/O ,因为索引需要额外的存储空间和处理,那些不必要的索引反而会使查询反应时间变慢,因此使用需要索引时需要考虑清楚,哪些表适合建立索引,以及哪些字段适合建索引。

2、SELECT子句中避免使用
‘ * ‘:

  ORACLE在解析的过程中, 会将’*’ 依次转换成所有的列名, 这个工作是通过查询数据字典完成的,
这意味着将耗费更多的时间。

3、只要有可能,在程序中尽量多使用COMMIT,
这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少:

  COMMIT所释放的资源:

  a.
回滚段上用于恢复数据的信息.

  b. 被程序语句获得的锁

  c. redo log buffer 中的空间

  d. ORACLE为管理上述3种资源中的内部花费

4、用Where子句替换HAVING子句:

  避免使用HAVING子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤. 这个处理需要排序,总计等操作. 如果能通过WHERE子句限制记录的数目,那就能减少这方面的开销. (非oracle中)on、where、having这三个都可以加条件的子句中,on是最先执行,where次之,having最后,因为on是先把不符合条件的记录过滤后才进行统计,它就可以减少中间运算要处理的数据,按理说应该速度是最快的,where也应该比having快点的,因为它过滤数据后才进行sum,在两个表联接时才用on的,所以在一个表的时候,就剩下where跟having比较了。在这单表查询统计的情况下,如果要过滤的条件没有涉及到要计算字段,那它们的结果是一样的,只是where可以使用rushmore技术,而having就不能,在速度上后者要慢如果要涉及到计算的字段,就表示在没计算之前,这个字段的值是不确定的,where的作用时间是在计算之前就完成的,而having就是在计算后才起作用的,所以在这种情况下,两者的结果会不同。在多表联接查询时,on比where更早起作用。系统首先根据各个表之间的联接条件,把多个表合成一个临时表后,再由where进行过滤,然后再计算,计算完后再由having进行过滤。由此可见,要想过滤条件起到正确的作用,首先要明白这个条件应该在什么时候起作用,然后再决定放在那里。

5、在含有子查询的SQL语句中,要特别注意减少对表的查询.例子:  

SELECT TAB_NAME FROM TABLES WHERE (TAB_NAME,DB_VER) = ( SELECT TAB_NAME,DB_VER
FROM TAB_COLUMNS WHERE VERSION = 604)。

6、用EXISTS替代IN、用NOT
EXISTS替代NOT IN:

在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(或NOT EXISTS)通常将提高查询的效率.
子查询中,NOT
IN子句将执行一个内部的排序和合并. 无论在哪种情况下,NOT IN都是最低效的 (因为它对子查询中的表执行了一个全表遍历).
为了避免使用NOT IN ,我们可以把它改写成外连接(Outer
Joins)或NOT EXISTS。

7、使用表的别名(Alias):

  当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column上.这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误。

8、用>=替代>,用<=替代<

高效:   SELECT * FROM EMP WHERE DEPTNO >=9000

低效:   SELECT * FROM EMP WHERE DEPTNO >9001   

两者的区别在于, 前者DBMS将直接跳到第一个DEPT等于9000的记录而后者将首先定位到DEPTNO=9001的记录并且向前扫描到第一个DEPT大于9000的记录。 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: