您的位置:首页 > 数据库

Sql语句优化-查询两表不同行NOT IN、NOT EXISTS、连接查询Left Join

2015-01-21 16:23 633 查看
在实际开发中,我们往往需要比较两个或多个表数据的差别,比较那些数据相同那些数据不相同,这时我们有一下三种方法可以使用:1. IN或NOT IN,2. EXIST或NOTEXIST,3.使用连接查询(inner join,left join 或者 right join)。

看下面的数据,我们准备选择出在depart_info中的pid在user_info中不存在的depart_信息。

有表1:depart_info




表2:user_info




方法一:采用NOT IN

IN和NOT IN后面接的是一个集合,in 是把外表和内表作hash 连接。



SELECT d.* FROM depart_info d WHERE NOT EXISTS (SELECT * FROM user_info u WHERE d.pid = u.pid);


经测试耗时在0.002s左右。

方法二:采用NOT EXISTS

EXISTS 和 NOT EXISTS是对外表作loop循环,每次loop循环再对内表进行查询,



SELECT d.* FROM depart_info d WHERE NOT EXISTS (SELECT * FROM user_info u WHERE d.pid = u.pid);


经测试耗时在0.002s左右。

方法三:采用连接查询

连接查询包括:

1、自连接(join 等同于inner join ):查询结果为两边都存在的数据

2、左连接 left join :返回左边全部数据,右边存在返回,不存在为null

3、 右连接 right join :返回右边全部数据,左边存在返回,不存在为null

4、 全连接 full join :只要某个表中存在就返回,另一个不存在为nul

SELECT d.* FROM depart_info d LEFT JOIN user_info u ON d.pid = u.pid WHERE u.pid IS NULL ;


经测试耗时在0.001s左右




总结:

1、对于小量数据exists 和in差不多,如果数据较多的话(在百万行)建议使用exists,更好的话使用关联查询。

2、数量较小,如果两个表中一个较小,一个是大表,则子查询表大的用exists,子查询表小的用in。

3、如果子查询中返回的任意一条记录含有空值,则IN查询将不返回任何记录,这点需注意。

4、返回数据是两个表的多个字段数据,建议使用关联查询。不仅速度快,而且返回数据可以自定义。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: