您的位置:首页 > 数据库

索引,一文搞定 | 数据库系列

2019-10-24 19:15 1481 查看
前段时间写数据库内核比较多,最近又有朋友问索引的应用了,其实相关索引应用之前或多或少写过,只是可能不这么系统,这一篇简单总结一下,并系统性补充一些概念。
画外音:本文基于MySQL5.6。
 
什么是聚集索引,非聚集索引?
详见《聚集索引,普通索引的差异》。

索引底层数据结构如何?
详见《数据库索引,到底是什么做的?》。

InnoDB到底支不支持hash索引?
详见《InnoDB到底支不支持哈希索引?》。
 
什么是回表查询,索引的覆盖?
详见《如何避免回表查询?什么是索引覆盖?》。
 
什么是联合索引?
多个字段上建立的索引,能够加速复核查询条件的检索。
举例,登录业务需求:

select uid, login_time from t_user where 

login_name=? and passwd=?

可以建立(login_name, passwd)的联合索引。
 
联合索引能够满足最左侧查询需求,例如(a, b, c)三列的联合索引,能够加速a | (a, b) | (a, b, c) 三组查询需求。
 
这也就是为何不建立(passwd, login_name)这样联合索引的原因,业务上几乎没有passwd的单条件查询需求,而有很多login_name的单条件查询需求。
 
SQL语句里,where条件中的and前后的顺序,是否会影响索引的命中?
不会(这是很多朋友容易搞错的地方)。
 
举个例子:

select uid, login_time from t_user where

passwd=? and login_name=?

能否命中(login_name, passwd)这个联合索引?
可以,最左侧查询需求,并不是指SQL语句的写法必须满足索引的顺序。

主键与唯一索引约束是啥?
详见《MySQL不为人知的主键与唯一索引约束》,很多人经常在这里采坑。
 
类型不匹配,字符编码不匹配,会不会对索引命中产生影响?
会,详见《两类非常隐蔽的全表扫描,不能命中索引》,介绍得比较详细。
 
负向查询,IN,OR,UNION哪些会对索引命中有影响?
 
举个例子:
假设订单业务表结构为:
order(oid, date, uid, status, money, time,…)
相关字段上也建立了索引。
 
假设订单有三种状态:0已下单,1已支付,2已完成
业务需求,查询未完成的订单,哪个SQL更快呢?

(1)select * from order where status!=2

(2)select * from order where status IN(0,1)

(3)select * from order where status=0 or status=1

(4)select * from order where status=0

union all

select * from order where status=1

 
第一个select * from order where status!=2
负向查询肯定不可以命中索引,无争议。
画外音:
前导模糊查询,像like '%XX'是同样的道理,无法命中索引;
非前导模糊查询,像like 'XX%',则可以命中索引。
 
最后一个

select * from order where status=0

union all

select * from order where status=1

两个SQL结果集合并,肯定可以命中status索引,无争议。
 
IN查询
select * from order where status in (0,1)
explain下试试看?是可以命中索引的。
 
OR查询
select * from order where status=0 or status=1
新版MySQL,可以优化为IN查询,故也是可以命中索引的。
 
其他一些实践
(1)数据区分度不大的字段,不宜使用索引
例如:
select * from user where sex=1
因为,性别只有男,女,每次过滤掉的数据很少,性能和全表扫描差不多。
 
(2)属性上的计算,不能命中索引
select * from order where YEAR(date) < ='2019'
即使date上建立了索引,也会全表扫描,可优化为值计算
select * from order where date < =CURDATE()
或者:
select * from order where date < ='2019-10-24'
后两者可以命中索引。
 
(3)如果列允许null值,查询会有巨大的坑。
例如:
select * from user where name != 'shenjian'
假设数据表有:

(1, shenjian)

(2, zhangsan)

(3, lisi)

(4, null)

你猜猜结果集中会包含哪些记录?
画外音:数据库允许空值(null),往往是悲剧的开始》。
 
希望大家对索引有更系统性的认识。

架构师之路-分享技术思路


相关文章

缓冲池(buffer pool),彻底懂了!
写缓冲(change buffer),彻底懂了!


1024,祝大家节日快乐!谢转。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: