您的位置：首页 > 数据库 > MySQL

mysql InnoDB 索引小记

2016-03-24 18:16 447 查看

0、索引结构

1）、MyISAM与InnoDB索引结构比较，如下：

2）、MyISAM的索引结构

主键索引和二级索引结构很像，叶子存储的都是索引以及数据存储的物理地址，其他节点存储的仅仅是索引信息。其数据物理地址相连。

3）、InnoDB的索引结构

主键索引的每一个叶子存储的都是一行数据，而二级索引的每一个叶子存储的是二级索引以及主键索引，其他节点存储的仅仅是索引信息。

1、索引使用原则

1）、最左前缀匹配原则，mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配，比如a = 1 and b = 2 and c > 3 and d = 4 如果建立(a,b,c,d)顺序的索引，d是用不到索引的，如果建立(a,b,d,c)的索引则都可以用到，a,b,d的顺序可以任意调整。

2）、=和in可以乱序，比如a = 1 and b = 2 and c = 3 建立(a,b,c)引可以任意顺序，mysql的查询优化器会帮你优化成索引可以识别的形式

3）、尽量选择区分度高的列作为索引,区分度的公式是count(distinct col)/count(*)，表示字段不重复的比例，比例越大我们扫描的记录数越少，唯一键的区分度是1，而一些状态、性别字段可能在大数据面前区分度就是0，那可能有人会问，这个比例有什么经验值吗？使用场景不同，这个值也很难确定，一般需要join的字段我们都要求是0.1以上，即平均1条扫描10条记录。

4）、索引列不能参与计算，保持列“干净”，比如from_unixtime(create_time) = ’2016-03-24’就不能使用到索引，原因很简单，b+树中存的都是数据表中的字段值，但进行检索时，需要把所有元素都应用函数才能比较，显然成本太大。所以语句应该写成create_time = unix_timestamp(’2016-03-24’);

5）、尽量的扩展索引，不要新建索引。比如表中已经有a的索引，现在要加(a,b)的索引，那么只需要修改原来的索引即可。

6）、如果表记录比较少，则可以不用使用索引。

2、使用联合索引的七种情况

1）、全列索引
mysql会使用索引，列顺序可以颠倒。

2）、最左前缀索引
mysql会使用索引

3）、查询条件用到了索引中的精确匹配，但中间某个条件未提供
mysql不会使用索引，但是如果把中间缺失的那个索引列补上，则可以有index优化。
“IN”可以用于索引列。

4）、查询条件未指定索引第一列
mysql不会使用索引。

5）、匹配某列的前缀字符串
只要通配符%不出现在开头，mysql可以为此列使用索引。

6）、范围查询
范围列可以用到索引，必须是最左前缀，但范围列后面的索引则列无法用到索引。

7）、查询条件列含有函数或者表达式
mysql不会为此列使用索引。

MySQL中的样例库中titles中

将索引emp_no删除，之后

当Where后面的查询条件都跟索引中列顺序一致时，

当其顺序与索引中顺序不一致时，

备注：这是由于MySQL的查询优化器会自动调整where条件的顺序来使用合适的索引。

备注：以上查询，Where条件中只是使用了索引中连续的一个或几个，当没有遵循最左前缀查询时，则只能进行全表扫描！

当联合索引中缺少某列时，且该列是可枚举的，此时可以将该列枚举一下，填坑的方式使其能够形成最左前缀。

当联合索引遇到>,<,>=,<=等符号时，则索引停止，这里跟普通的联合索引有所不同，当不是主键联合索引时，则当第一列使用了该种符号，则不会使用索引，当第二列使用时，则第一列才会使用索引。

如user表中的联合所有是(username,passport,loginTime)，则当

1）、select * from user where username < 'Lee Tao' and passport = '123456';时，不会使用索引；

2）、select * from user where username = 'Lee Tao' and passport > '123456';时，则只会使用第一列username长度的索引；

不能在索引列上进行计算，也不能在索引列上添加函数计算，否则也不会使用该索引。

order by中当是联合主键时，是会使用索引，当是普通的联合索引时，若想要使用索引，则需要force index或查询的就是索引列，如：

一般order by需要跟limit或where一起使用时才能使用索引。

以下是普通索引的样例：

以上根据比例，新增有限制长度的索引。

当使用>=时，当是索引第一列时，则不会使用索引。

备注：对于同一张表的查询，每次只会用一个索引！

综上，存在联合索引a_b_c(a,b,c)，其中假设每个列的长度分别为1，2，3，则根据where条件不同，应用最左前缀匹配原则，有：

1)、a = 1 and b = 2 and c = 3时，使用联合索引a_b_c(1+2+3)进行等值查找；
2）、a = 1 and b = 2时，使用联合索引a_b_c(1+2)进行查找，由于缺了c，只能使用部分索引；
3）、a = 1 and c = 3时，使用联合索引a_b_c(1)进行查找，由于缺了b，只能使用部分索引；当b是可枚举时，可以使用填坑的方式，将其补齐，如a = 1 and b in (1,2) and c = 3时，此时使用联合索引(1 + 2 + 3)；
4)、a = 1时，使用联合索引a_b_c(1)进行查找，由于只有a，只能使用部分索引；
5）、b = 2 或 c = 3 或 b = 2 and c = 3时，由于此时不满足最左前缀匹配，故不会使用联合索引a_b_c；
6）、a = 1 and b = 2 and c > 3时，使用联合索引a_b_c(1 + 2)，其中当索引列遇到>,<,>=,<=等符号时，则索引停止；
7）、a > 1 and b = 2时，当该索引是普通索引时，则不会使用索引，否则会使用索引a_b_c(1)。

备注：
1)、建立索引根据(表中该列的不同的值的行数) / (表中的所有记录行数 )的比例，越接近1，说明其可区分度高，则可以建立索引，当接近0时，即可区分度不高时，如性别或状态什么，就不适合建立索引。
2）、能建立联合索引的尽量建立联合索引。

小知识：前缀索引
前缀索引的选择
select count(distinct column_name) / count(*) from table_name;

select count(distinct left(column_name, prefix_length)) / count(*) from table_name;

建立前缀索引
alter table table_name add index(column_name(prefix_length));

前缀索引的优缺点：有效减少了索引文件的大小，提高了索引的速度，但不能在order by 或group by 中使用，也不能作用在覆盖索引(Covering Index)。

图说mysql查询执行流程【来自于网络】

1）、查询缓存，判断sql语句是否完全匹配，再判断是否有权限，两个判断为假则到解析器解析语句，为真则提取数据结果返回给用户。
2）、解析器解析。解析器先词法分析，语法分析，检查错误比如引号有没闭合等，然后生成解析树。
3）、预处理。预处理解决解析器无法决解的语义，如检查表和列是否存在，别名是否有错，生成新的解析树。
4）、优化器做大量的优化操作。
5）、生成执行计划。
6）、查询执行引擎，负责调度引擎获取相应数据
7）、返回结果。

参考：
http://blog.coderland.net/mysql/2015/08/26/MySQL%E7%B4%A2%E5%BC%95%E5%AE%9E%E8%B7%B5/ http://www.kancloud.cn/kancloud/theory-of-mysql-index/41857 http://tech.meituan.com/mysql-index.html http://www.cnblogs.com/hustcat/archive/2009/10/28/1591648.html http://tec.5lulu.com/detail/104dan2wtey6z85a7.html http://www.2cto.com/database/201302/188193.html
以上所引用的图什么大部分来自于网络！

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航