您的位置:首页 > 数据库 > MySQL

MySQL技术内幕 InnoDB存储引擎:B+树索引的使用

2018-10-16 08:06 1011 查看
版权声明:作者:jiankunking 出处:http://blog.csdn.net/jiankunking 本文版权归作者和CSDN共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接。 https://blog.csdn.net/xunzaosiyecao/article/details/83067509

1、联合索引

MySQL允许对表上的多个列进行索引,联合索引的创建方法与单个索引创建的方法一样,不同之处仅在于有多个索引列。

CREATE TABLE t( a INT, b INT,
PRIMARY KEY(a),
KEY idx_a_b(a, b)
)ENGINE=InnoDB

多个键值的B+树

  • 对于查询SELECT*FROM TABLE WHERE a=xxx and b=xxx,显然是可以使用(a, b)这个联合索引的。
  • 对于单个的a列查询SELECT*FROM TABLE WHERE a=xxx,也可以使用这个(a, b)索引。
  • 但对于b列的查询SELECT*FROM TABLE WHERE b=xxx,则不可以使用这棵B+树索引。

联合索引的第二个好处是已经对第二个键值进行了排序处理。 例如,在很多情况下应用程序都需要查询某个用户的购物情况,并按照时间进行排序,最后取出最近三次的购买记录,这时使用联合索引可以避免多一次的排序操作,因为索引本身在叶子节点已经排序了。

2、覆盖索引(covering index)

即从辅助索引中就可以得到查询的记录, 而不需要查询聚集索引中的记录。 使用覆盖索引的一个好处是辅助索引不包含整行记录的所有信息, 故其大小要远小于聚集索引, 因此可以减少大量的 IO 操作。

对于InnoDB存储引擎的辅助索引而言,由于其包含了主键信息,因此其叶子节点存放的数据为(primary key1,priamey key2,…,key1,key2,…)。例如,下面语句都可仅使用一次辅助联合索引来完成查询

SELECT key2 FROM table WHERE key1=xxx;
SELECT primary key2,key2 FROM table key1=xxx;
SELECT primary key1,key2 FROM table key1=xxx;
SELECT primary key1,primary key2,key2 FROM table key1=xxx;

覆盖索引的另一个好处是对某些统计问题而言,如上的buy_log,要进行如下查询

CREATE TABLE buy_log(
userid INT UNSIGNED NOT NULL,
buy_date DATE
)ENGINE=INNODB;
INSERT INTO buy_log VALUES(1,‘2009-01-01‘);
INSERT INTO buy_log VALUES(2,‘2009-01-01‘);
INSERT INTO buy_log VALUES(3,‘2009-01-01‘);
INSERT INTO buy_log VALUES(1,‘2009-02-01‘);
INSERT INTO buy_log VALUES(3,‘2009-02-01‘);
INSERT INTO buy_log VALUES(1,‘2009-03-01‘);
INSERT INTO buy_log VALUES(1,‘2009-04-01‘);
ALTER TABLE buy_log ADD KEY(userid);
ALTER TABLE buy_log ADD KEY(userid,buy_date);
explain SELECT COUNT(*) FROM buy_log;

InnoDB存储引擎并不会选择通过查询聚集索引来进行统计。由于buy_log还有辅助索引,而辅助索引远小于聚集索引。选择辅助索引可以减少IO操作。

如图显示。possible_keys是NULL,但是实际执行优化器却选择了userid,而列Extra的Using index就是代表优化器选择了覆盖索引的操作 。

3、索引提示

MySQL数据库支持索引提示(INDEX HINT)显式的高速优化器使用了哪个索引。以下是可能需要用到INDEX HINT的情况

  1. MySQL数据库的优化器错误的选择了某个索引,导致SQL运行很慢。这个在最新版的数据库版本中非常少见。优化器在绝大部分情况下工作的非常有效和正确。
  2. 某些SQL语句可以选择的索引非常多,这时优化器选择执行计划时间的开销可能会大于SQL语句本身例如优化器分析Range查询本身就是比较耗时的操作。这时DBA或开发人员分析最优的索引选择,通过index hint来强制使优化器不进行各个路径的成本分析直接选择指定的索引来完成查询

4、Multi-Range Read优化

MySQL 5.6开始支持Multi-Range Read(MRR)优化。目的是为了减少磁盘的随机访问,并且将随机访问转化为较为顺序的数据访问,这对IO-bound类型的SQL查询语句可带来性能极大的提升。 MRR优化可适用于rangeref,eq_ref类型的查询

MRR优化的好处

  • MRR使数据访问变得较为顺序。在查询辅助索引时,首先根据得到的查询结果按照主键进行排序,并按照主键排序的顺序进行书签查找

  • 减少缓冲池中页被替换的次数

  • 批量处理对键值的查询操作

对于InnoDB和MyISAM存储引擎的范围查询和JOIN查询操作,MRR工作方式如下

  • 将查询得到的辅助索引键值存放在一个缓存中,这是缓存中的数据是根据辅助索引键值排序的

  • 将缓存中的键值根据RowID进行排序

  • 根据RowID的排序顺序来访问实际的数据文件

此外,若InnoDB存储引擎或者MyISAM存储引擎的缓冲池不足够大,即不能存放下一张表中的所有数据,此时频繁的离散读操作还会导致缓存中的页被替换出缓冲池,然后有不断地被读入缓冲池。

5、Index Condition Pushdown 优化

ICP原理通俗讲就是,查询过程中,直接在查询引擎层的API获取数据的时候实现"非直接索引"过滤条件的筛选,而不是查询引擎层查询出来之后在Server层筛选。

换句话说就是ICP在获取数据的同时实现了where的次选条件中无法直接使用索引的情况下的筛选,避免了没有ICP优化的时候分两个步骤的实现(获取数据的过程没有做次选条件的过滤)

如果是非ICP优化查询的话,是两步:

  1. 获取数据
  2. 获取的数据进行条件筛选。

显然,相比后者,前者可以一步实现索引的查找Seek+filter,效率上更高。

适应的场景:

ICP的优化策略可用于range、ref、eq_ref、ref_or_null 类型的访问数据方法

本文整理自:《MySQL技术内幕 InnoDB存储引擎

个人微信公众号:

作者:jiankunking 出处:http://blog.csdn.net/jiankunking

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: