mysql-冗余和重复索引
2017-10-16 08:50
316 查看
mysql允许在相同列上创建多个索引,无论是有意还是无意,mysql需要单独维护重复的索引,并且优化器在优化查询的时候也需要逐个地进行考虑,这会影响性能。
重复索引是指的在相同的列上按照相同的顺序创建的相同类型的索引,应该避免这样创建重复索引,发现以后也应该立即删除。但,在相同的列上创建不同类型的索引来满足不同的查询需求是可以的。
这段SQL创建了3个重复索引。通常并没有理由这么做。
冗余索引和重复索引有一些不同,如果创建了索引(a,b),再创建索引(a)就是冗余索引,因为这只是前面一个索引的前缀索引,因此(a,b)也可以当作(a)来使用,但是(b,a)就不是冗余索引,索引(b)也不是,因为b不是索引(a,b)的最左前缀列,另外,其他不同类型的索引在相同列上创建(如哈希索引和全文索引)不会是B-Tree索引的冗余索引,而无论覆盖的索引列是什么。
冗余索引通常发生再为表添加新索引的时候。例如,有人可能会增加一个新的索引(A,B)而不是扩展以后的索引(A)。还有一种情况是将一个索引扩展为(A,ID),其中ID是主键,对于InnoDB来说主键已经包含在二级索引中了,所以这也是冗余的。
大多数情况下都不需要冗余索引,应该尽量扩展已有的索引而不是创建新索引,但也有时候处于性能方面的考虑需要冗余索引,因为扩展已有的索引会导致其变得太大,从而影响其他使用该索引的查询性能。如:如果在整数列上有一个索引,现在需要额外增加一个很长的varchar列来扩展该索引,那么性可能会急剧下降,特别是有查询把这个索引当作覆盖索引,或者这是myisam表并且有很多范围查询的时候(由于myisam的前缀压缩)
比如,有一张userinfo表。这个表有1000000条数据,对每个state_id值大概有20000条记录。在state_id有一个索引,那么下面的SQL我们称之为Q1
改查询的执行速度大概是每秒115次(QPS)
还有一个SQL,我们称之为Q2
这个查询的QPS是10,提升该索引性能最简单的办法就是狂战索引为(state_id,city,address),让索引能覆盖查询:
(注:state_id已经有索引了,根据前面的概念,这是一个冗余索引而不是重复索引)
2.可以使用Percona Toolkit中的pt_duplicate-key-checker,该工具通过分析表结构来找出冗余和重复的索引。
重复索引是指的在相同的列上按照相同的顺序创建的相同类型的索引,应该避免这样创建重复索引,发现以后也应该立即删除。但,在相同的列上创建不同类型的索引来满足不同的查询需求是可以的。
CREATE TABLE test( ID INT NOT NULL PRIMARY KEY, A INT NOT NULL, B INT NOT NULL, UNIQUE(ID), INDEX(ID), ) ENGINE=InnoDB;
这段SQL创建了3个重复索引。通常并没有理由这么做。
冗余索引和重复索引有一些不同,如果创建了索引(a,b),再创建索引(a)就是冗余索引,因为这只是前面一个索引的前缀索引,因此(a,b)也可以当作(a)来使用,但是(b,a)就不是冗余索引,索引(b)也不是,因为b不是索引(a,b)的最左前缀列,另外,其他不同类型的索引在相同列上创建(如哈希索引和全文索引)不会是B-Tree索引的冗余索引,而无论覆盖的索引列是什么。
冗余索引通常发生再为表添加新索引的时候。例如,有人可能会增加一个新的索引(A,B)而不是扩展以后的索引(A)。还有一种情况是将一个索引扩展为(A,ID),其中ID是主键,对于InnoDB来说主键已经包含在二级索引中了,所以这也是冗余的。
大多数情况下都不需要冗余索引,应该尽量扩展已有的索引而不是创建新索引,但也有时候处于性能方面的考虑需要冗余索引,因为扩展已有的索引会导致其变得太大,从而影响其他使用该索引的查询性能。如:如果在整数列上有一个索引,现在需要额外增加一个很长的varchar列来扩展该索引,那么性可能会急剧下降,特别是有查询把这个索引当作覆盖索引,或者这是myisam表并且有很多范围查询的时候(由于myisam的前缀压缩)
比如,有一张userinfo表。这个表有1000000条数据,对每个state_id值大概有20000条记录。在state_id有一个索引,那么下面的SQL我们称之为Q1
SELECT count(*) FROM userinfo WHERE state_id=5; --Q1
改查询的执行速度大概是每秒115次(QPS)
还有一个SQL,我们称之为Q2
SELECT state_id,city,address FROM userinfo WHERE state_id=5; --Q2
这个查询的QPS是10,提升该索引性能最简单的办法就是狂战索引为(state_id,city,address),让索引能覆盖查询:
ALERT TABLE userinfo ADD KEY state_id_2(state_id,city,address);
(注:state_id已经有索引了,根据前面的概念,这是一个冗余索引而不是重复索引)
怎么找出冗余索引和重复索引呢?
1.可以使用Shlomi Noach的common_schema中的一些试图来定位,common_schema是一系列可以安装到服务器上的常用的存储和试图。2.可以使用Percona Toolkit中的pt_duplicate-key-checker,该工具通过分析表结构来找出冗余和重复的索引。
参考文献:
[1] Baron Schwartz等 著,宁海元等 译 ;《高性能MySQL》(第3版); 电子工业出版社 ,2013相关文章推荐
- mysql工具pt-duplicate-key-checker检查重复和冗余索引
- MySQL 冗余和重复索引 推荐
- mysql重复索引、冗余索引、未使用索引的定义和查找
- mysql优化----大数据下的分页,延迟关联,索引与排序的关系,重复索引与冗余索引,索引碎片与维护
- 高性能的MySQL(5)索引策略一压缩,冗余,重复,索引和锁
- mysql 给有重复记录的表添加唯一索引
- mysql 创建唯一索引前 删除重复数据只保留ID最小一条。
- Maatkit工具使用<二>之mysql重复索引检测工具
- 数据库索引:唯一索引【便捷的无重复插入记录的方法(基于mysql)和索引设计思想小结】
- mysql检测重复索引
- sql优化之:数据库索引创建原则,or/in/union与索引优化,聚集索引/非聚集索引/联合索引/索引覆盖,MySQL冗余数据的三种方案,MySQL双主一致性架构优化(来源:架构师之路)
- MySQL中重复索引和重复外键清理
- 索引与排序,重复索引与冗余索引,索引碎片与维护
- mysql将普通索引更改为唯一索引,且对重复的数据只保留一条
- MySQL建立唯一索引实现插入重复自动更新
- MySQL查找重复索引和冗余索引
- mysql5.6配置慢查询 及安装pt-query-digest,检查重复索引pt-duplicate-key-checker
- mysql创建索引时出现duplicate "XX"的原因以及查询重复记录
- mysql 给有重复记录的表添加唯一索引
- 去掉mysql重复的索引