您的位置：首页 > 其它

聚簇索引 & 非聚簇索引

2014-07-16 09:39 155 查看

　　建立索引的目的是加快对表中记录的查找或排序。付出的代价：

1. 增加了数据库的存储空间

2. 在插入和修改数据时要花费较多的时间(因为索引也要随之变动)。

一。索引分类

　　索引分为聚簇索引和非聚簇索引两种。

　　每个表只能有一个聚簇索引，因为一个表中的记录只能以一种物理顺序存放。但是，一个表可以有不止一个非聚簇索引。实际上，对每个表你最多可以建立

249个非聚簇索引。非聚簇索引需要大量的硬盘空间和内存。另外，虽然非聚簇索引可以提高从表中取数据的速度，它也会降低向表中插入和更新数据的速度。

每当你改变了一个建立了非聚簇索引的表中的数据时，必须同时更新索引。因此你对一个表建立非聚簇索引时要慎重考虑。如果你预计一个表需要频繁地更新数

据，那么不要对它建立太多非聚簇索引。另外，如果硬盘和内存空间有限，也应该限制使用非聚簇索引的数量。

二。区别

1. 聚簇索引的叶节点就是数据节点，而非聚簇索引的页节点仍然是索引检点，并保留一个链接指向对应数据块。

2. 聚簇索引主键的插入速度要比非聚簇索引主键的插入速度慢很多。

3. 相比之下，聚簇索引适合排序，非聚簇索引不适合用在排序的场合。因为聚簇索引本身已经是按照物理顺序放置的，排序很快。非聚簇索引则没有按序存放，

需要额外消耗资源来排序。

4. 当你需要取出一定范围内的数据时，用聚簇索引也比用非聚簇索引好。

三。建立聚簇索引的思想

1、大多数表都应该有聚簇索引或使用分区来降低对表尾页的竞争，在一个高事务的环境中，对最后一页的封锁严重影响系统的吞吐量。

2、在聚簇索引下，数据在物理上按顺序排在数据页上，重复值也排在一起，因而在那些包含范围检查(between、<、<=、>、>=)或使用group by或

order by的查询时，一旦找到具有范围中第一个键值的行，具有后续索引值的行保证物理上毗连在一起而不必进一步搜索，避免了大范围扫描。

3、在一个频繁发生插入操作的表上建立聚簇索引时，不要建在具有单调上升值的列上，否则会经常引起封锁冲突。

4、在聚簇索引中不要包含经常修改的列，因为码值修改后，数据行必须移动到新的位置。

5、选择聚簇索引应基于where子句和连接操作的类型。

四。聚簇索引的侯选列

1、主键列,该列在where子句中使用并且插入是随机的。

2、按范围存取的列，如pri_order > 100 and pri_order < 200。

3、在group by或order by中使用的列。

4、不经常修改的列。

5、在连接操作中使用的列。

五。MySQL 的聚簇索引

　　1. InnoDB使用B-Tree来实现聚簇索引，并把索引和数据存放在同一结构中。

　　2. 只有叶子节点才包括了数据行的值，非叶子节点只存了索引字段。

　　3. InnoDB只能按照主键做聚簇。如果表中没有定义主键，InnoDB会选择一个非空且有唯一性约束的索引来做聚簇，如果没有这样的索引，则会定义

一个不可见的主键，并以这个主键来聚簇。

　　4. InnoDB clusters records together only within a page. Pages with adjacent key values may be distant from each other.

　　InnoDB的聚簇是页面级别的，即聚簇索引值相邻的行会被存入同一个页面，当这个页面存满时，接下来的相邻行会被存入另外一个页面，而这两个页面可

能会离的很远。如图中的布局所示，索引值为1～10的行被存在第一个页面，11～20的行被存在另外一个页面，数据被聚簇在单个页面内，而页面1和页面2的

磁盘位置却可能离的很远。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航