为什么说B+-tree比B 树更适合实际应用中操作系统的文件索引和数据库索引?
2016-04-13 23:56
302 查看
B树:
B+树
1) B+-tree的磁盘读写代价更低
[b]B+-tree[/b]的内部结点并没有指向关键字具体信息的指针。因此其内部结点相对B
树更小。如果把所有同一内部结点的关键字存放在同一盘块中,那么盘块所能容纳的关键字数量也越多。一次性读入内存中的需要查找的关键字也就越多。相对来说IO读写次数也就降低了。
举个例子,假设磁盘中的一个盘块容纳16bytes,而一个关键字2bytes,一个关键字具体信息指针2bytes。一棵9阶B-tree(一个结点最多8个关键字)的内部结点需要2个盘快。而[b]B+ [/b]树内部结点只需要1个盘快。当需要把内部结点读入内存中的时候,B
树就比[b]B+ [/b]树多一次盘块查找时间(在磁盘中就是盘片旋转的时间)。
2) B+-tree的查询效率更加稳定
由于非终结点并不是最终指向文件内容的结点,而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条从根结点到叶子结点的路。所有关键字查询的路径长度相同,导致每一个数据的查询效率相当。
读者点评
本文评论下第149楼,fanyy1991针对上文所说的两点,道:个人觉得这两个原因都不是主要原因。数据库索引采用B+树的主要原因是 B树在提高了磁盘IO性能的同时并没有解决元素遍历的效率低下的问题。正是为了解决这个问题,B+树应运而生。B+树只要遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的,而B树不支持这样的操作(或者说效率太低)。
摘自:http://blog.csdn.net/v_JULY_v/article/details/6530142/
文件索引和数据库索引为什么使用B+树,个人认为:
1. 因为文件与数据库都是需要较大的存储——不可能全部存储在内存中,故要存储到磁盘上
2. 所谓索引,即是快速定位与查找,那么索引的结构组织要尽量减少查找过程中磁盘I/O的存取次数(B+树相比B树,其非叶子节点占用更小的空间,可以有更多非叶子节点存放在再内存中,减少大量的IO)
3. 局部性原理与磁盘预读,预读的长度一般为页(page)的整倍数,(在许多操作系统中,页得大小通常为4k)
4. 数据库系统巧妙利用了磁盘预读原理,将一个节点的大小设为等于一个页,这样每个节点只需要一次I/O就可以完全载入,(由于节点中有两个数组,所以地址连续)。而红黑树这种结构,h明显要深的多。由于逻辑上很近的节点(父子)物理上可能很远,无法利用局部性
5. B+树还有一个最大的好处,方便扫库,B树必须用中序遍历的方法按序扫库,而B+树直接从叶子结点挨个扫一遍就完了,B+树支持range-query非常方便,而B树不支持。这是数据库选用B+树的最主要原因
B+树
1) B+-tree的磁盘读写代价更低
[b]B+-tree[/b]的内部结点并没有指向关键字具体信息的指针。因此其内部结点相对B
树更小。如果把所有同一内部结点的关键字存放在同一盘块中,那么盘块所能容纳的关键字数量也越多。一次性读入内存中的需要查找的关键字也就越多。相对来说IO读写次数也就降低了。
举个例子,假设磁盘中的一个盘块容纳16bytes,而一个关键字2bytes,一个关键字具体信息指针2bytes。一棵9阶B-tree(一个结点最多8个关键字)的内部结点需要2个盘快。而[b]B+ [/b]树内部结点只需要1个盘快。当需要把内部结点读入内存中的时候,B
树就比[b]B+ [/b]树多一次盘块查找时间(在磁盘中就是盘片旋转的时间)。
2) B+-tree的查询效率更加稳定
由于非终结点并不是最终指向文件内容的结点,而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条从根结点到叶子结点的路。所有关键字查询的路径长度相同,导致每一个数据的查询效率相当。
读者点评
本文评论下第149楼,fanyy1991针对上文所说的两点,道:个人觉得这两个原因都不是主要原因。数据库索引采用B+树的主要原因是 B树在提高了磁盘IO性能的同时并没有解决元素遍历的效率低下的问题。正是为了解决这个问题,B+树应运而生。B+树只要遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的,而B树不支持这样的操作(或者说效率太低)。
摘自:http://blog.csdn.net/v_JULY_v/article/details/6530142/
文件索引和数据库索引为什么使用B+树,个人认为:
1. 因为文件与数据库都是需要较大的存储——不可能全部存储在内存中,故要存储到磁盘上
2. 所谓索引,即是快速定位与查找,那么索引的结构组织要尽量减少查找过程中磁盘I/O的存取次数(B+树相比B树,其非叶子节点占用更小的空间,可以有更多非叶子节点存放在再内存中,减少大量的IO)
3. 局部性原理与磁盘预读,预读的长度一般为页(page)的整倍数,(在许多操作系统中,页得大小通常为4k)
4. 数据库系统巧妙利用了磁盘预读原理,将一个节点的大小设为等于一个页,这样每个节点只需要一次I/O就可以完全载入,(由于节点中有两个数组,所以地址连续)。而红黑树这种结构,h明显要深的多。由于逻辑上很近的节点(父子)物理上可能很远,无法利用局部性
5. B+树还有一个最大的好处,方便扫库,B树必须用中序遍历的方法按序扫库,而B+树直接从叶子结点挨个扫一遍就完了,B+树支持range-query非常方便,而B树不支持。这是数据库选用B+树的最主要原因
相关文章推荐
- Oracle_object_id和data_object_id的区别与联系
- mysql 查询理解
- Windows下安装MySQL5.7
- TimesTen内存数据库体系结构
- Windows下MySQL5.6以上版本不能用localhost和127.0.0.1连接问题
- 重设mysql数据库root用户密码
- mysql之触发器trigger
- Oracle-10-对表中数据进行增删改查
- oracle11g_64位连接32位PLSQL_Developer
- 磁盘读写和数据库读写哪个效率更高?磁盘读写与数据库的关系
- Oracle-09-删除表(drop和truncate区别、闪回删除等)
- 实现用户登录并且在数据库中查找匹配的账号密码
- oracle学习 第二章 限制性查询和数据的排序 ——02
- IOS使用项目中的本地数据库简单操作
- Memcache-Java-Client-Release源码阅读(之一)
- 海量数据解决方案,知多少?
- mysql查询语句实例 复杂mysql查询
- Oracle-08-修改表结构(对已有的表增删改查)
- MySQL基础八:MySQL存储过程
- 向mysql中插入数据(时间,图片)