Mysql为什么使用B+Tree作为索引结构

2024-02-05 12:50:02
开发
47

B树和B+树

一般来说，数据库的存储引擎都是采用B树或者B+树来实现索引的存储。首先来看B树，如图所示：
在这里插入图片描述
B树是一种多路平衡树，用这种存储结构来存储大量数据，它的整个高度会相比二叉树来说，会矮很多。
而对于数据库而言，所有的数据都将会保存到磁盘上，而磁盘I/O的效率又比较低，特别是在随机磁盘I/O的情况下效率更低。
所以高度决定了磁盘I/O的次数，磁盘I/O次数越少，对于性能的提升就越大，这也是为什么采用B树作为索引存储结构的原因，如图所示。
而MySQL的InnoDB存储引擎，它用了一种增强的B树结构，也就是B+树来作为索引和数据的存储结构。
相比较于B树结构来说，B+树做了两个方面的优化，如图所示：
在这里插入图片描述
1、B+树的所有数据都存储在叶子节点，非叶子节点只存储索引。
2、叶子节点中的数据使用双向链表的方式进行关联。

原因分析

在这里插入图片描述
1、从磁盘I/O效率方面来看：B+树的非叶子节点不存储数据，所以树的每一层就能够存储更多的索引数量，也就是说，B+树在层高相同的情况下，比B树的存储数据量更多，间接会减少磁盘I/O的次数。
2、从范围查询效率方面来看：在MySQL中，范围查询是一个比较常用的操作，而B+树的所有存储在叶子节点的数据使用了双向链表来关联，所以B+树在查询的时候只需查两个节点进行遍历就行，而B树需要获取所有节点，因此，B+树在范围查询上效率更高。
3、从全表扫描方面来看：因为，B+树的叶子节点存储所有数据，所以B+树的全局扫描能力更强一些，因为它只需要扫描叶子节点。而B树需要遍历整个树。
4、从自增ID方面来看：基于B+树的这样一种数据结构，如果采用自增的整型数据作为主键，还能更好的避免增加数据的时候，带来叶子节点分裂导致的大量运算的问题。

总结

总体来说，我认为技术方案的选型，更多的要根据具体的业务场景来决定，并不一定是说B+树就是最好的选择，就像MongoDB里面采用B树结构，本质上来说，其实是关系型数据库和非关系型数据库的差异。

原文地址:https://blog.csdn.net/qq_30064799/article/details/136025782 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1754366748913700864.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

Mysql为什么使用B+Tree作为索引结构

B树和B+树

原因分析

总结

相关推荐

最近更新

热门阅读