【Mysql系列】——详细剖析数据库中的核心知识【索引】

前言
- 索引
- - 索引概述
  - 为什么需要索引？
  - 索引的优缺点
  - 索引结构
  - 索引的结构为什么不是二叉树和红黑树？
  - 索引的B+树结构
  - 索引的Hash结构
  - Hash结构索引的特点
  - 思考：为什么InnoDB存储引擎选择使用B+Tree索引结构呢？
总结撒花

博客昵称：博客小梦
最喜欢的座右铭：全神贯注的上吧！！！
作者简介：一名热爱C/C++，算法，数据库等技术、喜爱运动、热爱K歌、敢于追梦的小博主！
博主小留言：哈喽！各位CSDN的uu们，我是你的博客好友小梦，希望我的文章可以给您带来一定的帮助，话不多说，文章推上！欢迎大家在评论区唠嗑指正，觉得好的话别忘了一键三连哦！

前言

哈喽各位友友们，我今天又学到了很多有趣的知识，现在迫不及待的想和大家分享一下！我仅已此文，和大家分享【【Mysql系列】——详细剖析数据库“索引”【上篇】~都是精华内容，可不要错过哟！！！

索引

索引概述

在数据之外，数据库系统还维护着满足查找算法的数据结构，这些数据结构以某种方式指向我们的数据，这样就可以在这些数据结构上实现高级查找算法，这种数据结构就是索引。简单来说，索引是帮助Mysql高效获取数据的数据结构（有序）。
说到数据结构，大家可能一想到B+树、红黑树、二叉树等等各种各样的树就感到头疼。

其实不用那么慌张，我们只需要了解其结构和一些基本性质就行了。

为什么需要索引？

前面我们已经提到了，索引是一种数据结构，它能够帮助数据库快速查询数据，这就是它的主要作用。当没有索引的时候，我们在查询数据时，就像下面这幅图一样进行全表扫描，这样效率是非常低下的。

通常来说，一般提到数据库的索引时，其数据结构都是B+树数据结构。下面这幅图是一个大概展示了索引查找数据的画面，并非真正的B+树。

索引的优缺点

优势	劣势
提高数据检查的效率，降低数据库的IO成本	索引也是要占用空间的
通过索引列对数据进行排序，降低数据排序的成本，降低CPU的消耗	索引大大提高了查询效率，同时却也降低更新表的速度，如对表进行的 insert、update、delete时，效率降低。

但是，现在的磁盘是很便宜的，所以索引占空间的问题就没有那么重要了。
其实在一个正常的业务中，进行增删改的操作远小于查询操作。所以索引的第二个不足也影响不大。
根据场景需求和业务需求选择是否使用索引。

索引结构

前面的博客已经提到过，索引是在存储引擎层实现的，不同的存储引擎有着不同的结构，主要包括一下几种：

默认索引都是B+树，面试的时候一般没有说明也是B+树索引结构。

索引的结构为什么不是二叉树和红黑树？

索引的B+树结构

上面都是数据结构中的B+数结构，而在Mysql中，是对其进行优化的。在原B+Tree的基础上，增加了一个指向相邻叶子结点的链表指针，就形成了带有顺序指针的B+Tree，提高区间访问性能。

索引的Hash结构

哈希表就是采用一定的Hash算法，将键值换算成新的hash值，映射到对应的槽位上，然后存储在hash表中。如果两个或者多个键值，映射到一个相同的槽位上，他们就产生了hash冲突（也称为是hash碰撞），可以通过链表来解决这个问题。

Hash结构索引的特点

Hash索引只能用于对等比较（ = ， in），不支持范围查询（between，>,<,…）
无法利用索引完成排序操作。我们可以看到，数据在hash表中的存储是无序的。
查询效率高，通常只需要一次检索就可以了，效率通常要高于B+Tree索引。这里之所以说是通常而不是一定，是因为在可能会发生hash冲突。

注意：在Mysql中，支持hash索引的是Memory引擎，而INnoDB中具有自适应的hash功能，hash索引是存储引擎根据B+Tree索引在指定条件下自动构建的。

思考：为什么InnoDB存储引擎选择使用B+Tree索引结构呢？

理由有以下几点：

相对于二叉树，层级更少，搜索效率更高；
对于B-树，无论是叶子结点还是非叶子节点，都会保存数据，这样导致了一页中存储的键值减少，指针跟着减少（键值key 的个数比指针数少1），要同样保存大量的数据，只能增加树的高度，导致性能的降低；
相对于Hash索引，B+Tree支持范围匹配和排序操作的。而Hash索引不能。