数据库算法 b+树服务器缓存 mysql中主键索引和联合索引的原理解析

前端软件开发数据库 2024-05-07 4 0

mysql中主键索引和联合索引的原理解析

一、主键索引二、什么是联合索引? 对应的B+树是如何生成的?1、建立索引方式2、什么是最左前缀原则?3、回表4、为什么要遵守最左前缀原则才能利用到索引?5、什么是覆盖索引?6、索引扫描底层原理7、order by为什么会导致索引消失？8、有哪些情况会导致索引失效?9、索引设计原则1、选择合适的列作为索引2、避免使用过多的索引

三、InnoDB 与MyISAM 的区别

一、主键索引

主键索引：按照主键数据从小到大按照从左到右进行排序，叶节点只存储数据区；接着将上面的页生成出来，页只存储索引和指针，指针指向数据域，当通过主键查找数据时，从B+树的头部开始寻址数据、读取数据。

上面为索引页下面为数据页

查询select * from table where a=6，会从上到下走法，找索引

查询select * from table where a<6，会从上到下走法，找索引；原因：先找a=6是走索引的，找到a=6数据后，将左边的数据全部返回即可。

为了方便把前面数据给你采用双向指针

查询select * from table where b=6，会从左到右走法，全表扫描，因为b未有命中索引。

二、什么是联合索引? 对应的B+树是如何生成的?

联合索引：将数据库表中多个字段组成一个索引。bcd联合索引；bcd三个字段进行排序

1、建立索引方式

create index idx_t1_bcd on t1(b,c,d);bcd三个字段进行排序

2、什么是最左前缀原则?

复合索引，也叫联合索引，用户可以在多个列上建立索引,这种索引叫做复合索引。当我们创建一个组合索引的时候，如(k1,k2,k3)，相当于创建了(k1)、 (k1,k2)和(k1,k2,k3)三个索引，这就是最左匹配原则。

select * from table where k1=A and k2=B and k3=C

3、回表

select * from t1 where b=1 and c=1 and d=1执行逻辑：通过联合索引找到一条数据的3个字段，但是select * 查找多个字段，所以需要存储主键字段，通过主键字段去主键索引里面找到完整的这条数据，并将这条数据返回。

通过主键再去主键索引里面找数据的过程叫做回表

4、为什么要遵守最左前缀原则才能利用到索引?

explain select * from t1 where c=1 and d=1 and b=1 ; 最左前缀原则和后面条件的顺序没有关系

不符合最左匹配原则：*11

符合最左匹配原则:1*1

b=1：走联合索引 (需要回表1次)

b>1:不走联合索引（因为需要回表很多次）

拿到主键会到主键索引里面拿数据（回表7次）

5、什么是覆盖索引?

查询的字段正好在联合索引字段里面，不需要回表

select b from t1 where b>1;(不需要回表了，直接从联合索引字段中将该字段取出来)

select a,b,c,d from t1 where b>1; 同样的也符合联合索引，也不需要回表，因为a字段（主键）在联合索引中。

select a,b,c,d,e from t1 where b>1; 不走联合索引，需要回表，因为e字段不在联合索引中，需要回表很多次

6、索引扫描底层原理

从bcd索引的叶子节点开始遍历主键索引存储的是8条完整的数据联合索引中存储的是8条不完整的数据，并且b字段在联合索引中，不会去回表到主键索引中。

从叶子节点开始扫描不需要符合最左匹配原则。

7、order by为什么会导致索引消失？

因为走全表扫描效率更高，不需要回表走索引会回表多次，效率低

8、有哪些情况会导致索引失效?

1、索引列使用!=、not、is null、is not null查询的时候，由于索引数据的检索效率非常低，因此Mysql引擎会判断不走索引。 2、使用like通配符匹配后缀%xxx的时候，由于这种方式不符合索引的最左匹配原则，所以也不会走索引。

但是反过来，如果通配符匹配的是前缀xxx%，符合最左匹配，也会走索引。

3、对索引列上进行函数运算、导致mysql无法识别索引列，就不会走索引了。

4、使用or连接查询的时候，or语句前后没有同时使用索引，那么索引会失效。只有or左右查询字段都是索引列的时候，才会生效。

5、当索引列存在隐式转化的时候，比如索引列是字符串类型，但是在sql查询中没有使用引号。

9、索引设计原则

查询更快、占用空间更小

1、选择合适的列作为索引

1.经常作为查询条件（where子句）、排序条件（order by子句）分组条件（group by子句）的列建立索引。2、区分度低的字段，例如性别，不要建立索引3、更新频繁字段不适合创建索引4、对于定义为text、image和bit的数据类型的列不要建立索引5、定义有外键的数据列一定要建立索引。6、数据量较小的表，索引效果较差，没有必要在此列建立索引7、尽量使用扩展索引，不要新建索引。比如表中已经有a的索引，现在要加(a,b)的索引，那么只需要修改原来的索引即可。8、使用短索引，如果对长字符串列进行索引，应该指定一个前缀长度，这样能够节省大量索引空间，如果搜索词超过索引前缀长度，则使用索引排除不匹配的行，然后检查其余行是否可能匹配。

2、避免使用过多的索引

1、每个索引都需要占用额外的磁盘空间2、更新表（update、insert、delete操作时），所有的索引都需要被更新3、维护索引需要成本

三、InnoDB 与MyISAM 的区别

聚簇索引:将数据存储与索引放到了一块、并且是按照一定的顺序组织的，找到索引也就找到了数据，数据的物理存放顺序与索引顺序是一致的，即:只要索引是相邻的，那么对应的数据一定也是相邻地存放在磁盘上的。非聚簇索引:叶子节点不存储数据、存储的是数据行地址，也就是说根据索引查找到数据行的位置再取磁盘查找数据，这个就有点类似一本树的目录，比如我们要找第三章第一节，那我们先在这个目录里面找，找到对应的页码后再去对应的页码看文章。

优势: 1、查询通过聚簇索引可以直接获取数据，相比非聚簇索引需要第二次查询(非覆盖索引的情况下)效率要高 2、聚簇索引对于范围查询的效率很高，因为其数据是按照大小排列的 3、聚簇索引适合用在排序的场合，非聚簇索引不适合

文章链接

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

Mysql 数据库算法 b+树服务器缓存

本文由用户于 2024-05-07 发布在金钥匙，如有疑问，请联系我们。
本文链接：https://www.51969.com/post/18747135.html

金钥匙

数据库算法 b+树服务器缓存 mysql中主键索引和联合索引的原理解析

编辑器 ide 【记录】VScode｜两种缩放快捷键的功能和开启方式（Ctrl+/-，Ctrl滚轮）

数据库 MySQL：1118 - Row size too large（行大小不能超过 65535 问题）

发表评论取消回复

金钥匙

数据库 算法 b+树 服务器 缓存 mysql中主键索引和联合索引的原理解析

编辑器 ide 【记录】VScode｜两种缩放快捷键的功能和开启方式（Ctrl+/-，Ctrl滚轮）

数据库 MySQL：1118 - Row size too large（行大小不能超过 65535 问题）

相关文章

发表评论取消回复

数据库算法 b+树服务器缓存 mysql中主键索引和联合索引的原理解析