MySQL回表查询与索引覆盖的区别是什么

回表查询

InnoDB索引分为两大类,一类是聚集索引(Clustered Index),一类是非聚集索引(Secondary Index)

聚集索引(聚簇索引):叶子节点中存的是整行数据,找到索引也就找到了数据,索引即数据,表中行的物理顺序与键值的逻辑(索引)顺序相同,一个表只能包含一个聚集索引。因为索引(目录)只能按照一种方法进行排序。

非聚集索引(普通索引、非聚簇索引、二级索引):非聚集索引的btree叶子节点中存储的是当行数据的PK(主键)。例如MYISAM通过key_buffer把索引先缓存到内存中,当需要访问数据时(通过索引访问数据),在内存中直接搜索索引,然后通过索引找到磁盘相应数据,这也就是为什么索引不在key buffer命中时,速度慢的原因。

为什么非主键索引结构叶子结点存储的是主键值?

减少了出现行移动或者数据页分裂时二级索引的维护工作(当数据需要更新的时候,二级索引不需要修改,只需要修改聚簇索引,一个表只能有一个聚簇索引,其他的都是二级索引,这样只需要修改聚簇索引就可以了,不需要重新构建二级索引)

当使用非聚集索引时,为了获取具体数据,我们需要通过主键返回到聚集索引并查询数据。着就叫回表查询。扫描了2次索引树。所以效率相对较低。

索引覆盖

索引覆盖就是解决回表查询的一种方案。见名知意,就是查询的所有列均被所使用的索引列覆盖(可以是单列索引也可以是联合索引,通常是联合索引,单列索引很难覆盖查询的所有列)。

因为索引中已经包含了要查询的字段的值,因此查询的时候直接返回索引中的字段值就可以了,不需要再到表中查询,避免了对主键索引的二次查询,也就提高了查询的效率。

id为聚集索引,name为非聚集索引:

select name, age from t where name = 'lcc';

就需要回表查询

索引覆盖:

在SQL中只查询name字段。这样name的索引就覆盖到了所有的查询列。

select name  from t where name = 'lcc';

将name的索引修改为联合索引(name, age ),之后还是执行select name, age from t where name = 'lcc'。这样也覆盖到了所有的查询列。
因为覆盖索引必须要存储索引的列值,而哈希索引、空间索引和全文索引等都不存储索引列值,从而只有使用B-Tree索引的数据可以做覆盖索引。

进行索引覆盖查询时,在explain(执行计划)的Extra列可以看到【Using Index】的信息。

索引覆盖的优点

  • 索引条目通常远小于数据行的大小,因为覆盖索引只需要读取索引,极大地减少了数据的访问量。

  • 索引是按照列值顺序存储的,对于IO密集的范围查找会比随机从磁盘读取每一行数据的IO小很多。

  • 一些存储引擎比如MyISAM在内存中只缓存索引,数据则依赖操作系统来缓存,因此要访问数据的话需要一次系统调用,使用覆盖索引则避免了这一点。

  • 针对InnoDB引擎下的数据库表,覆盖索引因为InnoDB的聚簇索引而非常实用。因为InnoDB的二级索引在叶子节点中保存了行的主键值,如果二级索引能够覆盖查询,就避免了对主键索引的二次查询。

哪些场景适合使用索引覆盖来优化SQL

  • 当不需要查询整行记录时;

  • 全表count查询优化;

  • Limit分页查询;

哪些情况下不要建索引

  • 表记录太少

  • 经常增删改的表或者字段(如用户余额)

  • Where条件里用不到的字段不创建索引

  • 过滤性不好的不适合建索引(如性别)

索引下推

索引下推优化是 MySQL 5.6 引入的, 可以在索引遍历过程中,对索引中包含的字段先做判断,直接过滤掉不满足条件的记录,减少回表次数

建立联合索引:

KEY `username` (`name`,`age`) )

执行:

select * from user2 where name like 'j%' and age=99;

上面的查询sql符合索引的最左前缀原则,所以将会用到 username 索引

5.5中上面这个 SQL 的执行流程是这样的:

  • 首先 MySQL 的 server 层调用存储引擎获取第一个以 j 开头的 username。

  • 存储引擎找到 username=‘j’ 的第一条记录后,在 B+Tree 的叶子结点中保存着主键 id,此时通过回表操作,去主键索引中找到该条记录的完整数据,并返回给 server 层。

  • server 层拿到数据之后,判断该条记录的 age 是否为 99,如果 age=99,就把该条记录返回给客户端,如果 age!=99,那就就丢弃该记录。

5.6中上面这个 SQL 的执行流程是这样的:

  • MySQL 的 server 层首先调用存储引擎定位到第一个以 j 开头的 username。

  • 找到记录后,存储引擎并不急着回表,而是继续判断这条记录的 age 是否等于 99,如果 age=99,再去回表,如果 age 不等于 99,就不去回表了,直接继续读取下一条记录。

以上就是MySQL回表查询与索引覆盖的区别是什么的详细内容,更多请关注其它相关文章!