到底什么是MySQL执行计划吗?
面试官说:工作这么久了,应该知道sql执行计划吧,讲讲Sql的执行计划吧!看了看面试官手臂上纹的大花臂和一串看不懂的韩文,吞了吞口水,暗示自己镇定点,整理了一下思绪缓缓的对面试官说:我不会面试官:。。。。,回去等通知吧我:%^&%$!@#
一、前言
当我们工作到了一定的年限之后,一些应该掌握的知识点,我们是必须需要去了解的,比如今天面试官问的SQL执行计划当我们执行一条SQL的时候,可以直接对应的结果,但是你并不晓得,它会经历多深远黑暗的隧道,通过连接器、查询缓存、分析器、优化器、执行器重重筛选,才有可能展示到我们面前,有时候当你等待N长时间,但是展现的却是 timeout,这个时候想砸电脑的心都有了,不过当你看了今天的SQL执行计划后,你再也不用砸电脑了,看懂了这篇文章你就会知道这都不是事,让我们一起来揭晓这里面的奥妙
在实际的应用场景中,为了知道优化SQL语句的执行,需要查看SQL语句的具体执行过程,以加快SQL语句的执行效率。通常会使用explain+SQL语句来模拟优化器执行SQL查询语句,从而知道mysql是如何处理sql语句的。
官网地址: https://dev.mysql.com/doc/refman/5.5/en/explain-output.html
首先我们来下面的一条sql语句,其中会有 id、select_type、table等等这些列,这些就是我们执行计划中所包含的信息,我们要弄明白的就是这些列是用来干嘛的,以及每个列可能存在多少个值。
explain select * from emp;
二、执行计划中包含的信息
贴心的小农已经把sql复制出来了,只需要放到数据库中执行即可,方便简单快捷 ——牧小农
建表语句:
SET FOREIGN_KEY_CHECKS=0; DROP TABLE IF EXISTS `dept`; CREATE TABLE `dept` ( `DEPTNO` int NOT NULL, `DNAME` varchar(14) DEFAULT NULL, `LOC` varchar(13) DEFAULT NULL, PRIMARY KEY (`DEPTNO`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; INSERT INTO `dept` VALUES (10, ACCOUNTING, NEW YORK); INSERT INTO `dept` VALUES (20, RESEARCH, DALLAS); INSERT INTO `dept` VALUES (30, SALES, CHICAGO); INSERT INTO `dept` VALUES (40, OPERATIONS, BOSTON); DROP TABLE IF EXISTS `emp`; CREATE TABLE `emp` ( `EMPNO` int NOT NULL, `ENAME` varchar(10) DEFAULT NULL, `JOB` varchar(9) DEFAULT NULL, `MGR` int DEFAULT NULL, `HIREDATE` date DEFAULT NULL, `SAL` double(7,2) DEFAULT NULL, `COMM` double(7,2) DEFAULT NULL, `DEPTNO` int DEFAULT NULL, PRIMARY KEY (`EMPNO`), KEY `idx_job` (`JOB`), KEY `jdx_mgr` (`MGR`), KEY `jdx_3` (`DEPTNO`), KEY `idx_3` (`DEPTNO`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; INSERT INTO `emp` VALUES (7369, SMITH, CLERK, 7902, 1980-12-17, 800.00, null, 20); INSERT INTO `emp` VALUES (7499, ALLEN, SALESMAN, 7698, 1981-02-20, 1600.00, 300.00, 30); INSERT INTO `emp` VALUES (7521, WARD, SALESMAN, 7698, 1981-02-22, 1250.00, 500.00, 30); INSERT INTO `emp` VALUES (7566, JONES, MANAGER, 7839, 1981-02-02, 2975.00, null, 20); INSERT INTO `emp` VALUES (7654, MARTIN, SALESMAN, 7698, 1981-09-28, 1250.00, 1400.00, 30); INSERT INTO `emp` VALUES (7698, BLAKE, MANAGER, 7839, 1981-01-05, 2850.00, null, 30); INSERT INTO `emp` VALUES (7782, CLARK, MANAGER, 7839, 1981-09-06, 2450.00, null, 10); INSERT INTO `emp` VALUES (7839, KING, PRESIDENT, null, 1981-11-17, 5000.00, null, 10); INSERT INTO `emp` VALUES (7844, TURNER, SALESMAN, 7698, 1981-09-08, 1500.00, 0.00, 30); INSERT INTO `emp` VALUES (7900, JAMES, CLERK, 7698, 1981-12-03, 950.00, null, 30); INSERT INTO `emp` VALUES (7902, FORD, ANALYST, 7566, 1981-12-03, 3000.00, null, 20); INSERT INTO `emp` VALUES (7934, MILLER, CLERK, 7782, 1982-01-23, 1300.00, null, 10); DROP TABLE IF EXISTS `emp2`; CREATE TABLE `emp2` ( `id` int NOT NULL AUTO_INCREMENT, `empno` int DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=utf8; INSERT INTO `emp2` VALUES (1, 111); INSERT INTO `emp2` VALUES (2, 222); DROP TABLE IF EXISTS `salgrade`; CREATE TABLE `salgrade` ( `GRADE` int NOT NULL, `LOSAL` double DEFAULT NULL, `HISAL` double DEFAULT NULL, PRIMARY KEY (`GRADE`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; INSERT INTO `salgrade` VALUES (1, 700, 1200); INSERT INTO `salgrade` VALUES (2, 1201, 1400); INSERT INTO `salgrade` VALUES (3, 1401, 2000); INSERT INTO `salgrade` VALUES (4, 2001, 3000); INSERT INTO `salgrade` VALUES (5, 3001, 9999); DROP TABLE IF EXISTS `t_job`; CREATE TABLE `t_job` ( `id` int NOT NULL AUTO_INCREMENT, `job` varchar(9) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL, PRIMARY KEY (`id`), KEY `j` (`job`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;2.1 id
select查询的序列号,包含一组数字,表示查询中执行select子句或者操作表的顺序
id号分为三种情况:
1、如果id相同,那么执行顺序从上到下
-- 左关联 explain select* from emp e left join dept d on e.deptno = d.deptno; -- 右关联e explain select* from emp e right join dept d on e.deptno = d.deptno;通过left join 和 right join 验证;id一样(注意执行计划的table列),left join 先扫描e表,再扫描d表;right join 先扫描d表,再扫描e表
2、如果id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
explain select * from emp e where e.deptno = (select d.deptno from dept d where d.dname = SALES);在下面的表中回先查询 id 为 2的数据 也就是我们的 d表(注意:我们可以看到d表中select_type为 SUBQUERY 也就是子查询的 意思),然后根据d表中的deptno去查询 e表中的数据

3、id相同和不同的,同时存在:相同的可以认为是一组,从上往下顺序执行,在所有组中,id值越大,优先级越高,越先执行
explain select * from emp e join dept d on e.deptno = d.deptno join salgrade sg on e.sal between sg.losal and sg.hisal where e.deptno = (select d.deptno from dept d where d.dname = SALES);在这里先从id为2的执行,如果id是一样的,就按照顺序执行
2.2 select_type
主要用来分辨查询的类型,是普通查询还是联合查询还是子查询
2.3 table
对应行正在访问哪一个表,表名或者别名,可能是临时表或者union合并结果集 1、如果是具体的表名,则表明从实际的物理表中获取数据,也可以是表的别名
explainselect*fromempwheresal>(selectavg(sal)fromemp);
2、表名是derivedN的形式,表示使用了id为N的查询产生的衍生表
explain select * from (select ename staname,mgr from emp where ename = WARD union select ename staname,mgr from emp where ename = SMITH) a;derived2 :表明我们需要从衍生表2中取数据
3、当有union result的时候,表名是union n1,n2等的形式,n1,n2表示参与union的id
explain select * from emp where deptno = 10 union select * from emp where sal >2000;
2.4 type
type显示的是访问类型,访问类型表示我是以何种方式去访问我们的数据,最容易想的是全表扫描,直接暴力的遍历一张表去寻找需要的数据,效率非常低下,访问的类型有很多,效率从最好到最坏依次是:
system > const > eqref > ref > fulltext > refornull > indexmerge > uniquesubquery > indexsubquery > range > index > ALL一般情况下,得保证查询至少达到range级别,最好能达到ref
--all:全表扫描,一般情况下出现这样的sql语句而且数据量比较大的话那么就需要进行优化。 explain select * from emp;
2.5 possible_keys
显示可能应用在这张表中的索引,一个或多个,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用
explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10;
2.6 key
实际使用的索引,如果为null,则没有使用索引,查询中若使用了覆盖索引,则该索引和查询的select字段重叠。
explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10;
2.7 key_len
表示索引中使用的字节数,可以通过keylen计算查询中使用的索引长度,在不损失精度的情况下长度越短越好。
1、一般地,keylen 等于索引列类型字节长度,例如int类型为4 bytes,bigint为8 bytes;
2、如果是字符串类型,还需要同时考虑字符集因素,例如utf8字符集1个字符占3个字节,gbk字符集1个字符占2个字节
3、若该列类型定义时允许NULL,其keylen还需要再加 1 bytes
4、若该列类型为变长类型,例如 VARCHAR(TEXT\BLOB不允许整列创建索引,如果创建部分索引也被视为动态列类型),其keylen还需要再加 2 bytes 字符集会影响索引长度、数据的存储空间,为列选择合适的字符集;变长字段需要额外的2个字节,固定长度字段不需要额外的字节。而null都需要1个字节的额外空间,所以以前有个说法:索引字段最好不要为NULL,因为NULL让统计更加复杂,并且需要额外一个字节的存储空间。
explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10;
2.8 ref
显示索引的哪一列被使用了,如果可能的话,是一个常数
explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10;
2.9 rows
根据表的统计信息及索引使用情况,大致估算出找出所需记录需要读取的行数,此参数很重要,直接反应的sql找了多少数据,在完成目的的情况下越少越好
explain select * from emp;
2.10 extra
包含额外的信息。
--using filesort:说明mysql无法利用索引进行排序,只能利用排序算法进行排序,会消耗额外的位置 explain select * from emp order by sal;
三 总结
到这里执行计划就讲完了,sql的执行计划并不是很难,主要是记住每个列代表的意思和如何进行优化,这个是需要大量的训练和实操实现的, 有兴趣的小伙伴可以自行去试试,还是很有趣的,本文只是简单介绍一下MySQL执行计划,想全面深入了解MySQL,可优先阅读MySQL官方手册,大家加油~
扫一扫,关注我们