sql analyze_MySQL having

sql analyze_MySQL having本文转载自“MySQL解决方案工程师”公众号,由徐轶韬翻译作者:NorvaldH.Ryeng译:徐轶韬MySQL8.0.18刚刚发布,它包含一个全新的功能EXPL…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

本文转载自“MySQL解决方案工程师”公众号,由
徐轶韬翻译

640?wx_fmt=jpeg

作者:Norvald H. Ryeng  译:徐轶韬
MySQL8.0.18刚刚发布,它包含一个全新的功能EXPLAIN ANALYZE,用来分析和理解查询如何执行。
EXPLAIN ANALYZE是什么?

EXPLAIN ANALYZE是一个用于查询的分析工具,它向用户显示MySQL在查询上花费的时间以及原因。它将产生查询计划,并对其进行检测和执行,同时计算行数并度量执行计划中不同点上花费的时间。执行完成后,EXPLAIN ANALYZE将输出计划和度量结果,而不是查询结果。
这项新功能建立在常规的EXPLAIN基础之上,可以看作是MySQL 8.0之前添加的EXPLAIN FORMAT = TREE的扩展。EXPLAIN除了输出查询计划和估计成本之外,EXPLAIN ANALYZE还会输出执行计划中各个迭代器的实际成本。

如何使用?

我们将使用Sakila样本数据库中的数据和一个查询举例说明,该查询列出了每个工作人员在2005年8月累积的总金额。查询非常简单:
SELECT first_name, last_name, SUM(amount) AS total	
FROM staff INNER JOIN payment	
  ON staff.staff_id = payment.staff_id	
     AND	
     payment_date LIKE '2005-08%'	
GROUP BY first_name, last_name;	
+——————+—————+—————+	
| first_name | last_name | total    |	
+——————+—————+—————+	
| Mike       | Hillyer   | 11853.65 |	
| Jon        | Stephens  | 12218.48 |	
+——————+—————+—————+	
2 rows in set (0,02 sec)
只有两个人,Mike和Jon,我们在2005年8月获得了他们的总数。

EXPLAIN FORMAT = TREE将向我们显示查询计划和成本估算:
EXPLAIN FORMAT=TREE	
SELECT first_name, last_name, SUM(amount) AS total	
FROM staff INNER JOIN payment	
  ON staff.staff_id = payment.staff_id	
     AND	
     payment_date LIKE '2005-08%'	
GROUP BY first_name, last_name;	
-> Table scan ><temporary>	
    -> Aggregate using temporary table	
        -> Nested loop inner join  (cost=1757.30 rows=1787)	
            -> Table scan >(cost=3.20 rows=2)	
            -> Filter: (payment.payment_date like '2005-08%')  (cost=117.43 rows=894)	
                -> Index lookup >using idx_fk_staff_id (staff_id=staff.staff_id)  (cost=117.43 rows=8043)
但这并不能表明这些估计是否正确,或者查询计划实际上是在哪些操作上花费的时间。EXPLAIN ANALYZE将执行以下操作:

EXPLAIN ANALYZE	
SELECT first_name, last_name, SUM(amount) AS total	
FROM staff INNER JOIN payment	
  ON staff.staff_id = payment.staff_id	
     AND	
     payment_date LIKE '2005-08%'	
GROUP BY first_name, last_name;	
-> Table scan ><temporary>  (actual time=0.001..0.001 rows=2 loops=1)	
    -> Aggregate using temporary table  (actual time=58.104..58.104 rows=2 loops=1)	
        -> Nested loop inner join  (cost=1757.30 rows=1787) (actual time=0.816..46.135 rows=5687 loops=1)	
            -> Table scan >(cost=3.20 rows=2) (actual time=0.047..0.051 rows=2 loops=1)	
            -> Filter: (payment.payment_date like '2005-08%')  (cost=117.43 rows=894) (actual time=0.464..22.767 rows=2844 loops=2)	
                -> Index lookup >using idx_fk_staff_id (staff_id=staff.staff_id)  (cost=117.43 rows=8043) (actual time=0.450..19.988 rows=8024 loops=2
这里有几个新的度量:

  • 获取第一行的实际时间(以毫秒为单位)
  • 获取所有行的实际时间(以毫秒为单位)
  • 实际读取的行数
  • 实际循环数

让我们看一个具体的示例,使用过滤条件的迭代器成本估算和实际度量,该迭代器过滤2005年8月的数据(上面EXPLAIN ANALYZE输出中的第13行)。

Filter: (payment.payment_date like '2005-08%')	
(cost=117.43 rows=894)	
(actual time=0.464..22.767 rows=2844 loops=2)
我们的过滤器的估计成本为117.43,并且估计返回894行。这些估计是由查询优化器根据可用统计信息在执行查询之前进行的。该信息也会在EXPLAIN FORMAT = TREE输出中。
我们将从最后面的循环数开始。此过滤迭代器的循环数为2。这是什么意思?要了解此数字,我们必须查看查询计划中过滤迭代器上方的内容。在第11行上,有一个嵌套循环联接,在第12行上,是在staff表上进行表扫描。这意味着我们正在执行嵌套循环连接,在其中扫描staff表,然后针对该表中的每一行,使用索引查找和过滤的付款日期来查找payment表中的相应条目。由于staff表中有两行(Mike和Jon),因此我们在第14行的索引查找上获得了两个循环迭代。
对于许多人来说,EXPLAIN ANALYZE提供的最有趣的新信息是实际时间“ 0.464..22.767”,这意味着平均花费0.464毫秒读取第一行,而花费22.767毫秒读取所有行。平均时间?是的,由于存在循环,我们必须对该迭代器进行两次计时,并且报告的数字是所有循环迭代的平均值。这意味着过滤的实际执行时间是这些数字的两倍。如果我们看一下在嵌套循环迭代器(第11行)中上一级接收所有行的时间,为46.135毫秒,这是运行一次过滤迭代器的时间的两倍多。
这个时间反映了整个子树在执行过滤操作时的根部时间,即,使用索引查找迭代器读取行,然后评估付款日期为2005年8月的时间。如果我们查看索引循环迭代器(第14行),我们看到相应的数字分别为0.450和19.988 ms。这意味着大部分时间都花在了使用索引查找来读取行上,并且与读取数据相比,实际的过滤成本相对低廉。
实际读取的行数为2844,而估计为894行。优化器错过了3倍的因素。同样,由于循环,估计值和实际值都是所有循环迭代的平均值。如果我们查看schema,发现payment_date列上没有索引或直方图,因此提供给优化器的统计信息是有限的。如果使用更好的统计信息可以得出更准确的估计值,我们可以再次查看索引查找迭代器。我们看到该索引提供了更加准确的统计信息:估计8043行与8024实际读取行。发生这种情况是因为索引附带了额外的统计信息,而这些数据对于非索引列是不存在的。
那么用户可以使用这些信息做什么?需要一定的练习,用户才可以分析查询并理解为什么它们表现不佳。但是,这里有一些帮助入门的简单提示:
  • 如果疑惑为何花费这么长时间,请查看时间。执行时间花在哪里?
  • 如果您想知道为什么优化器选择了该计划,请查看行计数器。如果估计的行数与实际的行数之间存在较大差异(即,几个数量级或更多),需要仔细看一下。优化器根据估算值选择计划,但是查看实际执行情况可能会告诉您,另一个计划会更好。
EXPLAIN ANALYZE是MySQL查询分析工具里面的一个新工具:
  • 检查查询计划: EXPLAIN FORMAT = TREE
  • 分析查询执行: EXPLAIN ANALYZE
  • 了解计划选择: Optimizer trace
希望您喜欢这个新功能,EXPLAIN ANALYZE将帮助您分析和了解缓慢的查询。


640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=gif

扫码加入MySQL技术Q群

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/193675.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 编译CTK「建议收藏」

    编译CTK「建议收藏」 使用ctkPluginFramework作为插件系统框架的确有着众多开发上的优势。最近收到一些站内信,大家都想使用ctkPluginFramework但是不知道如何编译,这篇教程就来讲一讲ctkPluginFramework插件系统在Windows下的编译过程。准备条件:https://wenku.baidu.com/view/83ef9e1be97101f69e3143323968011ca3…

  • P3P解决cookie跨域

    P3P解决cookie跨域P3P是什么P3P(PlatformforPrivacyPreferences)是W3C公布的一项隐私保护推荐标准,以为用户提供隐私保护。 P3P标准的构想是:Web站点的隐私策略应该告之访问者该站点所收集的信息类型、信息将提供给哪些人、信息将被保留多少时间及其使用信息的方式,如站点应做诸如“本网站将监测您所访问的页面以提高站点的使用率”或“本网站将尽可能为您提供更合适的广告”等

  • 模糊PID算法及其MATLAB仿真(2)

    模糊PID算法及其MATLAB仿真(2)上一篇写了模糊自整定PID的理论,这篇来做MATLAB仿真。目录补充内容:如何计算临界稳定下的开环增益Ku和震荡周期TuMATLAB进行模糊PID仿真1、准备工作2、模糊控制器的设计补充内容:如何计算临界稳定下的开环增益Ku和震荡周期Tu学过控制工程或者相关理论的同学应该比较了解,判断系统稳定性的条件一般用到劳斯表(劳斯判据)。而PID控制和模糊PI…

  • 常用经典SQL语句大全完整版–详解+实例

    常用经典SQL语句大全完整版–详解+实例下列语句部分是Mssql语句,不可以在access中使用。  SQL分类:  DDL—数据定义语言(CREATE,ALTER,DROP,DECLARE)  DML—数据操纵语言(SELECT,DELETE,UPDATE,INSERT)  DCL—数据控制语言(GRANT,REVOKE,COMMIT,ROLLBACK)  首先,简要介绍基础语句:  1、说明:创建数据库CREATED…

  • pycharm选择解释器_python高级编程

    pycharm选择解释器_python高级编程一、IDE配置解释器二、配置pip镜像按照【配置永久生效】全局配置文件Window系统下,文件夹路径中输入%APPDATA%,若没有pip目录创建,并在里面创建文件pip.ini,内容如下[global]timeout=6000index-url=https://pypi.mirrors.ustc.edu.cn/simple/tr…

  • python深拷贝和浅拷贝详解_Java浅拷贝和深拷贝的区别

    python深拷贝和浅拷贝详解_Java浅拷贝和深拷贝的区别Python深拷贝和浅拷贝详解浅拷贝,指的是重新分配一块内存,创建一个新的对象,但里面的元素是原对象中各个子对象的引用。深拷贝,是指重新分配一块内存,创建一个新的对象,并且将原对象中的元素,以递归的方式,通过创建新的子对象拷贝到新对象中。因此,新对象和原对象没有任何关联。1.浅拷贝使用数据类型本身的构造器对于可变的序列,还可以通过切片操作符:来完成浅拷贝Python还提供了对应的函数copy.copy()函数,适用于任何数据类型1.1使用数据类型本身的构造器lis

    2022年10月23日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号