mysql explain不准确_mysql explain预估剖析「建议收藏」

大家好，又见面了，我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

引子：

使用MySQL建立了一张表country，总共有才3121行记录。

但是使用explain select count(*) from country;的时候，发现行数rows达到6897，让我大吃一惊。

mysql> explain select count(*) fromcountry;+—-+————-+———+——+—————+——+———+——+——+——-+

+—-+————-+———+——+—————+——+———+——+——+——-+

+—-+————-+———+——+—————+——+———+——+——+——-+

问题：为什么explain的结果和真实的结果运行不一致，并且产生这么大的误差？

针对这个问题，上网查了些资料，特此发博文总结下，当然自己也是刚刚使用mysql，有很多不了解的地方，希望多多指正。

一、explain是什么？

通过explain可以查看MySQL的执行计划，从而知道MySQL是如何处理我们的SQL语句。具体来说通过explain我们能得到一系列的关键信息，比如哪些索引被实际使用，查询了多少行等等。

explain使用Rows来告知我们数据库即将要阅读的行数，但是实际将要阅读的行数和explain所记载的将要阅读的行数可能会有差异，这是因为explain并没有真的去执行sql语句从而得出行数，而是进行了某种预估。

二、explain怎么预估行数

1)mysql-5.5之前

首先找到查询第一个记录所在的page(记为PLeft)，统计PLeft里的记录数(记为Records_PLeft)，之后找到最后一个记录所在的page(记为PRight)，统计PRight的记录数(Records_PRight)，之后将Records_PLeft与Records_PRight取平均，最后乘以总共的page数目(记为Page_Num)。公式如下：

Rows = ((Records_PLeft + Records_PRight)/2)*Page_Num

统计上讲这个预估方法是很有偏的。比如总共4个page：page1(999 records), page2(1 record), page3(1 record), page4(1 record)，这样预估出来的Rows=((999+1)/2)*4 = 2000，然而实际上才总共才有1002个记录。

2)mysql-5.5之后

上述预估偏差大的关键在于有偏，而有偏的关键在于采样的page数太少了，事实上只采样了边界2个，新算法的思路很简单，增加采样数目，比如采样10个page，这样可以在一定程度上降低偏差。

具体来说，mysql除了边界2个外，还沿着左侧page往右连续查找8个page，如果总的page数目小于等于10个，那么预估的Rows和真实的Rows一致。

Rows = ((Records_PLeft + Records_P1 + Records_P2 + … + Records_P8 + Records_PRight)/10)*Page_Num

上述方法只是在一定程度上缓解了有偏的问题，但是不准确还是存在的，事实上楼主的mysql版本是5.6版本，可见还是没有解决的很好。

三、思考

为什么是从左往右连续选8个page，而不是在首尾之间随机选择8个page，既然要缓解采样有偏的问题，那么随机选应该更好。猜想可能有两个原因：1)随机选择每次explain得到的Rows不一样，不方便应用；2)随机选会造成I/O开销，尤其是数据量大的时候，毕竟explain是希望能快速得到预估结果。

我觉得应该还有更好的算法，能实现explain效率与精度的tradeoff，希望大家能给出建议。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/180883.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

mysql explain不准确_mysql explain预估剖析「建议收藏」

相关推荐

Python 如何理解又晕又好用的装饰器

【图像超分辨】RDN

java栈的实现_java技术栈

前端vue面试题2021及答案_redux面试题

013实现使用两个堆栈队列(keep it up)

PotPlayer最新 中文,绿色版 PotPlayer

发表回复

PotPlayer最新中文,绿色版 PotPlayer