手把手教你玩转 MySQL InnoDB优化器：从踩坑到起飞

date

Feb 13, 2025

slug

In-depth-Analysis-of-MySQL-InnoDB-Optimizer

status

Published

一、优化器的"脑回路"大揭秘

大家有没有遇到过这种情况：明明你写的SQL看起来完美无缺，但执行起来却慢得像蜗牛？别急着怀疑人生，八成是优化器这个"聪明反被聪明误"的家伙在搞事情！

1.1 优化器的"算盘"怎么打

想象一下优化器是个精明的会计，它用两个关键指标算账：

统计信息：就像超市的库存清单（不过偶尔会缺斤少两）

成本计算：把每个操作都换算成金币（但有时会算错账）

读个数据页 ≈ 1金币
做个比较 ≈ 0.2金币

举个栗子🌰：当你要在1000万用户表里找人，优化器可能觉得全表扫描更划算，因为索引扫描的"金币成本"更高。但实际上，如果目标数据只要前100条，索引才是真香！

1.2 优化器的十八般武艺

1.2.1 乾坤大挪移（查询重写）

触发条件：当WHERE条件过滤掉所有NULL值时，外连接自动变内连接

1.2.2 数学课代表（代数优化）

相当于把公共因子提取出来，减少计算量

1.2.3 索引使用指南

招式名称	使用场景	威力加成	秘籍要领
覆盖索引	查询字段全在索引	⭐⭐⭐⭐	SELECT字段别太多
索引下推	WHERE有多个条件	⭐⭐⭐	5.6+版本才支持
MRR优化	范围查询+回表	⭐⭐	调整read_rnd_buffer_size参数

举个实战案例📝：

二、优化器的"七寸"在哪里

2.1 统计信息不准的坑

去年双十一的惨痛教训：订单表明明有500万数据，优化器非说有300万，结果选了全表扫描，直接导致数据库CPU飙到90%！

解决方案三连：

更新统计信息

强制使用索引

调整采样精度

2.2 分页查询的生死劫

新手常见车祸现场🚑：

你以为只是取20条？实际上MySQL默默读了100万条数据！

救命锦囊：

原理就像查电话本：先快速找到20个号码，再回头查详细信息

三、高频问题急救手册

3.1 COUNT(*)到底该怎么用

四大场景对照表：

使用场景	正确姿势	错误示范	性能对比
统计总行数	COUNT(*)	COUNT(主键)	快3倍
统计非空列	COUNT(列名)	COUNT(*)	准确但慢
快速估值	EXPLAIN的rows列	随便猜	闪电速度
实时精确统计	用汇总表	每次都COUNT	快100倍

汇总表实战：

3.2 JOIN优化的九阴真经

黄金三原则：

小表驱动大表（就像用小车拉大货，翻车概率低）

被驱动表必须建索引（否则就是全表扫大街）

巧用STRAIGHT_JOIN纠正优化器

3.3 UNION的隐藏陷阱

血泪教训💧：某同事用了UNION导致查询从0.1秒变3秒，最后发现是忘了加ALL！

性能对比实验：

记住：UNION会悄悄做去重+排序，就像给数据洗澡还做SPA，能不慢吗？

四、高手进阶秘籍

4.1 执行计划深度解读

教你用EXPLAIN算命🔮：

type列：从最好到最差 system > const > eq_ref > ref > range > index > ALL

Extra列暗语大全：

Using index：喜提覆盖索引
Using temporary：临时表警告
Using filesort：需要排序大礼包

4.2 成本模型调教指南

想让优化器更听话？试试调整这些参数：

五、防翻车检查清单

每次写完SQL后，拿出这个清单🧾挨个打勾：

所有JOIN字段都有索引吗？

分页超过1000条用了延迟关联吗？

COUNT查询是否用星号？

UNION是不是真的需要去重？

GROUP BY字段有没有索引？

最近有没有更新统计信息？

EXPLAIN结果看过没？

六、终极忠告

记住三句口诀：

索引不是万能的：就像不能拿菜刀削苹果

优化器不是神仙：它也需要正确的统计信息

不要过早优化：先让SQL跑起来，再考虑优化

最后送大家一张护身符🧿：当遇到诡异性能问题时，请依次检查：

执行计划

索引使用

统计信息

服务器配置

祝大家在MySQL的江湖里，少踩坑，多起飞！遇到问题记得回来看看这篇秘籍~ 🚀