mysql 索引工作的原理

比如 in 这个查询 in(1,2,3,4) 索引是分别拿 1，2，3，4 去索引查，查四次索引，还是查一次索引

如果是查四次索引，那我们查出来的数据很多的话比如说一千条，io 的次数不就超级多了

LYEHIZRF

2020 年 5 月 15 日

？？

Philyu

2020 年 5 月 15 日

mysql 的索引基础结构是 B+树，如 id in （ 1,2,3,4 ），那么会将 id 列的索引加载到内容，分布找到对应 id=1,2,3,4 的四行数据的偏移量，最少只需要一次 IO 。具体几次，涉及到你这表每一行的数据大小，因为磁盘读取，一次 IO 是 64K，有可能这 4 条数据都在了。

noble4cc

2020 年 5 月 15 日

@Philyu 意思还是查索引树查 4 次，io 看情况，一般挨着比较近就一次 io 搞定了

Philyu

2020 年 5 月 15 日

正常是这样，而且 mysql 会将部分用到的索引加载到内存，4 次或 1 次都很快；如果 in 里面是连续的值，大概率会被优化器优化。

noble4cc

2020 年 5 月 15 日

@Philyu 我的理解会把索引的 root 加载到内存，每次从 root 向下找，1，2，3，4 分别走四次 root，分别往下找，如果欧优化的话一次找到 1，2，3，4 就不再走 root 找了，这样理解对吗

2379920898

2020 年 5 月 15 日

光 mysql 索引这一部分就可以写一本书，并且 50%的程序员没有掌握这项技能

2379920898

2020 年 5 月 15 日

索引策略很多的，基本上最优的索引策略学下来要赶上学两次 C1 证了

2379920898

2020 年 5 月 15 日

IO 和索引不要一起提，毕竟你这样一问，显得很不专业。

cxshun

2020 年 5 月 15 日

@noble4cc #5 其实不需要走四次根结点，因为 B+树的叶子结点是一个链表，它可以在上面找到你所有的数据。所以只会是在取下一个子结点的时候会触发 IO，一般情况下 3-4 次 IO 就可以了。

noble4cc

2020 年 5 月 15 日

@cxshun 但是如果 id 值比较离散呢，10 10000 1000000 呢，这种恐怕一个叶子节点很难包括在一起，不走 root 怎么个搜出来呢

shenmimu

2020 年 5 月 15 日

索引逻辑结构是有序的 B+树,查找一列时间复杂度是 O(log(n)),物理结构是分页的硬盘存储
in 查询结果和分别查询结果相同,读多少次索引取决与引擎有没有预加载到条件需要的页,
再加上多次从索引到聚集索引的 fetch 和多次网络开销
in 查询绝大部分情况下比多次查询更快

Philyu

2020 年 5 月 15 日

我明白 lz 的意思，其实没有你想象的那么多 IO，首先索引是有序的，可以连续读取；就算 key 很分散，IO 次数也还跟 key 的数量在一个量级；查询到的记录再多，还是成片的，可以连续读取。

thinkmore

2020 年 5 月 19 日

不得不贴出我这篇文章 https://juejin.im/post/5e99136d51882573c508e278

thinkmore

2020 年 5 月 19 日

@thinkmore 贴错了，这个才是 https://juejin.im/post/5ea273f951882573cd41c7a4.

如果对于 in 有疑问，你完全可以 explain 分析下，看看是怎么走的

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/672072

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.