mysql，级联查询，还是单表多次查询（对于查出多条数据来说）？

想到 3 种查询方案，假如有 A、B 两个表，会查出 100 条数据
1、A、B 表级联查询
2、先查询 A 表，得到一个集合，然后遍历这个集合，用单条数据中的某个属性去查询 B 表，再把查询出来的结果插到这单条数据里
3、先查询 A 表，得到一个集合 X，然后遍历这个集合 X，取出每个单条数据里的某个属性组成 in()，去查询 B 表得到集合 Y，然后把集合 Y 的数据对应插入到集合 X 里
第 1 种只查询 1 条 sql，第 2 种要查询 101 条 sql，第 3 种查询 2 条 sql，大家用哪种方案？
如果是更大的数据量呢

glacer

2018-06-11 10:48:29 +08:00

让数据库做行遍历少的 join 是可以的，尤其是能做到小表驱动时。剩余的情况更倾向于单表多次查询。
像 GraphQL 这类查询语言，其原生版本就不支持多表的 join 查询。即使 join-monster 这样的中间件，其底层实现 join 的技术也有两种。其官方文档里也明确在一对一级联（或少量数据级联）的情况下可使用 join 查询，而在多对多级联则建议使用单表 batch 查询。
如果你们的数据库在后期会做水平分库的话，不管是使用 proxy 还是数据库中间件，对 join 查询的支持都不好（分布式数据库对 join 查询是很不友好的）。所以如果前期尽量避免 join 的使用的话会省很多事情。
另外，单表多次查询可以对查询的中间结果缓存，这对 join 来说是很难做到的。

monsterj

2018-06-11 11:36:28 +08:00

@glacer 那单表多次查询的话，第二种和第三种，哪个好一些

monsterj

2018-06-11 11:39:30 +08:00

@glacer in()里的数据多了影响性能，但第二种 sql 又太多

glacer

2018-06-11 12:06:47 +08:00

@monsterj 第三种。第二种方法会发送大量 SQL，造成 N+1 问题。
我不明白你所说的「 in()里的数据多了影响性能」是否有论据。使用 in 也是可以命中索引的，性能并不会比 join 差多少。

janssenkm

2018-06-11 12:32:01 +08:00

@glacer 有索引好些，没索引什么库都是渣

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/462063

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.