一段 sql 比较

2022 年 4 月 28 日
 lipaa

A: and (data_his_id = '0' or data_his_id in (select id from xx where business_type = 1 and states = 2 and audit_status = 2))

B: and (data_his_id = '0' or (select count(1) from xx where business_type = 1 and states = 2 and audit_status = 2 and id=data_his_id)>=1)

本人菜鸡 大佬说 a 写法好 因为 b 是小表 求解 但是这连主键都用不上了 本人不敢多说. 大伙看看

3872 次点击
所在节点    MySQL
20 条回复
ration
2022 年 4 月 28 日
凭感觉是 A 好,B 用了 count 还关联了表。具体你可以看看实际的执行时间和执行计划
Hurriance
2022 年 4 月 28 日
感觉 A B 最终结果集是不一样的
bthulu
2022 年 4 月 28 日
navicat 连上去, 生成测试数据, 大表 1 一个亿, 小表 100 万, 再把你这两条 sql 分别执行一下看看就知道了
brader
2022 年 4 月 28 日
理论争论不下的时候,建议实操,试下各自的想法建立索引,不同表数据量下的实际查询时间较量。

另外,长点心吧,where 条件 id 用字符串'0'来做条件,虽然 mysql 听智能的,会自动转化
season8
2022 年 4 月 28 日
都不好,换成 exists
and (data_his_id = '0' or exists (select 1 from xx where xx.id = data_his_id and business_type = 1 and states = 2 and audit_status = 2))
season8
2022 年 4 月 28 日
@season8 抱歉,没看清,exist 大表小表都合适(万金油),如果 xx 是小表的话,A 方式 也是可以的。
lipaa
2022 年 4 月 28 日
@Hurriance 一样的
lipaa
2022 年 4 月 28 日
lipaa
2022 年 4 月 28 日
lipaa
2022 年 4 月 28 日
lipaa
2022 年 4 月 28 日
麻了
xuanbg
2022 年 4 月 28 日
A 写法中规中矩,B 写法实在是脑洞有点大啊。
lipaa
2022 年 4 月 28 日
@xuanbg 我也觉得
lipaa
2022 年 4 月 28 日
我的想法是 A 查全表了 B 可以用上主键索引 性能应该更好 尤其 A 表后期变大了的情况下 但是貌似我的想法错了 我多测测吧 复习吧
wolfie
2022 年 4 月 28 日
A:关联表数据量大就慢。
B:跟 exists 差不多,看起来难受,性能不会拉跨。
DonaldY
2022 年 4 月 28 日
都不好诶。

OR 优化掉吧。
LeegoYih
2022 年 4 月 28 日
如果条件允许的话,我建议是拆成 2 个 SQL:
1:select id from xx where business_type = 1 and states = 2 and audit_status = 2;
2:select * from t where any = ? and data_his_id in (ids);

第 1 个 SQL 执行完后,通过代码往结果里塞一个'0',然后再执行第二个 SQL 。


不确定这个是最高效的,建议在仿真环境看看每个 SQL 的执行计划:

```sql
set optimizer_trace="enabled=on";
select * from xxx where xx = ?;
select * from information_schema.optimizer_trace;
set optimizer_trace="enabled=off";
```
LeegoYih
2022 年 4 月 28 日
如果一定要写成一个 SQL 的话,可以用 union all ,不会影响性能。

select * from t
where any = ?
and data_his_id in (
select 0
union all
select id from xx where business_type = 1 and states = 2 and audit_status = 2);
zlowly
2022 年 4 月 28 日
两者有可能在优化器作用下差别不大,你真要比较,应该将 B 重写成 EXISTS 方式的查询语句来比较,因为 exists 可以在子查询只返回第一条记录而不是所有记录,应该对执行计划有较大影响。

但在真实世界里,如果 A 查询对 xx 表的子查询的结果集比较大(例如上万条)那么优化器可能会将原表和子查询结果集做 Hash Join ,而 B 查询也许是 Nested Loop ,这都是视乎你表的数据量和列数据的选择性等情况而定。

所以要做性能比较,这与其上网隔空问,还远不如直接看执行计划或者就是直接执行来得实在。
pengtdyd
2022 年 4 月 28 日
现在的 sql 优化器你怎么写基本上已经没啥区别了。。。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/849734

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX