SELECT COUNT(*) 查询如何优化？

2022 年 5 月 9 日

anxn

如题，业务上需要全文搜索，数据大约有两百万条，每次需要查询并统计条数，发现这样花的时间是两倍，第一条 SQL 花了两秒，COUNT 又花了两秒，这样效率太低了，请教如何优化？

因为项目原因，不让用 Redis ，是不是最好的方案就是再弄一张表单独记录 COUNT ，然后定期更新数据？

第一条 SQL

SELECT
	* 
FROM
	bookclist 
WHERE
	btitle LIKE '%社会主义%'

第二条 SQL

SELECT
	COUNT(*) 
FROM
	bookclist 
WHERE
	btitle LIKE '%社会主义%'

还有就是全文搜索准备用全文索引，然后用 MATCH AGAINST 查询，但是就是发现在查三个字的人名时速度还比不上 LIKE 查询，不知道各位 v 友知道怎么解决吗？

4692 次点击

所在节点

MySQL

26 条回复

Jooooooooo

2022 年 5 月 9 日

不小的数据量, 搜索匹配, 不是 mysql 的强项, 搞个 es 吧.

ration

2022 年 5 月 9 日

第一条是需要分页吧。。只能全文索引了，单独记录 count 的话也没用，搜索条件是不确定的。不上 es 的话，试一下 mysql 的全文索引，缓存占用比较大才能发挥优势。

akira

2022 年 5 月 9 日

不是 COUNT(*) 的问题，是全文检索的问题

lanlanye

2022 年 5 月 9 日

1. 分成两个接口，这样相同条件只需要 count 1 次

2. 如果全文检索本身无法利用索引优化，可以用 OVER() 一次获取到结果和总数，少查一次

xiaopanzi

2022 年 5 月 9 日

Never use COUNT(*) in production mode.

anxn

2022 年 5 月 9 日

@ration 对第一条就是有分页

Juszoe

2022 年 5 月 9 日

如果你的业务和搜索引擎一样只需要近似值，如“约 100000 条结果”，可以用 explain 命令

Euthpic

2022 年 5 月 9 日

全文搜索用 ES 是最好的,用 MySQL 的 ngram 也行

anxn

2022 年 5 月 9 日

@lanlanye 感谢建议，不过第 2 条查了下是 MySQL 8 才支持 OVER()函数，公司项目还是 5.7 版的
再研究研究怎么弄合适吧

Sasasu

2022 年 5 月 9 日

过会你就来问深翻页怎么办了

yesterdaysun

2022 年 5 月 10 日

如果总条数不是特别重要, 可以考虑只精确查询特定数量以下的条数, 比如 10000 条, 10000 条之上统一显示 10000 或者提示超过 10000, 之下才精确计算

可以先用 select 1 from t where xxx limit 10000,1 确定是不是超过 1 万条, 超过则 total 直接写 10000
如果没超过再 select count(1) form t where xxx

1 万条可能大了点, 可以换成 1 千条之类的, 应该可以提高一点 count 的速度, 但是效果可能不会很好, 有条件还是上 ES 吧

sutra

2022 年 5 月 10 日

`select found_rows();`

https://dev.mysql.com/doc/refman/8.0/en/information-functions.html#function_row-count

sutra

2022 年 5 月 10 日

上面的 link 有点错。

后面的 anchor 改成 #function_row-count

SELECT
SQL_CALC_FOUND_ROWS *
FROM
bookclist
WHERE
btitle LIKE '%社会主义%'

select found_rows();

sutra

2022 年 5 月 10 日

我怎么老是贴错，anchor 应该是 #function_found-rows

akira

2022 年 5 月 10 日

@sutra 看了下文档，他是建议还是继续用 select count(*) 作为第二个语句来获取总行数的呀

anxn

2022 年 5 月 10 日

@sutra 这个方法测试可行，感谢！

sutra

2022 年 5 月 10 日

@akira 我也没怎么用过这个，只是知道。

encro

2022 年 5 月 10 日

@sutra
@anxn

看文档意思是 found rows 已经被弃用（因为某些优化无效），建议用 count(*)会更好。

Mysql 应该是无解的，简单来说用全文索引会好过 like 很多。特别对于 tilte 这种，走索引后几百万数据还是挺快的。

Mysql 中文全文索引（含实例 5 分钟上手）

https://c4ys.com/archives/2098

anxn

2022 年 5 月 10 日

@encro 全文索引也研究了，就是发现查 3 个字的人名还是比较慢，比如包含这个人名的记录有 5k 多条(记录不超过 1k 条得话可以达到毫秒级)，查询还是得花 3 秒多，不过 COUNT(*)就非常快了，可以达到毫秒级

这是我的配置文件
innodb_ft_min_token_size = 1
innodb_ft_max_token_size = 84
ngram_token_size = 2

SQL 语句：

SELECT
*
FROM
bookclist
WHERE
MATCH ( btitle ) AGAINST ('邓小平' IN NATURAL LANGUAGE MODE );

查"邓小平"或者"邓小"都是 3 秒多，研究了好久不知道咋优化了，不知道 MySQL 能不能对指定词库做索引，之前只查到了 stopword

anxn

2022 年 5 月 10 日

@anxn 补充一下，全文搜索 LIMIT 1000;应该是个优化思路

第 1 页／共 2 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/851848

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.