mongo 分页优化问题求教

看到 mongodb 的 skip 数据量大后会慢，如果排序字段是 id，或者是以时间排序，排序字段值唯一可以用 find 代替 skip。但如果我的排序字段不是 id 甚至字段值不唯一呢，怎么能用 find 代替 skip 分页？那还是绕不开 skip 吗？

lbfeng

2020-03-01 09:53:28 +08:00

https://www.codementor.io/@arpitbhayani/fast-and-efficient-pagination-in-mongodb-9095flbqr

a627795061

2020-03-01 10:00:05 +08:00

@lbfeng 老哥，你这个方案就是我说的 find 代替 skip，但前提是用 id 排序，但我的问题是不是 id 排序的情况下，而且排序字段的值有可能相等

Vegetable

2020-03-01 10:22:23 +08:00

这个不是 mongodb 的问题，mysql 用 offset limit 在 offset 够大的时候一样要面对这个问题，这个逻辑本身没有通用的解决办法。你想知道某个排序条件下第 10000 个到 10010 个记录分别是谁，必须要先把前 9999 条记录都排出来。
从你的描述可以看出来你应该看过官方文档的分页实现建议了，如果你的业务模型足够清晰的话，也许有办法通过别的手段优化 skip 比较大时的性能，不过这个很多时候是没那么必要的，具体还是看你业务

a627795061

2020-03-01 10:27:10 +08:00

@lbfeng 老哥，你这个方案就是我说的 find 代替 skip，但前提是用 id 排序，但我的问题是不是 id 排序的情况下，而且排序字段的值有可能相等
@Vegetable 是的，但是业务就是排序字段可以任选🤨

fmumu

2020-03-01 11:42:37 +08:00

限制只能查前一万条记录

optional

2020-03-01 11:56:30 +08:00

如果在意性能，那就把 [不唯一] 的字段 [变唯一] 。我这边的常用操作是，线上排序不允许多字段，如果有多字段预处理为单字段，如果有重复问题，就把该字段拆为高低 2 个部分，高位为值，低位填充随机数。

huang7230468

2020-03-01 16:46:14 +08:00

目前我们也是在用 mongo：
我们主要有以下措施：
1、条件，我们应该利用条件来尝试将尽可能的 documents 的数量减少；
2、如果是数据非常多，几百万、几千万，那么应该考虑集群分片；
3、重新审视目标 collection 的 Index，是否合理？
4、甚至可以考虑 SSD ；
最后，问下，你们目前大概是多少数据呀？如果说只有几万条，理论上讲应该不会有问题；

itskingname

2020-03-02 11:12:45 +08:00

MongoDB 自动生成的_id 是一个排序递增的字段，可以直接通过它来搜索和分页。记录上一次的_id，第二次搜索的时候大于_id 就好了。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/648756

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.