数百万数据门店销售订单按门店分组排序分页取销售额前 20 条怎么优化 order by

大致有订单表 order, 含 amount storeid (每单销售额, 销售门店)
select storeid,sum(amount) as total
from
order
group by storeid
order by total desc
limit 0,20
数据量快千万了, 不加 order by 排序很快. 但是分页需要显示销售额最高的前 20 条数据, 不可避免排序
一般数据量大的改怎么分组排序? (数据量很大, 取出来放代码里排统计也不行)

实际上也需要连接其他表? 是先主表分组后再 left join 还是 left join 后再分组?
请问下大佬们是怎么解决的.

cloverzrg2

2020-12-24 17:13:29 +08:00

你这个要实时获取最新的？
不是的话，放到缓存里，每隔一个小时左右更新一次就行了

matrix67

2020-12-24 17:40:09 +08:00

@cloverzrg2 #2 2 楼老哥说的对
不需要实时的话，是不是再开个表，每天晚上统计每个门店销售额，然后从这个表 select 就行了。

还有最近看 elk，它的 demo 里面有销售数据，是不是可以来搞这个，做到准实时。

wuzhizuiguo

2020-12-24 17:40:49 +08:00

@wangritian 嗯,原来也加了表, 但是数据不准. 又返回去了.

LJ2010

2020-12-24 17:41:34 +08:00

写个定时服务,每天 /月统计一次订单表
insert to 门点销售额表
查询直接查统计表

renmu123

2020-12-24 17:43:33 +08:00

数据量这么大了很难做到实时，一般这种产品都是看前一天数据的，参考微信小程序的数据统计。就说产品这个需求是伪需求，以及技术难度过高，占据过多性能，，把产品怼回去

wuzhizuiguo

2020-12-24 17:43:39 +08:00

@matrix67 好的,现在算是实时的, 底下商户也要看下实际销售情况. 没想到 order by 这么慢

LJ2010

2020-12-24 17:44:29 +08:00

补充下, 单表查询慢的话 ,可以增加分区,或者拆表(不过会增加业务处理逻辑的复杂度),一般分区根据分区字段排序查询,速度应该都可以

kiracyan

2020-12-24 17:45:22 +08:00

你把旧数据汇总一份当天的在这个表里拿往前的数据从汇总表里拿然后查当天的信息再加起来排序可以吗？

wuzhizuiguo

2020-12-24 17:45:35 +08:00

@renmu123 哈哈, 限制也是有点儿, 时间, 但时间跨度大一些就明显慢了.

liian2019

2020-12-24 17:47:24 +08:00

整个定时任务，定时统计数据插入到统计表，比如根据门店定时汇总销售额。单纯靠订单表来统计不靠谱，以后量大了，查不动是迟早的事，要是因为这个查询影响正常下单业务就得不偿失了。

ElmerZhang

2020-12-24 17:48:23 +08:00

又要实时，又要性能的情况下
方案 A：另外加个汇总表，定单表与汇总表的更新做成事务。这样的缺点就是订单业务中耦合了统计的逻辑，不优雅，而且对性能也会有一些影响。
方案 B：仍然是加个汇总表，但是通过 [otter]( https://github.com/alibaba/otter) 来更新，没有方案 A 中提到的缺点，但是架构变复杂了。

wangritian

2020-12-24 17:53:40 +08:00

@wuzhizuiguo 数据不准的原因是什么呢？开启事务和订单行锁，一般不会出现并发异常

ElmerZhang

2020-12-24 18:40:14 +08:00

纠正一下我 #16 的回复，方案 B 中应该是用 [canal]( https://github.com/alibaba/canal)

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/738660

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

数百万数据 门店销售订单 按门店 分组排序分页 取销售额前 20 条 怎么优化 order by

数百万数据门店销售订单按门店分组排序分页取销售额前 20 条怎么优化 order by