来个 PHP shell 自动执行的思路

2017-05-30 22:08:19 +08:00
 colordog

场景是这样的,有一个商城,预估用户数为 10w+,客户要求每月 1 日,计算每个用户上个月的消费总额和消费笔数,然后根据这 2 个数值,自动给用户升降级,同时需要写入升降级记录以便用户查询;

问题,写一个 php 程序,如果一次 foreach 出来 10w 个数据,再循环查询、插入,效率感觉很低,服务器基本要垮掉,而浏览器我记得可以一次处理一部分,然后跳转再执行下一部分,跟分页似的,可是用 shell 行么?不行吧,使用 sleep 让 php 等待不知道是不是可以,希望大家给个思路。

3900 次点击
所在节点    PHP
26 条回复
shmilyin
2017-05-30 22:13:42 +08:00
php cli
cnlongxi
2017-05-30 22:21:29 +08:00
PHP 一次执行 100 条,没计算完就用 PHP 执行 exec 继续
shoaly
2017-05-30 22:26:18 +08:00
放到 crond 里面去执行: 执行思路:
1 每次取 100 个用户, 计算积分, 并且缓存该积分, 然后记录本次计算的时间戳
2 注意取的时候要 where 出 当前时间减去上一次更新时间>阈值的数据

基于上面 2 个点, 就可以无限去运行 crond 了, 既不会重复计算, 也不会因为某一次计算量太大而卡住, 即便是卡住了, 也可以"断点续传"的接着上次 bug 掉的地方继续处理
colordog
2017-05-30 22:32:00 +08:00
@shmilyin 以前稍微弄过一点,不太熟悉,还是不太了解一次性处理大量数据的方法。
colordog
2017-05-30 22:32:17 +08:00
@cnlongxi 这个方法好像可以诶,谢谢
colordog
2017-05-30 22:32:31 +08:00
@shoaly 看着好复杂的样子,不过看起来貌似可以
sagaxu
2017-05-30 22:35:59 +08:00
10 万是很小的量,放心 foreach 吧
rekulas
2017-05-30 22:38:22 +08:00
10w+的数据量 PHP 的性能完全能胜任,如果慢很可能是卡在数据库相关操作上,检查你的语句即可
hiboshi
2017-05-30 22:45:02 +08:00
既然是写脚本不需要考虑浏览器,超时。直接 php-cli 即可。
hiboshi
2017-05-30 22:45:26 +08:00
@hiboshi > php run.php
doctorlai
2017-05-30 23:00:43 +08:00
每次从数据库里取 1000 条,执行,结束。
加入 crontab 每几分钟执行一次
coolyujiyu
2017-05-30 23:02:49 +08:00
任务分片、多线程处理。
dangyuluo
2017-05-30 23:04:26 +08:00
同时从数据库内取 10000 条,然后处理完成后,组成一条长 MySQL update 语句,这样执行很快。
Fishdrowned
2017-05-30 23:34:14 +08:00
我来说三个点
1、如果你要遍历所有用户,你可以写成两层循环,外层 while(读 1000 条),内层 foreach (刚才读到的 1000 条);
2、在 sql 里就可以筛选掉大部分记录。升级比较容易处理,降级再加一个条件,因为最低级别是不会再降级的,所以不用处理最低级的用户;
3、每月 1 号执行配置一下 crontab 就可以了,具体怎么配置,搜索一下。
cxbig
2017-05-31 07:26:39 +08:00
用户总有自增 ID 的吧?怕读多了锁表或吃太多内存,每次取 100 个来计算不就好了? SQL 不是有 LIMIT 分页么。
azh7138m
2017-05-31 07:56:03 +08:00
@Fishdrowned 最低级用户可以升级的吧
zhs227
2017-05-31 08:26:46 +08:00
如果数据不会因为后续的更新而导致 sql 变化,可以把要执行的 sql 都统一生成到一个文件里,前后加上事务执行开始和结束。然后使用 mysqladmin 导进去。
Fishdrowned
2017-05-31 08:57:19 +08:00
@azh7138m 升级和降级是分开处理的
klgd
2017-05-31 08:57:28 +08:00
没有消费的用户也要处理吗? 如果不处理的话,就反过来,先查出上月消费数据,根据这些数据来处理用户升降级,这样要处理的数据会少很多(每月不可能 10W 用户都有消费的)
sarices
2017-05-31 09:07:11 +08:00
分开取出或者一次性取出,10W 不多,但是看你取出会不会有慢查询了,然后放到队列跑

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/364792

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX