每天 60w 日活的 app 后台数据分析怎么做合适.

2017-05-25 17:05:18 +08:00
 snail00

公司之前没有后台, 后台从 0 开始, 就我一个人.

目前服务器资源:

凌动双核 cpu 1.8g 主频,4g ddr3 800 内存, 500g 机械硬盘

亚马逊免费 rds 一台, 1c 1g 20g 空间

后台写了报文收集和简单的入库查询.

现在用户慢慢更新了应用.

每天报文量 18w+, 占用硬盘空间 20M 左右, 数据入库 60w+条, 统计的日活只有 4w 用户, 还在一直增加.

今天算了下, 按三分之一用户会更新新版来算, 这么搞很快就死了.

现在的思路是:

  1. 压缩单用户的数据
  2. 按月分表, 这也是单表千万数量级
  3. nosql 或索引
  4. 冷热数据分离, 单独搞个结果表.

现在问题来了, 有没有更好的办法, 资源比较有限 或者说做 100w 日活的后台统计, 大概需要什么什么规模的计算资源, 就亚马逊的产品来说.

6499 次点击
所在节点    程序员
32 条回复
dangyuluo
2017-05-26 03:02:12 +08:00
发现 ELK 系列真是神器啊,只要记录下来了,想做什么分析都可以。
snail00
2017-05-26 09:08:58 +08:00
@dangyuluo #21 等手头这么处理差不多了, 搭套 elk 试试.
Hozzz
2017-05-26 09:43:00 +08:00
以楼主的数据量,I/O 肯定是个瓶颈(无论如何优化)。
gamecreating
2017-05-26 09:59:05 +08:00
啥 APP...发来帮你研究下
yanzixuan
2017-05-26 11:10:30 +08:00
@snail00 es 是个好东西,但是吃内存。。少于 1 一个 g 的内存玩不动。。。我在 vps 上试了一下极限情况。1g 内存,设置 jvm 吃 500m 内存。勉强能用。再跑点别的就不行了。
jswh
2017-05-26 12:11:52 +08:00
我最后选了 Cassandra
mingyun
2017-05-28 08:39:29 +08:00
这么多人推荐 elk
firefox12
2017-05-29 08:55:25 +08:00
啥 app 日活 60 万?够一个人生活了吗?求 app 名字
mineqiqi
2017-06-20 17:27:28 +08:00
@firefox12 日活 60w 还不够一个人生活?
snail00
2017-06-20 17:41:43 +08:00
@mineqiqi #29 额, 不是一个人, 是一个公司其中的一个 app 做后台目前就我一人.
mineqiqi
2017-06-20 17:48:33 +08:00
@snail00 嗯哪,我知道不是你一个人,我回答的是 28 楼,你是不是看错头像了
firefox12
2017-06-21 10:22:57 +08:00
@mineqiqi 所以想知道什么 app

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/363790

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX