小白求一个大数据解决方案,感谢您的热心回答

2018-03-09 16:57:16 +08:00
 tzh1247

公司做 IPTV 业务的,每一个地区每个业务每天的数据量 400 万 PV 左右(地区较多 15 个地区左右,每个地区一到两个业务,一个业务两台机器做的集群,每个地区的网络不互通,可跟公司白名单服务器互通),

求一个大数据方案,主要要求如下:

  1. 计算每天 UV、PV、各页面访问量等

  2. 计算每月 UV、PV、各页面访问量等

  3. 根据运营条件做相关数据计算

  4. 服务器机器为两台集群,2G 内存到 8G 内存,本人想法是服务器最多算每个月的数据量,超过一个月的数据删除,用 mysql 实现

  5. 将服务器数据拉取到本地,采用多服务器、高配置,算一年或者几年的数据量

  6. 由于运营需要实时查看每天或者几天的数据,所以个人觉得第 4 点可行,比较服务器资源有限。

请各位大神指点下方案,小白不胜感激,小白努力学习,感谢各位的指点。

3175 次点击
所在节点    MySQL
7 条回复
liprais
2018-03-09 17:00:54 +08:00
总共一天六千万数据,随便写就行了
Thiece
2018-03-09 17:29:53 +08:00
时间序列数据库考虑一下? influxdb 了解一下?
vus520
2018-03-09 17:36:20 +08:00
量级不大,随便一个日志中心化的方案+数据库都可以抗得住。推荐 ES。
tzh1247
2018-03-10 15:33:59 +08:00
@vus520
@liprais
大佬能具体点吗?打算做几年的架构考虑,后期也要做数据分析,感谢
tzh1247
2018-03-10 15:35:38 +08:00
而且考虑做大数据渲染图展示
tzh1247
2018-03-10 15:36:07 +08:00
服务器配置不高,硬盘也不大,不到 1T
runntuu
2018-03-11 14:59:10 +08:00
1.OTLP 业务和 OLAP 业务最好分开在不同服务器,如果做不到 OLAP 至少要放到深夜进行,不能影响白天业务
2.光说 PV 这个指标参考意义不大,多少内存也不是拍脑袋想出来的。数据库有最重要的两个指标,QPS 和 TPS,想办法得到业务高峰时这两个数值再去考虑服务器配置。
3.超过一个月的数据删除,这个,额…万一要用到一个月前的数据怎么办?建议先归档吧,实在用不到再删除。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/436604

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX