百度指数、微信指数、微博指数等等这样的系统后端是如何存储数据的?

2018-02-01 20:42:24 +08:00
 anonymoustian

用过百度指数、微信指数朋友们应该都了解,输入一个关键词或者热词,它就会返回这个词在过去的一段时间的流量情况。

我想实现类似的一个系统,但是不知道从何入手。 现在的问题就是不清楚这种系统后台是用什么数据库存的,因为每天都有“新词”产生,而且要一直记录每天或者每小时的每个词的 count,数据会越来越多。

所以想请教一下朋友们,有实现过类似功能的老铁能指导下 数据库应该选用什么方案,表和库结构或者一些字段该如何设计吗?

谢谢了!

2250 次点击
所在节点    程序员
4 条回复
anonymoustian
2018-02-01 20:46:21 +08:00
对于新词,它之前时间的数据肯定是空的; 而且这些词的量级大概在 2 亿左右,老铁们有什么建议吗?
willchen
2018-02-01 20:47:47 +08:00
试试时序型数据库吧
anonymoustian
2018-02-01 20:50:38 +08:00
@willchen 你好 我尝试过时序型数据库 influxdb,如果有两亿个词的话,就要有 两亿种 series, 这个真的没问题吗?或者您有用过什么好用的数据库?
anonymoustian
2018-02-02 17:19:05 +08:00
这么多人收藏。。。没人回答一个么。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/427819

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX