请问一下微博和百度贴吧的热门话题排行榜是如何生成的?

2016-10-19 12:43:31 +08:00
 changwei

微博和贴吧都是国内数一数二的 PHP 构建的高并发网站,请问他们的这个热门话题排行榜是如何得出的?我目前只想得到用中文分词库对全站内容分词和统计,但是这类高并发网站每天都是成千上亿的数据产出,用分词的话如何是如果解决效率问题的?或者他们还用了其他什么技术?

原题地址: https://segmentfault.com/q/1010000007208032

1611 次点击
所在节点    问与答
7 条回复
hshpy
2016-10-19 12:48:36 +08:00
给钱的,强制输送,不说了都是套路
Quaintjade
2016-10-19 12:57:58 +08:00
有的是塞钱的,有的是管理员手动添加的。只不过是针对已知词组进行统计。

倒是搜索引擎的搜索词趋势报告可能涉及分词。
ibufu
2016-10-19 14:08:52 +08:00
题主是不是很失望
murmur
2016-10-19 14:11:16 +08:00
我猜 80%是给钱推广的 20%是真的热点 毕竟那种党和国家的大事都要给钱推广 新浪估计要关门了
cnZary
2016-10-19 15:42:27 +08:00
用钱生成的
sensui7
2016-10-19 17:32:16 +08:00
你还以为是算法生成的? 乃衣服啊, 无利不起早, 国内凡是各种排行榜, 热门推荐都是........
kaneg
2016-10-19 18:47:54 +08:00
本以为是个技术问题,实际却是个商业问题

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/313828

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX