搜索引擎的热门/冷门词语组合的搜索结果是怎么生成的?

2020-08-31 01:35:04 +08:00
 crella
今晚本来突发奇想搜一下之前同学的人名,感慨这么少见的人名搜得那么准。

然后我觉得比如邱 LX 这个名字对应多少条链接是早就索引好的了。

然后我搜索了同在一所学校的两组很少见的同学名,一组能搜得到是因为学校有个新闻里她们都上榜了,另一组无结果。

然后我又试着组合一些热门和冷门的词语。

比如:
邓紫棋+唐国强:很多结果,他俩的联系是共同演唱了林俊杰的曹操,我觉得这属于强关系,这结果应该有提前确定好的

邓紫棋+比尔盖茨:多是 UGC 的索引聚合,比如论坛讨论邓紫棋的页面有引向比尔盖茨话题的链接,或者是他们都因参与冰桶挑战而上新闻。我觉得这属于弱关系,这结果可能是实时计算的

邓紫棋+坝体应力:我看不出搜索结果里体现了他们什么关系

巴洛克+俳句:外国文学史或者文艺类 UGC

屈服强度+内存溢出:除了“结构力学求解器”的问答之外基本没联系(哈哈土木工程的同学会懂)

……

所以我就想,这搜索引擎在分析不同热门 /冷门的词语的时候,是不是存在一定的规则;怎样算出搜索结果的?
487 次点击
所在节点    问与答
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/702694

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX