这是一个创建于 1348 天前的主题,其中的信息可能已经有所发展或是发生改变。
今晚本来突发奇想搜一下之前同学的人名,感慨这么少见的人名搜得那么准。
然后我觉得比如邱 LX 这个名字对应多少条链接是早就索引好的了。
然后我搜索了同在一所学校的两组很少见的同学名,一组能搜得到是因为学校有个新闻里她们都上榜了,另一组无结果。
然后我又试着组合一些热门和冷门的词语。
比如:
邓紫棋+唐国强:很多结果,他俩的联系是共同演唱了林俊杰的曹操,我觉得这属于强关系,这结果应该有提前确定好的
邓紫棋+比尔盖茨:多是 UGC 的索引聚合,比如论坛讨论邓紫棋的页面有引向比尔盖茨话题的链接,或者是他们都因参与冰桶挑战而上新闻。我觉得这属于弱关系,这结果可能是实时计算的
邓紫棋+坝体应力:我看不出搜索结果里体现了他们什么关系
巴洛克+俳句:外国文学史或者文艺类 UGC
屈服强度+内存溢出:除了“结构力学求解器”的问答之外基本没联系(哈哈土木工程的同学会懂)
……
所以我就想,这搜索引擎在分析不同热门 /冷门的词语的时候,是不是存在一定的规则;怎样算出搜索结果的?