搜索引擎超过 10 页以后的数据,有必要索引吗?

2019-07-21 08:32:40 +08:00
 okwork
1 很少有用户翻到 10 页以后
2 数据准确性几乎没有可参考价值
3 广告位也卖不出去

只保留 10 页以内的数据,远比保存几百、几千页数据存储和索引的效率都高很多。10 页以后的数据价值可能只有 10 页内的 1%都不到吧,有必要索引吗?
4039 次点击
所在节点    问与答
36 条回复
opengps
2019-07-21 08:34:47 +08:00
必要性还是有的,很多行业资料少的可怜,需要翻遍所有结果,更换各种关键字。
搜索引擎的收录量也是用户选择的参考
hoyixi
2019-07-21 08:35:51 +08:00
全国 10 亿人,只准 1000w 人上学,标准那啥定, 你愿意吗?
nethard
2019-07-21 08:37:18 +08:00
用户搜索的时候又不是只输入一个关键字,多个关键字用空格分开的时候,即使单个关键字索引很靠后的站点也能排在前面。
wangxiaoaer
2019-07-21 08:55:22 +08:00
大哥,你是来搞笑的吗?

搜索引擎建索引的时候怎么知道某条记录的页数?

所谓的页数只有在给定关键字的时候才有意义啊
delectate
2019-07-21 09:02:23 +08:00
对于百度来说,第一页也没有任何参考价值哦。这边建议您用 bing 或者 google 呢。
okwork
2019-07-21 09:04:49 +08:00
@wangxiaoaer 建立索引是反向的,呈现结果当然能按权重控制输出页数。
zhidian
2019-07-21 09:11:35 +08:00
我啥都不懂,但似乎应该是索引了它才被放到第十页的
binux
2019-07-21 09:13:23 +08:00
@okwork 权重是和关键词相关的,不知道关键词,你怎么能知道权重的?
lylsh1993
2019-07-21 09:13:52 +08:00
对特定网站搜索可能会翻很多页
okwork
2019-07-21 09:34:32 +08:00
@binux Pagerank,超链分析,域名 URL 权重,内容查重,文本分析等,这些都可以判断权重。
binux
2019-07-21 09:40:17 +08:00
@okwork #10 但是展示的时候权重最大的是相关性啊!!!
okwork
2019-07-21 09:53:01 +08:00
@binux 李鬼可以把 SEO 相关性做到最高。
binux
2019-07-21 09:55:56 +08:00
@okwork 那和你‘搜索引擎超过 10 页以后的数据’有什么关系吗?
wangxiaoaer
2019-07-21 10:01:39 +08:00
@okwork #6 建立索引是反向的,呈现结果当然能按权重控制输出页数。


------------------

现在的搜索结果本身就是按照权重排序输出的,但这个权重是动态的,你所谓的“ Pagerank,超链分析,域名 URL 权重,内容查重,文本分析”这些是相对静态的。

10 页以后可以不展示,但这是搜索阶段的控制,索引建立跟这个是两个独立的阶段。

举个例子,搜索关键词 A 的时候某个 11 页的内容,你认为不应该建立索引,但是搜索关键词 B 的时候,这条内容本应该出现在 10 页以内,结果因为没索引所以搜索不到,你觉得合理吗?

-----------------

另外看了你的回复,建议你提高些逻辑思维能力。
okwork
2019-07-21 10:19:50 +08:00
@wangxiaoaer 搜索引擎是个复杂的工程,意见相左没关系,就事论事的交流。


教别人做人之前,请先秀一下你的智商。
wangxiaoaer
2019-07-21 10:31:43 +08:00
@okwork 我没教你做人,我只是让你自己把逻辑练一练。

你自己看看 10 11 12 楼的回复,心疼 binux
iyaozhen
2019-07-21 10:34:56 +08:00
@wangxiaoaer 心疼

我就问楼主,一个网页 1,在 a 关键词拍第一页,在 b 关键词拍第十一页,你怎么判断?遍历所有关键词?
summerwar
2019-07-21 10:36:51 +08:00
你不能因为吃到第十个馒头饱了,就说前面的九个都白吃了。你的这个问题跟这个道理差不多
vindurriel
2019-07-21 11:04:31 +08:00
您的建议在一种情况下是可行的 那就是关键词可穷举 不过这样的系统一般不叫搜索引擎 叫排行榜 data cube 等等
LongLights
2019-07-21 11:11:43 +08:00
数据先被索引才被排序的。。。你从排序结果推索引与否,那你做的东西就不是现在说的搜索引擎了,是目录搜索

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/584785

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX