Google 谷歌搜索业务倒闭的可能性分析

2021-10-11 19:16:12 +08:00
 bethebetter

前情提要

发现很多网友对「小搭百科网」的关注度比较高,于是……

https://www.v2ex.com/t/806684

如何屏蔽 Google 搜索出来的一堆垃圾内容

https://www.v2ex.com/t/807058

简体中文互联网站都需要备案,基本部署在国内,现在移动端封闭,web 基本上都要跳转到 app 去查看全文,中文互联网围墙化,没有足够量的允许搜索引擎索引的新内容产出,导致搜索逐渐劣化

目前英文搜索也是这个趋势发展,因为英文用户体量大,再内容 app 围墙也还是有一部分产出

我彷佛看到了 Google 照这种趋势发展下去,其搜索部门可能会倒闭

大家觉得在这个 app 时代谷歌搜索业务会怎么发展下去呢?

3391 次点击
所在节点    互联网
32 条回复
exploreexe
2021-10-12 00:37:02 +08:00
英文站也是一个德行,没好到哪里去,很多这种垃圾站,如果你搜索一些软件,很多都是病毒站点,还搞什么通知权限,诱导下载流氓软件。

另外就是互联网内容围墙的出现,从移动互联网出现的时候就早就察觉出这个问题了,现在想要搜到什么内容,越来越难了。比如微信公众号里的内容百度谷歌都搜索不了,比如一些 APP 的内容也搜索不到。内容付费现在也越来越多,很多内容不花钱你是看不了了。

好怀念之前的那个互联网时代,还没有实名制,还有很多声音,论坛遍地开花,大家还没那么暴躁,不像现在这么一个个的激进的不行。
2i2Re2PLMaDnghL
2021-10-12 01:55:18 +08:00
@nomedia 说起来,楼上说了很多,我就给个实例
去用英文查询含义非常接近的单词甚至可互换的单词的含义对比。
比如 settings vs configuration
第一页一半是垃圾内容农场,单纯地把两个词的含义解释一遍。
而且这个内容农场效率还挺高,生成量关于采集量的测度是 O(N^2) 的,别的采集十份内容做十个页面,它采集十份内容做 100 个页面。
teruspot
2021-10-12 02:00:59 +08:00
@exploreexe 对头,实名制之前的互联网是最好玩的,现在各种厂商服务都是封闭的了,离互联网精神越来越远
ziseyinzi
2021-10-12 03:16:18 +08:00
互联网肯定是越来越封闭的,中文的快一点,英文的慢一点,到最后都会成为一个个孤岛。黄金时代不会回来了。
enzyme
2021-10-12 05:33:23 +08:00
简体中文的衰落。用繁体搜索就行了。
iPhone9
2021-10-12 05:42:09 +08:00
就一个采集站就说中文互联网的问题的人难道不会用百度?

https://www.baidu.com/s?wd=site%3Ag.penzai.com
datocp
2021-10-12 05:45:12 +08:00
。。。早就倒闭了。
当年 2013 年?我们做培训关键字,那时候 google 还能用的,一整年就花了一万不到,百度可是 100 多万。现在 Google 根本就是在国内不存在,即便装了 Google 浏览器那也是网络不通。
jackmod
2021-10-12 08:32:32 +08:00
https://wayforward.archive.org
互联网已死:互联网变成传统媒体:回到花钱买内容的传统媒体时代
n1dragon
2021-10-12 08:55:10 +08:00
@2i2Re2PLMaDnghL 我还真查了一下,没觉得有什么内容农场。Google 的英文搜索质量目前来看还是相当高的。

![google_search.png]( https://i.loli.net/2021/10/12/Q4kfgXaVjeC1hLp.png)

1. 字面意思,wikidiff
2. 在 IT 领域的差异,来自 stackoverflow.com
3. 更深入的讨论,来自 Quora
4. 日常用法,来自 hinative.com
5. 探讨 configuration 和 customization 的区别,虽然有点偏题,但属于延伸阅读,来自一片博客
6. 运维领域的差异,来自 stackexchange.com
7. vscode 里面的意义
8. 在 Ubuntu 里面的差异

这 8 个结果,我没有看到任何内容农场,反而是多角度的理解这两个词语的差异,基本上看完这一页对这个问题就会有比较准确的理解。
2i2Re2PLMaDnghL
2021-10-12 10:41:22 +08:00
@n1dragon 你这个 1. 就是内容农场,wikidiff 充斥着简单地把两个单词的含义解释一遍,完全没谈到底有什么区别。
你仔细看一下这个网站上面的各种 diff,纯粹就是 a vs b,b vs c,a vs c 这样,combination[N,2] ,随便给 10 个词它能做出 45 个页面。
5. 也是内容农场,只不过不是爬虫内容农场,可能是阿三人工农场,内容比 GPT-3 还语无伦次。

其他实际上是用户画像相关,你已经被打上程序员的标签了。你试一下 Startpage (它是直接买的 Google 搜索结果)来消除用户画像,恰好一半是内容农场。

我想了想,认为英文内容农场少的,应该是英语不精,所以也不太容易撞上。
我的体验上来说,内容农场最少的可能是日文,但反过来也可能是我日文不精。
nomedia
2021-10-14 13:56:54 +08:00
@2i2Re2PLMaDnghL
下面哪些域名是垃圾农场的,我一般只看 Stack Overflow 的 所以没大关注?
[![5QI9Ff.png]( https://z3.ax1x.com/2021/10/14/5QI9Ff.png)]( https://imgtu.com/i/5QI9Ff)
2i2Re2PLMaDnghL
2021-10-14 18:47:51 +08:00
@nomedia 跟我 #30 说的差不多
wikidiff 是 O(n^2) 农场
techadv 那篇是不如 GPT-3 的胡言乱语车轱辘话,你看看作者,什么专业话题都插一脚,但这个域名似乎只是平台,比喻地解释下,就好比 juejin 和 zhihu 都是鱼龙混杂。
至于 hinative 是个百度知道一样的瞎问+瞎回答,回答的内容都和 Startpage 搜『配置 设置 区别』搜出来的第一个百度知道差不多,完全排除了二者的可互换性回答,算是经典思维盲区:问有什么区别的时候人们常常不会想到这两个词区别恐怕不大,但因为关注焦点,人们会夸大这个区别。

另外,这里涉及用户画像,你试试用买 Google 结果的第三方比如 Startpage,正好 5 个。
可互换的词对比是一个边界例,因为常见优化之近义词归化的问题,近义词对比一直是搜索引擎难点。
比如,你尝试用中文,无论百度 Google,搜索区别更是干脆只有一两条,剩下的甚至可能不会同时出现需要对比的这两个词。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/807121

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX