V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
caesarwoo
V2EX  ›  Google

Google 英文搜索也被内容农场污染的差不多了

  •  2
     
  •   caesarwoo · 2021-11-28 18:28:46 +08:00 · 12503 次点击
    这是一个创建于 851 天前的主题,其中的信息可能已经有所发展或是发生改变。

    平常一直只用英文搜索 Google, 但是今天搜了点东西发现英文搜索也变成内容农场的形状了.
    比如搜索: python os.rename force overwrite
    会得到以下结果: 搜索结果

    继中文搜索沦陷之后, 英文搜索也沦陷了. 各位 V 友有无对策?

    第 1 条附言  ·  2021-11-28 19:54:58 +08:00
    这些内容农场不像是中文的某某百科网, 标题和名称都不规律. 而且 URL 构成也不规律, 很难像中文内容农场一样直接用规则 + 插件屏蔽.
    第 2 条附言  ·  2021-11-30 14:22:47 +08:00

    实测 @leogcry22 建议的 Chrome 插件对于这些网站有效. 如果有和我一样抱怨的人可以试试看.
    URL: https://chrome.google.com/webstore/detail/content-farm-terminator/lcghoajegeldpfkfaejegfobkapnemjl
    效果: after

    70 条回复    2021-11-30 16:32:02 +08:00
    VioletTec
        1
    VioletTec  
       2021-11-28 18:32:21 +08:00
    催更一下图片,图片打不开了
    caesarwoo
        2
    caesarwoo  
    OP
       2021-11-28 18:35:31 +08:00
    @VioletTec 换了个图床, 现在应该好了.
    WildCat
        3
    WildCat  
       2021-11-28 18:39:14 +08:00   ❤️ 9
    Google 这搜索技术倒退得好厉害啊
    Lemeng
        4
    Lemeng  
       2021-11-28 18:49:38 +08:00
    谷歌疫情后感觉一直挺放飞
    Vinceeeent
        5
    Vinceeeent  
       2021-11-28 18:52:10 +08:00 via Android
    这个搜索结果有啥问题吗?没发现问题点😂
    caesarwoo
        6
    caesarwoo  
    OP
       2021-11-28 18:54:09 +08:00   ❤️ 8
    @Vinceeeent 前四个搜索结果, 第一个 stackoverflow 是来源, 后面三个都是爬 stackoverflow 的内容农场.
    ospider
        7
    ospider  
       2021-11-28 19:18:08 +08:00   ❤️ 1
    @Lemeng 看来哪家 WFH 都是放飞自我啊, Google 现在内容农场的数量简直比 iOS 的 bug 数还多
    zxCoder
        8
    zxCoder  
       2021-11-28 19:40:41 +08:00
    确实
    jdhao
        9
    jdhao  
       2021-11-28 19:46:39 +08:00 via Android
    自己 block 吧
    Rheinmetal
        10
    Rheinmetal  
       2021-11-28 20:17:44 +08:00
    大概是人力 all in 元宇宙去了
    skiy
        11
    skiy  
       2021-11-28 20:48:01 +08:00
    都是内容农场,没法整的了。bing 也一样多。应该是说现在懂技术的搞农场来钱快吧。无所谓了。只要 description 有一样的内容,我就不点开就 好了。
    Vinceeeent
        12
    Vinceeeent  
       2021-11-28 20:58:54 +08:00 via Android
    @caesarwoo 原来是这样😂
    MaiKuraki
        13
    MaiKuraki  
       2021-11-28 21:07:48 +08:00
    懂了,财富密码
    ChrisFreeMan
        14
    ChrisFreeMan  
       2021-11-28 21:17:12 +08:00
    用 duckduckgo?
    wzw
        15
    wzw  
       2021-11-28 21:26:22 +08:00 via iPhone
    @MaiKuraki 做一个?采集站,为啥可以用 google adsense
    yaott2020
        17
    yaott2020  
       2021-11-28 21:54:26 +08:00
    中文搜索程序员 xx 还有残留,估计没有一年清不完
    jones2000
        18
    jones2000  
       2021-11-28 22:21:04 +08:00
    这种 api 函数使用直接看官方文档不就可以了, 根本不需要 google
    Biwood
        19
    Biwood  
       2021-11-28 22:39:27 +08:00
    @caesarwoo 原来是这样,难怪这几天我搜索技术内容时不时发现有些网站给的答案跟 stackoverflow 一模一样,更绝的是,有个中文的 stackoverflow 站,内容是直接机翻英语内容的,感觉开放式网络就这样慢慢被玩死了
    abc8678
        20
    abc8678  
       2021-11-28 22:44:57 +08:00 via Android
    之前大家遇到小 X 知识网的时候,我没遇到。大家都平静之后,我现在搜中文出现了很多小 X 知识网(不是说站长已经道歉关掉了吗)。怀疑是机场有问题,赶紧换外卡用数据流量上网。谷歌提示了一下机器人,出了一些选图验证,验证完后发现那些知识网没了。回到机场,知识网还在。大概的确是跟机场有关系了。没想到现在英文又来……
    abc8678
        21
    abc8678  
       2021-11-28 22:46:15 +08:00 via Android
    @caesarwoo 看到很多一模一样的标题,有百度那味了。经常找半天都是同一篇东西。不过好像没毛病,重复率高,所以都被搜到了。没办法
    leafre
        22
    leafre  
       2021-11-28 22:47:36 +08:00   ❤️ 1
    谷歌中文我的暂时解决方法:

    `search content site:cnblogs.com OR site:github.com OR site:github.io OR site:v2ex.com OR site:juejin.cn OR site:segmentfault.com OR site:cloud.tencent.com OR site:developer.aliyun.com OR site:infoq.cn OR site:zhihu.com OR site:jianshu.com`

    谷歌英文如果熟悉常用域名也可行
    Leviathann
        23
    Leviathann  
       2021-11-28 22:53:11 +08:00
    还有什么 gitmemory
    我甚至看过机翻中文内容的内容农场
    keith1126
        24
    keith1126  
       2021-11-28 23:05:50 +08:00   ❤️ 2
    Stack Overflow 本身就是开放自身数据的,允许用户下载数据库: https://data.stackexchange.com/

    所以,理论上这些网站应该也不算违规爬取数据?
    pengtdyd
        25
    pengtdyd  
       2021-11-28 23:14:12 +08:00
    改 ip 地址
    bojue
        26
    bojue  
       2021-11-28 23:19:08 +08:00
    我还以为内容农场是 CSDN ,或者阿里云良心云 [DOG 头]
    mythabc
        27
    mythabc  
       2021-11-28 23:51:09 +08:00   ❤️ 19
    现在发现并不是英语网站质量高,是 Stack Overflow 质量高。
    rpman
        28
    rpman  
       2021-11-29 00:15:15 +08:00
    想起上次那个来吹垃圾站的,就是那种绝子绝孙货给互联网投毒呗
    Tiande
        29
    Tiande  
       2021-11-29 00:21:34 +08:00
    甚至在第三页搜到了爬这篇文章的文章 XD
    sagaxu
        30
    sagaxu  
       2021-11-29 00:28:03 +08:00 via Android
    这是财富密码,如果你愿意做,被动收入几万不是问题
    TomChaai
        31
    TomChaai  
       2021-11-29 01:17:31 +08:00 via iPad
    锁站点命令:
    site:site.com
    WuSiYu
        32
    WuSiYu  
       2021-11-29 05:02:53 +08:00   ❤️ 1
    限制 site 属于下策,很多独立博客的内容就搜不到了,让全网搜索引擎的意义变弱了
    lovestudykid
        33
    lovestudykid  
       2021-11-29 05:42:05 +08:00
    打不过就加入,然后内容农场越来越多,谷歌就会重视这个问题了,手动狗头
    lovestudykid
        34
    lovestudykid  
       2021-11-29 05:42:46 +08:00
    @sagaxu 他们变现多半还是要通过 Adsense ,是需要人工审核的,这是我最不能理解的地方
    haiyan
        35
    haiyan  
       2021-11-29 08:44:14 +08:00
    这很打脸以前学的 SEO 知识,谷歌很智能的,相同的内容会被降权甚至隐藏,然后大家都不这样做,结果现在来打脸了
    yogapants
        36
    yogapants  
       2021-11-29 08:45:26 +08:00
    我用百度搜 Java 相关问题的时候,有个垃圾网站 javashuo 总会定位到我搜索的关键字,但是点击去毛都没有,这种垃圾网站真的是很恶心
    Sabrina9
        37
    Sabrina9  
       2021-11-29 09:06:53 +08:00 via iPhone
    这些内容农场真的太恶心了现在
    HolaPz
        38
    HolaPz  
       2021-11-29 09:56:17 +08:00
    想问下这是外国人开的农场还是 国内之前农场主往海外发展?
    abcbuzhiming
        39
    abcbuzhiming  
       2021-11-29 10:17:16 +08:00   ❤️ 10
    @HolaPz 你莫非觉得老外有钱不赚道德特别高尚一些吗?要知道内容对抗生成这些技术最先进的都是国外,他们怎么可能不用
    zjuster
        40
    zjuster  
       2021-11-29 10:31:51 +08:00   ❤️ 1
    @ospider 谷歌的搜索质量评估一直是众包分包给全球各地的人做的,其实不怎么被 WFH 影响。
    如果 DCG 等模型还在运行,在数据输入正常的情况下,不应该下滑啊。

    不排除有农村变身为分包商,内外勾结后发现规则漏洞影响了搜索结果。

    目前谷歌搜中文完全不行,英文偶尔可以;百度英文本来就不行,中文看运气。
    大概两家都弃疗(毕竟搜索没啥赚钱的想象空间了)
    xianzhe
        41
    xianzhe  
       2021-11-29 11:03:04 +08:00 via Android
    有无使用 bing 的老哥?看看能不能换 bing
    abersheeran
        42
    abersheeran  
       2021-11-29 11:09:00 +08:00   ❤️ 14
    我属实是笑了啊。

    - 中文结果内容农场:你们中国人就是垃圾、眼里只有钱。脱离简中圈很久了,简体中文没有有效信息。
    - 英文结果内容农场:“这些内容农场太恶心了”,“想问下这是外国人开的农场还是 国内之前农场主往海外发展?”

    同一件恶心事是不是该做出点差不多的评价啊。😓想起之前一些类似的评价,只想感慨一句:合着中国人干的坏事就是中国人不行,外国人干的事就是人类不行?

    最后祝全球所有的内容农场早日完蛋。
    v3xe
        43
    v3xe  
       2021-11-29 11:16:04 +08:00   ❤️ 2
    Chrome 有个插件 uBlacklist

    可以自定义屏蔽搜索结果

    也可以订阅常见的黑名单,跟采集站说拜拜。



    fengjianxinghun
        44
    fengjianxinghun  
       2021-11-29 11:25:34 +08:00
    一个问题,反正打不过了,怎么加入?一起加速到没有正常内容,这个时候说不定就有人想办法解决了?
    noparking188
        45
    noparking188  
       2021-11-29 12:38:22 +08:00
    不知道俄语内容质量咋样
    bug123
        46
    bug123  
       2021-11-29 12:40:43 +08:00
    做这种垃圾站的人很多,绝大部分都起不来
    caesarwoo
        47
    caesarwoo  
    OP
       2021-11-29 12:45:57 +08:00
    集中回复一下
    @jones2000 这只是一个示例, 不代表我的日常搜索内容. 即使可以看官方文档, 一些内容可能文档也不一定是很详细的, 花时间去看实现可能不如 Google 一下来的快.
    @leogcry22 @leafre @pengtdyd @TomChaai @xianzhe @v3xe 感谢提供解决思路.
    @keith1126 先不说违反不违反 Stackoverflow 的 TOS 吧, 就是 Google 搜索下来一页能有很多标题和内容都重复的东西, 查找解决方案的效率很低.
    sagaxu
        48
    sagaxu  
       2021-11-29 12:53:16 +08:00 via Android
    @lovestudykid 人工审核只是增加一点对抗成本,并不能完全堵死这条路。有几家小公司靠类似这个方式发着小财呢。
    brust
        49
    brust  
       2021-11-29 12:58:09 +08:00
    @v3xe #43
    感谢 已经屏蔽 csdn
    liaoyaoheng
        50
    liaoyaoheng  
       2021-11-29 13:39:04 +08:00
    ?问,谁干污染搜索引擎这种事情?
    HolaPz
        51
    HolaPz  
       2021-11-29 13:41:18 +08:00
    @abersheeran 单纯想知道是谁开的 怎么感觉被你误解了?
    Biwood
        52
    Biwood  
       2021-11-29 15:07:07 +08:00   ❤️ 5
    @HolaPz 这哥们专门喜欢发这类煽动情绪的回复,我记得大概一两年前有个 Vue/React 相关的帖子,本来是纯讨论技术的,也是强行被他往政治 /民族情绪上引,而且文字一发出来就特别妖娆,很吸引眼球,比如开头的“我属实是笑了啊”,围观的人一看血液就沸腾了
    feelinglucky
        53
    feelinglucky  
       2021-11-29 16:48:46 +08:00
    @abersheeran 感谢您丰富了我的 blocklist
    youxiachai
        54
    youxiachai  
       2021-11-29 17:03:40 +08:00   ❤️ 1
    内容农村能用 AdSense ,这是我至今没搞明白,谷歌想干嘛。。
    bug123
        55
    bug123  
       2021-11-29 17:22:45 +08:00
    @youxiachai 谷歌从没说过不允许采集站,另外采集站的内容质量还不错,你看中文这个 it1352.com 被谷歌拔毛了,但是百度收录和排名都非常好,百度对垃圾站才是真爱
    UnAmico
        56
    UnAmico  
       2021-11-29 17:25:32 +08:00   ❤️ 2
    @abcbuzhiming 我来杠一下?
    "要知道外挂技术最先进的都是国外, 他们怎么可能不用",
    现实就是玩游戏时不论哪个区, 开挂的几乎都是国人
    UnAmico
        57
    UnAmico  
       2021-11-29 17:27:58 +08:00
    @abcbuzhiming @abersheeran 简单查了下, 这个截图的第二地址是: newbedev.com, 它的域名注册手机号和 jianliziyuan.net 一模一样, 我猜测就是中国人?
    https://who.is/whois/newbedev.com
    https://who.is/whois/jianliziyuan.net
    jalr4ever
        58
    jalr4ever  
       2021-11-29 17:28:46 +08:00
    = = duckduckgo 那个 一搜 jvm 参数咋出现了一些黄色网站,在公司不敢用了
    cstj0505
        59
    cstj0505  
       2021-11-29 17:47:12 +08:00
    @yogapants 某云不也经常这么做,点进去一个文章列表,毛都没有
    abersheeran
        60
    abersheeran  
       2021-11-29 19:26:45 +08:00   ❤️ 2
    @UnAmico 前几年域名保护政策推行开之后,这种公开的 whois 信息里的手机号、邮箱等私人信息都是注册商那边的。半桶水就不要出来抬杠,丢人。
    abersheeran
        61
    abersheeran  
       2021-11-29 19:35:21 +08:00   ❤️ 3
    @Biwood 以前闲着没事的时候在推特上和某些逆民高强度对线过,这种相关话题有点 PTSD 。要是误伤了你,我对此感到十分抱歉。

    @feelinglucky block 没必要艾特我,搞得我还以为是向我表白。

    @HolaPz 并非针对你,只是你发的这种类似的话,我看到的绝大部分时候都是作者在自我矮化。如果你没有这个意思,我很抱歉。
    bbvps
        62
    bbvps  
       2021-11-29 21:37:23 +08:00
    @abersheeran 你还真是闲得慌,这些逆民能说得通就见鬼了!
    abersheeran
        63
    abersheeran  
       2021-11-29 22:18:32 +08:00
    @bbvps 那会在大学闲着😂
    Lightbright
        64
    Lightbright  
       2021-11-30 00:03:45 +08:00 via Android
    做内容农场很赚的钱吗,求大的佬带的路
    emeab
        65
    emeab  
       2021-11-30 00:14:54 +08:00
    @UnAmico 因为 namesilo 是域名注册商啊..
    emeab
        66
    emeab  
       2021-11-30 00:28:55 +08:00   ❤️ 2
    @UnAmico 如果你肯动用你聪明的小脑瓜查查 v2ex.com 的 whois 信息.
    就知道注册手机号和 cloudflare.com 一模一样, 我猜测就是中国人?
    gablic
        67
    gablic  
       2021-11-30 09:32:12 +08:00
    老哥是日本 vps ?多钱有推荐不
    catror
        68
    catror  
       2021-11-30 13:49:18 +08:00 via Android
    打不过就加入,快进到 V 站人手一个内容农场。
    bbvps
        69
    bbvps  
       2021-11-30 15:37:40 +08:00
    我就想知道,这种内容农场是否违反 stackoverflow 的 tos ,看了半天 tos ,看不懂,绕来绕去的。
    zjm947373
        70
    zjm947373  
       2021-11-30 16:32:02 +08:00
    这种东西未经原作者许可就随意利用盈利放国内都违法,就不用看什么 tos 了吧😅
    怎么一到国外搞内容农场就有人费劲洗了,国内搞的内容农场好像就没见有人说要先看看 tos
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2718 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 15:39 · PVG 23:39 · LAX 08:39 · JFK 11:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.