如何移除 Google 搜索中被引流站爬取的内容

2021-04-28 13:01:02 +08:00
 kuichieh
网站上存在一些敏感信息,关键词被 Google 爬取到了。现在在源网站中移除了相关内容,使用 Google 的更新 Cache 使得关键词的搜索内容也从 Google 搜索结果中移除。

现在的问题是之前的搜索被一些博彩网站爬取了,导致当前 Google 搜索关键词,出来的都是这些引流网站,并包含了敏感的缓存内容。点击这些引流网站,跳转到的也是其他网站的内容(不存在实质性内容,我理解就是欺骗点击量)。

因此我尝试了向 Google 举报 Spam,结果一个多月过去了还是没有变化。尝试更新 Cache,被 Google Deny 。这些结果要怎么移除呢?
2918 次点击
所在节点    Google
23 条回复
HenryGe
2021-04-28 22:12:09 +08:00
如果能知道爬虫是怎么爬取的内容,让爬虫再爬一遍,把原来的内容洗掉就可以了。
kkocdko
2021-04-28 23:53:24 +08:00
几乎没有办法。因为数据并不仅仅存在于 Google 的缓存中,也存在于那些菠菜的网站里。菠菜的网站似乎并没有明显违反 Google 的规定,因此也很难投诉成功。
我所想到的只有:尽量将敏感数据变得不敏感。例如,泄露了密码,就修改密码,那么旧密码就不属于“敏感信息”了
PolarBears
2021-04-30 01:43:36 +08:00
@kkocdko 还有可能是被要求清查网站内有没有涉及到某人或某事相关的文章,还要截图各种搜索引擎和微博之类的,报告已经清理干净了这种.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/773818

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX