如何防止 blog 内容被采集站采集

2022-09-26 22:25:07 +08:00
 LxnChan

在 blog 被 v 友赋予“博客禁止右键的人”的称号 89 天之后(指路:在 Cloudflare Workers 上部署 Hexo 网站),终于我的 blog 也被采集站采集了。

怎么说呢,五味杂陈,一方面又开心——内容有被更多的人看到,另一方面又很难过——不是从我站上面得到的(而且他也没有标明出处)。

所以想问问大家有没有什么好的办法防采集,博客是 Hexo 渲染的。


啊,差点忘了说,我的文章地址是 https://lxnchan.cn/mi-r4ag-openwrt.html ,采集站地址是 https://www.luyouwang.net/9751.html

1956 次点击
所在节点    问与答
8 条回复
dem0ns
2022-09-26 22:32:15 +08:00
根据他的采集特征,反向塞垃圾信息广告啥的
HugoChao
2022-09-27 01:01:17 +08:00
好像真不能右键,但复制和开控制台都没影响
LongLights
2022-09-27 01:16:56 +08:00
我以前个人站被采集 那个 b 甚至没做图片本地化 全烧的我 cdn 钱,然后我一怒之下把图片 refer 防盗链全改成了“本文抄袭于 xxx”然后那个采集站有差不多一个星期整个网站映入眼帘的都是“本文抄袭于 xxx”,然后我被 d 的换了两千块一个月的高防….
arch9999
2022-09-27 01:47:29 +08:00
在文章中加入随机水印,就当他们帮做引流了,这些🐶真的难防,我一个没被百度收录的他们都搞。
eason1874
2022-09-27 01:48:15 +08:00
@LongLights #3 我也被采集站浪费过大概两百元 CDN 费用,后来设置外链白名单了,没被报复。没想过反抗,不敢惹这些流氓,ddos 成本低,防御成本又高,为了让网站继续赚钱只能苟活于世 😅
NewYear
2022-09-27 09:01:53 +08:00
写文的时候多塞一些你网站特有的名词,比如作者名字,博客名字,英文名,相关词。
这样会扩大你的知名度(名号)

博客不是记笔记,适当保护自己,静态网站基本不要想什么防采集,没什么意义。
对了,早几年有人用 css 文字嵌入到文中,或者部分词替换成图片,理论上可以一定程度防采集。

但是都很麻烦,不如按最前面的方法
Alliot
2022-09-27 09:51:17 +08:00
文中加入自己的名字作为主语,适当嵌入自己的 URL ,采集站存在多年了,没有破解的好方法。
eben
2023-01-24 13:21:27 +08:00
这年头,都是在截图或者内容中加上自己的专属东西,不然白瞎
防不胜防,维权成本高昂

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/883139

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX