某些网站把个人博客的文章爬去了,不带原文链接,如何应对?

2019-11-01 20:55:06 +08:00
 liufish

话说,某些网站把个人博客的文章爬去了,放在他们自己网站上,还不带原文链接,这个怎么应对呢?

6606 次点击
所在节点    程序员
42 条回复
liufish
2019-11-02 09:17:46 +08:00
@1239305697 他们非常贴心的把原文地址删了。
dandycheung
2019-11-02 09:20:47 +08:00
曾被推酷这么干过,给他们发邮件就搞定了。觉得还是尽量先直接联系他们吧。
skiy
2019-11-02 09:23:50 +08:00
现在很多人不爱写博客了,因为流量都没到这边来。百度权重永远是给 CSDN 之流的,估计是交了保护费吧
mydearbaby
2019-11-02 09:38:32 +08:00
这个还是要从根本上解决,早两年也做过一些抓取,楼上说的什么插图片不解决问题,对方可以把图片本地化。这个要先确认下对方是用的什么方法抓去的,html 标签提取,还是 xpath,有没有用代理。如果对方用的标签提取,你不考虑 seo 的话,文章内容写一个打乱排序的方法或者加密方法,结合 js,重置排序或者解密,不影响用户阅读体验,但是他抓去之后就乱了。如果是 xpath 提取,大概率是能直接提取你给用户最终呈现的效果,乱序和加密解密没意义。那没办法,只能封 ip,做策略,限制访问。
reus
2019-11-02 10:43:19 +08:00
起诉
reus
2019-11-02 10:44:20 +08:00
@xkzhangsan 爬虫不违法,爬个人信息才违法。爬虫违法的话,百度就不用干了
MikeLei
2019-11-02 10:48:53 +08:00
阿里云爬的文章,真的是垃圾中的战斗机,有时候里面就是零零散散完全没有意义的几个字,有时候里面压根就没有任何内容,只有标题是搜索的目标词,都是目录导流到其它页面的词条,真的是垃圾。
isukkaw
2019-11-02 12:15:38 +08:00
把你自己网站的权重做到足够高,这样不论他们怎么爬取,都没有办法和你竞争 SEO。
luckylo
2019-11-02 12:25:04 +08:00
转图片?上水印?
greatbody
2019-11-02 12:29:41 +08:00
爬虫是违法的。除非你的网站里面没有写 rebot.txt
LZSZ
2019-11-02 12:32:43 +08:00
放些广告试试?
tabris17
2019-11-02 12:39:00 +08:00
把原文链接以 0px 的大小嵌入正文
superrichman
2019-11-02 13:30:20 +08:00
@Jirajine 这操作太骚了
FantasyPupil
2019-11-02 14:10:45 +08:00
@reus 爬虫需要遵守 robots.txt 规则,只要遵守了就不违法。 主流的搜索引擎都遵守的。
Epsil0n9
2019-11-02 14:21:46 +08:00
@shiny

"看了一下这位蒋律师的历史回答,就是快板的人。这是帮律师开的公司,收购作者报刊上的旧文章版权,然后散播到网上。因为作者知名度一般,原文章首发于地方报纸,刊登内容为生活常识小科普。导致网上大多数公众号运营无法判断来源,同时也觉得这种日常生活文章没有过多原创性。转载后,该公司会恶意发函,对公众号索要高达 3000 的侵权费,同时该公司位于杭州垄断了 80%的杭院互联网起诉案,全靠这种无赖起诉法,被告多为内蒙北京等远地,又会驳回异审申诉,导致被告打官司成本过高,只能吃哑巴亏。收益全部被该公司获得,作者只有当初卖的稿费。说白了就是买旧文章处找中小企业碰瓷的公司,钻了法律的漏洞,屡试不爽,用同一篇文章已经起诉了上百家企业,一个打着“保护原创”的流氓公司。"

作者:匿名用户
链接: https://www.zhihu.com/question/59277574/answer/227023845
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
Cielsky
2019-11-02 16:23:15 +08:00
@aocif23 百度知道的答案就是百度百科啊,维基百科等地方复制过来的
shiny
2019-11-02 17:53:27 +08:00
@Epsil0n9 之前差评洗稿,霍炬维权就是找的快版权。
encro
2019-11-02 18:17:36 +08:00
如果被百度收录了,去百度举报。
yingfengi
2019-11-02 18:38:51 +08:00
我的小破站也被爬了,我去留言要脸吗,作者回复不要。。。。。
xdaoo
2019-11-04 00:23:49 +08:00
文章用 canvas 画出来

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/615412

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX