这个大专栏网站是爬虫网站?窃取别人的文章

2020-09-05 22:45:31 +08:00
 jdhao

地址: https://www.dazhuanlan.com/

窃取我的文章,也不引用来源。 例如: https://www.dazhuanlan.com/2020/02/19/5e4c63b7105ec/

原本的文章: https://jdhao.github.io/2018/12/25/my_reading_list_2018/

5327 次点击
所在节点    程序员
23 条回复
murmur
2020-09-05 22:47:22 +08:00
爬了 121080 这么多页帖子,也没广告,这啥垃圾网站
jdhao
2020-09-05 22:49:50 +08:00
@murmur 难道是作者想自己收藏
murmur
2020-09-05 22:52:08 +08:00
@jdhao 这是能备案的网站,应该是国内服务器,点了一下切换栏目和分页,卡的一笔,这站长可能弱智到索引都没加,稍微来点压力整站就炸了
winnerczwx
2020-09-05 22:57:14 +08:00
简单做下反爬吧
datou
2020-09-05 23:14:27 +08:00
果然是 wordpress....
heiheidewo
2020-09-05 23:14:44 +08:00
@jdhao 现在每天只有 6k ip, 等流量大点再放广告
spark
2020-09-05 23:17:44 +08:00
@heiheidewo 6k ip 是怎么看出来的?
zyqf
2020-09-05 23:25:46 +08:00
应该是有广告的,然后前段时间腾讯通知个人备案不允许挂广告。。。
learningman
2020-09-06 08:42:35 +08:00
@winnerczwx 然后顺便把 SEO 整挂
yunyingsilue
2020-09-06 16:30:46 +08:00
mamicode 和 bubuko 之类也是,就知道爬别人网站
ushio
2020-09-06 17:44:52 +08:00
很多这种垃圾站,所以现在我写文章都会给图片加上水印,插入自己公众号二维码
han777
2020-09-06 18:28:40 +08:00
UI 很像 hexo 的 next 主题啊
han777
2020-09-06 18:28:57 +08:00
这就是个静态网站
Tianyan
2020-09-06 20:53:54 +08:00
@han777 看起来像 next,不过确实是 wp 网站
Tianyan
2020-09-06 20:54:43 +08:00
@murmur wp 的网站 啥都不需要 只要服务器配置够高就行了
xiqingongzi
2020-09-07 09:18:56 +08:00
可能是这个哥们的? https://www.v2ex.com/t/529521
他之前搞了个大专栏的开源项目
hafuhafu
2020-09-07 13:48:11 +08:00
这不是那种“内容农场”吗?爬 /生成一堆文章来提高自己 SEO,不过好像又没看到广告啥的..
OKOOk666
2020-09-07 14:49:22 +08:00
这不是很正常嘛,没什么大惊小怪的,我也有一个文学类的爬虫站 http://www.wlkankan.com
jdhao
2020-09-07 15:04:14 +08:00
@xiqingongzi 应该是的,他那个帖子里面的开源项目已经删了,看不到了
jdhao
2020-09-07 15:05:19 +08:00
@OKOOk666 正常个屁,爬取别人内容,也不表明来源,这叫正常吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/704556

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX