v2ex plus 用户们,你们知道你们的浏览器被用来跑分布式爬虫了吗

351 天前
 Xianmua
首先承认标题夸张了点,但是事实确实如此。
看到有个 V2EX plus 插件,很多人都装了的,准备也安装来用用。插件功能不少,这个没错,有些方便的小功能。
进设置页面的时候,发现有个 vdaily 默认开启,比较有意思的是这句话“同时接受等量的爬取任务”。有点好奇接受任务这件事,于是看了看怎么回事。哦只要安装了插件,会不断地从服务器获取爬虫任务。
vdaily 作者的网站,有非常详细的请求统计和快速滚动的爬虫任务日志分析,想看的自己去看吧,都是公开的(在请求统计和日志那里)。这里有一堆截图,可以看看。
当然可以说作者做的一点毛病也没有,毕竟在插件设置内都写明了,开启 vdaily 会接受爬取的任务,至于爬取的数据,那就是 vdaily 的资产了对吧。分布式爬虫人家也没什么遮遮掩掩的,都是正大光明的,本篇帖子也没有有技术含量的分析。只是说我是不太喜欢这个 feature ,删了。提醒一下大家,不知道的或者是介意的,都知道知道。
图片合辑: https://imgur.com/a/shPfy8I













https://i.imgur.com/N4TK3FG.mp4
39492 次点击
所在节点    程序员
185 条回复
lambdaq
351 天前
这思路不错。。。
coolair
351 天前
没用这个插件,用的“V2EX 增强”这个油猴脚本。
cuixiao603
351 天前
谢谢提醒 已关闭
xloger
351 天前
在用,且知道。不过不知道这个是不是默认开启的
AoEiuV020JP
351 天前
这种东西居然默认开启,恶心到了,删除+举报,
kamal
351 天前
谢谢提醒,关掉这个功能了,不过插件其他功能还是挺不错的,目前还没找到替代,我就继续用不卸载了。
Greatshu
351 天前
找到了 https://vdaily.huguotao.com/report.html
这个面板挺好看的,有没有大佬知道名字
gaobh
351 天前
恶心到了,自动更新就开启了
1120101929
351 天前
@Greatshu 看左下角,GoAccess
raycool
351 天前
原来我也装了这个插件,谢谢, 已删除。
Drumming
351 天前
好思路....但是很恶心
Excepti0n
351 天前
谢谢提醒 已关闭
glaucus
351 天前
shinession
351 天前
用的 V2 Polish, 没发现这个功能
fg990
351 天前
谢谢,已经卸载了。

作者也要吃饭,能理解,但不喜欢。
hxzhouh1
351 天前
感谢,已经卸载+举报
mht
351 天前
@Greatshu 好像是 goaccess 生成的模板
pota
351 天前
感谢 已卸载
HFX3389
351 天前
@sciooga 呼唤作者
shyrock
351 天前
这个分布式爬虫是用于生成 vdaily 这个功能的数据吗?还是爬取其他用途的数据?

这个插件的作者似乎也在 v2 呢,要不出来领一下工单?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/939486

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX