v2ex plus 用户们,你们知道你们的浏览器被用来跑分布式爬虫了吗

2023-05-12 13:50:20 +08:00
 Xianmua
首先承认标题夸张了点,但是事实确实如此。
看到有个 V2EX plus 插件,很多人都装了的,准备也安装来用用。插件功能不少,这个没错,有些方便的小功能。
进设置页面的时候,发现有个 vdaily 默认开启,比较有意思的是这句话“同时接受等量的爬取任务”。有点好奇接受任务这件事,于是看了看怎么回事。哦只要安装了插件,会不断地从服务器获取爬虫任务。
vdaily 作者的网站,有非常详细的请求统计和快速滚动的爬虫任务日志分析,想看的自己去看吧,都是公开的(在请求统计和日志那里)。这里有一堆截图,可以看看。
当然可以说作者做的一点毛病也没有,毕竟在插件设置内都写明了,开启 vdaily 会接受爬取的任务,至于爬取的数据,那就是 vdaily 的资产了对吧。分布式爬虫人家也没什么遮遮掩掩的,都是正大光明的,本篇帖子也没有有技术含量的分析。只是说我是不太喜欢这个 feature ,删了。提醒一下大家,不知道的或者是介意的,都知道知道。
图片合辑: https://imgur.com/a/shPfy8I













https://i.imgur.com/N4TK3FG.mp4
42418 次点击
所在节点    程序员
185 条回复
ZeroDu
2023-05-12 18:24:03 +08:00
@zyronon #58 目前里面没有贴主高亮,查看对话的功能吧,这个还挺好用
gzlock
2023-05-12 18:35:50 +08:00
我也开发过浏览器扩展,这种功能默认启用,超出了底线,删除+举报滥用
zyronon
2023-05-12 18:37:26 +08:00
@ZeroDu #61 回复已经是楼中楼了,不再需要查看对话这种功能了。贴主有个 OP 的小标签,原站就有的功能,所以高亮就没啥必要了,
wolfie
2023-05-12 18:56:35 +08:00
@zyronon
试用了一下,当前主题渲染不出来。😂😂
随便打开几个 其他主题 没事。
wolfie
2023-05-12 18:59:00 +08:00
@zyronon
回复本主题后,又能渲染了。
herozzm
2023-05-12 19:12:01 +08:00
这种功能是作恶,已经不是简单的一个功能,爬虫会显著导致用户网速变慢
想起一个免费网游加速器,它直接不提醒,偷偷的跑分布式爬虫
sechi
2023-05-12 19:43:47 +08:00
已经在谷歌插件商店举报了。没有主动告知用户就进行爬虫纯属恶心人,已经触碰到底线了吧
Livid
2023-05-12 19:51:16 +08:00
而且,这样的功能:

1. 会显著增加 V2EX 的服务器负担
2. 增加用户遇到 403 rate limit 的概率,最后是我们会经常收到这样的用户询问:为什么又把我的 IP 403 了?

哎……
storyxc
2023-05-12 19:58:38 +08:00
之前还在作者的帖子下面提过 issue ,因为这个 vdaily 功能会导致最近查看的主题异常,当时还真没往爬虫这方面想,而且感觉这个功能很鸡肋,反而污染版面,后面就把这个功能关了。不知道作者采集这些数据有什么用,单纯的搞个看板自嗨? 如果默认关闭&开启的时候提醒倒也算了,直接默认启用这功能性质是挺恶劣的。
lchkid
2023-05-12 20:02:23 +08:00
@zyronon #42 脚本不错,就是样式没有 polish 好看(审美很主观,不用管我
ljsh093
2023-05-12 20:03:27 +08:00
@Livid #68 为什么又把我的 IP 403 了?哈哈哈
0914xc
2023-05-12 20:15:34 +08:00
哈哈,找了半天设置,最后才发现,我用的 V2EX Polish
wonderfulcxm
2023-05-12 20:15:42 +08:00
@wangnimabenma 那插件自动签到功能也是违规的了?
Rache1
2023-05-12 20:17:57 +08:00
@oldshensheep 我知道你的意思,但是我想说,这种情况,在修改 response header 的时候,显然是可以判断一下,在 allow Credentials 的时候,allow origin 是不允许为 * 的,改为当前的 origin 就行了,而且直接修改 allow origin 为当前 origin 明显是更合适的情况,而不是简单的替换为 *

这种是很常见的情况,而且当我在使用这类插件的时候,自然是希望他默认情况下全局就可以用的
ClericPy
2023-05-12 20:20:29 +08:00
谢谢提醒, 已提前一年卸载...
garipan
2023-05-12 20:23:36 +08:00
谢谢提醒,这个确实不太地道。哪怕弹个提醒呢,应该提前说明白。
icy37785
2023-05-12 20:28:37 +08:00
@Aloento #49 没有明确告知就默认开启甚至是违法行为。你竟然还在问作者做错了什么?
vtoexname
2023-05-12 20:28:57 +08:00
firefox 上好像没有这个选项。
supertan
2023-05-12 20:43:47 +08:00
@lchkid #70 polish 配色看着就不舒服
locoz
2023-05-12 20:51:54 +08:00
默认开启属实是...卸载了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/939486

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX