在一片对 V2EX Plus 作者的口诛笔伐中,还是可以听一下他的解释的

354 天前
 clearc
虽然正是热点,还是链接下前情:

提出疑义: https://www.v2ex.com/t/939486
站长声明: https://www.v2ex.com/t/939839
作者解释: https://www.v2ex.com/t/939852


本帖观点:

1 、存在客观上能够被站方和用户认为的恶意行为(未主动告知的非授权访问、可以远端控制的配置)。

2 、作者的回应具备一定合理性,能够部分解释动机和行为,但是依旧存在一定的回避性论述。

3 、站方做防御措施、用户删除并举报都没有任何问题,也是应该做的。

4 、现在大家情绪都有些激动,但对作者动机是否本身具备恶意,在没有实际证据前(如确实涉及黑产等),建议减少先入为主的判断。同时如果有确凿证据显示有问题 ,支持警务处理。

5 、作者应该更积极论证自己动机的合理性以及对此结果的担当。


理由:

1 、在作者解释中,说明了全部代码是开源的,包括后端结果也是公开可验证,一定程度上降低了其恶意动机的怀疑度,对于帖子中质疑的修改后台和删除等问题,也给出了还算合理的解释。(当然开源并不能成为脱罪石,其后续解释是否为真需要严格验证)

2 、作者说明开发时为学生,对隐私等方面不了解。这一点如果为真,确实能够部分阐释既开源同时又做“恶意行为”的矛盾点,大家学生的时候应该或多或少都有点想炫技同时又没有那么在乎一些用户隐私的欲望。

3 、作者目前为实名,自称也在一家公司创业,能够极大增加其论述可信度。

当然即便所有均为真,也无法回避实质上本插件实施了对站方和用户的允许外的恶意行为,还是需要作者体现一定的担当,即便是学生时期的项目。

出了问题,透明是解决的良药。在秉承着受过基本教育的人本性非恶的基本原则下,目前情况我选择偏向于相信作者论述,但是也欢迎被打脸。
7543 次点击
所在节点    程序员
32 条回复
shzbkzo
354 天前
别尬洗。

爬虫功能是今年三月份加了,早就不是学生了,现在作者自己开公司了

另外学生身份就可以做任何事了?学生可以是做坏事的挡箭牌?

一个帖子打开放着不关闭,v2ex-plus 以 20 秒一次的速度一直请求 v2 ,相当于 ddos 了吧

你不如直接说:中国人愿意用隐私换便捷
o4kj893hg
354 天前
"可以远端控制的配置"

这一点还不严重?
shalk
354 天前
为了实现 vdaily ,在插件里加了一些不该有的功能。

通过客户端收集数据,这不是得同意嘛,各种软件都会说是否同意收集数据,用户什么什么改善?

为了统计小区什么地板畅销,就直接去每个人家里看看?
wangritian
354 天前
如果我是站长,可能会找一些朋友回传大量假数据给插件服务器,迫使他关闭这个功能
weijancc
354 天前
程序员在国人中算在意隐私的群体吧, 不打算用隐私换便捷. 生气的原因可能不是在意作者的动机是否恶意, 而是侵犯了用户的隐私.
Bob0800
354 天前
@wangritian 沟通无效再做这种事吧... 如果人家愿意关你又何必做这种事。
defunct9
354 天前
吐一口老浓痰
dawn009
354 天前
看到目前为止,进展挺顺利的。作者承诺停掉这个功能,站长部署了防御规则。
lwjef
354 天前
插件作者就是作死,提供功能给用户是合理的,默认开启完全不能做。
分布式爬虫还是太骚了,更骚的不仅用户端爬当前页还会爬未浏览页面。
说到不牵涉隐私,用户的 ip 加浏览的页面不是隐私?

洗一下
@shzbkzo #1 20 秒是请求插件服务端。
https://www.v2ex.com/t/939839#r_13072795

@wangritian #4 这么做给自己找不痛快,如果防爬难度太大会影响用户体验也很耗站长精力。
shzbkzo
354 天前
@lwjef 洗不了哦

https://www.v2ex.com/t/939839#r_13072767 这个回复有详细的爬取步骤

第一步,请求插件服务端的 /api/topic/task 接口,接口返回值是{"sign":"646052931b3e3ac3cf9cd9f3","id":785109,"page":1,"url":"/t/785109?p=1"},url 的内容就是帖子 id

第二步,爬取 url 对应的帖子内容

第三步,将爬取到的帖子内容提交到 api/topic/info?task=hash 值这个接口


另外,你发的 https://www.v2ex.com/t/939839#r_13072795 这个回复的贴图,只看到 task 请求,是因为他只筛选了 task 请求

byteroam
354 天前
多大个事,大公司这么干的多了,大家屁都不敢放一个,欺负个人也不用太过分啦,还是要给个改正的机会
ryd994
354 天前
@lwjef 他代码有 bug ,说的是 30 秒一次最多 3 次。实际上次数限制代码错的,是 30 秒一次无限重复。每次请求有 30%的概率返回任务,那就算是 90 秒一个任务,如果有人网页没关,一天下来的请求量也很恐怖了。

作者当然说是无意中写的 bug 。但是对于灰产相关,我一向不吝以最大的恶意去揣测,再考虑默认启用而不通知用户。即使整件事都是无心之失,作者依然难辞其咎。

我认为,作者现在应该做的,不是去澄清什么有意无意,而是先把脚本下架,替换成空脚本。自动更新会帮助大部分用户解决问题。原始代码保留以备大家检验。服务器端亦然。事情搞到这个地步,这个产品就已经废了,想挽救也是枉然。

先好好认个错,这才是最大的诚意。有意还是无意,根本不是重点。
lwjef
354 天前
@byteroam #11 抱怨的人可太多了,大公司它不改法律也不制裁它能有啥办法,插件作者这些行为有人抱怨反感是应该的,至于有些细节上误解的或者不礼貌的的确没太大办法。

不知道下面这个算屁吗。
cookie 技术与隐私权纠纷第一案——法院为何判百度不侵权? - 案例分析 - 新闻资讯 - 知识产权司法保护网(知产法网)
http://www.chinaiprlaw.com/index.php?id=2024
Alfie007
354 天前
还好我是没用
diagnostics
354 天前
用 V2EX PLUS 就是用个楼中楼功能罢了,换成 V2EX POLISH 完全平替,简单用了看起来也没爬虫的东西,UI 还更好,设计还更好。为啥我还要用 PLUS 呢?

“人本性非恶”就是扯淡的,尤其是在中国这个环境下,只要能有利益,什么道德统统不存在,你忘记 996 了?
diagnostics
354 天前
@diagnostics 还有一个就是,V2EX PLUS 背后已经是商业,而不是简单的开源,为爱发电了。

换位思考,如果是你,有个财富自由的路径给你,你还为爱发电?
november
354 天前
这都可以洗?
“相信作者的论述”是什么意思?好像没人说作者说谎了啊。

而且你用了“疑义”这词来形容那个帖子,是说爬虫这件事真假还有带商榷?

不管是爬虫任务,还是作者声称关闭了爬取却依然再爬,甚至是作者声称只多 2-3 个请求却是平均 20s 一个,这些哪个是错的?

那你说相信作者,也就是说你认为 v2er 说的“没有关闭爬虫,平均 20s 一个请求”都是诬陷的?

利益不相关,没有用这个插件。只是没想到这都可以洗。
taine221
354 天前
OP 可能是反串,本来觉得作者可能存在 ”心大“ 的成分

现在尬洗一下,直接感觉就是故意的,拜拜了您嘞
siweipancc
354 天前
跳出来逼人拉黑?演员?
levelworm
354 天前
@byteroam 也不是啦,大家喷腾讯啊什么的也是经常喷,只不过没法定位到个人,所以马和张就是主角了。楼主说的这个大家可以定位到个人,总不能说是谁逼迫他开发的吧?所以就直接喷个人了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/939872

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX