针对爬虫 返回污染数据 导致爬取者损失的 是否要负法律责任?

2021-03-05 10:18:53 +08:00
 zsyld

举个例子,

网易的藏宝阁,很多脚本捡漏的,秒级下单付款完成

网易在知道某个请求是脚本的情况下,返回污染数据,比如某个实际价值只有几元 /几十元的虚拟商品,标价数十万,爬虫者给付款了,网易有责任吗?

4145 次点击
所在节点    问与答
46 条回复
also24
2021-03-05 11:19:24 +08:00
@zictos #18
你没理解到我为什么举几百块的例子…… 因为这就是典型的『假冒伪劣』商品啊。

一个交易平台,如果不积极参与处置假冒伪劣商品,口碑都会一落千丈。
那么一个成熟的平台,如果选择自己官方纵容、甚至参与售假,后果是什么呢?

为了 10 万块钱,赌上整个平台的商誉?
also24
2021-03-05 11:24:18 +08:00
@kop1989 #19
暂且不说楼主说的这种比较极端的直接造成经济损失的干扰数据。

就说日常的反爬虫吧,不拒绝访问,而是返回一些看起来不好判断真假的数据。
那么爬虫方就很难确定自己当前的程序是否被抓到了,自然也就不能及时做出修改。
爬虫方无法及时做出反反爬虫措施,那反爬方也就不必着急更新更严格的反反反爬虫措施,给自己省心啊。
xingshu1990
2021-03-05 11:24:38 +08:00
@xingshu1990 #20 也不能说违法,只能说是:作弊。
参考阿里员工用脚本抢月饼。

不管他抢月饼是用来卖的,还是他自己吃,他用脚本这个方式,就是通过作弊手段获利了。这个观点不能模糊掉。
woshipanghu
2021-03-05 11:27:54 +08:00
返回假数据应该是常规操作
zictos
2021-03-05 11:28:12 +08:00
@also24 #21 也可能误伤正常用户,一旦被曝光,后果很严重。 如果反爬真那么厉害,能 100%不会误伤,那为什么现在很多网站还在正常用户访问网站的时候动不动弹验证码。
also24
2021-03-05 11:33:08 +08:00
@zictos #25
因为对于正常用户的话,在支付 10 万元的时候就停止操作了啊。
即使真的手快支付成功了,网易会拒绝退还这 10 万元么?
ditel
2021-03-05 11:41:01 +08:00
这样看起来商品好像有些问题
zictos
2021-03-05 11:41:17 +08:00
@also24 #26 涉及到金钱支付的流程的时候爬虫也不傻,肯定会多次判断。确保页面的东西跟价格匹配才支付的。爬虫是去捡漏的,自然会有大量预先设好的数据,知道自己需要什么物品,知道什么物品值多少钱。只有当物品确实很便宜的时候才会购买。

我前面说了是返回污染的数据,但这个污染的数据是改了图片。所有不管是爬虫还是正常用户都知道这个物品的确是值 10 万的。所以如果误伤了正常用户,那正常用户也会认为这个东西值 10 万,也可能买。

这不是退不退还的问题。如果说自己买前看到的东西与最终付款后订单中显示的东西不一样,那说明这个网站有漏洞或者完全没有信誉可言,用户也可能去网上曝光。况且虽然是误伤,但网易可能依然会认为用户是爬虫,并且坚持价格没问题。
rogi
2021-03-05 11:41:41 +08:00
@also24 老哥真的猛,25 小时高强度冲浪
also24
2021-03-05 11:44:58 +08:00
@zictos
一个会多次判断商品和价格匹配的爬虫… 却连支付限额都没写的意思?
ward56
2021-03-05 11:48:10 +08:00
楼主脑洞非常强,请收下在下的膝盖。
zictos
2021-03-05 11:48:49 +08:00
@also24 #30 10 万只是举例,也许他愿意买 10 万的东西,只有买贵的东西才赚得越多,他觉得 10 万不算什么,但他设了 20 万的限额
keepeye
2021-03-05 11:48:49 +08:00
非法途径被坑了只能自己打碎牙齿往肚里咽吧 用户协议里面应该有这方面的条款
zictos
2021-03-05 11:55:50 +08:00
@also24 #30 说实话,我以前玩梦幻西游,还用 python 写过收货脚本。
就是识别物品的图片,比如收购宝石就识别宝石的种类以及等级,是需要多次判断的。包括图片识别、文字识别以及判断价格的位数与物品是否匹配。不然一个 1 级宝石和 10 级宝石差别大了去了,比如 1 级宝石 6 毛钱,10 级宝石将近 300 元。一旦出错就是几百元损失。
also24
2021-03-05 11:57:03 +08:00
@zictos #32
算了,我直接列单子吧:

假设 A 物品,价值 10 元;
B 、C 物品,价值 10 万元
D 物品,与 B 物品长得非常像,但实际价值 5 万元。


情况 1:
用户期望购买 A 物品,查看 A 物品详情,下单支付时变为 B 物品,订单记录为 B 物品,实际发货为 B 物品:
正常用户在支付时就应当停止操作,即使真的昏了头,大概率可以通过合理途径找回。

情况 2:
用户期望购买 A 物品,查看 A 物品详情,下单支付时为 A 物品,但价格为 B 物品的 10 万元,订单记录为 B 物品,实际发货为 B 物品:
正常用户在支付时就应当停止操作,即使真的混了头,大概率可以通过合理途径找回。

情况 3:
用户期望购买 B 物品,查看 B 物品详情,下单支付时为 B 物品,且价格为 B 物品的 10 万元,订单记录为 A 物品,实际发货为 A 物品:
正常用户在查看订单记录或收货时会发现问题,这属于显失公平的情况,大概率可以通过合理途径找回。

情况 4:
用户期望购买 B 物品,查看 B 物品详情,下单支付时为 B 物品,订单记录为 C 物品,实际发货为 C 物品:
平台这么干的意义是什么?

情况 5:
用户期望购买 B 物品,查看 B 物品详情,下单支付时为 B 物品,且价格为 B 物品的 10 万元,订单记录为 B 物品,实际发货为 D 物品:
这就是典型的假冒伪劣情况,在各类电商平台上都能看到,由于订单记录为 B 物品,一般维权难度不大。

情况 6:
用户期望购买 B 物品,查看 B 物品详情,下单支付时为 B 物品,且价格为 B 物品的 10 万元,订单记录为 D 物品,实际发货为 D 物品:
这就是典型的假冒伪劣情况,同时平台深度参与售假,问题是,平台这样做的获利,是否能填补自身的商誉损失呢?
imn1
2021-03-05 12:13:51 +08:00
想到两个词:大数据杀熟、市场供需定价

然后扩展一下思维,“自动下单”、“捡漏”算不算“杀熟”?只不过逆转了立场,买方“杀”卖方而已
又扩展一下,自动下单有法律责任么?去 12306 抢票呢?
漂移一下,股票交易不少机构是脚本交易,就是根据股价由电脑完成交易,非人工操作

其实我也不知道哪个对哪个错,似乎定价是关键点,但价格法也没去研究
遇上大数据杀熟的话(换个词就是从“定价商品”变为“议价商品”),我也很气愤,但又说不出错在哪个点

但有一点是肯定的,无论哪方才用了超出正常交易的方式,都会影响自身信誉,买卖双方都是
zictos
2021-03-05 12:15:04 +08:00
@also24 #35 你举的例子正好就证明了正常用户也可能下单并出现跟自己买前看到的物品不一致的情况。
即便是爬虫程序,在最终支付的时候肯定也会再次判断当前页面的内容的,一个页面一个页面来的,跟正常用户差不多。

你说的情况 6,这个一般没平台会这么做,但倘若消费者真遇到了,那可能要自认倒霉了。虽说不太可能出现这种情况,但不知道程序会不会有类似意外(或不能复现的 bug )或者内部人员进行非法操作但查不到之类的。

举个例子,你用网银转账 1 万,你转账前看得清清楚楚就是 1 万元,但转完后查看交易记录发现转了 10 万元。银行坚称是你自己转了 10 万元,你根本就没法证明你只转了 1 万元,因为你不可能全程录视频。就算曝光后大部分人也会相信银行,他们会坚信银行的系统不会出错,没几个人会相信你。
also24
2021-03-05 12:22:25 +08:00
@zictos #37

『虽说不太可能出现这种情况,但不知道程序会不会有类似意外(或不能复现的 bug )』


这段话对所有电商、支付系统都适用。
zictos
2021-03-05 12:24:19 +08:00
@also24 #35 我有一次在饿了么出现一份普通盖码饭花了 30 多元的情况。那个店平时都有满减,盖码饭原价 30 多,满减后就是 13 元的样子,实际就算实体店也是只要 13 的样子,故意提高价格再满减的,就是一份很普通的盖码饭。

然后我点完后过了一个月才发现扣了 30 多元。但是我平时下单一般在订单页面以及支付宝付款页面都会看的,我不敢相信我会这么大意。但支付宝里面也显示是 30 多元,所以饿了么不太可能联合支付宝这样,所以应该是我真的大意了。

不过倘若平台真的有这种买前及买后显示的价格不一样的情况,事后你真的没法证明,因为不可能下单时录视频。饿了么好歹有支付宝,美团就是自带的支付,他完全可以改任何数据。
Maboroshii
2021-03-05 13:07:07 +08:00
"怎么是污染呢,就是开发不小心写了一个 bug 而已"

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/758688

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX