爬虫的法律风险有多大?

2019-08-25 23:09:44 +08:00
 xiaoming1992

把别人网站上的资源爬下来卖给他人商用,卖方和买方负担的法律责任分别是怎么样的?

4880 次点击
所在节点    Python
11 条回复
mumbler
2019-08-25 23:22:01 +08:00
签合同让用数据的人承担全部责任即可,你只是提供技术服务
xiaoming1992
2019-08-25 23:52:18 +08:00
@mumbler 这样的合同能有法律效益吗?
dazkarieh
2019-08-26 00:08:21 +08:00
普通案件亦即大部分是民事不正当竞争案件,得看对方主张的损失金额。17 年,两公司爬了新浪微博部分商业数据用做盈利,连带赔了 220 万; 15 年,某小公司爬了乐视的影视资源,赔了几十万。

如果通过窃取或者其他方法非法获取公民个人信息等个人信息、商业机密,情节严重(刑九以后 5000 元入罪)则构成侵犯公民个人信息罪,量刑分三年以下和三至七年两档,运气好的缓刑走起,当然民事责任依然是免不了的。如果不幸碰了国家机密,那等着被安全局摩擦吧……

牵涉民事责任的,根据侵权责任法,行为人与教唆、帮助者承担连带责任,当然内部如何分担赔偿比例你们可以自己提前约定。但是一旦违法涉及刑事责任,那楼上建议的从犯跟主犯签免责条款 /合同是无效的,从犯也是共犯,量刑上有轻重之分而已。
mumbler
2019-08-26 00:24:55 +08:00
@xiaoming1992 扒数据并不违法,谷歌百度也扒数据,拿出来商用才违法。只要在合同条款规避了,你提供的是技术服务,不是数据本身,不会连带责任。但甲方跟不跟你签就难说了,不签坚决不干这活
xiaoming1992
2019-08-26 01:17:17 +08:00
@dazkarieh 感谢感谢,没那么严重,就是普通的商业数据😄


@mumbler 好吧,还是别沾这样的麻烦吧,个人怎么搞的过资本。
daozhihun
2019-08-26 08:29:25 +08:00
我觉得你最好不要直接卖原始数据,可以卖加工过的,让人看不出是爬虫。
现在这种公司好像很多,比如我知道有一家叫“商圈秀”,是针对外卖的,里面就不是卖的原始数据,你看看能不能按照它的套路包装一下。
Cellei
2019-08-26 10:22:41 +08:00
挺有用,马克一下
locoz
2019-08-26 10:41:54 +08:00
要看是什么样的“资源”,一般的“资源”没啥问题,但是簧色视频这种违禁的就不行。搞之前先确认对方是做什么事情用,明显不太好的事情也别参与,即使合同写了只提供技术服务也不行。
tomczhen
2019-08-26 11:49:56 +08:00
违法与否要看相关法律条例,最次也得看之前的判例,结果好几个人上来都是“觉得”。

很多时候爬虫做的反爬措施——包括突破验证码,逆向加密方法,逆向 App 等都会涉及到刑法条款,严格来说都属于违法行为,但实际需要看最终造成的影响,还有被侵权企业的影响力了。
xiaoming1992
2019-08-26 12:35:41 +08:00
我是搞全景的,市面上 90%的全景(包括 720yun 这种做的比较大的)都是用的同一个框架,稍加处理就能爬下全景图片(虽然都是简单的东西,可是会全景的不会爬虫,会爬虫的不会全景),而全景图片的拍摄成本是比较高的,所以感觉可以搞。可是毫无疑问,这些东西必然有版权,真是撑死胆大的,饿死胆小的。
dsg001
2019-08-26 15:47:32 +08:00
个人理解,爬取豆瓣电影评论进行商用,这个不行,但爬取豆瓣电影简介,没什么问题

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/595005

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX