请教一下,想找人爬金融管理总局 2020 起所有的处罚公开表,收费几何

196 天前
 Endocryne

https://www.cbirc.gov.cn/cn/view/pages/ItemList.html?itemPId=923&itemId=931&itemUrl=zhengwuxinxi/xingzhengchufa.html&itemName=%E8%A1%8C%E6%94%BF%E5%A4%84%E7%BD%9A

3600 次点击
所在节点    Python
48 条回复
linvaux
196 天前
敢爬 gov ,纯属作死
WeiPong
196 天前
按年收费
Granado
196 天前
建议不收费
lisxour
196 天前
@linvaux 有啥问题吗
1. 公开信息
2. 没违反网站数据使用说明
3. 没侵权行为
wanmyj
196 天前
弱弱问下,这种 gov.cn 的公开数据真的不能被爬嘛?
老美的*.gov 应该随便爬吧
Endocryne
196 天前
有机构专门做过监管处罚分析的,所以肯定都有人爬过的

https://www.pwccn.com/zh/insurance/publications/analysis-regulatory-penalties-insurance-dec2021.pdf
lisxour
196 天前
粗略看了一下,有 JSON 数据,有附件文件,没验证码,代码没啥加密,不包含后期统一格式数据提取的话,150-300 可接受,超 500 就纯大冤种了,按我自己的时间性价比的话 200-250 (我不接单!!!我不接单!!!我不接单!!!我只是有爬虫经验)

Endocryne
196 天前
@lisxour 好的,谢啦,如果有大佬能接单也欢迎联系哈
wpyfawkes
196 天前
我知道的风险有两个:
1. 如果没控制好请求频率,导致网站无法访问.那就是严重破坏计算机系统罪.
2. 如果网站有漏洞,能爬到一些不能公开发布的文件.那就是非法取得国家秘密罪.
建议找个境外的老哥接单.🤣
bkmi
196 天前
@lisxour 做爬虫被判刑的又不在少数,建议去了解下
scorpion91
196 天前
@lisxour 中国讲这些是没用的,说你犯法就犯法
dufldylan1
196 天前
@wpyfawkes 然后被承德的老哥们接单
evan9527
196 天前
风险太高。
刑不可知,威不可测
lun9
196 天前
那么大风险才几百块,懒得接,哈哈哈
tom8
196 天前
爬着爬着 处罚名单里面应该就有自己的信息了
tool2d
196 天前
码农先做爬虫最好就是免费,一收费风险会直线上升。

一个没任何加密的爬虫项目顶天收 1~2k ,你也发不了财,直接变成一个潜在的背锅侠。
5dang
196 天前
主要是含表格,而且各地分局不一样,这个比较扯。
TB 和 XY 都有商务接单,去询个价格呗。
MajestySolor
196 天前
兄弟胆子有点大啊👍
lrabbit
196 天前
别在网上乱说,用个代理爬,谁知道你爬的,没啥风险,而且这种数据公开的
netnr
196 天前
爬取数据须遵规
https://www.spp.gov.cn/llyj/202202/t20220210_543998.shtml

从三个方面划定数据爬虫技术合法使用的边界:
一是合法的网络数据爬取应限于对开放数据的获取。如果网络爬虫获取非开放的数据,便涉嫌违法甚至犯罪;
二是合法使用的数据爬虫技术不应具有侵入性,可以说,爬虫的侵入性是其违法性的主要体现;
三是数据爬取应当基于正当目的,对开放数据的获取可能因不符合正当目的而具有违法性。对开放的非商业性数据的爬取应当要求符合公共利益之根本目的。对开放的商业性数据的爬取则可借鉴版权法上的合理使用原则,要求基于合理利用目的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/985356

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX