请教一下,想找人爬金融管理总局 2020 起所有的处罚公开表,收费几何

207 天前
 Endocryne

https://www.cbirc.gov.cn/cn/view/pages/ItemList.html?itemPId=923&itemId=931&itemUrl=zhengwuxinxi/xingzhengchufa.html&itemName=%E8%A1%8C%E6%94%BF%E5%A4%84%E7%BD%9A

3613 次点击
所在节点    Python
48 条回复
tool2d
207 天前
@lrabbit 不收费没风险,收了钱如果 OP 因为某些原因被抓,会顺着银行卡找过来。
bluetree
207 天前
做好自己这边的风险隔离,之后就干呗,做好爬虫的保险装置,gov 流氓级别,祝你好运
netnr
207 天前
大多数是第二条,没控制好频率,搞成压力测试
thinkm
207 天前
坏消息:爬到自己了
netnr
207 天前
iorilu
207 天前
关键频率一定要低

你要知道, 政府网站大多都是 N 年前随便凑得系统

根本没任何高并发能力, 可能 10 个并发就能拖垮, 到时候你就麻烦了
520discuz
207 天前
爬=攻击 等着那啥吧...
potatowish
207 天前
很多事都是秋后算账,当时你觉得没事,事后揪住这个小辫子搞你一波
xuhuanzy
207 天前
政府小水管要是崩了必抓人
LudwigWS
207 天前
@lisxour 时间不值钱?写这种定制需求代码要稳定运行怎么也得一天吧,不是出于学习爬虫目的真懒得写,上班的很难为了几百块写这些代码
zbwsmile
207 天前
可以加我微信聊
tramm
207 天前
1 分钟请求一次应该不要紧
nodejsexpress
207 天前
@lisxour 还是留给你做吧.
lisxour
207 天前
@LudwigWS 可能水平问题吧,这样的网站,只抓数据的话,代码 + 调试,不超两小时。。。如果有明码 JSON ,不需要破解 JS 的情况下,这种网站我中途都不需要调试的,20-30 分钟写完代码,一次就过😂
lisxour
207 天前
@LudwigWS 这类单通常不具备完善的合同制或者压根没合同,而且从我这么久的经验来说,绝大部分人(客户)都对需求说明比较弱,很多东西说不清楚,所以需求沟通时间成本和中间各种琐碎皮毛的修改才是占用时间的大头,不是代码时间,核心代码 1/3 时间,其他沟通+修改 2/3 时间,这都常有的事。屁大点的爬虫,你以沟通等的理由说加钱吧,客户也不会接受,不加钱吧,自己也不划算。
xiamy1314
207 天前
为了几百块。。。属实没必要。。。
zbwsmile
207 天前
OP 这么久也不回复也不留账号,估计自己搞了吧
@lisxour
SixGodHave7
207 天前
@netnr 欲练爬虫,先学刑法
zxCoder
207 天前
不懂就问。

那如果比如有一个人闲的蛋疼,自己手动访问一个一个下载下来,这合法吗哈哈哈

@lisxour
realpg
206 天前
@netnr #25
不知道博客园是啥,但是名字语义分析,结合这篇文章,感觉这博客园的技术实力好弱鸡的感觉……
都不如我草台班子搞得巨型医院门户(以前带预约挂号 qps 起飞)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/985356

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX