想找个爬虫高手学习下

2020-01-16 16:01:32 +08:00
 huadaonan
主要目标是想学会爬 amazon,fb,淘宝,微博等大站,我觉得这几个站能搞定基本覆盖爬虫大部分知识了。
有大神或者培训机构推荐吗。多谢 qq 805709000
5653 次点击
所在节点    Python
35 条回复
1992w
2020-01-16 16:03:39 +08:00
直接爬,遇到问题就解决问题。
huadaonan
2020-01-16 16:18:36 +08:00
直接卡到 用 selenium + 代理模式也爬几条就封掉了 就没什么好办法了
linbingqinag
2020-01-16 16:21:26 +08:00
GitHub 上可以看看,有很多实现
murmur
2020-01-16 16:21:30 +08:00
爬虫都是小事,反扒那是个人吃饭的东西别人怎么会给你,一个淘宝就是顶级难度了还加了个等。。
huadaonan
2020-01-16 16:25:02 +08:00
嗯 加一条 可以付费的
ccoming
2020-01-16 16:32:39 +08:00
我觉得爬完淘宝,其他都不是事儿。
虽然我是瞎说的,哈哈哈。
jdgui
2020-01-16 16:33:27 +08:00
爬虫高手你估计得在监狱里面找
matepi
2020-01-16 16:37:28 +08:00
有好的成套解决方案的,早就按服务 /次数 /条数收费了
拿可收费的吃饭工具出来卖的,说明问题还不少,要么就是直接吃饭风险太大,只卖个工具风险分散点
mmqc
2020-01-16 16:44:08 +08:00
爬虫写得好,牢饭吃到老
shimengren
2020-01-16 16:53:26 +08:00
借楼,有没有 python 学习群呀,想加入学习下哈哈
ClericPy
2020-01-16 17:02:48 +08:00
0. 想学爬虫, 爬淘宝吧
1. 反爬太猛了, 好像 App 能爬
2. 呀, 不是明文 HTTP 的
3. 反编译看看 Java 源码
4. 威武威武威武威武.....
sprit
2020-01-16 17:04:20 +08:00
坐牢的那种
linglongll
2020-01-16 17:07:50 +08:00
最近在拿 puppeteer 爬一点 ins 的图 发现这种模拟浏览器的模式很棒 不知道 tb 对这个反爬做了什么拦截么 没动过 也不敢动。。。
Tn5ohB1Yecdk3qCK
2020-01-16 17:08:08 +08:00
高手在牢里呢
zdnyp
2020-01-16 17:10:23 +08:00
爬虫要学的太多了,培训班教的都是基础,找本书入门都比培训班强...
fancy111
2020-01-16 17:14:01 +08:00
淘宝做得不错,主要是价格难爬。
目前只找到两种方法。
kevinmissu
2020-01-16 17:16:22 +08:00
建议你先开始爬淘宝 然后你会发现 我特么是脑袋抽风要来学爬虫?劝退利器
tomczhen
2020-01-16 17:18:19 +08:00
正常用户浏览淘宝速度快点都能触发反爬,说简单的自己有没有实践过爬多点商品的?
ShundL
2020-01-16 17:22:16 +08:00
牢里 爬虫、外挂,攻击都就学会了
liuxu
2020-01-16 17:22:26 +08:00
淘宝正常浏览宝贝都能触发验证码,还是无限那种

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/638472

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX