各位大佬,爬虫问题请教

2017-12-15 10:39:53 +08:00
 zbl430

想问你各位大佬,有抓取过中登网的吗?貌似很麻烦

http://www.zhongdengwang.org.cn/zhongdeng/index.shtml

3494 次点击
所在节点    Python
20 条回复
zbl430
2017-12-15 10:40:23 +08:00
不是伸手党
yearliny
2017-12-15 11:50:01 +08:00
你能说的更详细一点吗?你在爬取的过程中哪里遇到了问题,你都不是一个合格的伸手党。
p2pCoder
2017-12-15 11:52:46 +08:00
@yearliny 他连爬啥 都没说
cyancat0525
2017-12-15 12:20:27 +08:00
那么问题来了,怎么判断一个人是不是伸手党
kahlkn
2017-12-15 12:22:39 +08:00
用 selenium
hahaxixi64
2017-12-15 12:22:48 +08:00
@cyancat0525 楼主觉得只要自己声明一下就可以了。
Kilerd
2017-12-15 12:49:32 +08:00
请问一下 有人爬过 taobao 吗? 貌似很麻烦。

不是伸手党,请麻烦把整份代码发送到我的 Telegram。

真的不是伸手党,感激不尽。
likuku
2017-12-15 12:51:39 +08:00
看到 #1 的声明,好好笑...
niuoh
2017-12-15 13:34:30 +08:00
虽然没爬过 不过针对你的问题回答一下吧 对 很麻烦
Sornets
2017-12-15 13:36:26 +08:00
没有。
此贴终结。
zgx030030
2017-12-15 13:50:36 +08:00
标准回答 没有
sublime
2017-12-15 14:03:51 +08:00
我怀疑楼主是来发外链的
qsnow6
2017-12-15 14:16:18 +08:00
连伸手党都不称职
Nick2VIPUser
2017-12-15 14:17:55 +08:00
确实很麻烦
welkinzh
2017-12-15 15:19:03 +08:00
竟然有验证码,还要登录,太难不会
ivechan
2017-12-15 15:47:47 +08:00
挺简单的,看了 10 秒钟。
Request URL 里有一个 RSOUT 参数, 目测访问这个网页的过程就可以得到。
Request Headers 里密码应该是 MD5 加密的,不过很有可能和验证码加盐处理过了。这个看 js 代码才能解。
(仅考虑手动验证码情况)
qq565999484
2017-12-15 16:30:39 +08:00
开局一标题,内容全靠猜?
zbl430
2017-12-15 17:39:02 +08:00
@welkinzh 而且进去还要再来个手机验证码

@qq565999484 内容说的很清楚,抓取过没有?

@all 楼主并没有想具体内容,单纯问有没有抓取过而已....心痛
devjoe
2017-12-15 19:05:33 +08:00
lavenKin
2017-12-18 16:18:47 +08:00
开局一标题,内容全靠猜? 笑死了····

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/414943

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX