刚刚接触Python爬虫,只会最基础的知识。现在存在的问题:
- 爬取QQ空间说说的话,我在源代码里面没发现说说内容,只有一些JS代码……不知道怎么解决
- 而且应该还有登录QQ的问题(想爬取的空间设置只对好友开放)
自己在网上搜了下,没有找到解决方案。求指点
刚刚接触Python爬虫,只会最基础的知识。现在存在的问题:
自己在网上搜了下,没有找到解决方案。求指点
1
Septembers May 13, 2015 |
2
kchum May 13, 2015 via iPhone 楼上是思路…
对于有些 Cookies 是 Javascript 生成的,可以用Selenium 免解析 Javascript. |
3
MasterYoda May 13, 2015
楼上Selenium是思路。
你也可以爬取页面后,试试phontomjs解析js。 |
4
guoer May 13, 2015 |
5
crab May 13, 2015
qq空间有个g_tk参数,这个跟下有接口的。
|
6
Septembers May 13, 2015
|
7
Lukin May 13, 2015 via iPhone
别想了,爬多了直接封你账号
|
8
LeoQ May 13, 2015
我想把我好友的说说全都点赞 以前看到过 https://github.com/atupal/3gqq , 不过后来好像没继续开发了
|
9
imydou May 14, 2015
wap版本
|
10
yanwen May 14, 2015
@Septembers ls用的是什么软件??
|
11
Septembers May 14, 2015 via Android |
12
hugleecool May 14, 2015
最简单的是爬wap版,3gqq。
这是为了兼容使用老款手机的不开js的浏览器的用户而保留的页面。 爬数据批量点赞什么的超级容易。 |