想放弃了,这种挫败感,自学的障碍

2016-07-30 10:56:26 +08:00
 vtea
本人小白,这几天自学 python 爬虫,爬单位内网 oa 。
各种不顺利啊,单位 oa 要工号密码登录,一段时间自动断开,同时是用 ajax 的动态网页。

起初学 python 一直用标准库, cookie 一直获取不到也登录不了,不知原因,后来发现 requests 第三方库好,又下载了,依然不成功。

下载了几本 python 书,看着作用不大,网上类似的教程看了也不成功, python 自带的文档看不太懂。

感觉自己还是因为学的不系统,直接拿来主义,很多东西都不是太了解,网页的基础知识欠缺,只知道 fiddler 抓包看看 post/get 。

折腾了几天,感觉没什么收获,只会爬爬简单的静态网站。单位都是采用 ajax 的 asp 网站,克服不了,这种挫败感让人想放弃。。。
4980 次点击
所在节点    随想
42 条回复
kindjeff
2016-07-30 11:04:50 +08:00
那就模拟 ajax 呗
bengol
2016-07-30 11:05:37 +08:00
加油,放弃
wenmingvs
2016-07-30 11:06:12 +08:00
留言看看网友有好的建议不
Lonely
2016-07-30 11:08:32 +08:00
有问题就问啊…
loading
2016-07-30 11:09:27 +08:00
说一声,直连数据库…
vtea
2016-07-30 11:15:28 +08:00
@kindjeff 不会 ajax 。。。看来要恶补
@bengol 主要是挫败感
@wenmingvs @Lonely 问题是我也不太懂,同时单位的 oa 是内网,上不了外网。仅我自己看网页源码,要抓的网页数据是通过 ajax 调用后台数据库。
PS 吐槽下单位旧系统 php 网页,居然 chrome 登录不行只能 ie6
phperstar
2016-07-30 11:20:46 +08:00
先下载别人的代码看看呀,然后再别人代码上再修改成自己要用的。 造轮子得先学会拆轮子,这样学习起来也比较快
xiaoshangmin
2016-07-30 11:29:17 +08:00
几天?我在学校自学 php 和 Python 什么问题都是自己搜索解决的 身边就没有一个喜欢打代码的 加过各种技术群 在论坛发过各种问题贴 从一个选错软件专业的人 花了快一年多 懂得 mvc 网页 翻墙 搭 lamp 爬虫 噢对 还会双击装系统 出来工作才发现我应该转行当厨师的 蛋炒饭 水煮方便面不加调料 现在都是我的拿手菜 不说了 要去送外卖了
6IbA2bj5ip3tK49j
2016-07-30 11:42:43 +08:00
为什么会有人觉得 ajax 不好抓, ajax 才是最好抓的,直接发请求就好了。
hellojinjie
2016-07-30 12:36:56 +08:00
写代码的时候,你需要旁边有能 google 的电脑。这样自学会很快
a412739861
2016-07-30 12:54:45 +08:00
用 chrome 的 web develop tool , windows 应该是 F12 ,能看出很多东西。也可以会记录请求。
terence4444
2016-07-30 12:59:51 +08:00
从简单的开始
markx
2016-07-30 13:02:50 +08:00
从简单的开始+1.
如果一开始有多都不懂的话,做起来确实会很没方向,也会遇到很多奇怪的问题。
icedx
2016-07-30 13:05:52 +08:00
看在你经常光顾午夜俱乐部的份上 有啥就问我吧
default
2016-07-30 13:08:28 +08:00
@xgfan 哈哈,那是你还没遇见难抓的,比如: http://www.tianyancha.com/s.json
Ahri
2016-07-30 13:23:08 +08:00
楼主需要先看懂 HTTP 协议。
yamyamyuo
2016-07-30 13:47:19 +08:00
最好的学习方法,看国外的 mooc ,先把国外的计算机基础课程都跟着学下来,并把项目都做了,你慢慢会有感觉,感觉楼主还没入门, google + stackoverflow oriented programming 几乎可以解决你遇到的任何问题,如果还有问题解决不了,那就去 stackoverflow 发帖子问咯
buckyRRRR
2016-07-30 13:54:48 +08:00
才几天而已,而且几天里又有多少时间是在真正在学编程, Python 好学,不过好学是相对的说法,编程本身并不简单呀,最起码过一个月再说吧
UnisandK
2016-07-30 14:01:05 +08:00
先用 postman 调通了再去写代码实现
DoraJDJ
2016-07-30 14:18:57 +08:00
@xgfan +1 ,只要上 F12 的 Network 标签里寻找 xhr ,然后照着请求弄一个就好了。
还可以把请求复制成 curl 命令方便研究。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/295959

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX