给个思路或方法:使用 python 下载文档库中的图片?谢谢先~

2016-03-04 09:09:54 +08:00
 wowo2088
比如: http://www.wendangku.net/doc/8b178be4c77da26924c5b029-303.html
页面中的图片地址是: http://www.wendangku.net/pic/view?ih=810&rn=1&doc_id=8b178be4c77da26924c5b029&o=jpg_6&pn=303&iw=1080&ix=0&sign=f15b06571c5a2ee125f50ed397ed54fe&type=1&iy=0&aimw=1080&app_ver=2.9.8.2&ua=bd_800_800_IncredibleS_2.9.8.2_2.3.7&bid=1&app_ua=IncredibleS&uid=&cuid=&fr=3&Bdi_bear=WIFI&from=3_10000&bduss=&pid=1&screen=800_800&sys_ver=2.3.7

使用 python 如何保存这个图片?
3567 次点击
所在节点    Python
7 条回复
yanchao7511461
2016-03-04 09:12:54 +08:00
file open write close
xxdd
2016-03-04 09:22:42 +08:00
百度都能搜到
gdqyn
2016-03-04 09:31:57 +08:00
人都能提取出图片地址来了, Python 就能做到,模拟人类操作就行,就是一楼说的那种方法了
leavic
2016-03-04 09:44:34 +08:00
不就是爬虫吗
vincenttone
2016-03-04 09:58:08 +08:00
直接抓就可以了, python 爬虫很多,找到图片节点就行。
或许楼主困惑的是为什么不是 jpg 或者 png 之类的格式,这是设置了 http 头的 Content-Type:image/jpeg ,所以是个 jpg 格式。直接抓回来自己给起个名后缀 jpg ,就搞定了。
em70
2016-03-04 12:44:38 +08:00
只要稍微有一点 HTML 语法基础,就能轻松的把网页中的图片地址分析出来
wowo2088
2016-03-04 15:14:04 +08:00
谢谢以上各位,我发现我痴呆了~~~~

我是想直接修改图片链接参数批量抓取全部文档的图片,即直接修改 pn=303 ,以为改成 pn=304 就可以抓下一页,结果返回错误信息,以为还有神马坑!下午仔细一看,参数只改一个是不对的,还需要改第二个~~~~~

还是老老实实爬吧,再次感谢!!!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/260989

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX