关于用 Scrapy 框架开发爬虫时保存图片操作的咨询

2017-10-19 22:34:46 +08:00

saximi

用 Scrapy 框架开发爬虫，按照一般的规范，对图片进行下载并保存的操作是不是应当放在 pipelines.py 中实现呢？
谢谢

2555 次点击

所在节点

7 条回复

misaka19000

2017-10-19 22:46:28 +08:00

是的

saximi

2017-10-19 23:33:00 +08:00

sunwei0325

2017-10-20 12:58:27 +08:00

saximi

2017-10-20 22:11:39 +08:00

@misaka19000 爬虫下载图片的做法，是不是最好用的还是 urllib 模块和以下的步骤？
req=urllib.request.Request(imageURL)
response=urllib.request.urlopen(req)
data=response.read()

saximi

2017-10-20 22:18:27 +08:00

@sunwei0325 谢谢，我去学习学习

saximi

2017-10-24 20:19:51 +08:00

@sunwei0325 请教，这个例子中的 get_media_requests(self,item,info)方法，info 参数是怎么个用法呢？谢谢

sunwei0325

2017-10-25 06:34:42 +08:00

@saximi 没什么用, 兼容旧版本的

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.