请推荐关于 Scrapy 包用法的中文版学习资料

2017-08-31 20:29:50 +08:00
 saximi
最好是能在断网环境下离线阅读的资料和电子书籍,万分感谢了!
2601 次点击
所在节点    Python
21 条回复
toono
2017-09-25 09:14:15 +08:00
@saximi

1. 在我这 next_page 为" ?start=30 ",并不是完整的网址,所以拼接起来的下一页 URL 是没问题的。
![]( )

2. 这个类继承了一个父类 ImagesPipeline,我只需要重载其中的两个处理方法就好了。

3. remove_tags 不是 python 标准库里的,而是 scrapy 的。使用方法可以查看它的源码定义,有相关的使用文档注释。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/387266

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX