关于统一处理 Scrapy spider 异常的问题

2016-11-04 18:14:10 +08:00
 Jelly

Scrapy 项目中有多个 spider ,某些 spider 在处理 response 的时候会出现异常(如 xpath 解析后得到空的 list ,这时去 list[n]的时候就会抛 Indexerror ),有没有什么办法可以统一管理这些异常? 自己写 SpiderMiddleware , spider 抛出异常的时候 process_spider_exception 方法并没有被触发...... 求建议~

5692 次点击
所在节点    Python
4 条回复
zhuangzhuang1988
2016-11-04 18:31:25 +08:00
pycharm 调试下流程就好了.
knightdf
2016-11-04 20:05:03 +08:00
scrapy,直接看源码的,很清楚的
1130335361
2016-12-02 17:38:25 +08:00
mudy
2019-04-11 16:16:23 +08:00
请问你找到解决办法了吗?谢谢!!!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/318100

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX