scrapy 的 xpath 真的好难学呀。 有啥办法能更好的学习么?

2016-07-26 11:28:22 +08:00
 xiaoyu9527

心好累

2819 次点击
所在节点    问与答
22 条回复
upczww
2016-07-26 11:43:26 +08:00
xpath 文档全部看一遍
BOYPT
2016-07-26 11:45:42 +08:00
可以用 pyquery 重新实现 spyder 的啊
https://gist.github.com/joehillen/795180
mrytsr
2016-07-26 11:47:20 +08:00
mrytsr
2016-07-26 11:48:47 +08:00
razrlele
2016-07-26 11:50:20 +08:00
exoticknight
2016-07-26 12:02:51 +08:00
可以用 css 的
真的很难学吗?经常用的不就是几种?
imn1
2016-07-26 12:38:42 +08:00
xpath 起码比正则简单多了
imn1
2016-07-26 12:45:09 +08:00
wmttom
2016-07-26 12:56:51 +08:00
pyquery +1
halmstad
2016-07-26 13:43:36 +08:00
可以用浏览器插件来验证 xpath
zjuster
2016-07-26 13:56:47 +08:00
@mrytsr 这个都是绝对路径的,很多情况不准的...
xss
2016-07-26 14:09:49 +08:00
firebug 插件,在 html 标签,右键,复制 xpath.....
feather12315
2016-07-26 14:42:54 +08:00
XPath / CSS selector / re
仨轮着用。
XPath 写不出来用 CSS selector ,
还不行用 re ,别绑在一条船上。大多数时候, XPath 难写, CSS selector 却很好写
wuhaoworld
2016-07-26 14:43:58 +08:00
我也觉得, scrapy 的 XPath 和标准格式不一样, Chrome 复制出来的还不能直接用,真的很蛋疼
xiaoyu9527
2016-07-26 15:11:41 +08:00
@feather12315

我用的就是 CHROME 弄 XPATH 但是调试起来很头大
dexterzzz
2016-07-26 17:50:03 +08:00
CSS selector 很清晰明了.
Allianzcortex
2016-07-26 19:35:26 +08:00
Chrome extension:XPath Helper;不过仍然难用...所以还是一起去喝汤...BeautifulSoup...
mringg
2016-07-26 19:54:03 +08:00
这东西貌似不用学
Suclogger
2016-07-26 21:29:05 +08:00
chrome 和 firefox 都有对应的工具

suclogger.tech/2016/05/17/从 webmagic 着手浅析 JAVA 爬虫 /
Suclogger
2016-07-26 21:29:26 +08:00
@Suclogger

http://suclogger.tech/2016/05/17/从 webmagic 着手浅析 JAVA 爬虫 /

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/294980

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX