请问这是什么爬虫规则

2019-08-14 11:24:12 +08:00
 kastrcn

"class.xing_vb5.0@text"

"class.xing_vb6.0@text|class.xing_vb7.0@text"

"class.vodImg.0@tag.img@src"

2082 次点击
所在节点    程序员
7 条回复
kastrcn
2019-08-14 11:39:38 +08:00
第一句话 是找到类为 xing_vb5 的第一个元素的内容

求教这个爬虫规则什么是给什么框架的用的?
DefineJ
2019-08-14 14:05:57 +08:00
你这问的表示没看懂,我写了一个 php 爬虫用的 QueryList,规则
$rules = array(
'规则名' => array('jQuery 选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),
'规则名 2' => array('jQuery 选择器','要采集的属性'[,"标签过滤列表"][,"回调函数"]),
..........
);
还有其他很多,xpath 之类的
tikazyq
2019-08-14 14:12:07 +08:00
可以加作者 tikazyq1 拉爬虫管理平台微信群,很多大佬,帮你解决疑难杂症

Crawlab Github: https://github.com/tikazyq/crawlab
kastrcn
2019-08-14 15:34:47 +08:00
@DefineJ 我感觉这个是一个类似 xpath 的那种爬虫框架的规则 网上找了一圈没发现是什么爬虫的框架框架 看看有没有见过识广的大佬见过 是什么爬虫框架
kastrcn
2019-08-14 15:36:40 +08:00
@tikazyq 已 star
SoulMelody
2019-08-14 16:51:08 +08:00
这个好像安卓阅读 app 用的规则 https://github.com/gedoor/MyBookshelf
kastrcn
2019-08-14 22:16:15 +08:00
@SoulMelody 非常感谢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/591760

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX