一款全新的网页数据采集工具:爬山虎

2017-12-02 17:26:25 +08:00
 oness

前言

现在互联网上有这么多的采集器,我们为什么要开发爬山虎呢?

原因很简单,大部分已有的软件用起来不爽,于是我们就自己开发了一个。

特性

爬山虎采集器是一款全新的网页数据采集工具。作为一款工具软件,我们:

  1. 放弃了花哨的界面,换之以快速流畅的体验。
  2. 放弃了复杂的规则配置,开发了智能的自动提取算法。
  3. 在基于浏览器的可视化操作上,同时保留了快速的 HTTP 引擎架构。

爬山虎采集器在保持了用户体验、用户低学习成本的同时,兼顾了软件的数据抓取效率。

数据采集

爬山虎采集器能够采集互联网上的绝大部分网页,比如动态网页、静态网页、单页程序、表格数据、列表数据、文章数据、搜索引擎结果、下载图片等等。

发布数据

在采集到数据后,还可以发布到 CSV、Excel、MySQL、SQLite、Access、MSSQL、以及网站 API 接口上。

当然爬山虎采集器作为一个新上场的选手,跟前辈们相比,可能会有些缺点、问题。

欢迎您下载试用,并且给我们提供宝贵的意见。(如果你懒得下载,可以看下网站首页的演示视频:)

爬山虎采集器网站

编辑器

16550 次点击
所在节点    分享创造
81 条回复
ResidualSoils
2017-12-02 17:40:18 +08:00
不开源的话不会是打算用来挣钱吧?
hundan
2017-12-02 17:46:13 +08:00
一楼这话听着怎么这么别扭
oh
2017-12-02 17:57:30 +08:00
来发个软件用来挣钱有啥问题吗……
i730
2017-12-02 19:22:20 +08:00
一楼。。。。。。
1931
2017-12-02 19:26:06 +08:00
P2p 种子搜索神器宇宙超级无敌加强版
est
2017-12-02 19:29:58 +08:00
bandicam 亮点。
ctsed
2017-12-02 19:31:40 +08:00
@ResidualSoils 碍着你了?
dzxx36gyy
2017-12-02 20:09:22 +08:00
客户端软件为啥要用导出数据条数区分不同套餐... 感觉这个一般是在线服务才这么搞吧,为啥不以导出的数据源类型以及其他售后服务来区分套餐_(:з」∠)_
oness
2017-12-02 20:26:48 +08:00
@dzxx36gyy 感谢建议,我在好好想下
f2f2f
2017-12-02 20:35:32 +08:00
现在一在 v2 看到爬虫我就想到了煎蛋……
gouchaoer
2017-12-02 20:56:31 +08:00
面向开发者不太讨好的说
cxd44
2017-12-02 21:33:11 +08:00
迫切想体验
cxd44
2017-12-02 21:34:32 +08:00
价格 499 元没有优惠了吗
cxd44
2017-12-02 21:35:41 +08:00
支持采集论坛帖子的附件吗?
lhx2008
2017-12-02 21:48:58 +08:00
和同类软件比,比如火车头比,没什么竞争力吧。
和自己写程序比,反爬虫,复杂的 ajax 数据,登录,验证码识别这些基本做不了
oness
2017-12-02 22:08:09 +08:00
@lhx2008 验证码目前还在开发,其他的都可以解决的。
正是看到火车头、八爪鱼他们的优劣势,我才自己开发了这个。
oness
2017-12-02 22:09:10 +08:00
@cxd44 赶紧体检,账号名发我,给你开通个权限
yeshang
2017-12-02 22:22:21 +08:00
@oness 可以帮我开通个权限吗? 账号名同 V2EX ID
oness
2017-12-02 22:27:42 +08:00
@yeshang 可以
yeshang
2017-12-02 22:31:00 +08:00
@oness 非常感谢. 等上班的时候使用一段时间啊.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/411413

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX