首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
探索世界的好奇心万岁
Udacity
网易公开课
Godel, Escher, Bach: An Eternal Golden Braid
V2EX  ›  分享发现

鸟巢网页数据采集系统 V2.2

  sohoer · 2016-04-11 10:01:31 +08:00 · 9114 次点击
这是一个创建于 895 天前的主题,其中的信息可能已经有所发展或是发生改变。

做个简单易用通用型采集器不容易,这个项目已经花了 6 年时间,还没完还将继续。

3 年前第一次发布

http://v2ex.com/t/65371#reply149

第一次发布后有人说太复杂,有人说应该提供独立的 WEB 管理界面等等,花了 3 年时间在这个版本都有实现,并且做了很多的重构与功能完善。

三年前注册的用户,可以直接安装使用(鸟巢采集器个人用户终身免费使用),

项目地址

https://github.com/speed/newcrawler

目前还不打算开放注册,准备再测试一个月(请不要申请邀请码)

鸟巢采集器

http://www.newcrawler.com

测试帐号(请使用海外节点,因为 GAE,OpenShift 都已被墙)

username:test 
password:test

演示视频

http://video.newcrawler.com/newcrawler_v2.2.mp4

http://ww3.sinaimg.cn/large/5e24c9a7gw1f2sj1vgfx8j20zk0rhtg2.jpg

第 1 条附言  ·  2016-04-11 11:15:52 +08:00
最快的部署自己的爬虫是
Fork coding 上的代码再开启演示功能,像这样
https://coding.net/u/speed/p/newcrawler/paas
第 2 条附言  ·  2016-04-11 16:35:03 +08:00
很期待大家多多提意见,我的目标是做一款强大好用又免费的工具(仅限个人)

上一次大家提的意见我花了 3 年时间完善,这一次说不定会花 4 年,刚好 10 年磨一剑。

再次感谢各位的赞!谢谢!
102 回复  |  直到 2017-12-08 12:06:59 +08:00
1  2  
    101
jorb   2017-08-04 11:12:47 +08:00
现在还不开注册吗?安装后才知道
    102
q99103248   289 天前
现在开放注册了么,求个邀请码
1  2  
关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   803 人在线   最高记录 3762   ·  
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.1 · 16ms · UTC 23:25 · PVG 07:25 · LAX 16:25 · JFK 19:25
♥ Do have faith in what you're doing.
沪ICP备16043287号-1