一个好用的爬虫应该有什么样的功能?有什么有趣的玩法?

2016-11-25 18:09:47 +08:00
 GrahamCloud

这两周,我们做了一个目前来看非常易用的云爬虫:

主页在这里, zaoshu.io

现在,我们提出了很多酷的设想,也在一步一步慢慢完善。 大家快来玩玩。 如果你也有酷的想法,愿意洗耳恭听。 期待可以一起合作。

24732 次点击
所在节点    推广
183 条回复
GrahamCloud
2016-12-06 11:17:14 +08:00
@saber000 api 需求欢迎提交给我,微信 Zaoshuio
lakewong
2016-12-12 15:06:55 +08:00
试了试爬知乎首页
GrahamCloud
2016-12-12 15:18:43 +08:00
@lakewong 不不,不能爬首页,对于知乎,将来可以通过 api 来搞。
首页的示例里,链家,拉钩这样的,是我们的主要应用场景。
xvx
2016-12-12 15:29:56 +08:00
域名早熟?
GrahamCloud
2016-12-12 17:42:42 +08:00
@xvx 晚熟,晚熟。
mingyun
2016-12-12 23:27:15 +08:00
厉害了我的哥,赶紧去看看
baiyi
2016-12-14 14:35:22 +08:00
下回节点能放在推广吗
9hills
2016-12-14 14:48:53 +08:00
试试爬一下多看电子书,自己爬比较麻烦的是代理池、防抓取等还需要自己做
GrahamCloud
2016-12-14 14:55:28 +08:00
@baiyi 其实倒真不是推广,是诚心来探讨聊天来着。推广肯定会买广告位,现在产品不成熟还是求意见聊场景的阶段。
baiyi
2016-12-14 15:22:22 +08:00
@GrahamCloud 嗯 加油做一个好产品!
9hills
2016-12-14 15:34:36 +08:00
失败了,这个失败都没有地方 debug 。。。

就一个执行失败。。。我还是老老实实的用 scrapy 吧<_<
hakulamatata
2016-12-14 15:37:29 +08:00
指哪爬哪能做到就已经能够很好了
GrahamCloud
2016-12-14 17:19:38 +08:00
@9hills 我去后台看下啥情况。求告知邮箱
9hills
2016-12-14 17:26:37 +08:00
@GrahamCloud swulling@gmail.com
GrahamCloud
2016-12-15 12:04:05 +08:00
@9hills 为了易用, debug 暂时不能给使用者,现在只能我们尽量帮 debug
GrahamCloud
2016-12-15 12:07:33 +08:00
@hakulamatata 产品上问题还特别特别多
GrahamCloud
2016-12-15 12:07:56 +08:00
@hakulamatata 看哪不好随时说。
haigeek
2016-12-16 15:40:30 +08:00
没人试试高校的教务管理系统吗? aspx 页面,某果,界面是空白的。
GrahamCloud
2016-12-16 16:01:18 +08:00
@haigeek 求告知网址!
haigeek
2016-12-16 16:45:13 +08:00
@GrahamCloud http://kmustjwcxk1.kmust.edu.cn/jwweb/ 这个是登录地址,是需要账户和密码的。
http://kmustjwcxk1.kmust.edu.cn/jwweb/MAINFRM.aspx 这个是登录上去的 但是我怕你还是打不开 但是你看后缀是 aspx 的,在页面直接是没有右键选项的。这个管理系统是青果,似乎国内用的也不少,听说是便宜。可以根据信息参考下。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/323314

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX