云爬虫 与 爬虫软件的认真探讨

2017-05-03 13:38:38 +08:00
 GrahamCloud

今年是造数云爬虫快速测试的一年

如今爬虫方面的同行很多,例如 import.io 等等。V 站也看到了非常好的作品,比如 hicrawler 等等。

学到很多。

这个帖子希望和大家一起探讨,各种爬虫的应用场景以及利弊等等。

10661 次点击
所在节点    推广
65 条回复
gamecreating
2017-05-03 13:39:46 +08:00
自己定制爬虫 靠谱点 你这个只能给小白用...
GrahamCloud
2017-05-03 13:55:35 +08:00
@gamecreating 大型定制爬虫我们也做,但是很多同类网站要自己一个一个写确实不如 用我们网站(恩!)
charli
2017-05-03 14:57:53 +08:00
“造数的采集节点遍布全国 7 个机房上百万个 IP ”
真有怎么多 ip 么
GrahamCloud
2017-05-03 15:15:34 +08:00
@charli 这倒是真的,看得好细致啊
gimp
2017-05-03 15:37:05 +08:00
测试了一个网站,体验比几个月前好了不少
GrahamCloud
2017-05-03 16:12:17 +08:00
@gimp 感谢关注,想讨论各种爬虫用起来的感受。
malusama
2017-05-03 16:16:59 +08:00
我就觉得好贵啊……
kangsgo
2017-05-03 16:28:35 +08:00
爬虫失败,失败原因:链接超时
LokiSharp
2017-05-03 16:31:39 +08:00
1 块钱 50 个页面太贵了吧
jwenwang
2017-05-03 17:02:58 +08:00
造数很好,就是还不能模拟登陆状态,有些网站不登陆情况下没法爬
GrahamCloud
2017-05-03 17:23:03 +08:00
@malusama
@LokiSharp 价格也是一个要认真探讨的地方,目前可以给大家赠一些。
GrahamCloud
2017-05-03 17:29:59 +08:00
@kangsgo 求问具体情况
kangsgo
2017-05-03 17:56:28 +08:00
@GrahamCloud 好像是源网址不稳定,哎呀,最近老范这种错误,真是抱歉呀
kchum
2017-05-03 18:24:33 +08:00
试用了下,感觉还有很大进步空间
要不然简单的爬虫真可以,另外 api 也是一个问题
GrahamCloud
2017-05-03 18:44:44 +08:00
@kchum 平时爬什么网站啊
qwe321
2017-05-03 18:51:42 +08:00
@charli 有的,类似于 www.qgvps.com 这种提供了大量地区的拨号 VPS,可以自己搭建代理 IP
GrahamCloud
2017-05-04 10:53:08 +08:00
@qwe321 老铁 666
BiggerLonger
2017-05-04 11:35:27 +08:00
可以解決 wp protected iframe 的問題嗎
acoder2013
2017-05-04 11:40:59 +08:00
不支持 api?
fuxkcsdn
2017-05-04 11:53:54 +08:00
@qwe321 感谢分享,之前在淘宝上联系过几个卖家,都只有 win 系统

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/358781

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX