有没有一种爬虫服务,只需要我指定网站和规则,就可以定时爬数据,并且可以提供我指定格式的 json api 的

2018-03-03 13:47:55 +08:00
 Brucepac

如题,希望各路大佬知道,告知一下。

PS:本人比较喜欢看自然科学相关的文章,经常看环球科学的网站,加上我是做 iOS 开发的,所以我想用 swift 做一个 app 方便看文章。

本来是想自己做全栈的,包括设计和前后端(前后端全用 swift),但是由于我对爬虫方面的知识不太了解,我想先完成 app,后期再用 Perfect 自己学习写爬虫程序。所以要是有现成的爬虫并且是开源的就最好了😄。

9266 次点击
所在节点    程序员
46 条回复
loading
2018-03-03 13:48:47 +08:00
幽灵蛛
malagebidi
2018-03-03 13:49:48 +08:00
用 huginn+feedly,完全满足需求。
devjoe
2018-03-03 14:29:25 +08:00
直接加载整个网页,然后利用 XPath 解析就行
bogun
2018-03-03 14:35:55 +08:00
可以试一下 portia,可视化爬虫
likuku
2018-03-03 14:39:27 +08:00
IFTTT ?
chroming
2018-03-03 14:40:43 +08:00
可以看下 pyspider
ospider
2018-03-03 15:29:42 +08:00
那你就先 mock 一个数据开发呗,做完再说。说不定中途就放弃了
lScarlet
2018-03-03 15:46:59 +08:00
马克
brotherlegend
2018-03-03 15:51:59 +08:00
看大佬们回答
yuanfnadi
2018-03-03 17:05:31 +08:00
toapi
可以把网站变成 api
silencefent
2018-03-03 17:20:57 +08:00
神箭手
giuem
2018-03-03 17:22:43 +08:00
safedogcc
2018-03-03 17:47:05 +08:00
这不就是我的 APP [下一栈]( https://nextstack.xyz)
该做的事吗!

原理也是一样,把网站的 html 或者 rss 或者 json api 转换成固定的 json 数据格式,只不过不用爬虫,直接在客户端进行爬取解析,欢迎体验!
coolloves
2018-03-03 17:51:20 +08:00
马克
zhtttyecho
2018-03-03 18:41:24 +08:00
马克
zhesheng
2018-03-03 18:46:31 +08:00
马克
anonnymous
2018-03-03 18:49:49 +08:00
克马
Esora
2018-03-03 19:02:04 +08:00
mark
leriou
2018-03-03 19:35:06 +08:00
八爪鱼试试
sohoer
2018-03-03 20:29:05 +08:00
可以先试用下 hicrawler.com ,目前支持 json api 或发布到 wordpress

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/434481

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX