奇思妙想:灵光闪现,想搞一个爬虫平台,有没有可能会火?

2017-11-20 11:01:24 +08:00
 dbfox
(不喜勿喷:都说了是灵光闪现)

想法是这样子的:

首先有这样一个平台,可以让爬虫爱好者提交爬虫上来 (不仅仅是可以爬网站,还可以爬公众号、头条号 ====)

比如:某爬虫爱好者,提交了一个 V2EX 最新帖子 和 最热帖子的爬虫进来

然后:这个爬虫可以让其他用户订阅使用

当聚集了一定的爬虫爱好者,每天会产生很多内容

主要的意义:聚合碎片化的阅读,为用户节约时间

当然一个平台需要不断的优化调整才能达到更好的体验,
这只是一个小小的想法,不知道能吸引到人来写爬虫不
6648 次点击
所在节点    奇思妙想
44 条回复
weer0026
2017-11-20 14:06:59 +08:00
这个让我想起来 golang 的爬虫框架 pholcus 了,思路很像。
wmhx
2017-11-20 14:22:16 +08:00
haker
2017-11-20 14:25:13 +08:00
八爪鱼
QQ2171775959
2017-11-20 14:36:38 +08:00
爬一下爬,要是能汇聚一批人和信息的也是有一点用处的
fiht
2017-11-20 16:52:13 +08:00
提交了一个爬虫上来:
提交的爬虫放在你的服务器上跑么...
不如 rss 靠谱
ThinkMan
2017-11-20 16:56:17 +08:00
几个月前,我也有这种想法。一模一样。
Zzzzzzzzz
2017-11-20 16:58:44 +08:00
秒变分布式 CC 平台.....
dbfox
2017-11-20 17:00:11 +08:00
@ThinkMan 搞个爬虫,以虫会友
@fiht 也可以在我家用电脑上跑,跑好了提交给服务器也可以,具体没想那么多细节
wulin
2017-11-20 17:46:03 +08:00
订阅 1024
Shura
2017-11-20 18:23:02 +08:00
v 站有人做了个自动签到平台就是这个思路,我发现最难的是“某爬虫爱好者,提交了一个 V2EX 最新帖子 和 最热帖子的爬虫进来 ”,很难做到让人提交爬虫脚本,到最后平台基本也就是作者自己提供的脚本最多了。
ZSeptember
2017-11-20 20:35:21 +08:00
神箭手
qfdk
2017-11-21 01:55:50 +08:00
跳蚤大神不是早就搞了 这轮子不用造了
Arnie97
2017-11-21 01:56:09 +08:00
这根 RSS 有什么本质差别…
yech1990
2017-11-21 02:28:40 +08:00
Google 阅读器还在的时候,google 和 yahoo 有类似的实现。Google RSS 关闭后,我也有和楼主一样的想法。

虽然现在有一些类似的方案,但都是闭源收费的服务为主。

之前打算在 github 开个 organization, 分享一些爬虫代码,定义一套接口规范,最终输出类似 RSS 的 xml 格式。

零散写了一些脚本后就放弃了。一方面工程浩大,一方面代码水平太差,一个人连 demo 都实现不了,实现不了 demo 的话,不可能有其他人贡献代码。另外就是现在 RSS 阅读似乎是时代的逆流了,不知几年后 RSS 的用户,也就没太多折腾的动力了。

楼上很多推荐聚合阅读的,应该是没明白楼主的出发点吧。。。
naiba
2017-11-21 08:28:33 +08:00
即刻+1
Norie
2017-11-21 09:27:06 +08:00
即刻+2
Aresn
2017-11-21 11:20:31 +08:00
你听说过 feedly 吗
haogefeifei
2017-11-21 14:28:50 +08:00
即刻+3
haozhu
2017-11-21 15:04:16 +08:00
即刻+4
dorothyREN
2017-11-21 16:26:42 +08:00
我看行

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/407837

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX