外包一个爬取指定微信公众号文章的程序

2016-02-25 10:47:02 +08:00
 tingping
[描述]
根据用户提供的微信公众号列表, 自动爬取历史文章并生成独立的静态 html 文件。


[输入]
程序需要提供一个简单的界面管理:
- 需要爬取的公众号账号
- 自动爬取频率(也可以人工触发爬取)

[输出]
- 跟进设置的爬取频率自动获取对于公众号下的新文章。每篇文章将是一个独立的静态 html 文件(包括文章发布时间,阅读量,标题, 原文地址)
- 获取到的文章将按照日期放在对应的目录(每天一个新目录保存当日文章和图片)
- 每次爬取将更新已获取文章的阅读量

[其他需求]
完成后需要将程序部署在我们使用阿里云服务器。

[报酬费用]
预算大概 5 ~ 10K 。 可以根据任务的完成进度分两次支付。

[联系方式]
QQ : 36008052
地址:上海市武定西路 1189 。 在上海的朋友也可以喝杯茶见面沟通。
1083 次点击
所在节点    外包
18 条回复
meeasyhappy
2016-02-25 11:22:11 +08:00
就这一条 [每次爬取将更新已获取文章的阅读量] 费用 就会变成 10 万元以上。
sunsh217
2016-02-25 11:43:47 +08:00
吃饱了接这种活,还不如好好上班。
tingping
2016-02-25 12:29:14 +08:00
@meeasyhappy 不明白这个很难吗?
xujif
2016-02-25 12:34:21 +08:00
@tingping 成本确实很高,除了程序,还需要维护一批登陆的微信号。 程序至少 5w 以上
meeasyhappy
2016-02-25 12:37:27 +08:00
@xujif @tingping 5w 搞不定的。
可以说 如果你把 阅读量 搞定了 并 大规模 抓取, 成立一个公司 卖数据, 你每年的收入 都是 几百万 级别的。
xujif
2016-02-25 13:39:35 +08:00
@meeasyhappy 每天 100w 文章+阅读方案,我有,几百万怎么赚,教我
youdaji
2016-02-25 13:44:32 +08:00
让我想起有个人跟我说:我请你吃顿肯德基,给我做个网站出来
meeasyhappy
2016-02-25 13:47:07 +08:00
@xujif 可以 微信沟通 xiaobei060537
jarlyyn
2016-02-25 13:47:32 +08:00
@tingping

觉得不难的话可以自己学着做么。
crayonyi
2016-02-25 13:52:31 +08:00
@xujif 我在 web 上设置下 ua 就可以获取了
nianjcn
2016-02-25 14:28:00 +08:00
侮辱价,觉得不难,自己做呗
kevin1452
2016-02-25 14:57:04 +08:00
有没有阅读量 是两回事.
另外... 就目前了解到的方法来说,这不是仅仅一个阿里云能做到的..还需要其他设备
SlipStupig
2016-02-25 18:34:36 +08:00
能批量挂微信号就不止这个价格了.....
leeiio
2016-02-25 20:15:32 +08:00
东西能做,只是这价格,我觉得,楼主还是自己写吧
baohao
2016-02-26 09:23:44 +08:00
3-4w 接
tingping
2016-02-26 18:41:17 +08:00
任务已经托管到码市了。 感兴趣的同学直接在上面报名吧: https://mart.coding.net/p/1022
ljcarsenal
2016-02-29 11:52:47 +08:00
@meeasyhappy 可以请教么如何赚钱么? 我做过微信的爬取
meeasyhappy
2016-02-29 19:40:18 +08:00
@ljcarsenal 微信私聊 xiaobei060537

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/258991

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX