懂采集,爬虫的大佬 求指点下小弟

2017-10-22 01:12:58 +08:00
 a54425415

根据自动采集关键词且自动采集相对应的文章,入库 呈现出来
这种最简单的用啥语言造个轮子 有懂得大佬 指点下

目测有个类似的系统 http://www.zhuantiyi.com

专题易

收费的 买不起 只能自造了

2899 次点击
所在节点    程序员
12 条回复
ila
2017-10-22 01:20:17 +08:00
欢迎进入 scrapy 副本,请注意,敌人还有五分钟到达战场
a54425415
2017-10-22 01:25:34 +08:00
@ila 昨天看了一圈 php Python java 感觉都好困难,
可能没有现成的例子观摩吧 ,自用的 bt 爬虫是 Python 改成了一键傻瓜式安装 自动定时重启爬虫 就觉得很简单了,


这种 新闻类似的 头一次 可能没掌握技巧吧 路漫漫其修远兮啊
可能比较倾向于一键傻瓜式吧
ila
2017-10-22 02:36:24 +08:00
知道一个道理,免费的最贵
傻瓜的手尾最长
a54425415
2017-10-22 02:52:15 +08:00
@ila 重来没想过 免费获取 免费才是最贵的 花钱买现成的跟花钱重头写 两个概念 意义不一样 啊哟思单
lhx2008
2017-10-22 07:50:34 +08:00
要么省成本要么省时间,省成本还要自己有技术,自己选吧
golmic
2017-10-22 09:27:06 +08:00
我可以付费帮你做一个
schoolers
2017-10-22 13:09:19 +08:00
可以联系我啊
ila
2017-10-22 16:58:10 +08:00
把要采集的网站发上来看看?
shuizhengqi
2017-10-22 21:08:43 +08:00
给钱办事
woscaizi
2017-10-25 23:13:50 +08:00
Java webmagic,不到一分钟搭好环境。
cangbaotu
2017-11-02 10:15:11 +08:00
不重复造轮子 现在要开发爬虫都用神箭手了
a54425415
2017-12-07 06:11:16 +08:00
这种事基于根据百度或者 gg 搜索相关关键词采集文章的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/399582

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX