想实现一种定期抓取特定页面的文章并推送到邮箱的功能应如何实现呢?

2016-09-07 13:30:05 +08:00
 Maltazard

有点类似于 RSS 订阅,但是常年关注的几个页面不是总有时间去页面上去刷,想要是能有类似的软件或者 Git 上有类似的代码能实现这个功能就完美了。 需求点: 1.每天两次抓取特定网站(多个)的文章页 2.抓取内容可进行关键词筛选(重要) 3.筛选后内容发送到邮箱

有大神能提供下思路或指点下应该怎么做真的感激不尽了!

1301 次点击
所在节点    问与答
7 条回复
TimePPT
2016-09-07 13:59:08 +08:00
你这自己不是都把思路写明白了么
helloworld2010
2016-09-07 14:33:09 +08:00
scrapy/beautifulsoup + mailgun
helloworld2010
2016-09-07 14:34:22 +08:00
@helloworld2010 再加一个 celery
Maltazard
2016-09-07 15:59:21 +08:00
@TimePPT 想问问看大家有没有现成的工具或者小插件啥的~
Maltazard
2016-09-07 16:00:20 +08:00
@helloworld2010 多谢啦!初学者技术不过关,我多去了解下。
koor
2016-09-07 16:02:53 +08:00
https://www.feedmyinbox.com
不知道这个服务还在不在运行了,几年前某自治区断网时,用过这个网站来了解外面的世界
Maltazard
2016-09-07 16:07:49 +08:00
@koor 谢谢!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/304533

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX