制作个性化的知乎首页 rss

2014-07-29 22:39:08 +08:00
 qmqy
相信各位技术大大自己会写爬虫解决这个问题,就不献丑了,这篇文章主要是分享给像我一样不会写爬虫的非技术童鞋。
知乎的更新时间很碎片化,效率极低;如果能把知乎首页的回答都通过rss进行输出,可以大幅度提升效率,无需整天泡在上面。
http://www.zhihu.com/question/24294851/answer/27319381
这是我自问自答,当做分享。
4295 次点击
所在节点    分享创造
8 条回复
imink
2014-07-30 10:18:24 +08:00
如果自己爬虫写的话,有没有相关教程推荐呢?
qmqy
2014-07-30 10:27:17 +08:00
@imink
自己写爬虫需要考虑很多问题:重复文章检测、数据存储、定时任务、定时删除等等.....我就是觉得这些加起来太耗时了,就不重复造轮子了........不过如果你有时间挑战下,可以看看这里:
http://blog.csdn.net/wxg694175346/article/category/1418998
或者去搜索编程语言+爬虫,也会有很多结果的。
祝你顺利!
imink
2014-07-30 10:41:27 +08:00
@qmqy 原来是汪海,这个博主年纪不大,爬虫博客写的多,我之前有看过。给楼主贴图写文章的精神鼓励。能这么认真写都挺不容易。 我去研究看看爬虫。
qmqy
2014-07-30 11:01:17 +08:00
@imink
祝你顺利~
ccbikai
2014-07-30 11:28:13 +08:00
知乎首页是动态加载的,鼠标悬浮头像上边都有加载新东西,博主的方法貌似只能抓取默认的几个问题

推荐个
http://www.zhihu.com/rss
qmqy
2014-07-30 14:11:59 +08:00
@ccbikai
1.动态加载的问题,我是通过缩短抓取周期解决(8分钟抓一次)。
2.“鼠标悬停头像上面都有加载新东西”是指?
3.目前我方案有个缺点就是没办法抓取知乎专栏,不过我用你提供的东东解决了~
4.http://www.zhihu.com/rss,我以前也是用这个来订阅,可是有两个缺点:
a.会重复出现以前看过的问题。
b.它是针对所有人的,无法做到定制化,也就是意味着你不喜欢、不关注的话题或人(太多了,相当烦人)它也会推进来,污染时间线,降低效率,这也是我放弃的最大原因。

5.我看你的博客有个新浪微博点赞脚本,其中一个半自动化的方案可以直接在邮件里点赞,不知道你这个方案能否用到这里呢?直接在rss阅读器里面点赞。
ccbikai
2014-07-30 23:32:15 +08:00
@qmqy 可以全自动点赞。微博也可以生成RSS,带点赞链接就行了
qmqy
2014-07-31 10:03:16 +08:00
@ccbikai
我指的是知乎也可以在rss里面点赞,请问可以做到么?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/125158

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX