关于RSS阅读器的数据库的设计

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 4435 天前的主题，其中的信息可能已经有所发展或是发生改变。

最近在想RSS阅读器(web版，有用户，像google reader)的实现，有几个问题比较困惑，希望大家能帮忙解答一下：

1. 根据订阅的xml解析出文章以后是存到数据库中吗，未读和已读状态是更新数据库实现的吗？

2. 如果1成立，那么已读以后就要删掉吗？如果删掉并且怎么知道下次来的文章已经读过了，如果不删掉，那么数据量就会猛张，怎么解？

3. 用户数量到一定规模以后（比如google reader或鲜果阅读器）频繁的更新数据库怎么突破瓶颈，有必要用NoSQL吗？如果用关系型数据库能hold住吗？有啥方案？

4. 来自不同订阅的内容按日期排序问题，怎么实现？直接在库里desc？

先问这些吧，因为对rss还不是很了解，如果能有热心人整体描述一下工作原理就更好了。

先谢过！！！

数据库

阅读器

删掉

4 条回复 • 1970-01-01 08:00:00 +08:00