V2EX › lifanxi 的所有回复 › 第 61 页 / 共 61 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 ... 52 53 54 55 56 57 58 59 60 61

❮

❯

2012-02-02 11:18:45 +08:00

回复了 iray1991 创建的主题 › 问与答 › 使用Calibre将期刊博客文章制作成电子书时，如何去掉抓取文章时间（365天）和篇数（100）的限制呢？

@iray1991
每个网站的RSS输出量都是非常有限的，一般就限在几十条的量级，这个输出量是网站方控制的。calibre如果直接抓网站的RSS的话，就最多只能抓到这么多。

如果某个网站的RSS在Google Reader中被某个人订阅过，那Google Reader的保存这个RSS所有的历史记录，即使网站实际输出的RSS中已经去掉了过期的内容，这些内容仍然会在Google Reader中保留。

所以如果你真要抓全，那就不能从原始网站的RSS去抓，可以考虑通过Google Reader代理一层。这个好像没有办法直接实现，不过应该可以通过修改calibre中的Google Reader新闻抓取清单来实现。我有空可以试试看。

2012-02-02 09:06:15 +08:00

回复了 iray1991 创建的主题 › 问与答 › 使用Calibre将期刊博客文章制作成电子书时，如何去掉抓取文章时间（365天）和篇数（100）的限制呢？

http://www.luanxiang.org/blog/feed 这个是墙外的，会跳转到被墙的feedburner上，所以很可能抓取不成功。
http://www.write.org.cn/feed 访问有时候不流畅，会出错。如果流畅的话是可以的，改oldest_article明显是有效果的。
http://www.zhihu.com/rss 上内容比较新，所以默认就可以抓全。把参数再改大也没有用，还是抓这么多。请注意Kovid给你回复中说的：calibre can fetch only as many articles as are present in the feed iteself. 如果RSS本身没有足够老的输出，你再改oldest_article也没有用。

2012-02-01 15:02:06 +08:00

回复了 iray1991 创建的主题 › 问与答 › 使用Calibre将期刊博客文章制作成电子书时，如何去掉抓取文章时间（365天）和篇数（100）的限制呢？

我曾经过试过你说的直接改oldest_article和max_articles_per_feed的方法，是可以达到期望的结果的。今天试了一下也没有能重现你的问题。

你能描述一下你所遇到的“Error”是什么吗？

另外，在用calibre新闻抓取功能时，要注意是不是受到了墙的干扰，尤其是抓国外的一些Feed或Google Reader时。

1 ... 52 53 54 55 56 57 58 59 60 61

❮

❯