GoogleReader备份的xml文件怎么阅读?

2013-06-20 23:00:08 +08:00
 wswj
大神写了python程序(http://live.aulddays.com/tech/13/google-reader-archive-download.htm)可以直接导出各个item的所有记录,均为xml文件。很多网站的一辈子都记录在这个小小的xml文件里了。

但是本人小白,压根不知道怎么用这东西,有什么软件能把xml还原成阅读模式吗?
4107 次点击
所在节点    问与答
22 条回复
wswj
2013-06-21 12:35:36 +08:00
已经把十多个item保存了,1.2G,急求使用方法教学
Jessepinkman
2013-06-21 12:44:41 +08:00
极客公园提供Google Reader Archive Project,可以将用户从 Google Reader 导出的数据转换为便于查看的 HTML 网页,包含简单的交互功能,同时尽量保留大家熟悉的 Google Reader 页面风格。
URL: http://www.geekpark.net/lab/google_reader
loading
2013-06-21 12:50:23 +08:00
上次feedly清掉我的feed怎么算,屮
wswj
2013-06-21 14:19:09 +08:00
@Jessepinkman
不一样的。gr只能导出自己的共享星标条目。

这个是能够把各个feed的所有条目全部导出来,有用多了!(相当于把整个网站离线保存了)
很多网站已经关闭,但是只要有rss,gr都给保存了。谷歌选择把它关闭真是太可惜了
regent
2013-06-21 14:43:40 +08:00
@Jessepinkman 这个只能对Google takeout导出的文件进行处理,而@wswj 说的这个可以抓取历史数据。希望v2ex上的各位能够开发一个针对性的xml 转html工具,然后就能够通过本地检索了。

@zythum @clowwindy @jybox @detecti1914 @alexrezit @rankjie @hit9 @sliuqin
哪位有空有兴趣做一做?这个造福广大群众啊
alexrezit
2013-06-21 16:02:35 +08:00
@regent
为啥 @ 我... = =
rankjie
2013-06-21 16:11:28 +08:00
@regent
怎么被@了= =
我好像用了feedly,之前的archive都在里面了,所以好像没有必要吧...
wswj
2013-06-21 16:33:18 +08:00
@regent
感谢!我正指望着大神开发阅读器。
其实最主要的是提醒下大家,有需要保存的东西赶紧去下载,只有10天不到了。
regent
2013-06-21 19:05:27 +08:00
@alexrezit
@rankjie 感觉二位动手能力强啊

另外,feedly有feed的历史存档?确定吗?
这个程序可以把Google reader开始抓取后的全部历史存档获取到,如果能够转换为更方便检索和查看的html的话,就更方便了。
alexrezit
2013-06-21 19:14:03 +08:00
@regent
我啥都不会... = =
LamProductionS
2013-06-21 19:16:41 +08:00
geekpark有提供相应的工具
ouankou
2013-06-21 19:20:45 +08:00
@LamProductionS geekpark只是针对官方导出的星标和共享文章吧,不支持自己单独导出的完整RSS记录。
laoyang945
2013-06-21 19:21:03 +08:00
@regent 其实我原来写过把这样导出的文章转换为wordpress的xml格式的脚本……
swulling
2013-06-21 19:29:08 +08:00
用随便什么RSS阅读器打开就行
regent
2013-06-21 19:53:22 +08:00
@ouankou 的确如此

@laoyang945 那就更好了,熟能生巧,造福群众,来一个转换html的脚本吧,要不你留个邮箱,我传送一份我下载的xml 给你看看?或者你可以用
http://live.aulddays.com/tech/13/google-reader-archive-download.htm 对应下载
https://github.com/Aulddays/GReader-Archive/archive/master.zip
解包后输入GR用户名密码即可开始备份,一般1分钟左右就能获取到第一个备份包

@LamProductionS 它们的有限制的,还不如直接用这个http://www.appinn.com/convertjson/ 本地转换,极客公园那个隐私政策不明,说”数据仅用于本项目用途“,懒得用
wswj
2013-06-21 20:09:23 +08:00
那啥,我把1024的下载了。
之前在性感玉米微博里看到过,发现能下载后赶紧拿马甲订阅了。。
wswj
2013-06-21 22:36:02 +08:00
继续求
manoon
2013-06-21 22:55:43 +08:00
我好像最近正在折腾python跟xml的东西。
如果可能的话,下周开始顺便把这个折腾一下。
思路如下:
A,python+bs 解析xml
B,入库 mysql或者sqllite
C,pyqt 数据库里面取东西出来,然后界面美化一下。

这是不是就可以了?
lzyland
2013-06-25 01:51:52 +08:00
https://pbs.twimg.com/media/BNhUkHMCIAATZan.jpg
GReader-Archive导出中断,哪位看下什么原因?对python不了解
wswj
2013-06-25 16:40:26 +08:00
@lzyland
手机没fq,看不到图。
上次见有人提过feed的名字有问题,比如空白名字或者奇怪的字符之类的。
还有就作者说的ip会暂时屏蔽,但我用ipv6下了一天都没遇到过

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/73068

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX