有没有使用 Feed43+Yahoo pipes+feedly 来监测无 RSS 的网页的朋友,最近遇到一些问题

2015-05-17 14:22:45 +08:00
 Gandum

最近使用Feed43+Yahoo pipes+feedly来监测无RSS的网页,出现了Feedly中不显示文章内容的现象。
例如用feed43为轻之国度-最近更新轻小说生成一个RSS地址
然后把它放到Yahoo pipes里面去抓取全文,得到一个新的RSS地址
这个RSS地址无论是订阅到The Old Reader,还是Inoreader,还是Newsblur,还是用浏览器直接打开查看xml文件,都是成功的,都可以看到全文。唯独Feedly会失败,变成这样:

这个问题还有如下特点:
- 如果是本来就有Rss源的网站,经过Yahoo Pipes抓取全文后,基本上不会出现在Feedly中无法看到内容的情况(但部分文章也会出现)。而我用的抓取全文的方法都是一模一样的,应该不是方法差异造成的。
- 经测试,订阅到The Old Reader,Inoreader,Newsblur均无问题。
- 不只是我一个人遇到问题,在Yahoo的论坛上发现了一篇贴子,上面有部分人也遇到这个问题。
附上相关Yahoo Pipes:
希望各位能够教教我如何修改Yahoo Pipes使得Feedly可以接受。因为手机上最习惯的Newsify只能和Feedly同步啊,而且Feedly的saved for later还不能导出。

2994 次点击
所在节点    问与答
13 条回复
Gandum
2015-05-17 17:20:31 +08:00
没人?
yeyeye
2015-05-17 22:52:43 +08:00
以前用pipes生成过全文rss 好像没什么问题 因为是长期用feedly的 所以基本肯定以前是没问题的 后来那些源的配置我没更新 现在也就没有了。

目测了一下 pipes输出的全文部分似乎有点不太规范,正常情况下有<>之类符号的内容是要用<![CDATA[包起来的。

要不你自己在内容里面加入这个标签包起来试试??
Gandum
2015-05-17 23:52:52 +08:00
@yeyeye Yahoo Pipes的做法是把description的内容全部url编码,而且对于本来就有Rss源的网站,经过Yahoo Pipes抓取全文后输出到Feedly里面就没有问题,只是Feed43的才有问题,很奇怪
yeyeye
2015-05-18 00:01:50 +08:00
@Gandum 直接pipes做rss和全文嘛,不经过feed43不是很好么
Gandum
2015-05-18 00:14:25 +08:00
@yeyeye 原来还可以这样啊,求教一下怎么操作?应该用哪一个可以用来生成RSS?貌似我使用的教程有些过时啊
caomu
2015-05-18 05:01:10 +08:00
feedly的兼容性问题。。。用feedburner重烧可能能改善。。。

尝试一下把item.description来个rename/copy as成content:encoded。
dz225
2015-05-18 09:46:29 +08:00
@Gandum 直接 xpath fetch page - loop - rss item build
Gandum
2015-05-18 18:34:24 +08:00
@caomu 完美解决方案,多谢!
yeyeye
2015-05-18 23:59:21 +08:00
@Gandum http://pipes.yahoo.com/pipes/pipe.info?_id=0266e168710054b6c147ce7ae1d556be

无RSS列表网页,生成RSS并抓取全文。

虽然被抓的网页已经不可用,但是你克隆过去很容易就理解如何做全套了。

这个好处就在于不用再依赖其他第三方了。
Gandum
2015-05-19 21:16:38 +08:00
@yeyeye 多谢,我试了一下,不过貌似Yahoo抓取次数过于频繁,许多Feed43能够正常生成RSS的网站直接Ban了Yahoo,返回403
yeyeye
2015-05-19 23:59:00 +08:00
@Gandum 是我我也ban掉,你是不知道看着那服务器日志 一秒钟都不间隔直接读取几十个我的页面 (获取每个item网址的全文的时候) 不全文的话频率还好的 会缓存一定时间
Gandum
2015-05-20 16:32:57 +08:00
@yeyeye 主要还是Yahoo在国内没人用,要是出个Baidu Pipes,看谁敢ban了(不过Baidu会出这样的产品吗)
yeyeye
2015-05-20 17:26:18 +08:00
@Gandum 这类不花钱的服务,盈利是个问题,比如IFTTT……你说能靠啥赚钱,规则设置好就再也不去了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/191690

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX