Feed DIY 开启全网订阅( RSS)

2017-02-20 09:52:34 +08:00
 sohoer
有点迫不及待的想跟大家分享这款基于鸟巢采集器的 RSS Feed 烧制工具( www.FeedDiy.com )。

在信息过载的今天, FeedDiy 可以全网监控并生成 RSS Feed ,

如监控人才热线上爬虫这个职位的更新 、各种电视剧的更新、更能监控各网站的新闻资讯更新。


FeedDiy 的特色功能:全文抓取、基于 Chrome 的 Javascript 支持

FeedDiy 的爬虫架构:



FeedDiy 演示视频:

http://video.newcrawler.com/feeddiy_v1.0.mp4


RSS 订阅效果( Inoreader ):










14927 次点击
所在节点    分享发现
91 条回复
sohoer
2017-02-20 21:33:29 +08:00
@fanghui 我就是这个版本,没问题啊!最好能具体说下什么问题,谢谢
sohoer
2017-02-20 21:34:10 +08:00
@zangbob 以后会考虑加上折扣功能
welsmann
2017-02-20 21:55:08 +08:00
试用了一下,简直 6 的不行...期待针对 V 站来个打折,一定会买
sohoer
2017-02-20 22:43:24 +08:00
@Mavious

第二个
http://www.feeddiy.com/rss/nUJVri

这两个网址都需要 Chrome 的支持,你可以注册账号试用

过段时间我会删除,每一个基于 Chrome 的抓取都是比较耗资源的
sohoer
2017-02-20 22:55:03 +08:00
@welsmann 好,可以先试用一段时间
autulin
2017-02-20 23:13:22 +08:00
用了,满足 ing...

向作者提需要改进的一个小细节,就是爬取出的 item 的顺序是反的,比如本来顺序是( 1 、 2 、 3 、 4 、 5 ), Feed 中的顺序则是( 5 、 4 、 3 、 2 、 1 )
sohoer
2017-02-20 23:31:34 +08:00
@autulin 确实是这样,对目前程序中的一些逻辑有冲突所以不是很好处理
fanghui
2017-02-21 00:32:11 +08:00
@sohoer 主要问题是没有 xpath 表达式显示在页面的左上角, [chrome 版本 56.0.2924.87 (64-bit)] 你可以看下截图,截图地址: https://pan.baidu.com/s/1ctf1Yu
lmusicwq
2017-02-21 00:37:31 +08:00
@Mavious #50 你可以看下 56 楼 binux 大大推荐的,可能需要补下一些 js 知识,不过应该不是特别难的。我 js 也没怎么学,试了下第一个 https://script.google.com/macros/s/AKfycbxnXuGbfbeJ7cKJFHiyYkM8ajJkcYzleiXAE0ro-YnuuE-3a4I/exec ,有兴趣试的话我的代码可以参考下 https://script.google.com/d/1BoghluAF8982Ku516FyPl11a8qEcsNC5OTyqanJNJhNd3IgZgnuyTqqu/edit?usp=sharing
sohoer
2017-02-21 00:46:42 +08:00
@fanghui 你把 Event 勾上了,这表示开启原网页的事件
suduo1987
2017-02-21 13:48:43 +08:00
我用 gas 没有搞不定的
tortoo
2017-03-03 20:04:08 +08:00
楼主我按照你的视频教程做出来一直有问题,这是我做的: http://www.feeddiy.com/rss/AB3Iru 。我按照顺序选择的,而且选择都 OK ,怎么最后标题丢了,正文成了标题,其他也很乱……我一共四个兴趣部落希望都能做成 rss 订阅,能够推送,能不能帮忙看下,告知问题在哪里
tortoo
2017-03-04 07:59:55 +08:00
@sohoer 忘了 @你了,我又新做了, http://www.feeddiy.com/rss/beEfmy ,但还是不尽满意,正文最底下显示的缩略部分,网页版 inoreader 显示为原始附件,链接点击跳转正常, iOS 版显示 image+简介文字链接,但链接调整都是 404 。另一个大问题是,我用 inoreader 和 reeder 同样订阅,但抓取的条目不一样,显示也不一样,比如 reeder 里显示正文,但不显示缩略和简介这部分。这该如何是好
sohoer
2017-03-06 23:54:05 +08:00
@tortoo #73


前天看到了留言刚好又在实现这个功能,就特意完成了再来回复,
你输入这个网址:
https://buluo.qq.com/p/barindex.html?bid=10247
选第一个再按 clone ,保存后再订阅到 inoreader
tortoo
2017-03-12 22:01:06 +08:00
@sohoer 你这个克隆的办法不错,哈,相当于代做😹。但还是不理想,比我做的改进的地方,是消息列表里的缩略图 OK 了,但有的正文丢了,比如《“限客令”能让学生正常的学习》这篇,我做的原文是 OK 的,乱但是不丢东西😹。唉,好像没有两全的办法……我的建议是, feeddiy 的优势很明显,结合了 distill 这种监控网页的做法,所见即所得,能实现绝大部分内容,但是需要代码微调这部分没有。要是能再结合 feed43 就好了,不过我试了 feed43 ,代码一直通不过,不知道是不是腾讯的网页代码太变态😹。我很看好你这个 diy ,如果能完善微调这部分,再结合即刻 APP 的订阅,几乎很完美
tortoo
2017-03-12 22:09:49 +08:00
@sohoer 我又翻了翻我第二次做的,有的也丢东西,比如《坚持就是胜利》和《武大, forever love 》这两篇,没有图片,正文有了,虽然变成了链接 404 的蓝字。这些都只能点标题进去原网页看全部
llhh
2017-03-31 17:58:25 +08:00
可以列出一些热门的资源出来。
ITOutsider
2017-04-21 15:34:38 +08:00
无法添加,左键一直是选择区域,右键是系统选项
sohoer
2017-04-21 15:37:12 +08:00
@ITOutsider #78 我操作是可以的,网址是什么呢?
ITOutsider
2017-04-21 15:44:20 +08:00
@sohoer http://chinese.engadget.com/

只有“ Google Home 現支援多人(帳號)語音辨識”这个最新的标题可以正常选择,其他文章标题就无法选择了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/341672

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX