也许是一个重复的轮子: V2EX 主题自助过滤和检视

2018-01-10 09:26:39 +08:00
 Aether
需求:
- 经常刷某个特定版面
- 只关心特别的关键字,比如 iOS、Android
- 不想刷界面,只想快速得到相关结果

实现:Python BeautifulSoup

代码:
https://gist.github.com/aetherwu/b9894721cc2a23167e7b0905ba3d8fdc

扫描关键字:上海

返回结果:
[求职 实习] [上海 杭州] Python Golang 后端 服务端 19 年毕业 求实习 求指点 - https://www.v2ex.com/t/421008#reply5
[社招-北京&上海&成都] [美团点评] ]分布式计算 / Java 开发 /架构专场 - https://www.v2ex.com/t/420972#reply3
更新了一遍简历。求一个 前端 /nodejs 的开发职位 [上海 /杭州 皆可,最好是上海]。 - https://www.v2ex.com/t/419762#reply6
八年开发老兵寻找远程工作机会 [上海 or 杭州 or 南京] - https://www.v2ex.com/t/419498#reply5
...
...

这里只是抛砖引玉,当然可以写成一个定时的爬虫加上储存,然后把新的主题发送到微信啥的(比如使用 SeverChan )……
1891 次点击
所在节点    分享创造
6 条回复
disposablexyz
2018-01-12 09:14:19 +08:00
这还不到 40 行代码,只能说鼓励一下,但下次就别拿出来了吧
Aether
2018-01-12 11:52:21 +08:00
@disposablexyz 我搜索过 v2ex,并没有找到类似的主题。大多数 v2exer 都比我聪明能干,但也许总能帮助到一些人。感谢你的鼓励。
kslr
2018-01-12 13:09:23 +08:00
@Aether #2 我觉得可以泛匹配一堆网站,这样就可以帮我很多忙了。
Aether
2018-01-12 13:16:41 +08:00
@kslr 匹配一堆网站是指,对很多网站的列表进行关键字监视么?
kslr
2018-01-12 13:25:04 +08:00
@Aether #4 比如针对某个网站的规则屏蔽某些标题 tr td 这样的 ( sis, 草榴什么的
Aether
2018-01-16 11:44:21 +08:00
@kslr 感觉这种时候你需要真·爬虫 https://segmentfault.com/a/1190000007360307

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/421574

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX