Glean 拾灵 - 一个自托管的 RSS 阅读器和个人知识管理工具

3 天前
 LeslieLeung

项目简介

Glean (拾灵)是一个自托管的 RSS 阅读器和个人知识管理工具。名字取自英文动词 glean ,意为“从大量信息中拾取精华”,中文名“拾灵”寓意“拾取灵感”。

作为一个信息重度消费者,我一直希望有一个工具能够帮助我高效地管理每天需要阅读的大量内容。我之前一直在使用 folo ,自从前段时间它变成了「正式版」,并且加入了怎么都关不掉的 AI 面板,我就很少再打开它,然后就传出了它裁员的消息。于是我着手开始 vibe 了一个我自己的 RSS 阅读器,搭配上我构思了很久的个人偏好系统。

项目地址: https://github.com/LeslieLeung/glean

目前已实现的功能

关于偏好系统

正好看到站内有个类似的讨论 https://v2ex.com/t/1180578 。Glean 实现了一个类似的东西,原理主要是这样:

  1. 文章向量化:每篇文章入库时,使用 Embedding 模型(如 OpenAI text-embedding-3-small 或本地部署的 qwen3-embedding-8b )将文章内容转换为向量,存储在 Milvus 向量数据库中。

  2. 用户偏好信号:用户可以对文章进行「喜欢」「不喜欢」或「收藏」操作,这些操作会触发偏好模型更新:

    • 喜欢:权重 +1.0
    • 不喜欢:权重 -1.0
    • 收藏:权重 +0.7
  3. 偏好向量计算:系统为每个用户维护两个偏好向量(正向偏好和负向偏好),使用加权移动平均的方式,将用户反馈过的文章向量融入偏好向量中。

  4. 推荐分数计算:当用户查看文章列表时,系统计算每篇文章的推荐分数:

    • 计算文章向量与用户正向/负向偏好向量的余弦相似度
    • 结合置信度因子(样本数越多置信度越高)
    • 叠加来源(订阅源)和作者的亲和度加成
    • 最终输出一个 0-100 的分数
  5. 智能排序:根据分数对未读文章进行排序,让用户更容易找到感兴趣的内容。

欢迎大家试用!

4896 次点击
所在节点    分享创造
4 条回复
skydiver
3 天前
名字和 glean.com 重了…
lekai63
2 天前
看起来蛮好的

就是既然已经向量化了,是否留个 AI 总结的按钮,方便用户快速看“摘要”
LeslieLeung
2 天前
@lekai63 后续会做一些 AI 相关的功能,还在构思,不希望有太多 AI 的功能喧宾夺主
deacyn
2 天前
还没有登录成功,但遇到两个问题:
1. 应用图标在 MacOS15.x 上显示过大
2. 注册时提示:Network Error

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1181005

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX