用开源模型折腾个知识库(RAG)有必要没?

21 小时 30 分钟前
 afkool
写代码。现在都是闭源模型一把梭。。遇到错误了总结个 skill 。反正也挺好用。
但是写鸿蒙这种就错误多一些,需要手动查文档之类的(虽然闭源也会差,但总感觉查准确率差一些),修起来费点时间。
有必要折腾个这种玩意嘛?
需求就是配合闭源的去完成工作。还是说继续闭源一把梭算了。。
1046 次点击
所在节点    程序员
12 条回复
whiteshh
21 小时 23 分钟前
没必要
cryptovae
21 小时 5 分钟前
没必要,
我是直接弄个 skill ,让模型帮总结成 md ,review 好后弄成博客
这些 md 直接弄给给模型当做知识库
目录加文件名就是天然的 RAG
frantic
19 小时 53 分钟前
参考下这个: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f 核心思路是文档数量不是特别多的场景下,用 LLM 来做
murmur
19 小时 49 分钟前
骗你的,鸿蒙文档也一堆坑,我遇到过,异步方法不说明,害得我调了好久才发现是文档没写明白
metaquant
19 小时 26 分钟前
知识库方面,感觉 ima 已经完全可以覆盖需求了,这篇文章挺有道理:

https://mp.weixin.qq.com/s/gjf5m6F_I6jI9mPvnm0SGg
hqgdyf
19 小时 12 分钟前
@metaquant 就是云端存储,后面如果有很合适的工具,迁移成本非常高。用过很多,目前是 obsidian+git 仓。就是需要自己整理,但是数据主权在自己手里。
YanSeven
19 小时 9 分钟前
@metaquant 云端的适合工作,公司的数据爱存哪存哪,私人的还是数据在自己这里好一点,obsidian+codex/cc 的组合也挺好的。
kuhung
19 小时 8 分钟前
没必要,这就跟写博客先折腾框架一样,本末倒置。折腾知识库不如倒逼自己输出,把自己搞成检索强人。
unco020511
19 小时 8 分钟前
如果是公开文档,一般使用 context7 就足矣,如果是自己私有的,那 notion 就天然支持支持库,为啥还要自己做
afkool
17 小时 58 分钟前
@kuhung 自从有了 AI 。脑子跟傻子一样。。Linux 命令都快忘光了。。擦。
Miary
16 小时 34 分钟前
我是本地弄了个 4B 的向量模型,然后把自己熟悉的技术栈的官方文档 git 到本地作为知识库,实际体验下来对 ai 并没有显著提升。
charliec
8 小时 50 分钟前
感觉没必要。文档直接做成 llms.txt 索引就好了,要不就都做成本地 markdown 。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1204576

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX