用开源模型折腾个知识库（RAG)有必要没？

写代码。现在都是闭源模型一把梭。。遇到错误了总结个 skill 。反正也挺好用。
但是写鸿蒙这种就错误多一些，需要手动查文档之类的（虽然闭源也会差，但总感觉查准确率差一些），修起来费点时间。
有必要折腾个这种玩意嘛？
需求就是配合闭源的去完成工作。还是说继续闭源一把梭算了。。

cryptovae

4 月 9 日

没必要，
我是直接弄个 skill ，让模型帮总结成 md ，review 好后弄成博客
这些 md 直接弄给给模型当做知识库
目录加文件名就是天然的 RAG

frantic

4 月 9 日

参考下这个: https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f 核心思路是文档数量不是特别多的场景下，用 LLM 来做

murmur

4 月 9 日

骗你的，鸿蒙文档也一堆坑，我遇到过，异步方法不说明，害得我调了好久才发现是文档没写明白

metaquant

4 月 9 日

知识库方面，感觉 ima 已经完全可以覆盖需求了，这篇文章挺有道理：

https://mp.weixin.qq.com/s/gjf5m6F_I6jI9mPvnm0SGg

hqgdyf

4 月 9 日

@metaquant 就是云端存储，后面如果有很合适的工具，迁移成本非常高。用过很多，目前是 obsidian+git 仓。就是需要自己整理，但是数据主权在自己手里。

YanSeven

4 月 9 日

@metaquant 云端的适合工作，公司的数据爱存哪存哪，私人的还是数据在自己这里好一点，obsidian+codex/cc 的组合也挺好的。

kuhung

4 月 9 日

没必要，这就跟写博客先折腾框架一样，本末倒置。折腾知识库不如倒逼自己输出，把自己搞成检索强人。

unco020511

4 月 9 日

如果是公开文档,一般使用 context7 就足矣,如果是自己私有的,那 notion 就天然支持支持库,为啥还要自己做

afkool

4 月 9 日

@kuhung 自从有了 AI 。脑子跟傻子一样。。Linux 命令都快忘光了。。擦。

Miary

4 月 9 日

我是本地弄了个 4B 的向量模型，然后把自己熟悉的技术栈的官方文档 git 到本地作为知识库，实际体验下来对 ai 并没有显著提升。

charliec

4 月 10 日

感觉没必要。文档直接做成 llms.txt 索引就好了，要不就都做成本地 markdown 。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.