zisen
13 小时 27 分钟前
我稍微研究过这个 ai 知识库,以下是我的拙见:
这种公司内部 ai 一般是这个流程:
用户问问题:“2025 年第一季度盈利百分比”
大模型( deepseek 之类的)收到问题,将问题转化为更准确的关键词,然后去后台调用知识库,知识库返回搜索结果,然后大模型结合搜索结果和用户问题,进行回答
所谓知识库,就是输入一个关键词,返回搜索结果,本质上就是搜索引擎,如果你对搜索引擎比较熟悉的话,可以直接用搜索引擎来实现知识库
另一种比较流行的就是将所有文档全部转换为图片,然后 ocr ,之后向量化,你可以向量化模型对这些文本进行处理例如 text-embedding-bge-large-zh-v1.5 ,可以参考这篇博文 https://gameapp.club/post/2025-04-02-embedding-compare/
最后就是向量化的知识库需要的显存并不大,但是前端对话的大模型是需要大显存的,你可以搜一下主流大模型的显存和算力要求
最后一点,其实部署完发现不咋滴,不如直接最原始的文档搜索引擎去搜关键词然后找对应文档去看,这里的向量化知识库本质上只是加强版的搜索引擎,所以你可以使用大模型前端对话外加后端搜索引擎搜索文档文本内容
如果有说的不对的请评论区大佬指正