BraveXaiver
V2EX  ›  问与答

RAG 的主流用法似乎是客服机器人 & 公司文档库。这套用法可以用来“这是我喜欢的文风,你帮我按这种文风情节写小说”吗?

  •  
  •   BraveXaiver · Apr 13, 2025 · 1820 views
    This topic created in 416 days ago, the information mentioned may be changed or developed.
    另外我本地用 ollama 装了 embding 和 postgresql 用作向量数据库,但 chat API 仍然是用的在线的 API ,有点好奇到底发生了什么线上的那个 API 知道了我本地的向量数据。

    谢谢
    6 replies    2025-04-14 12:04:03 +08:00
    akira
        1
    akira  
       Apr 13, 2025
    1. 先去知识库(向量数据库)获取你要的信息
    2. 把获取到的信息和你的问题 一起丢给 LLM
    akira
        2
    akira  
       Apr 13, 2025   ❤️ 1
    抱歉回车按错了。
    3. 所以 llm 那边不管是在哪,自然都能获得你本地向量数据库的信息了。
    BraveXaiver
        3
    BraveXaiver  
    OP
       Apr 13, 2025
    @akira #2 那合着每次调用 chat AI 时都程序都有大量上下文跟过去呗。。
    mumbler
        4
    mumbler  
       Apr 13, 2025
    是你的客户端把向量库检索结果和问题一起发给在线 API 的
    ZeroClover
        5
    ZeroClover  
       Apr 14, 2025   ❤️ 2
    RAG 并不适合创造性的工作,相反大部分 RAG 是在试图严格限制 AI 的创造性来避免产生幻觉。

    而且,丢过去一堆内容并不能让 AI 真正理解你希望的「文风」到底是什么,用 RAG 的手段更是会让 AI 直接偷懒从知识库里面复制粘贴

    要让 AI 的输出贴近某种风格正确的方法是微调
    lisxour
        6
    lisxour  
       Apr 14, 2025
    最近也在研究这玩意,就不能自己用一堆的小说炼出一个专门的 ai ?网上搜一堆资料也没这方面的知识
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1188 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 17:44 · PVG 01:44 · LAX 10:44 · JFK 13:44
    ♥ Do have faith in what you're doing.