V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Triump
V2EX  ›  程序员

实现一个企业内部知识库的问答机器人

  •  
  •   Triump · 115 天前 · 2484 次点击
    这是一个创建于 115 天前的主题,其中的信息可能已经有所发展或是发生改变。

    需求

    如题,准备一个企业内部问题的知识库,做一个聊天机器人,回答的问题都是知识库相关的。
    

    实现思路

    思路 1:借助一些开源的支持私有部署的 chatGPT

    这个开源项目支持聊天功能,并且也支持 API 调用,这样就更容易实现第三方集成,但是缺点是:目前不支持导入自己的知识库。

    这个开源项目是我刚发现的,而且是国产的。具体能否实现还没去研究。

    思路 2:使用分词技术

    找一些分析工具,将用户输入的问题进行分词匹配,但是这有可能会匹配到多条回答,如何找出最优的回答呢?

    各位路过的大佬,有好的思路或好的开源工具欢迎一起讨论一下

    7 条回复    2024-01-03 18:30:47 +08:00
    HanSonJ
        1
    HanSonJ  
       115 天前
    也可以用现成的服务,例如讯飞。

    知识库就不是通过分词来匹配了,匹配多个也会有相关度,不是你想要的就是知识库不够庞大。
    infun
        2
    infun  
       115 天前
    给你一点提示: 向量数据库 + GPT
    4rat
        3
    4rat  
       115 天前
    已经做完了,用的 fastgpt + ChatGLM3
    https://github.com/labring/FastGPT
    kevinmissu
        4
    kevinmissu  
       115 天前
    @4rat
    daxin945
        5
    daxin945  
       115 天前
    我用的这个 CPU 模式 做知识库效果还可以
    https://github.com/chatchat-space/Langchain-Chatchat/wiki/
    anubu
        6
    anubu  
       115 天前
    前台项目主要有 FastGPT 和 langchain-chatchat ,基本都能开箱即用。FastGPT 完成度更高一些,但商业考量也多一些。进一步调优可能还是要看底层框架,langchain 、llama-index 等。有能力的话自己拿框架搓一个前台也可以。

    模型还是看算力看规模,知识库类的一般要求不高。企业内部可能要自部署模型,chatglm3 、千问都可以,千问似乎更好一些。

    关键词:RAG

    真正落地能用还是要了解 RAG 应用的基本架构,各个流程节点也有很多优化措施值得摸索。
    Wyearn
        7
    Wyearn  
       115 天前
    我这边也再想搞这个,我们写了很多 FAQ 文档,一直无法落地,大部分人都习惯直接当面去问,很少去看 FAQ 或者相关文档,但是我看了一下准备的硬件资源得需要一定费用,估计你这个得跟老板或者上级领导好好沟通了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3257 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 00:46 · PVG 08:46 · LAX 17:46 · JFK 20:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.