自己搭建一个私域 openai 可行么?

2023-04-05 12:44:55 +08:00
 justincnn
把自己的一些项目和知识放在里面,或者把感兴趣的数据不断喂投,慢慢的形成自己的,且保密的信息池
1973 次点击
所在节点    OpenAI
7 条回复
xmumiffy
2023-04-05 12:51:17 +08:00
zacharyjia
2023-04-05 13:08:16 +08:00
首先基于 OpenAI 的 API 必然是不行的,不满足你的**保密**要求。最近三星已经出了几次 ChatGPT 的泄密事件了。

不考虑保密,可以用 1 楼的方法。

考虑保密的话,需要自己部署私有的开源 LLM ,比如清华的 ChatGLM ,Meta 的 llama 等。两种模式:一种是参考现有的模式,对每次提问去搜索相似的文本语段,作为上下文提供给 LLM ,然后它根据上下文和问题进行回答;另一种是用你自己的数据对它进行 fine-tune ,让你的知识嵌入到模型当中。
iloveoovx
2023-04-05 13:12:57 +08:00
去看看微软怎么解决保密问题的
毕竟 2B 解决方案保密需求是第一要求
q307990588
2023-04-05 22:22:14 +08:00
怎么一直喂? gpt 最大的储存 token 不是有限的么,记住现在的,会把之前的遗忘吧
Fenix666
2023-04-06 10:28:22 +08:00
不考虑保密的话,用 fine-tune ,一楼的办法还是摆脱不了 token 限制,但 fine-tune 贵的一批
avenger
2023-04-07 15:04:22 +08:00
@Fenix666 fine-tune 测试了不可行,参考我的帖子
Fenix666
2023-04-08 15:19:53 +08:00
@avenger 对,embeddings 是成本最低办法,但缺点仍然很多,目前最明显的问题就是 1:token 限制,2:上下文对话里如果使用了代词之类的词,会出现匹配不准,这个我看 openai 论坛里有人提过,不知道怎么解决。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/929965

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX