chatgpt 出来这么久了,看到的都是卖号,或者直接用 api 开发个啥,就没人想微调,针对垂直行业做定制化的 chatgpt?

2023-04-03 22:34:57 +08:00
 diehe

据我对各行各业的观察,这个需求其实很大的。

最好是,把整个微调过程,做成无需写代码的方式。 让他们只要简单上传,自己行业的专业数据资料,就能得到一个全能的二十四小时在线的行业专家。

并且这个本行业的 chatgpt 还可以做成 api 形式,对外收费。岂不美哉? 当然这是后话!

有懂这方面技术的大佬,愿意一起来弄这个事么?

16633 次点击
所在节点    程序员
109 条回复
randyo
2023-04-04 10:05:39 +08:00
不怕数据泄露可以上传
diehe
2023-04-04 10:14:34 +08:00
大佬,虽然技术方面我可能不如你,但是显卡,我还是懂滴,你去闲鱼搜下:叠鹤倒显卡 看看!
a100 说是禁运,其实随便买。我搞显卡的,经常在国外竞拍显卡,大量 a100 ,可以随便拍,只是目前国内,没这么多能消化。或者说,中间的倒爷赚太多了,导致也没什么人想去搞专业卡。比如最近一批 a100 ,80G 的,全新的,国内做专业卡的给我报价七万五一张,而人家竞拍就是九万起,怎么玩?
diehe
2023-04-04 10:16:53 +08:00
@Lanceliel 可能你说的对。行业专业数据资料,这个可能更难!
diehe
2023-04-04 10:19:02 +08:00
@AeroXi 这个玩意,我试玩了很多,感觉都不咋滴,比如:chatthing.ai chatpdf.com
diehe
2023-04-04 10:20:12 +08:00
@vsitebon 难怪了
diehe
2023-04-04 10:21:00 +08:00
@zapper 我有钱啊+有显卡啊,够了不?
Jungeer
2023-04-04 10:39:41 +08:00
怎样微调 带带弟弟
karatsuba
2023-04-04 10:43:10 +08:00
你指的是 embedding ? 早就有人做了,而且为了数据安全不可能用你的东西的
tomari
2023-04-04 10:44:37 +08:00
有的,微软自己就做了很多啊,针对 bing 的 chatgpt ( new bing ),针对 office 的 chatgpt ,针对 teams 的 chatgpt ,等等。
ggcver
2023-04-04 10:53:59 +08:00
怎么会没有...
sft,rlhf,rm ,都一直在复现和做垂类。我有朋友都做出场景下微调后的效果了,我也在做
你有显卡?可以互补一下资源?
diehe
2023-04-04 10:54:41 +08:00
@karatsuba 给企业做私人制定
byron
2023-04-04 10:56:16 +08:00
perfectar
2023-04-04 11:03:01 +08:00
这块未来肯定需求很多,但是现在 OpenAI 成 closeAI 了,所以国内的一帮 ToB 的都是在摸着石头过河,我们自己也在做垂直领域的迁移适配,难度挺大的。
pkoukk
2023-04-04 11:12:17 +08:00
gpt 已经是面向个人消费者的终端产品了,就像手机一样,你说手机没用么?非常有用
但是哪个工厂舍得拿手机当生成工具呢?他们的大部分场景就需要一个可触摸平板点点极其有限的内容即可
手机的通用处理能力他们完全用不上,他们也不愿意为这些用不上的功能付费

另外,垂直领域的“AI”其实不成立,就像 SASS 喊了那么多年也做不成,因为即使是同行业每家的玩法也不同,还是得定制开发。那垂直领域的“AI”怎么训练呢?不同的公司对同一规则的处理流程可能是完全相反的,适配到了最后还是硬编码...
6i3BMhWCpKaXhqQi
2023-04-04 11:14:34 +08:00
@diehe 有钱有显卡太可以了,绝对的大佬。
能好奇的问一下吗?有多少?
diehe
2023-04-04 11:20:18 +08:00
@pkoukk 你这么一说,好像有道理。但是现在企业的数据很多都是机密,不可能直接喂给 chatgpt 。
你说,有没有可能,用他开源的前几个版本,搭建一个私有的,然后投喂自己的数据。这样避免数据泄露,同时能满足自己的需求。

把这整个过程,做成一个软件,在客户本地安装,数据什么的也都在本地。

然后跟 erp 软件一样,按年收费。
milukun
2023-04-04 11:30:17 +08:00
微调会有,但是是 openai 选择与你合作,而不是你选择和 openai 合作
这种企业级的合作,比如和老东家微软的 bing 合作
其他的目前还没有看到,但肯定不是申请个 api 或者网上填个表格就开始的这么简单的事情哦
dudubaba
2023-04-04 11:42:26 +08:00
有人用代理二次封装,然后充值供国内用户调用,赚麻了好吗,日进万金都是小 case
garlics
2023-04-04 11:45:06 +08:00
有比较浅显的应用:
周报生成器
打拳小作文生成器等
pkoukk
2023-04-04 11:58:56 +08:00
@diehe 不能的,从目前的成果来看,AI 的智能程度和训练数据集的大小存在极大的关联。
你可以假想他就是个人,一个人起码要经历九年义务教育,才能做一个符合社会要求的工人。
你只给 AI 喂垂直数据,而且是离散度不高的,重复性很强的数据,它会表现的非常智障,它很难理解你说的话的含义。
我曾经做过一些 AI 和模型的工作,范围小,规则强的东西还是写代码最高效、而且更可控。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/929554

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX