🙏🏻🙏🏻🙏🏻我是个小公司桌面运维,老板让我给他开发个 AI 大模型……

2024-08-20 11:04:02 +08:00
 oColtono
如题
我在一家非 IT 行业的公司干桌面运维,说是运维其实啥都干,简单的服务器运维、直播推流、摄影摄像等等。老板基本上是个技术盲,在他眼里,技术相关的问题我全知道。

他想要有一个 AI ,把一位哲学家(比较小众)的文集通读一遍(大概 40 万字)。然后扮演这位哲学家,充当聊天机器人。这个聊天机器人的用户量估计不会太高(小众圈子里面流传一下),最多也就 1000 人左右(并发可能就 30 人以内)。

我说我干不来,他表示让我至少给个方案,适当招两个人,或者找人外包都行。

从头搞个 AI 模型我猜是不可能的,我大概想法是租个云服务器,给 Llama 3 或类似的开源模型喂点数据,然后套个前端。

希望懂行的朋友告诉我一下我的想法是否可行?以及这个事情工作量大不大。如果可行的话,我就去着手研究一下怎样微调 Llama 3 ,然后给老板一个方案。
17811 次点击
所在节点    职场话题
119 条回复
BadFox
2024-08-20 11:05:58 +08:00
好炸裂的需求,更炸裂的是你居然真的想去干。
abersheeran
2024-08-20 11:06:05 +08:00
从技术上可以,从工作上来说我建议不要这么给老板说。把工作量说多一些,多要几个 HC 。
newaccount
2024-08-20 11:08:06 +08:00
先把硬件配上,4090 两块,一块放公司跑模型,一块放家里玩黑神话啊不是,一块在家里做技术研究
Solix
2024-08-20 11:08:22 +08:00
fastgpt 把文章传上去,然后写个 prompt ,然后给老板 gpt 的链接就行了
Huangzi7
2024-08-20 11:09:38 +08:00
@newaccount 今天请假,原因:🐒流感
zfyStars
2024-08-20 11:10:03 +08:00
是不是只需要写个 prompt ?
RiverMud
2024-08-20 11:11:59 +08:00
预算。

预算到位什么想法都可行。
whp1473
2024-08-20 11:12:45 +08:00
把书喂给 kimi ,然后让它扮演哲学家就可以了,不需要祖云服务器
HuberyPang
2024-08-20 11:13:18 +08:00
https://www.v2ex.com/t/1022439#reply81 感觉参考这个思路,就是把文集构建向量数据库,然后搞个开源大模型,或者购买个大模型 AI 接口 查询问题时,先查向量数据库,然后把结果给大模型,然后让大模型在回答。
idealhs
2024-08-20 11:13:58 +08:00
GPT 预设个角色就 OK 了,数据的话 OpenAI 已经学过了
qwertooo
2024-08-20 11:14:10 +08:00
《这个聊天机器人的用户量估计不会太高》

在国内做,有合规问题吧,别进去了
ETiV
2024-08-20 11:14:32 +08:00
我觉得上面配两块 4090 的建议靠谱些
fengshils
2024-08-20 11:20:44 +08:00
我也觉得上面配两块 4090 的建议靠谱些
oColtono
2024-08-20 11:24:24 +08:00
@frencis107 #11 谢谢提醒,这个我也跟老板说过了。老板头铁得很,好在这个圈子实在影响力有限,他之前搞的一些别的骚操作都没兴起什么风浪
最后要做的时候我会跟法务确认一下。如果确实有问题老板还要坚持做的话,我就让他自己去找外包了。
oColtono
2024-08-20 11:24:44 +08:00
@newaccount #3 hhh ,这事我也不是没想过
oColtono
2024-08-20 11:25:29 +08:00
@HuberyPang #9 谢谢!!这个看起来很接近我想要的东西了
oColtono
2024-08-20 11:29:07 +08:00
@whp1473 #8 考虑过,如果这样的话,工作量就几乎都在前端上了。还有一个担忧是,kimi 这类线上 AI 是否能够微调的程度有限,我怕多问几句,它就露馅了,比如自报家门说我是 kimi ,只是一个人工智能之类的?
weiaichongfeng
2024-08-20 11:45:05 +08:00
可以的这个实现思路没问题

老板不懂所以会说出让你开发个大模型,完成核心诉求就好,只是同时要拿到你自己想要的钱就更好

对于懂行的人来说,不算大,用户界面部份开源的部署一下就好,Llama 3 部署一下,一天之内就能搞定,喂数据麻烦点,但网上也有教程搜搜就行了

不懂行的挺麻烦的 工作量很大
https://ollama.com/
https://github.com/lobehub/lobe-chat
particlec
2024-08-20 11:47:37 +08:00
github 有现成的 ai 聊天前端界面,给 token 就行
aw2350
2024-08-20 11:49:05 +08:00
老板挺有追求的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1066362

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX