瞎扯大模型,文心一言和 kimi,应该押注哪一个?

2024-05-16 23:13:15 +08:00
 teli
只是瞎扯一下。
因为没掏钱,文心一言最新版本的能力,我不知道。
身边朋友认为 kimi 能力应该超过免费版的文心一言。
国内其它模型用得不多,如果觉得应该押注其它模型,也不妨说说你的见解。
押注哪一个,一方面考虑的是当下双方表现出来的能力,另一方面得做长远考虑(基础设施,一般都不愿意更换)。

再瞎扯一句,是不是应该开个大模型版块?
8170 次点击
所在节点    程序员
59 条回复
maolon
2024-05-17 09:39:10 +08:00
kimi 跟随人类指令的能力相当差,优势只在超长上下文。 文心没怎么用不评价。
国内外一起算的话 qwen 应该是国产最强模型。yi 就一魔改 llama ,没啥前景。
deepseek 还有待进一步观察他那个 MHL 是否在回答质量上优于 MHA
rahuahua
2024-05-17 09:39:48 +08:00
如果只是调用 api ,也不存在啥押注
ndd200
2024-05-17 09:40:16 +08:00
经过各种对比,在某些时候对中文语义的理解,百度的要强于 GPT 。
一些中文的问题,比如某些词语的解释,GPT 出错的概率比百度高。
DigitaIOcean
2024-05-17 09:43:18 +08:00
kimi 感觉免费/价格低 超长上下文
文心一言 要收费 什么都有,比较全
chatgpt 智商更高,贵
itskingname
2024-05-17 09:55:19 +08:00
如果你说对比通义千问和 kimi ,我还要真的考虑一下选谁。

但是你说对比文心一言和 kimi ,那还考虑啥,百度做的工业垃圾有可比性吗?肯定选 kimi 啊。
smalltong02
2024-05-17 09:58:07 +08:00
我蛮喜欢 Qwen 和 YI 模型的,它们为开源社区做出了很大贡献。
feirisu
2024-05-17 10:16:27 +08:00
代码都不行,经常调用某些类不存在的函数,也就早期 gpt3.5 的水平,中文理解可能略强一点
haikea
2024-05-17 10:19:25 +08:00
好比押注中超谁夺冠........我看都不想看的比赛
RealVic
2024-05-17 10:20:47 +08:00
Kimi 上下文感觉一般,经常搞不懂我说的话,但是总结文章还挺好,支持读取微博、公众号连接。
unco020511
2024-05-17 10:28:09 +08:00
你说的押注是指啥?买相应公司的股票?还是作为公司 ai 业务的底层模型?也没什么压不压的,一般都会有个 AI 网关,会同时接入多个模型 API,网关可以无缝切换各个模型,与业务无关.

要说好用,还得是 GPT
cxk0
2024-05-17 10:37:53 +08:00
他俩都比较弱。只是因为 Kimi 营销更胜一筹.
百度真的没有营销人才吗? 营销部门是成本部门咯?
redvoilin
2024-05-17 10:45:41 +08:00
文心一言最近没用过,不知道如何,kimi 最近用过,觉得挺垃圾的,完全营销出来的产品,过不了 1 、2 年可能就没了
sriram
2024-05-17 10:52:07 +08:00
deepseek,有自研的超级 MOE,采购基建项目便宜一定是压倒性的
CodeCodeStudy
2024-05-17 10:54:25 +08:00
智谱清言和百川大模型的比较好
rb6221
2024-05-17 10:55:04 +08:00
什么意思,你不能两个都押?
enderftt
2024-05-17 11:33:21 +08:00
我押海螺 ai
houzhiqiang
2024-05-17 11:45:19 +08:00
我选 deepseek
W4J1e
2024-05-17 12:36:46 +08:00
看到它这么回答,我仿佛是在用初代的文心一言和 chatGPT:
我:你怎么翻译“是故学然后知不足,教然后知困”
Kimi:"这句话出自中国古代思想家孔子的《论语》,原文是“是故学然后知不足,教然后知困”。这句话的意思是:通过学习,我们才能意识到自己的不足;通过教导他人,我们才能发现自己理解上的局限。"
PbCopy111
2024-05-17 13:04:52 +08:00
压智谱吧。
googlefans
2024-05-17 13:38:33 +08:00
现在国内好用的是阿里的千问,其他都不行,开始智谱还可以,最近被千问超过了。国内的我一直用千问。感觉对于处理中文还是需要国内的模型,国外的无疑 gpt 了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1041469

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX