感觉 Kimi tinking 吹的很厉害,使用起来差强人意

49 天前
 fingerxie

一直以来都用 claude code ,今天听说 kimi thinking 很强,甚至高于 gpt5,我就去付费试了试。

试完以后的结论就是:

  1. 他的指令遵循能力很差,比如说我定义好的 claude.md ,对他而言没有作用。
  2. 代码能力还行,修改东西还算可以接受
  3. 工具运用能力不太行,明明要给我展示一段代码,但是用成了修改代码的工具,吓得我赶紧拒绝

这是我使用了一段时间的个人感受,不代表任何客观情况。

希望国产 AI 越做越好

6058 次点击
所在节点    程序员
40 条回复
ethanwan9
49 天前
差强人意: 表示大体上还可让人满意。
yanyuechuixue
49 天前
我昨天正好遇到一个 mathematica 画图代码需要从画一条线改成几条线画在一起,kimi 的表现并不如意。
ethanwan9
49 天前
另: Kimi Thinking
fingerxie
49 天前
@ethanwan9 客气一下而已。不好用
fingerxie
49 天前
@ethanwan9 拼写错了 尬了~
daweii
49 天前
歪个楼,我现在每次看到“差强人意”我都要停下来想想这用对没🤔。

语言是活的,估计这个词很快就跟“空穴来风”一样,本来正确的意思是有根据,但是大家都在说明没有根据的时候用,最后反倒是错误用法占了上风成了主流意思。
netherder
49 天前
Claude.md 不是 claude 的配置吗 你应该让他指定读取吧
5ssl
49 天前
用着好像还可以
Seck
49 天前
v2 不是刚冲进来好几个暗广吗?

一到实战就抓瞎,习惯了
Bantes
49 天前
TRAE 才搞笑。
fingerxie
49 天前
@lightmanlu 因为用的是 claude code ,只是 kimi 模型
Saniter
49 天前
@daweii 感觉现在大部分人还是知道差强人意的意思的,比如 op 就是表达原意。

之前用错的挺多,近几年好像纠正的差不多了
laminux29
49 天前
我自己感觉,

Kimi 就是比国内的 deepseek 与 豆包 差一点。

Google 的 Gemini 又比 GPT 、Grok 、Claude 差一点。
KingFong
49 天前
已经不敢在公开场合使用“差强人意”这个成语了。
tlerbao
49 天前
国产都是狗屎,我把话放这 ,包括 GLM4.6
Wenwener
49 天前
kimi 用了七百额度 转 cc 之后 很多 bug 一轮就能修好 kimi 改半天改不好
ysy950803
49 天前
考试高分的学霸,实操不一定最强,道理就是这么简单。我平时遇到编程难题时,都是各个 LLM 都试一遍,每次满意的可能并不是同一个模型。
gunner168
49 天前
@daweii 在我认知里,差强人意就是不太满意,通俗点就是不行
xing7673
49 天前
他的指令遵循能力很差,比如说我定义好的 claude.md ,对他而言没有作用。
这里指的是它完全忽略了规则,还是说它有看到规则但是没有按照规则去执行?
这种情况我之前在 grok fast 那个模型上也看到过
感觉模型对应用环境不敏感
looplj
49 天前
可以看下是不是开了 thinking 模式,thinking 是要单独开的,不开好像不走 thinking 。
和 MimiMax-M2 不一样,M2 是一定会 thinking 的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1171379

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX