感觉 Kimi tinking 吹的很厉害，使用起来差强人意

2025 年 11 月 8 日

fingerxie

一直以来都用 claude code ，今天听说 kimi thinking 很强，甚至高于 gpt5,我就去付费试了试。

试完以后的结论就是：

他的指令遵循能力很差，比如说我定义好的 claude.md ，对他而言没有作用。
代码能力还行，修改东西还算可以接受
工具运用能力不太行，明明要给我展示一段代码，但是用成了修改代码的工具，吓得我赶紧拒绝

这是我使用了一段时间的个人感受，不代表任何客观情况。

希望国产 AI 越做越好

6831 次点击

所在节点

程序员

40 条回复

ethanwan9

2025 年 11 月 8 日

差强人意: 表示大体上还可让人满意。

yanyuechuixue

2025 年 11 月 8 日

我昨天正好遇到一个 mathematica 画图代码需要从画一条线改成几条线画在一起，kimi 的表现并不如意。

ethanwan9

2025 年 11 月 8 日

另: Kimi Thinking

fingerxie

2025 年 11 月 8 日

@ethanwan9 客气一下而已。不好用

fingerxie

2025 年 11 月 8 日

@ethanwan9 拼写错了尬了～

daweii

2025 年 11 月 8 日

歪个楼，我现在每次看到“差强人意”我都要停下来想想这用对没🤔。

语言是活的，估计这个词很快就跟“空穴来风”一样，本来正确的意思是有根据，但是大家都在说明没有根据的时候用，最后反倒是错误用法占了上风成了主流意思。

netherder

2025 年 11 月 8 日

Claude.md 不是 claude 的配置吗你应该让他指定读取吧

5ssl

2025 年 11 月 8 日

用着好像还可以

Seck

2025 年 11 月 8 日

v2 不是刚冲进来好几个暗广吗？

一到实战就抓瞎，习惯了

Bantes

2025 年 11 月 8 日

TRAE 才搞笑。

fingerxie

2025 年 11 月 8 日

@lightmanlu 因为用的是 claude code ，只是 kimi 模型

Saniter

2025 年 11 月 8 日

@daweii 感觉现在大部分人还是知道差强人意的意思的，比如 op 就是表达原意。

之前用错的挺多，近几年好像纠正的差不多了

laminux29

2025 年 11 月 8 日

我自己感觉，

Kimi 就是比国内的 deepseek 与豆包差一点。

Google 的 Gemini 又比 GPT 、Grok 、Claude 差一点。

KingFong

2025 年 11 月 8 日

已经不敢在公开场合使用“差强人意”这个成语了。

tlerbao

2025 年 11 月 8 日

国产都是狗屎，我把话放这，包括 GLM4.6

Wenwener

2025 年 11 月 8 日

kimi 用了七百额度转 cc 之后很多 bug 一轮就能修好 kimi 改半天改不好

ysy950803

2025 年 11 月 8 日

考试高分的学霸，实操不一定最强，道理就是这么简单。我平时遇到编程难题时，都是各个 LLM 都试一遍，每次满意的可能并不是同一个模型。

gunner168

2025 年 11 月 8 日

@daweii 在我认知里，差强人意就是不太满意，通俗点就是不行

xing7673

2025 年 11 月 8 日

他的指令遵循能力很差，比如说我定义好的 claude.md ，对他而言没有作用。
这里指的是它完全忽略了规则，还是说它有看到规则但是没有按照规则去执行？
这种情况我之前在 grok fast 那个模型上也看到过
感觉模型对应用环境不敏感

looplj

2025 年 11 月 8 日

可以看下是不是开了 thinking 模式，thinking 是要单独开的，不开好像不走 thinking 。
和 MimiMax-M2 不一样，M2 是一定会 thinking 的。

第 1 页／共 2 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1171379

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.