我用来测试 AI 准确度的问题:「SNES 游戏宇宙巡航机的英文名是?」

1 月 31 日
 Livid

这个问题甚至 Sonnet 4.5 都会答错。

如果是用其他 Local LLM ,会得到更离谱的瞎编答案。

1499 次点击
所在节点    Claude
9 条回复
incubus
1 月 31 日
你会不会骗别人粘贴大模型的回复然后给封号[狗头]
xuromky
1 月 31 日
这是正确的答案吗
Livid
1 月 31 日
@xuromky Gradius III 是正确答案。
sgt
1 月 31 日
随手用 gemini3pro 测了一下,得到正确答案
@Livid
Tink
1 月 31 日
开启思考模式试了一下手边的几个 AI , 基本都 OK



Kudos
1 月 31 日
rayyume
1 月 31 日

openclaw + google-gemini-cli/gemini-3-pro-preview 回答正确
wwhc
1 月 31 日
本地部署的 Qwen3-next-80b 可以回答出是 Gradius III
Silent7Wang
1 月 31 日
deepseek 没开搜索也答出来了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1189682

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX