gemini3 真有那么神吗

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

› Google Play

› Google Fi

› Google Developers Channel

› Google 全球透明度报告

› 9to5Google

最近这段时间在折腾 Gemini 3 （ Ultra / Flash 都试过），本来没想写帖子，但身边有好几个朋友问我“到底感觉怎样”，索性在 V2EX 上随便记录一下，纯个人视角，不代表任何结论，也没有立场。

一、先说直观感受：速度比我预期快很多我原来以为 Gemini 3 这样的大模型肯定会有点“重”，但实际用下来，响应速度比我想象得快得多。尤其是 Flash 版本，看起来就是为了“能跑就跑”的需求设计的：

反应快
有时候比 4o mini 还灵敏
简单任务（总结、改写、问答）非常顺滑 Ultra 3 则更像是用来“干活”的，复杂问题、推理类、代码类都比前代稳不少。

二、代码能力我觉得是这代最大的进步随便测试了几个我常用的场景：

写小脚本（抓 API ，处理数据）：可用
JS / TS / Node 抽象能力：明显增强
让它改别人写得乱七八糟的代码：整理能力不错
多文件结构的理解：比上代强
看日志、分析报错信息：比较聪明，不会乱猜以前 Gemini 代码的“幻觉”主要体现在喜欢搞一些不存在的函数，现在 3 代里这种情况少了不少。（但依然不能完全信任它——毕竟没有一个模型可以。）

三、语言风格变得更“自然”了这个我还挺意外的。 Gemini 2 的时候，我总能感觉到它写出来的东西带一点“模板味”。 Gemini 3 在不少场景下的风格更像“真人写的”，尤其是：

叙述类
观点表达类
讨论意见类不会过度堆知识，也不会元认知式地解释“我作为一个 AI 模型……”。这点对我这种用它写文案、写电商脚本的场景挺有帮助。

四、图像理解能力也提升了，但仍不完美对照片、UI 截图、文档图、手写稿的识别都比以前强。 尤其是：

小字体
拍歪了的纸张
模糊一点的场景都能“读懂”。不过依然有三类容易翻车：

数字（比如金额、日期） — 偶尔会看错
图表 — 简单折线图可以，多层嵌套的会混乱
情绪类理解 — 它会猜，但不一定准总体，我觉得是“能干活，但不能盲信”。

五、最让我意外的一点：写视频脚本很强我最近在折腾一些 AI 视频相关的东西（主要是广告脚本、短片脚本），Gemini 3 的分镜、节奏、台词安排比上代强太多。如果你是：

做短视频
做广告脚本
做产品展示 Gemini 3 给的结构通常比 GPT 那种“文学写法”更实用一点。

六、一些我觉得还不够好的地方

有时候会“过度自信”
逻辑链条太长的时候会跳步骤
代码解释里偶尔会重复内容
看英文长文档依然比不上 Claude
作为 API 调用还不够便宜（这是巨头通病）
有些回答明明知道答案，却因为对齐策略“不肯说死”（这个我个人不是很喜欢）但整体来说，属于可以真用的程度了。

七、总结一句话：不是“颠覆”，但确实在往正确方向走如果你问我： Gemini 3 值不值得用？我的回答是： 如果你是做内容、做脚本、做代码、做分析——值得一试。 如果你只做基础问答、总结、翻译——区别没那么大。它不是那种“惊天动地”的升级，但确实把几个最重要的基础能力都补齐了。我感觉我们现在进入一个阶段： 大模型不是比谁聪明，而是比谁更稳定、更能干活、更好融入真实场景。 Gemini 3 很明显就是往这个方向走的。

如果有人也在用，可以在下面说你们遇到的坑 or 好用的地方，大家一起交流一下。

Gemini3

速度

代码能力

11 条回复 • 2025-11-21 00:37:26 +08:00

tool2dx

9 小时 11 分钟前 via Android

修传统代码 bug （非前端），side by side 对比，3.0pro 不如 2.5pro 。
语言是 hp basic ，可能是训练集的关系，没覆盖到，但我还是觉得 2.5 pro 泛化能力更强。

Feeli

6 小时 47 分钟前

感觉对这些 AI 有点怯魅了

事前各种炒作，等上手了也就那么回事

也就应用端有点意思

Kelly00

6 小时 46 分钟前

@Feeli ai coding 还是很惊艳我的😂，非程序员敲出月入万刀产品的比比皆是

Feeli

6 小时 39 分钟前

@Kelly00 我的意思是没有当初那种惊艳的感觉了，感觉有点到顶了，现在基本都是在应用端布局了

shoushen

3 小时 40 分钟前

@Kelly00 “非程序员敲出月入万刀产品的比比皆是”
怎么可能，你以为全球这么多程序员都是 sb 吗？什么不懂的人，用 ai 随便搞搞能个产品，还能赚钱？怎么可能啊。

bbbblue

3 小时 32 分钟前

@shoushen 幸存者偏差+还有些是融资的诱饵弹😂

maolon

3 小时 14 分钟前

3.0 preview 现在模型本身肯定有点问题，指令遵循在 9w tokens 之后就开始失效了，他会开始自由发挥，
大多数的评测和自己的测试都是短 context 测试，一个 case 一个 context 所以这种效应不明显，一旦进入大代码库的实际场景这种问题就会开始凸显，
这也可以解释为什么现在各种评测显示 gemini3 最好的就是前端场景，因为就算他自由发挥了你也看不出大的问题（而且大部分这种测试都是从头构建的前端）

const

2 小时 47 分钟前

我对比了同样的数据分析/技术等问题，gemini 确实比 GPT 回答好很多，不管是准确性还是文本风格上。
deep research 倒是 GPT 一直没输过

Biem

1 小时 9 分钟前

为什么我感觉这个帖子有点 GPT5.1 的味道

usn

PRO

47 分钟前 via iPhone

你知道发布 ai 内容再有人艾特 Livid ，之后你的号会被封禁吗

usn

PRO

47 分钟前 via iPhone

起码得标注下经过 ai 润色吧