V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Kelly00
V2EX  ›  Google

gemini3 真有那么神吗

  •  
  •   Kelly00 · 9 小时 36 分钟前 · 1447 次点击

    最近这段时间在折腾 Gemini 3 ( Ultra / Flash 都试过),本来没想写帖子,但身边有好几个朋友问我“到底感觉怎样”,索性在 V2EX 上随便记录一下,纯个人视角,不代表任何结论,也没有立场。

    一、先说直观感受:速度比我预期快很多 我原来以为 Gemini 3 这样的大模型肯定会有点“重”,但实际用下来,响应速度比我想象得快得多。 尤其是 Flash 版本,看起来就是为了“能跑就跑”的需求设计的:

    • 反应快
    • 有时候比 4o mini 还灵敏
    • 简单任务(总结、改写、问答)非常顺滑 Ultra 3 则更像是用来“干活”的,复杂问题、推理类、代码类都比前代稳不少。

    二、代码能力我觉得是这代最大的进步 随便测试了几个我常用的场景:

    • 写小脚本(抓 API ,处理数据):可用
    • JS / TS / Node 抽象能力:明显增强
    • 让它改别人写得乱七八糟的代码:整理能力不错
    • 多文件结构的理解:比上代强
    • 看日志、分析报错信息:比较聪明,不会乱猜 以前 Gemini 代码的“幻觉”主要体现在喜欢搞一些不存在的函数,现在 3 代里这种情况少了不少。 (但依然不能完全信任它——毕竟没有一个模型可以。)

    三、语言风格变得更“自然”了 这个我还挺意外的。
Gemini 2 的时候,我总能感觉到它写出来的东西带一点“模板味”。
Gemini 3 在不少场景下的风格更像“真人写的”,尤其是:

    • 叙述类
    • 观点表达类
    • 讨论意见类 不会过度堆知识,也不会元认知式地解释“我作为一个 AI 模型……”。 这点对我这种用它写文案、写电商脚本的场景挺有帮助。

    四、图像理解能力也提升了,但仍不完美 对照片、UI 截图、文档图、手写稿的识别都比以前强。
尤其是:

    • 小字体
    • 拍歪了的纸张
    • 模糊一点的场景 都能“读懂”。 不过依然有三类容易翻车:
    1. 数字(比如金额、日期) — 偶尔会看错
    2. 图表 — 简单折线图可以,多层嵌套的会混乱
    3. 情绪类理解 — 它会猜,但不一定准 总体,我觉得是“能干活,但不能盲信”。

    五、最让我意外的一点:写视频脚本很强 我最近在折腾一些 AI 视频相关的东西(主要是广告脚本、短片脚本),Gemini 3 的 分镜、节奏、台词安排 比上代强太多。 如果你是:

    • 做短视频
    • 做广告脚本
    • 做产品展示 Gemini 3 给的结构通常比 GPT 那种“文学写法”更实用一点。

    六、一些我觉得还不够好的地方

    • 有时候会“过度自信”
    • 逻辑链条太长的时候会跳步骤
    • 代码解释里偶尔会重复内容
    • 看英文长文档依然比不上 Claude
    • 作为 API 调用还不够便宜(这是巨头通病)
    • 有些回答明明知道答案,却因为对齐策略“不肯说死”(这个我个人不是很喜欢) 但整体来说,属于可以真用的程度了。

    七、总结一句话:不是“颠覆”,但确实在往正确方向走 如果你问我: Gemini 3 值不值得用? 我的回答是:
如果你是做内容、做脚本、做代码、做分析——值得一试。
如果你只做基础问答、总结、翻译——区别没那么大。 它不是那种“惊天动地”的升级,但确实把几个最重要的基础能力都补齐了。 我感觉我们现在进入一个阶段:
大模型不是比谁聪明,而是比谁更稳定、更能干活、更好融入真实场景。 Gemini 3 很明显就是往这个方向走的。

    如果有人也在用,可以在下面说你们遇到的坑 or 好用的地方,大家一起交流一下。

    11 条回复    2025-11-21 00:37:26 +08:00
    tool2dx
        1
    tool2dx  
       9 小时 11 分钟前 via Android
    修传统代码 bug (非前端) ,side by side 对比,3.0pro 不如 2.5pro 。
    语言是 hp basic ,可能是训练集的关系,没覆盖到,但我还是觉得 2.5 pro 泛化能力更强。
    Feeli
        2
    Feeli  
       6 小时 47 分钟前
    感觉对这些 AI 有点怯魅了

    事前各种炒作,等上手了也就那么回事

    也就应用端有点意思
    Kelly00
        3
    Kelly00  
    OP
       6 小时 46 分钟前
    @Feeli ai coding 还是很惊艳我的😂,非程序员敲出月入万刀产品的比比皆是
    Feeli
        4
    Feeli  
       6 小时 39 分钟前
    @Kelly00 我的意思是没有当初那种惊艳的感觉了,感觉有点到顶了,现在基本都是在应用端布局了
    shoushen
        5
    shoushen  
       3 小时 40 分钟前
    @Kelly00 “非程序员敲出月入万刀产品的比比皆是”
    怎么可能,你以为全球这么多程序员都是 sb 吗?什么不懂的人,用 ai 随便搞搞能个产品,还能赚钱?怎么可能啊。
    bbbblue
        6
    bbbblue  
       3 小时 32 分钟前
    @shoushen 幸存者偏差+还有些是融资的诱饵弹😂
    maolon
        7
    maolon  
       3 小时 14 分钟前
    3.0 preview 现在模型本身肯定有点问题,指令遵循在 9w tokens 之后就开始失效了,他会开始自由发挥,
    大多数的评测和自己的测试都是短 context 测试,一个 case 一个 context 所以这种效应不明显,一旦进入大代码库的实际场景这种问题就会开始凸显,
    这也可以解释为什么现在各种评测显示 gemini3 最好的就是前端场景,因为就算他自由发挥了你也看不出大的问题(而且大部分这种测试都是从头构建的前端)
    const
        8
    const  
       2 小时 47 分钟前
    我对比了同样的数据分析/技术等问题,gemini 确实比 GPT 回答好很多,不管是准确性还是文本风格上。
    deep research 倒是 GPT 一直没输过
    Biem
        9
    Biem  
       1 小时 9 分钟前
    为什么我感觉这个帖子有点 GPT5.1 的味道
    usn
        10
    usn  
    PRO
       47 分钟前 via iPhone
    你知道发布 ai 内容再有人艾特 Livid ,之后你的号会被封禁吗
    usn
        11
    usn  
    PRO
       47 分钟前 via iPhone
    起码得标注下经过 ai 润色吧
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1183 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 17:24 · PVG 01:24 · LAX 09:24 · JFK 12:24
    ♥ Do have faith in what you're doing.