Gemini 3 Pro 这么牛吗

51 天前
 iflint

看起来各项数据都遥遥领先啊

10172 次点击
所在节点    Google
42 条回复
wsseo
51 天前
领先 50%
jamos
51 天前
在哪试用
Q980q48Jgj6pRXoO
51 天前
数值怪,智商比 chatgpt 高,但情商还不够,不会有追问
street000
51 天前
感觉大模型 benchmark 参考价值很低了,多少分全靠 ai 公司自觉,grok 和 claude 就是两个对立的例子。目前用下来问了一些非技术性的问题,感觉就是常规升级,问题还不少。知识库太旧不说,幻觉问题感觉比 2.5 pro 严重,问个 2.5 pro 都在那信誓旦旦说没有这个模型,最新的 gemini 是 1.5 pro ,问 2.5 pro 至少它会还会先联网查。长上下文性能有人说也有问题,退化速度很快,超过 100k 几乎没法用了。
charmToby
51 天前
@jamos https://aistudio.google.com/prompts/new_chat?model=gemini-3-pro-preview
我在这里测试的,感觉很强,生成的代码一次成功
Nanosk
51 天前
@street000 确实 问他 coding 最强的模型给我蹦出来 gpt4o 和 sonnet3.5 ,让他联网查第一回查出来个 o1 ,第二回才正确
jhdxr
51 天前
强是强,2.5 刚发布的时候也很强,openai 自己对 GPT5 发布时的测评也很强。但这和你能用到的不是一个版本。算力不够就降智这手段各家都玩了多久了。。。
YanSeven
51 天前
子弹飞一会儿,大伙儿测测就知道了。LLM 有一个好处,就是它在部分领域真的算是落地了,可以直接体验测评,不是光看报告了。
stimw
51 天前
不要看 benchmark ,有参考性,但不高。
nakun233
51 天前
@usn 我试着问一下情商超高,还自认 EVA 老粉
Seck
51 天前


看到这个数据,说实话,我有点怀疑他作假,所有数据,只有一项是输的

我知道不能单纯参考榜单,但是所有分数.....,人都麻了

话说:V 站是不是该开个 AI 节点 ?
Moishine
51 天前
cursor 里面已经有了啊
wniming
51 天前
Gemini 3 Pro 吊打 gpt5 ,刚刚我问了这俩同一个问题,关于 tmux 的:

set -g status-keys vi

and

set -g status-keys emacs


What's the difference?


结果 gpt5 废话连篇,我追问好几次都没给我解释明白,浪费我十几分钟时间,然后又问了一下 Gemini 3 Pro ,结果一下就给我讲明白了,Gemini 3 Pro 给出了最关键的信息:

How it works: You start in Insert Mode (typing normally). To navigate or edit what you typed, you must hit ESC to enter Command Mode.

gpt5 根本就不知道要按 esc 键才能使用 vim 的移动光标的快捷键。

因为 chatgpt 吐词速度比较快,刚问问题就立即开始输出结果,而 gemini 要等到有结果了才一次性输出,所以我一般习惯先问 chatgpt ,但是我觉得以后较为复杂问题还是不要问 chatgpt 了,比 gemini 差太多了。
moefishtang
51 天前
@Seck 倒是有 OpenAI 节点,感觉不太够用了😑
pipi32167
51 天前
Benchmark dataset is all you need!
iden
51 天前
闭源模型(实际上是 api )的 benchmark 分数基本全看厂商自觉,参考性远没有开源模型强。

开源模型可以监督是否在测试集上做了训练。
ao99
51 天前
SWE benchmark 只追平 sonnet 4.5 ,对 vibe coding 帮助不大啊,可能设计样式上有些帮助
songco
51 天前
@Seck MathArena Apex 这么高

厉害了
kursk
51 天前
我感觉非常强,我问了一个有关电机学的问题

我在学习《电机学》中变压器章节,对文中这段文字有疑问:

"漏磁通在一次侧绕组中感应电势,加到由互磁通产生的感应电势上"

漏磁通名称中之所以有“漏”字,就是因为它没有经过绕组,何谈在“一次侧绕组中感应电势”?

Gemini 3.0 回答非常准备,尤其是下面这段文字

漏磁通 (Leakage Flux, $\Phi_l$):它是由该绕组自身的电流产生的。它的“漏”是指:它只穿过产生它的那个绕组(比如 $\Phi_{l1}$ 只穿过一次侧绕组 $W_1$),但没有穿过另一个绕组(二次侧绕组 $W_2$)。

完全针对我提出的问题,而且我问题还提交了图片,这种图文结合提问方式经常遇到,Gemini 3.0 完全理解了图片和文字,我感觉它完全铺平了学习中的困惑

另外,我本人是搞 IT 的,学习电力知识也是为了工作,里面有大量的公式,原来觉得很难,但是在 AI 的帮助下很多学习困难都可以高效解决
iflint
51 天前
@kursk 确实是最好的老师 当年上大学要是有这么个好东西就好了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1173713

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX