gemini_2.5_pro_preview_0506 让我头皮发麻

我也算是 AI 编程的重度用户了，之前用了各种的模型，包括 3.5,3.7 ，也是有比较深入的体验。
最近不是搞了个 cursor 的教育版么，然后试了了 gemini_2.5_pro_preview_0506 ，400 多行代码一气呵成，跑起来没有任何报错，代码逻辑完成，还有很多我都没有想到的处理。要是以前用 3.7 ，可能也得调试个几遍才能出来。
真的是让我头皮发麻了一会儿。

kneo

161 天前

头皮发麻可能是颈椎病的症状。适度使用 AI 。如果症状加重建议去三甲医院就诊。

murmurkerman

161 天前

感觉也不是特别好用，让他写 lsp 服务器还是只画了歌瓢，让他实现完整功能屡教不改，只写架子。

thinkm

161 天前

不太行，问它问题，它自动忽略我问题中的难点，然后用简单的组件实现。
提醒他之后就开始车轱辘话，不太好使

mumbler

161 天前

@murmurkerman #3 智商高，你瞧不起人能看出来的，那就糊弄你呗。保持基本礼貌，话说完整，不要省略和歧义，你再试试

akira

161 天前

不要高估也不要低估。遇到特定问题可能能处理的很好，遇到下个问题又降智，都是可能的。保持平常心就好了啦

Donahue

161 天前

确实非常强，LLM 能力进化速度超乎想象，这才 3 年时间，LLM 大爆发了。。。甚至还能理解图片。。

xljya

161 天前

我说怎么今天 gemini 变好用了，一看才发现升级到 0506 了，之前是 03

liyafe1997

161 天前

我也是 Cursor 重度用户，之前试过一下 Gemini 2.5 Pro ，不记得是哪个版本了（一个多月前试的，应该是 03 ），感觉比 Claude 3.7 & Thinking 差多了，之后就一直用 Claude 3.7 & Thinking

CuteGirl

161 天前

感觉主流语言都大差不差小众语言就很明显我使用 nim 明显感觉 Claude 比 Gemini 优秀

killadm

161 天前

@thinkm 难点 cursor 会乱写，gemini 会指出核心问题所在让你自己去查，并会祝你好运

当找到问题原因的时候感觉 ai 比我都高兴，一堆赞美和烟花，我甚至感觉被 AI 反向 PUA 了

LPJD

161 天前

问了后台表数据、程序设计、逻辑设计、性能优化相关的问题。gemini_2.5_pro 表现一般般，推理能力较弱，有种书呆子的感觉，没有考脑筋急转弯，就是它发现不了它给出的方案的逻辑不合理的地方。同样的问题问 Claude 3.7 ，Claude 会思考、分析、修正方案，gemini_2.5_pro 做不到，还是差了一点

SiLenceControL

161 天前

Grok3 也给我同样感觉，但是实验室怕泄密都不让用

xsen

161 天前

还是有坑，关键节点还是要打断 ai ，提供解决方案——上午给 go-zero 的 logx 编写 zincsearch 的日志后端，想加个 trace id 做简易的链路追踪，死活坑了半个多小时
最后还是自己把代码过一遍才解决。。

greygoo

160 天前

sonnet 3.7 >> gemini 2.5 pro 0506,至少在 Roo code 里面
gemini 2.5 pro 0506 输出的又多又毫无逻辑，我被它折腾了两天后乖乖用回了 3.7 ，常常不听话+固执，而且又很贵。不知道是 prompt 问题还是模型问题

Hyxiao

160 天前

我都是 gemini 2.5 pro 和 claude3.7 切着用，但是 gemini 2.5 pro 确实最近用起来感觉很舒服

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1131814

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.