gemini_2.5_pro_preview_0506 让我头皮发麻

112 天前
 2ruowqe9r
我也算是 AI 编程的重度用户了,之前用了各种的模型,包括 3.5,3.7 ,也是有比较深入的体验。
最近不是搞了个 cursor 的教育版么,然后试了了 gemini_2.5_pro_preview_0506 ,400 多行代码一气呵成,跑起来没有任何报错,代码逻辑完成,还有很多我都没有想到的处理。要是以前用 3.7 ,可能也得调试个几遍才能出来。
真的是让我头皮发麻了一会儿。
3716 次点击
所在节点    程序员
18 条回复
kneo
112 天前
头皮发麻可能是颈椎病的症状。适度使用 AI 。如果症状加重建议去三甲医院就诊。
YsHaNg
112 天前
要不就挠挠
murmurkerman
112 天前
感觉也不是特别好用,让他写 lsp 服务器还是只画了歌瓢,让他实现完整功能屡教不改,只写架子。
thinkm
112 天前
不太行,问它问题,它自动忽略我问题中的难点,然后用简单的组件实现。
提醒他之后就开始车轱辘话,不太好使
RicardoY
112 天前
要不就挠挠
mumbler
112 天前
@murmurkerman #3 智商高,你瞧不起人能看出来的,那就糊弄你呗。保持基本礼貌,话说完整,不要省略和歧义,你再试试
akira
112 天前
不要高估 也不要低估。 遇到特定问题可能能处理的很好,遇到下个问题又降智 ,都是可能的。保持平常心就好了啦
Donahue
112 天前
确实非常强,LLM 能力进化速度超乎想象,这才 3 年时间,LLM 大爆发了。。。甚至还能理解图片。。
xljya
112 天前
我说怎么今天 gemini 变好用了,一看才发现升级到 0506 了,之前是 03
liyafe1997
111 天前
我也是 Cursor 重度用户,之前试过一下 Gemini 2.5 Pro ,不记得是哪个版本了(一个多月前试的,应该是 03 ),感觉比 Claude 3.7 & Thinking 差多了,之后就一直用 Claude 3.7 & Thinking
CuteGirl
111 天前
感觉主流语言都大差不差 小众语言就很明显 我使用 nim 明显感觉 Claude 比 Gemini 优秀
killadm
111 天前
@thinkm 难点 cursor 会乱写,gemini 会指出核心问题所在让你自己去查,并会祝你好运
当找到问题原因的时候感觉 ai 比我都高兴,一堆赞美和烟花,我甚至感觉被 AI 反向 PUA 了
LPJD
111 天前
问了后台表数据、程序设计、逻辑设计、性能优化相关的问题。gemini_2.5_pro 表现一般般,推理能力较弱,有种书呆子的感觉,没有考脑筋急转弯,就是它发现不了它给出的方案的逻辑不合理的地方。同样的问题问 Claude 3.7 ,Claude 会思考、分析、修正方案,gemini_2.5_pro 做不到,还是差了一点
SiLenceControL
111 天前
Grok3 也给我同样感觉,但是实验室怕泄密都不让用
xsen
111 天前
还是有坑,关键节点还是要打断 ai ,提供解决方案——上午给 go-zero 的 logx 编写 zincsearch 的日志后端,想加个 trace id 做简易的链路追踪,死活坑了半个多小时
最后还是自己把代码过一遍才解决。。
greygoo
111 天前
sonnet 3.7 >> gemini 2.5 pro 0506,至少在 Roo code 里面
gemini 2.5 pro 0506 输出的又多又毫无逻辑,我被它折腾了两天后乖乖用回了 3.7 ,常常不听话+固执,而且又很贵。不知道是 prompt 问题还是模型问题
Hyxiao
111 天前
我都是 gemini 2.5 pro 和 claude3.7 切着用,但是 gemini 2.5 pro 确实最近用起来感觉很舒服
wxs5266318
111 天前
就问各位是不是比以前手敲快多了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1131814

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX