感觉 Cursor 解决复杂一点的编程问题还很弱

171 天前
 monosolo1on1

比如我让它实现一个算法解决这个问题:
有 N 个视频章节,总时长是 D 。分成 D // 3600 组,每组必须是相邻的连续章节且时长尽可能接近。

写倒是很快写出来了,很快啊,几秒钟。
然后我问它,“我没看你的代码,仔细检查一下是否有问题”,就开始鬼打墙了:

感觉也就在背 API 接口、写写 CRUD 和 UI 组件方面尚可,如果是游戏或者物理方面的就完全不行了。

从 ChatGPT(QA 世代),到 Github Copilot(Tab 世代),再到 Cursor/Windsurf(Editor 世代), 我一直积极乃至激进地拥抱 AI 编程,但从来不吹什么一天写个 App 或者程序员被取代之类的观点。
算是谨慎乐观吧,感觉还有不少的路需要走。

5548 次点击
所在节点    程序员
50 条回复
webs
170 天前
>> 写倒是很快写出来了,很快啊,几秒钟。
你的网速不错
还是我的网速太慢了?
4UyQY0ETgHMs77X8
170 天前
个人觉得其实是角度问题,每次问他都会以不同角度去看问题,因为知识库融合了多种人的知识角度。
其实更是一句话:万事万物没有绝对
hdczsf
170 天前
写 CRUD 确实很爽,写算法实现还是要你告诉它思路,不然它在自己的思维里打转,代码越堆越复杂,就是解决不了问题.
我有一次让它写一个处理图片的代码,它各种高大上的概念,没听说过的算法名,把我唬得一愣一愣的,我让它按这个思路实现代码,结果是正确的,就是很慢,处理一张图片要八九分钟.
让它优化速度,它又提出了四五个优化方案,让它实现之后,速度没变快,处理结果反而出错了,指出问题后,它又给出修复方案,如此拉扯好几轮,代码膨胀到了 300 多行,还是没解决问题.
感觉遇到了三哥一样,理论一套一套的,各种高大上,结果代码拉一坨,很心累.
我看偷懒不成,只能硬着头皮看代码,了解它的思路,然后发现了更好的实现路径,告诉它:



结果它一轮就输出了可用的正确代码,整个方法不到 100 行.
所以目前 Claude 写代码还不能超出你自己的能力范围.如果是稍微复杂一点的问题,你不搞懂,光指望 Claude 的话,它有不小的几率绕死你.
kenshinhu
170 天前
@monosolo1on1 算法的可能通过 Agent 来让 cursor 自己调试,来通过迭代来处理。
这个问题也同样在移动开发上出现,可能是 LLM 对依赖号的版本不敏感和没有一个及时的反馈越写越乱。
话说, 感觉 Claude 3.7 并不比 Claude 3.5 要好
shunia
170 天前
知识领域的问题,不是 AI 不够聪明,是你这个领域它可用的内容太少。

我实测也遇到过很多次,做的项目全网的可用内容都非常少,基本上问完问题后 100%出问题,用啥模型也不好使。这也是没办法的事情。
zqx
170 天前
ai 经常说一些不存在的库,还伪造 github issue 地址让我自己去看,我问他一个我自己发布在 npm 的库怎么用,他开始瞎编。用 ai 有基本的判断能力,不然就是被他随便糊弄
ppxppx
170 天前
昨天刚修了一个折磨我好久的 bug (修了几天了),结果发现是以前用 chatgpt 写的一段代码错了。很简单的东西,求三阶逆矩阵,图方便用 ai 写了也没测,结果坑死了,把其他逻辑梳理了很多遍结果错在最基础的地方。总结,虽然 ai 写代码确实挺厉害,但是 ai 写的代码得多写测试,人会犯的错 ai 也会。
zomco
170 天前
@monosolo1on1 有立场的话会不会变得很倔,死不认错
lts9165
170 天前
@musi 明白,在我自己的领域看他写代码就是这种感受
kevinxzhao
170 天前
吹 claude3.7 的人太多了。
wyntalgeer
170 天前
@monosolo1on1 #15 为啥我让她检查代码经常信誓旦旦说没问题,我实际运行也没问题,而看你的 prompt 那么奔放,她给你奔放的写没什么问题吧?
yuxian
170 天前
恭喜题主,遇到了 AI 编程的上限了。这基本上是所有 ai 的通病,一旦遇到细化领域,就开始抓瞎了。基本上没有好的解决办法。需要给更多的示例和表示,通过 prompt 更精准的控制范围。但这样做的话,还不如自己上手写了。
但,这也是程序员目前的价值所在,简单重复的活儿,如 curd ,基本上一次过。需要复杂的物理算法,还是得自己写。写好核心部分,剩下的让 ai 来包装,加上各种检测,非空判断。
能用第三方库,就用第三方库,ai 最擅长这些 api 的组合。
j4fun
170 天前
恭喜楼主一时半会不会被取代~值得高兴哈哈哈
GuLuDaDuiZhang
170 天前
ai 能提供个思路,能给你起个头,具体实现还是得自己关注,最好是拆分成小任务让 ai 分析实现然后自己 review 整合,除非完全不了解这块,不然不能全部照抄或者只靠 ai 生成。

我之前遇到个很简单的问题,定义的几个常量字符串文本里有转义字符,导致程序执行结果不对,问 ai 问了几次非得写一大堆改造一大堆代码去分析拆解这个字符串,纳闷这里原来这么复杂吗,自己一看字符串硬编码的,在里面再多加斜杠取消转义就行了。。
kjstart
170 天前
@monosolo1on1 你终于当上 pm 了竟然希望程序员有自己的立场?
monosolo1on1
170 天前
@j4fun 我倒是非常希望自己能被取代,要做的事情还有很多,又雇不起人,哈哈😁
monosolo1on1
170 天前
@kjstart 经典的问题,忍不住笑了
bbao
170 天前
@mumbler 你要不要试试楼主的需求看看你的结果如何?
GaGim
170 天前
我用 claude3.7 写一些逻辑稍微复杂的代码,比 grok 还弱,到处吹的神乎其神
z1060450187
170 天前
我觉得 cursor 下载变得很傻,给了上下文也不会看

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1120793

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX