手贱拿大模型试了下最近一次的 LeetCode 周赛,道心破碎了,成仙路已断,前路在何方?

225 天前
 CC11001100

四道题全部 AC 。。。

我连题目都没仔细看,就无复制粘贴题目给它,等它推理出结果就复制回提交框:

中间有提交错误的:

我把错误截图给大模型,让它继续推理,然后如此反复,除了最后一道题错了几次才推理出来,前边都是一把过,最后一道题错了两次推测出来了。

跟一个力扣刷了几千道的朋友吐槽用大模型刷题,虽然我在嘴硬,但我自己撑死了也就是三道题的水平。。。AI 算法水平至少高我一个大段位。。。。

不过还好,它用时大概半小时,比第一名耗时还长一些,碳基生物保住了一点脸面:

但想一想,从 OpenAI 发布 Chatgpt 到今天,也才几年的时间就已经发展到这个程度了,我原本以为程序员能干到 35 岁也行,到时候回老家养猪,就很抽象,感觉撑不到 35 岁就得被淘汰了。。。过年回去得提前调研下养猪方案了。。。

12851 次点击
所在节点    程序员
91 条回复
w568w
225 天前
大可不必妄自菲薄,从你给的这几题来看,大模型训练的时候数据集里肯定有对应题解了,它只是原样背诵答案罢了。

「看到题目会写这个算法本身」值 1 块钱,「理解算法背后的思想」值 10 块钱,「实际工程中与人交流并设计架构,想到现实的独特场景可以转化成这个算法问题来解决」值 1000 块钱。
RoccoShi
225 天前
leetcode 的题还是偏简单了,对于现在的大模型来说小菜一碟
CC11001100
225 天前
@w568w 我开始是拿 hot100 来试的,觉得能做出来是因为早就有题解了,所以后来我拿周赛来试,周赛都是新题现出的,类似于高考试卷有模式可寻但都是新题,我记得之前力扣周赛排名高的话好像可以大厂绿色通道面试速通,感觉可能会出现新的作弊赛道,哎大意了直接发论坛了。。。
tcper
225 天前
你如果正经训练一下肯定比大模型厉害,人脑也是需要训练的

而且可以找找真正竞赛题让 ai 试试,几种算法的组合 ai 就不行了
CC11001100
225 天前
@tcper 戳心了兄弟,我训练了,上学那会儿还专门刷过一段时间算法题,奈何资质愚钝。。。
ccoming
225 天前
拳头永远硬不过锤子,要学会使用工具。
CC11001100
225 天前
@RoccoShi 第四道题能做出来,在码农里算法水平应该能算前 0.1% 。。。
levelworm
225 天前
@CC11001100 大模型的训练快多了。

不过说实话,我的确觉得 AI 代替部分码农的工作,不是很远的未来了。很可能大公司内部已经在做了。而且要命的是,码农还挺配合的。

很多朋友举的反例,我觉得都不是很大的问题。比如说需求不清楚 AI 也没办法。第一,需求不清楚,其实人也没办法,你还得继续交流,而交流的精准度和耐心,人未必比得上 AI ,第二,公司可以强制执行标准化需求,换句话说,与其让 AI 适应人,不如让人适应 AI 。

国内大厂我相信肯定有人在做了,就是不能说。我觉得首当其冲的大概就是数据分析,数据工程、前段这种直接面对业务(业务恨不得你们 24 小时相应),技术上又没啥特别难的东西。
neteroster
225 天前
R1 确实很猛,带思考的大模型做这种题只会越来越强,毕竟:结果可验证 + R1 指明了强化学习在推理 LLM 上的有效性,这俩一结合就能预估这种算法竞赛未来的 LLM 能打过所有人类就是和 alpha go 打败人类棋手一样自然的事情。

虽说如此,实际应用场景复杂得多,还要在 Agent 、超长记忆、持续学习这几个领域有所进步才行,现在的技术这几个方面是明显薄弱的。很期待未来的发展。
williamjing
225 天前
以后 leetcode 的分数就没意义了,因为你面对的都会是 AI 。以后面试看来默认需要手撕代码了。
mythabc
225 天前
积极拥抱变化寻找出路,不要再钻研代码细节。
(上回发了个 cursor 的帖子,还有人说我广告,时代都变了感觉 v2 有一帮冥顽不灵的人)
tcper
225 天前
@CC11001100 你意思是自己刷一些题算训练了?你去看看 ACM 队员怎么训练的
me1onsoda
225 天前
@w568w 碳基生物何尝不是在背答案,效率还低。很多人一年半载再去刷 h100 又不会了。背到极致也算牛逼
48y1951r9G8k7Zou
225 天前
想当年李世石柯洁输给阿尔法狗,岂不比楼主更加道心破碎。人家可都是实实在在的行业前 0.1%(不包括业余棋手)。

李世石没几年就宣布隐退了,理由是输给 AI 后,他再也无法享受围棋这项竞技。

柯洁则是一开始对 AI 各种冷嘲热讽,实战被吊打后则是破防嚎啕大哭。然后能明显感觉出来他对下棋越来越没有胜负欲,工作生活的重心也开始转移到围棋以外的地方。或许这就是我们这些“传统程序员”中一部分人的写照。

好在程序员这个职业的工作内容几乎不是“算法竞技”,现实场景的业务涉及到和形形色色的人、和其他(非计算机)系统的对接,这些目前看来还很难由 AI 独立搞定。

不过那些纯搞技术的“底层程序员”确实应该“睁眼看看世界”了,不然真的会被落在后面。我在 /t/1095887 #2 回复的后续,我们公司那帮老算法工程师在被 AI 降维打击一次后,现在也开始拥抱 AI ,用 LLM 辅助研究了。
jukanntenn
225 天前
高射炮打蚊子,别说大模型,我用搜索引擎也能达到同样的效果呀,这能说明什么问题呢?
kk2syc
225 天前
你让大模型来试试高考题,应该连大专都不够分数。
fpk5
225 天前
周赛是给你练习速度和熟练度的,半个小时三道题就差不多了。你不能跟计算器比乘除法。
levelworm
225 天前
@majula #14
这个还不算底层。至少要到操作系统编译器这个层次,然后接触硬件啥的。AI 对于缺乏公开资料的东西还是不行,还能苟几年。
mumbler
225 天前
现在最强模型是 gemini-2.0-flash-thinking-exp-01-21
aistudio.google.com
mumbler
225 天前
@kk2syc #16 现在三巨头大模型有博士水平,但不能保证一次做对,需要抽卡,重试多次高考全部能拿下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1107195

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX