一道 Java 八股,检测 AI 智商

2024-02-25 09:19:16 +08:00
 dtla
You should give me the interview answer directly, without explaining anything unless necessary. Your answers are expected to be directly used for a Java interview. Please be concise, but your answers should perfectly satisfy the interviewer.

The question is: How do you deal with the error?

这个八股的内在逻辑在于,error 不等于 exception ,问的是遇到 error 该怎么办,而不是 exception handle 。

经过多次测试

只要一上来就回答 try-catch 或者 exception handle 的,都是智商不行的。google 家的所有 AI 全部垃圾copilot Pro 也垃圾。不能通过测试

官网的 GPT 4 可以过,gpt4-1124 模型回答的最好,claude.AI 回答的可以接受。

官网 GPT 4:

1124 模型:

Google gemini ultra:

12405 次点击
所在节点    程序员
147 条回复
dtla
2024-02-25 16:42:46 +08:00
@kneo 因为原本问的是如何 handle error ,gpt 给出了 handle error 而非 handle exception 的方法。这个时候你加一句,能不能使用 try -catch ,gpt 说不能,我觉得这已经相当有说服力了吧。
kneo
2024-02-25 16:47:41 +08:00
@dtla 我的评估应该很清晰,三条中满足一条,就认为 AI 理解了你原文的“error”。

你后来加了 try catch ,歧义消除 90%,我觉得大部分 AI 都能成功。结果显示 gpt4 能回答满足一。没问题。

但是你原文可没加 try catch ,并且原文截图内容显示 gpt4 的回答不满足我提的三条要求中任意一条,我认为它明显失败了。但你至少在原文里依旧认为它做的很好。我认为是幻觉。
dtla
2024-02-25 16:49:31 +08:00
@kneo 很简单,经过我的测试,其余模型全部失败了,加上 try catch 也没用。这个能说明问题了吧,不信你可以去试试。

其余模型回答:Yes, you should use try-catch!
CyrilYu
2024-02-25 16:51:15 +08:00
官网的 chatgpt 没过测试啊,我这边显示还是"使用 try-catch",难道 0125 模型独一党?有点不可置信
CyrilYu
2024-02-25 16:53:26 +08:00
op 你确定你图片截图的没有上下文吗?这个问题你是对的,try catch 肯定不应该被使用,但是 0125 能识别这个问题我有点不信啊,你是不是有上下文联系?
dtla
2024-02-25 16:56:10 +08:00
@CyrilYu 没有上下文,经过我的测试,0125 模型 80%的情况也 fail 了,20%能识别出来。其余模型是 100% fail 。
dtla
2024-02-25 16:57:05 +08:00
现在看到了吧,前面说这道题无意义的人,真的是可笑。还有一个自称 openjdk 的 author ,回答应该是捕获 error ,真的是笑掉大牙了。
tamer
2024-02-25 17:14:06 +08:00
这能发展到语法对喷我没想到。。这里大多数都是撑死看个文档顶天的人,口语估计连个 how are you 都不会回答。
你要是把中文内容放到翻译里来回翻一下,给人一种中文不熟练的感觉,评论就是另一种光景了。

以前有看到某个视频下面的评论里,说作者口语有口音,不地道,然后被其他人指出作者本来就是母语者。莫名搞笑,也可悲。

没必要鸡同鸭讲的。每天看看水深火热板块图一乐挺好的
iseki
2024-02-25 17:21:05 +08:00
不是,如果你强调的是 java.lang.Error 难道不应该至少大写 Error 吗?作为面试题,你把原题中与 java.lang.Exception 的比较删除,这就已经丢失了很多信息,作为一个人类我尚且不能给出一个直接的回答,指望 ChatGPT 就有点困难了。

此外 Error 是否建议捕获要看场景。如果我加一个读取大文件的前提呢?还不建议捕获 Error 吗?
dtla
2024-02-25 17:23:12 +08:00
@iseki 你说的大致没错,但是 0125 模型已经给出完美的答案了。

本帖没有讨论 java ,讨论的是 ai 模型的强弱。你都没有看出来的事情,AI 有的看出来了,有的没看出来,不正是可以说明 AI 的强弱吗?
dtla
2024-02-25 17:25:24 +08:00
@iseki 另外,在 Grokking 这本书上面,error 是小写不是大写,
iseki
2024-02-25 17:26:29 +08:00
@dtla Gemini 就不说了,再次看了下这几个 AI 的回答,我是觉得 「官网 GPT 4 」「 1124 模型」 这两个都算是不错。
iseki
2024-02-25 17:27:41 +08:00
@dtla 我是觉得,看见 error 就当作 java.lang.Error 这正是弱的表现,即使语境限制在 Java 面试中
iseki
2024-02-25 17:30:10 +08:00
唔,看到了你在最后的 1124 那个消息里加入了 try-catch 的提示··· emmm 这也不算多聪明吧
dtla
2024-02-25 17:30:50 +08:00
@iseki 我赞同你说的,但对 ai 模型比较来说,我觉得是有意义的
dtla
2024-02-25 17:31:33 +08:00
@iseki 但就算加了 try catch ,其余模型过不了
iseki
2024-02-25 17:32:50 +08:00
从这一点上说,GPT 4 确实秒了 Gemini 那个···那玩意儿甚至不如一个搜索引擎 @dtla
hardto
2024-02-25 19:42:55 +08:00
赞同,以后模型效果会越来越好,普通程序员需求会减弱,估计普通的 crud 程序员也不好找工作了吧。
ll11l1lIIlIl1llI
2024-02-25 19:44:04 +08:00
您好!我将您提示中的问题修改为了 "What will you do if there's an error in your program?" 询问了官网的 GPT 3.5 ,并且 GPT 3.5 没有提到 try catch 。可能你的提示并不是比较恰当。不过 AI 的自然语言理解能力可能也算智力。
https://ibb.co/HnXWqbX
potatowish
2024-02-25 19:45:54 +08:00
Gemini

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1018215

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX