一道 Java 八股,检测 AI 智商

2024-02-25 09:19:16 +08:00
 dtla
You should give me the interview answer directly, without explaining anything unless necessary. Your answers are expected to be directly used for a Java interview. Please be concise, but your answers should perfectly satisfy the interviewer.

The question is: How do you deal with the error?

这个八股的内在逻辑在于,error 不等于 exception ,问的是遇到 error 该怎么办,而不是 exception handle 。

经过多次测试

只要一上来就回答 try-catch 或者 exception handle 的,都是智商不行的。google 家的所有 AI 全部垃圾copilot Pro 也垃圾。不能通过测试

官网的 GPT 4 可以过,gpt4-1124 模型回答的最好,claude.AI 回答的可以接受。

官网 GPT 4:

1124 模型:

Google gemini ultra:

12409 次点击
所在节点    程序员
147 条回复
wallriding
2024-02-26 10:56:14 +08:00
当别人指出我的英语表达有问题

反应 1:太好了我看一下是不是真的有问题

反应 2:我在美国工作了 X 年,我有 A 国 B 国 C 国的同事,我的口语很好,原文是别人写的你别找我你找原作者,blablablabla
qq135449773
2024-02-26 11:16:10 +08:00
可是异常处理统称叫 Error Handling 吧?

只说一个 error 谁知道你是要了解 Error Handling 还是 difference between Error and Exception ?

你觉得呢?
qq135449773
2024-02-26 11:17:26 +08:00
也可能叫 Exception handling ,两种表达印象里都见过
UGas2t22Svnlm2K2
2024-02-26 11:34:13 +08:00
1124 模型在哪里使用?楼主
dtla
2024-02-26 11:38:24 +08:00
@williamcc 我说错了,是 0125 模型,直接用 api 调用就好了,官网有。


@qq135449773 java 没有 error handling 的说法,只有 Exception handling 。error 就是 error 类,参见 Oracle 的官方文档。error 不建议 handle ,只有 exception 才需要 handle 。

所以对 error 要做的事情是先检查是什么 error ,99%的情况是不能 try-catch 的
UGas2t22Svnlm2K2
2024-02-26 11:48:30 +08:00
@dtla 0125 api 需要开 plus 吗 大佬 甩个网址呗
dtla
2024-02-26 11:53:09 +08:00
@williamcc api 是 API 呢,不需要 plus ,你去 openai 官网,就有 api 就好了。
hulooq
2024-02-26 11:58:03 +08:00
> gemini-pro 的回复

**How do you deal with the error?**

1. **Identify the error.**
2. **Determine the cause of the error.**
3. **Fix the error.**
4. **Test the fix to ensure that the error is resolved.**
5. **Document the error and the fix.**
6. **Implement measures to prevent the error from recurring.**
dtla
2024-02-26 12:01:19 +08:00
@hulooq 加一句,should i use try-catch
jones2000
2024-02-26 13:20:56 +08:00
1. 自己发现的 error, 随手就改掉
2. 其他人发现的 error, 让他发 issue 出来, 然后根据提交的 issue 的描述信息修正。
dtla
2024-02-26 13:45:29 +08:00
> 这种文字游戏的问题,还没有 i++等于多少有意义。
> 你想用来自 PayPal 来证明“权威”。楼上有个 openjdk 的 author 算不算另外一种“权威”


@qinxi 刚刚才看到你这条消息,这个自称 openjdk 的 author 不过是北美的一个学生(看他发帖记录)@Tabjy ,我再不济也是一个美国的 Senior SDE ,你觉得他更权威?贡献了一点 openjdk 代码就叫作 author 了?

我这么跟你说把,他在这条帖子里说的话没有一条是对的。
qinxi
2024-02-26 13:50:42 +08:00
@dtla #131 你猜猜我为什么带上了引号, 自始至终我都觉得玩文字游戏来测试 AI 也好, 面试真候选人也好都是没有意义的.
尤其是何况你还删除了能减小误解的部分, 故意测试文字游戏的影响
dtla
2024-02-26 13:53:31 +08:00
@qinxi 文字游戏才能测试 AI 的能力,著名“鲁迅和周树人的关系”就是辨别 3.5 和 4.0 的分水岭,这到面试题本质上没有和这个问题有任何区别,只是比“鲁迅和周树人的关系”这道题更高深罢了。

对于 AI 模型的区别,我不知道你是做什么工作的,我反正每天都离不开,选择一款好的 AI 模型对我的工作至关重要。
dtla
2024-02-26 13:57:56 +08:00
算了,这个帖子就是被一群什么都不懂自以为是的小屁孩歪楼的,我看你也不是很懂。 @qinxi

下面是其他的想法:

看见他说是 openjdk 的 author 一瞬间我真的质疑了我自己,我在美国做 java senior sde 这么多年,竟然被一个小孩子唬住了,说明我确实需要继续学习。

也许楼层里面质疑和骂我的人,现实世界就是个 loser 吧,不是很懂为什么我需要在乎
dtla
2024-02-26 14:01:05 +08:00
以后不逛 V2EX 了,感觉 loser > 正常人的数量太多,不说其他的,我一个 senior 的 title ,质疑我的可能现实世界就是个 loser 吧,不说了,删号走人。
NessajCN
2024-02-26 14:40:09 +08:00
https://i.4cdn.org/pol/1493993226750.jpg
Let's count how how many logical fallacies OP had committed:
[ad hominem]
[appeal to authority]
[appeal to emotion]
[genetic]
[tu quoque]
...
Be free to add what I missed.
makerbi
2024-02-26 15:03:02 +08:00
单纯从一道题目来看大语言模型的性能还是有失偏颇,评测肯定是从多个维度多方面评价的。单一题目考核最容易出现的问题是数据泄露的问题,即原题目本身出现在了模型训练数据里,这是目前很多 LLM 榜单存在的问题(当然也有对应的检测和新的考核方案)。

对于这道题目本身,对比了几个模型的输出,除了 OpenAI 外,ChatGLM 和 Qwen 看起来都还行。
https://vectorvein.com/public/workflow-run-record/04ef976b300848b9b0318dc233b8f29d

我倾向于还是训练数据的问题,不完全能代表模型能力本身。目前一个热点研究也是在小模型上增加更多的训练数据达到更好的效果。
Inevitable
2024-02-26 15:14:13 +08:00
看楼主回复记录
@LUO12826 看了眼,绝了
o562dsRcFqYl375i
2024-02-26 16:42:21 +08:00
退一万步来说,仅凭一个 java 面试题目就敢断言 “google 家的所有 AI 全部垃圾,copilot Pro 也垃圾。”,楼主你是不是有点不太严谨和自大呢?

另外,谁规定论坛的谈论一定要限定在帖子的内容,而不能发散讨论其他方向?还是美国有这样的法律吗?

楼主说自己在美国十几年,是精神美国人吗?还是已经转了国籍,成为真正美国人啦?

我看了一下楼主你的回复,很多时候不都在说自己在美国混、中文论坛比不上外国论坛、拿 paypal 当权威来说事,这些东西。

你给人感觉就是在外面呆了一下,自我感觉见识高了,拿着所谓的国外面试题自己做了些简单的试验,草率地得出一个结论,以为发现了什么新大陆,然后抱着 “如果把这个结论发到中文论坛,肯定能让那群人长长见识的” 的心情来发了个贴。

谁知道那群人居然敢提出其他意见和看法,严重地违背了你的预期和伤害了你的自尊心。
seasonsolt
2024-02-26 16:49:59 +08:00
我的 0125 也不能正确回答,可能楼主没有情况上下文重新提问吧。但是把 “the error” 更换成 “the java.lang.Error”...哪怕 3.5 回答的也很好,所以无论是实验设置,还是实验结论我都不是很认可

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1018215

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX