这道数学题能让目前所有 AI 原地爆炸

191 天前
 ayang23

一水池有甲和乙两根进水管,丙一根排水管。空池时,单开甲水管,5 个小时可将水池注满;单开乙水管,6 个小时可将水池注满;满池水时单开丙水管,4 个小时可将水池排空。如果按照甲、乙、丙、甲、乙、丙……的顺序轮流各开一个小时,要将水池注满需要多少个小时?

测了一下各种模型,只有 deepseek 最大的模型深度思考能做出来,但过程非常漫长,一直推翻自己的结论,耗时 446 秒,没测 chatgpt 的深度思考,因为没号。其他全错。

9881 次点击
所在节点    分享发现
105 条回复
ayang23
190 天前
@wulili 正确答案是 19.6 小时,最后一个循环不排水,最多可以加水 12/60+10/60=22/60
ayang23
190 天前
@terrysnake 不说了,赶紧投简历去了。。。
ayang23
190 天前
@apollo007 哈哈哈,小学奥数学起来。。。
allenzhangSB
190 天前
Gemini 2.0 Pro Experimental 02-05 只花了 10 秒钟就算出正确答案了
listenfree
190 天前
再次推一下 qwq32B-4bit,19.6 ,本地运行,两次都是 19.6 ,deepseek 官网第一次算错,第二次算对。同样 gemma3 不是推理型的现在拿来做数学题根本不耐打。
ayang23
190 天前
@listenfree 32B 小模型这么能打
ayang23
190 天前
@listenfree 我现在又用 ollama qwq32B 已经跑了 24 分钟了,还没出结果,显卡要冒烟了
pakro888
190 天前


deepseekR1+gemini 挺快的
Naples
190 天前
@iwish 吊打普通 AI !
justFxxk2060
190 天前
豆包 也有深度了,又快又好
F281M6Dh8DXpD1g2
190 天前
我就问个一百米的棍子能过五米高四米宽的门么这种问题
都想不通
lovestudykid
190 天前
楼主钓的一手好鱼,其实对推理模型来说根本不是什么难题
listenfree
190 天前
说得对,正常觉醒后的推理模型,低子只要不是太差,应该都能算出来
listenfree
190 天前
@ayang23 我用的 mini4 pro ,节能模式,能有 7 个左右 token (整机功耗 22W ),满电有 11 个左右(整机功耗>65W),所以我不急的时侯直接节能模式,单位能耗相当能打。这种题本来就没有意义,你就让它算啊。关键他能对。我还叫它算六位数乘六们数,qwq32B_4bit 都没问题,(当然要引导一下,直接让它算,它都觉得没意义)我都把假 deepseek r132b 删了。
ayang23
190 天前
@listenfree
@lovestudykid 看起来是开推理模式大部分模型都能算出来了,确实挺厉害。我吐槽的主要是计算时间长的没边,比如我又测试了 QWQ ,半个小时没出结果,只好停掉了。
shunia
190 天前
@iwish #56
说真的我实在不能理解你们会数学的人是怎么把一个问题转化成一句一句定理似的证明过程的。

就虽然你算对了,但是中间为什么可以那么肯定的进行计算,总是让我觉得匪夷所思。

那什么 N ,K 是为啥可以那么设的?凭啥 N 应该取最小正整数?那个式子又是从何而来?

😂😂😂😂😂
Huelse
190 天前
@liprais 这类问题是典型的缺少隐藏条件(类似脑经急转弯),你给 ai 说清楚了就能答了
F281M6Dh8DXpD1g2
190 天前
@Huelse 你问任何小学生都能答出来,还要啥隐藏条件?
Orangeee
190 天前
手算了下,答案是 19.6 小时
kisaho
190 天前

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1118105

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX