让你们的 AI 做做这道题,见真章!

10 小时 47 分钟前
 sillydaddy

为了榨取 AI 的性能,而抽象出的一个数学问题。网页版的 AI 都很差劲,没一个答对。

提示词:

这里有一个抽象算法题:

假如人完成一次提示词和一次验证的总时间是 M 分钟,其中提示词需要 M1 分钟,验证需要 M2 分钟,而 M1+M2=M 。
AI 编码一次需要 N 分钟,AI 数量是 n 。

可以知道,理论上能达到的最大任务吞吐量是 min(1/M, n/N)。

为了达到最大吞吐量,高峰时需要借助的 AI 数量 n 至少是多少呢?

注意实际的约束:人先给提示词,AI 才能编码,AI 编码完成,才能由人来验证。

我需要你仔细分析,并用实际的例子验证。
500 次点击
所在节点    分享发现
4 条回复
sillydaddy
10 小时 45 分钟前
补充下,我用 Cursor 里面的 Opus 4.5 ,似乎给出了正确答案。但是我也不太确定,因为我也不会。
你们试试看呢?
lswlray
10 小时 28 分钟前
豆包说:只要 AI 数量≥N/M 取整,就能支撑人侧满负荷工作,达到最大吞吐量
sillydaddy
9 小时 40 分钟前
@lswlray 好像是这样。但 Opus 4.5 给的是 AI 数量≥1+N/M 。

我的测试用例是「提示词 1 分钟,验证 2 分钟,AI 编码 3 分钟」,M=N=3 分钟,需要几个 AI ?

开始我自己想的是 3 个 AI ,后来被 Opus 说服需要 2 个 AI (所以认为它对了),现在想通了 1 个 AI 就足够了。😂
xiaocongcong1
4 小时 34 分钟前
基础的都都答不对,而且和 ai 沟通的越多他越会迎合你的喜好或者之前的聊天记录胡说八道。导致我现在完全不信任 ai 给出的结果。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1181547

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX