V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
sillydaddy
0.64D
0.15D
V2EX  ›  分享发现

让你们的 AI 做做这道题,见真章!

  •  
  •   sillydaddy · 10 小时 47 分钟前 · 501 次点击

    为了榨取 AI 的性能,而抽象出的一个数学问题。网页版的 AI 都很差劲,没一个答对。

    提示词:

    这里有一个抽象算法题:
    
    假如人完成一次提示词和一次验证的总时间是 M 分钟,其中提示词需要 M1 分钟,验证需要 M2 分钟,而 M1+M2=M 。
    AI 编码一次需要 N 分钟,AI 数量是 n 。
    
    可以知道,理论上能达到的最大任务吞吐量是 min(1/M, n/N)。
    
    为了达到最大吞吐量,高峰时需要借助的 AI 数量 n 至少是多少呢?
    
    注意实际的约束:人先给提示词,AI 才能编码,AI 编码完成,才能由人来验证。
    
    我需要你仔细分析,并用实际的例子验证。
    
    4 条回复    2025-12-27 17:55:09 +08:00
    sillydaddy
        1
    sillydaddy  
    OP
       10 小时 45 分钟前
    补充下,我用 Cursor 里面的 Opus 4.5 ,似乎给出了正确答案。但是我也不太确定,因为我也不会。
    你们试试看呢?
    lswlray
        2
    lswlray  
       10 小时 28 分钟前
    豆包说:只要 AI 数量≥N/M 取整,就能支撑人侧满负荷工作,达到最大吞吐量
    sillydaddy
        3
    sillydaddy  
    OP
       9 小时 40 分钟前
    @lswlray 好像是这样。但 Opus 4.5 给的是 AI 数量≥1+N/M 。

    我的测试用例是「提示词 1 分钟,验证 2 分钟,AI 编码 3 分钟」,M=N=3 分钟,需要几个 AI ?

    开始我自己想的是 3 个 AI ,后来被 Opus 说服需要 2 个 AI (所以认为它对了),现在想通了 1 个 AI 就足够了。😂
    xiaocongcong1
        4
    xiaocongcong1  
       4 小时 34 分钟前
    基础的都都答不对,而且和 ai 沟通的越多他越会迎合你的喜好或者之前的聊天记录胡说八道。导致我现在完全不信任 ai 给出的结果。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2677 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 14:29 · PVG 22:29 · LAX 06:29 · JFK 09:29
    ♥ Do have faith in what you're doing.