|      1p7IySTldqB      255 天前 今年 AI 大爆发令人兴奋。 | 
|  |      2chipipi      255 天前  13 “工作中常见到的炮弹问题” | 
|  |      3Satansickle      255 天前 咋?老哥是华为驻非洲工程师? | 
|      4paopjian      255 天前 妈耶, 老哥是军工设计师么, 为什么会有弹道预测的问题 | 
|  |      5mingtdlb      255 天前 怎么认为他很强?  | 
|  |      8me1onsoda      255 天前 大模型好像都是发布一开始强无敌,然后开始降智了。大模型质量问题,应该要有个监管的机制。 | 
|      9lthon      255 天前 还在等 Claude 4 | 
|      10sunny352787      255 天前 哈哈哈哈哈哈这例子要吓死了,其实是做游戏的吧? | 
|      11LaTero OP | 
|      12LaTero OP @mingtdlb 判断字符本来就不是 AI 该做的事,因为原理上 AI 收到的都是 token ,一个 token 可能有好几个字。而且假如真的有了 AGI ,和人类一样的智力水平,你觉得它会浪费算力去数吗?假如是一个聪明的人类,他应该做的是使用工具。AGI 也应该是写一个程序去数,不是自己数。最近 AI 进步也都是在数学、逻辑推理等方面。 | 
|  |      14hiveex      255 天前 Poe 用户等上线体验 | 
|  |      15pizone      255 天前 不知什么时候能用上 Grok 3 的 api ,还是有点期待。 | 
|      16CodeAllen      255 天前 没必要问 AI 字符问题,这个跟 NLP 的 token 分词技术有关系,没什么意义。 这就有点像一个人口头问你,计算“饕餮盛宴”这几个字有几个笔画,能当面正确写下这四个字的人都不多吧,还得数笔画,有什么意义? | 
|      17sunny352787      255 天前 @LaTero 哎,同行的敏锐性~ | 
|  |      18stone9527      255 天前 | 
|      19LaTero OP  1 @stone9527 没问题呀,现在主流的模型这个都不会错的吧。我平时主用 openrouter ,这个网站的 chatroom ,预设的几个问题就有 9.9 和 9.11 哪个大,还有 strawberry 里几个 r 。后者还有些模型会错,但是前者这样比大小的基本都是没问题的。 | 
|  |      20pkoukk      255 天前 强是很强.. 但是老🐴用了快 10 万张 h100 ,居然只获得了 1400 分出头,仅仅比 R1 强 40 多分,3%左右 而且这么大的训练规模,预计参数量也不小,推理消耗估计也挺大 有点不及预期了 | 
|  |      21br00k      255 天前 试了下,感觉没有多少差距。不及预期。 | 
|  |      23yukino      255 天前 via Android 要不你跟隔壁 openai 楼的老哥打一架 | 
|  |      24kaedea      254 天前 via Android 做一下今年考公的行测题试试 | 
|  |      25Ehend      254 天前 编程领域感觉不如 chatgpt 和 deepseek | 
|  |      26gitxuzan      253 天前 编程方面不行,比 gpt 差 | 
|  |      27gitxuzan      253 天前 deepseek 如果有这么强的算力,不是要排行老大了。 |