DeepSeek V4 Pro:处于前沿的首个中文模型

2 小时 9 分钟前
 fragmede

https://foodtruckbench.com/blog/deepseek-v4-pro

5 次运行全部成功。中位数投资回报率( ROI )高达 +1,257%。中位数净资产达 $27,142 。 首个跻身 Opus 4.6 、GPT-5.2 和 Grok 4.3 (最新版)同等 ROI 梯队的中国模型; 在所有受测的高级模型中,其运行表现最为出色且稳定性最高。

1761 次点击
所在节点    程序员
6 条回复
LunarConcerto
2 小时 1 分钟前
没看懂这个测试基准是啥
xmsl
1 小时 58 分钟前
只要定语足够多,那就是第一!
mingtdlb
1 小时 54 分钟前
所以这么看,deepseekv4Pro 还不如 GPT5.5Instant
TimeNewRome
1 小时 54 分钟前
不是很明白,这个是回测还是实盘?如果是回测就没什么意义,实盘的话,我将 all in 。
FantaMole
1 小时 20 分钟前
看完了,原来是一套餐车模拟 benchmark ,这个测评内容还蛮有意思的,但我觉得论坛里面大多数人更需要量化模拟 benchmark

不过我觉得这套东西改一改之后可以推销给勇哥餐饮创业说,我觉得来连线的绝大多数都需要这么一套东西来帮他们整理一下脑子里的开店思路
fuchish112
37 分钟前
不看,反正官方说了不如 opus4.6 ,我只用来辅助或者交叉验证,写确定的,不复杂的代码用它也足够了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1211341

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX