站在这儿: https://wcelo.com
起因是我对那些「 AI 预测世界杯」一直有点怀疑——大多没法证伪,赛后还能随便挑口径圆 回来。所以我干脆把它做成一个能打脸自己的实验:开赛前把三个假设写死、git commit 冻结、锁定赛后怎么算分,之后只许按这套规则结算。
三个假设:
模型本身很常规、不炫技,好玩的是这套不能反悔的设计。也把我们的概率和 Polymarket / Stake 的盘口摆一起,但不指望赢市场——人家有伤病和内幕,我没有,输给它才正常。
说实话我的先验是「大模型多半只加噪声」,但我按最强形态把它实现了,免得验证变成 自我实现。方法和预注册都在站内 /method 。
小组赛今晚开打,欢迎来拍,尤其第 3 条的设计。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.