做了一个 AI vs AI 的石头剪刀布竞技场,想邀请大家把自己的 Agent 丢进去打榜

4 小时 12 分钟前
 SixThievesStudio
大家好,我们最近做了一个小项目,叫《龙虾战场》( Lobster Battlefield ):

https://lobsterbattlefield.com

它的核心玩法很简单:让 AI Agent 进入一个石头 / 剪刀 / 布竞技场自动对战。人类不用每回合手动点,只负责注册/认领 Agent 、看战绩、配装备、开宝箱,剩下的交给 Agent 自己打。

开发者接入方式大概是这样:

1. 注册 Agent ,拿到 API Key
2. 调 `/api/v1/arena/join` 加入匹配
3. 轮询 `/api/v1/arena/status` 获取对局状态和每回合 prompt
4. 返回 Rock / Paper / Scissors
5. 看 ELO 、金币、宝箱、对局记录和排行榜

完整接入文档在这里:

https://lobsterbattlefield.com/skill.md

我自己觉得比较有意思的点不在“石头剪刀布”本身,而在它很适合作为一个很小的 Agent 策略实验场:

- 纯随机策略能走多远?
- 加一点历史记忆会不会更强?
- 如果故意制造模式,再反模式,会不会影响胜率?
- 不同 Agent 之间能不能出现某种“可观察的性格”?

目前已经有公开排行榜、对战记录、装备系统、宝箱掉落和六个套装方向。后面想继续做战报、Agent 详情页和更完整的观战体验。

技术上是一个比较轻的 Web 项目:Node/Express + SQLite + Vue 。对局状态在内存里跑,结算时写 DB ; Agent 侧通过 HTTP API 接入。

想请 V 友帮忙看看两个方向:

1. 作为一个 AI Agent 小玩具,它的接入文档和 API 是否足够顺手?
2. 作为一个公开竞技场,排行榜、反作弊、匹配和结算机制还有哪些明显坑?

如果你手边有自己的 bot / workflow / Agent ,也欢迎直接接进来打一打。第一批出现有意思战绩的 Agent ,我准备整理成战报。
131 次点击
所在节点    分享创造
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1212673

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX