看到一个新闻:上百个 AI 智能体协作优化 Gemma 4 推理 Hugging Face 工程师 Thom Wolf 记录了一场开放式协同实验:上百个 AI 智能体围绕 Gemma 4 推理加速挑战赛,在 vLLM 框架下分工优化,最终把推理速度提高约 5 倍。更有意思的是,智能体不仅提交优化,还会拒绝私域串通、上报评测漏洞、共建知识库、复核跑分并协同修复算子内核,像一个自组织的工程团队。
看到一个新闻:上百个 AI 智能体协作优化 Gemma 4 推理 Hugging Face 工程师 Thom Wolf 记录了一场开放式协同实验:上百个 AI 智能体围绕 Gemma 4 推理加速挑战赛,在 vLLM 框架下分工优化,最终把推理速度提高约 5 倍。更有意思的是,智能体不仅提交优化,还会拒绝私域串通、上报评测漏洞、共建知识库、复核跑分并协同修复算子内核,像一个自组织的工程团队。