我们做的表格 Agent 在 SpreadsheetBench 拿了 68.86%,刚冲上榜一,分享下进展

10 小时 7 分钟前
 Dushusir

最近我们在做的 Univer 电子表格 Agent 在 SpreadsheetBench (就是那个微软和 OpenAI 都引用的基准)跑出了 68.86% 的 Pass Rate ,直接冲到榜一。而且,这是第一次有中国团队上这个榜。

https://imgur.com/a/8eWKQIx

简单来说,它不靠 Excel 、不靠宏,是一个能自己理解指令、自己定位区域、自己修正错误的"表格专家"。

总之,微软 CEO 九月时还在自己的推特上庆祝他们拿榜一,两个月不到就被我们易主了,还是很振奋人心的消息。

如果你对产品/技术方向有兴趣,欢迎来我们 Github 逛逛,顺手点个小星星: 仓库地址: https://github.com/dream-num/univer

另外我们团队在招 AI Agent / LLM 工程方向的同学,请联系我们: developer@univer.ai

265 次点击
所在节点    程序员
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1174024

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX