写了个玩具项目: LLM 对比测试平台,同时对比如 OpenAI、DeepSeek、Gemini 等平台 LLM 回答质量、响应速度

156 天前
 NowTime

一个用于比较多个大型语言模型( LLM )性能和响应质量的前端网页程序,具体项目介绍可以看 GitHub 地址

截图:

首页对话 配置 系统提示词

🤔 为什么会有此项目?

因为工作项目中需要用到 LLM API 做一些功能,这时候就需要对比不同平台(如 ChatGPT 、DeepSeek 、Gemini 、阿里百炼、火山引擎等) LLM 实际表现能力如何(回答质量、响应速度),原本使用如 Chatbox 开不同对话进行测试,但是效率有点低(可能我没发现更好的用法),然后就有了本项目。

为了做这个项目大概分为以下步骤:

  1. 脑子里大概想到的一个布局,然后用简单的画图工具画出一个草图
  2. 通过 Cursor 工具进行提示、生成代码
  3. 不断优化提示词有了本项目
  4. 然后因为样式难看,就借鉴了一些项目 + AI 画了个图让 Cursor 还原

✨ 核心功能

🟩 结尾

本项目开箱即可使用,但是有一些功能是没有完善的比如新建对话的命名(因为感觉不是特别重要,就没有优先去做 😂), 后面会慢慢进行完善 : )

欢迎大家评论交流

2116 次点击
所在节点    分享创造
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1127646

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX