独立开发复盘：我做了一个支持多语言图片描述的 Image Describer

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

爱意满满的作品展示区。

最近刚把一个自己长期在用的小工具正式上线，算是一个比较偏「工程需求驱动」的 side project ，简单做个复盘分享。

这个项目叫 Image Describer，核心功能非常单一：
上传图片 → 输出结构化、可用的文字描述，并且支持多语言。

为什么会做这个？

起因其实很现实。

我在做一些内容型网站和工具站时，经常会遇到这些问题：

现有的一些方案要么：

于是干脆自己做了一个。

围绕「可直接使用」这个目标，目前做了几种固定输出模式：

目前图片描述支持直接输出多种语言，包括：

不是先生成英文再机翻，而是在 prompt 和输出结构层面就按目标语言生成，主要是为了避免：

这个点在做多语言 SEO 或无障碍内容时还挺关键的。

很多时间其实花在调描述结构和边界情况上，而不是 UI 。

现在算是 第一版稳定可用，还有不少地方可以继续优化，比如：

如果你也有：

欢迎交流，也欢迎直接拍砖 🙏

目前尚无回复