openclaw 无法多模态输入图片识别

2 天前
 louistsangjk

我用 Telegram 的,我尝试过发送图片识别错误 我换了两次模型,一开始是 kimi k2.5 ,后面换了 gemini 3 flash 都不行 每次都是乱回答图片内容 我尝试图片 url 是可以的,那说明模型是没问题的,我猜测是只发送了一个文件名过去了? 有什么解决办法吗?我写了个 skill ,他还是执着使用 read 去读取

318 次点击
所在节点    OpenClaw
3 条回复
rolandzhou
1 天前
我的是 tg + gemini 3 pro/claude-sonnet-4-5 ,没有做额外配置,开箱就能直接发图片过去,它也能理解图片的内容
Watchdog
1 天前
gemini 完全可以,直接发,语音、图片都可以,就是慢
liverpool17
14 小时 3 分钟前
读取图片路径不对,我一开始也是你这样后来跟模型说清楚让他自己查找位置修改位置就好了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1191533

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX