V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wudaye
V2EX  ›  OpenAI

现在 GPT-4V 识图能力支持 api 调用了吗

  •  
  •   wudaye · 141 天前 · 1495 次点击
    这是一个创建于 141 天前的主题,其中的信息可能已经有所发展或是发生改变。

    GPT-4V 的图像识别能力似乎已经非常牛叉了,在想能不能用 api 来给我的本地相册做一次批量的图像识别打标签,方便我做二次整理和查找。目前 openai 开放这个 api 了吗,或者国内有中间商实现这个能力了吗?

    16 条回复    2023-12-13 11:59:58 +08:00
    Puteulanus
        1
    Puteulanus  
       141 天前   ❤️ 1
    账单遭不住吧。。
    x86
        2
    x86  
       141 天前
    api 好贵嘟
    yanyao233
        3
    yanyao233  
       141 天前 via Android
    有了啊,但是你如果仅仅是想打标签的话为啥不用开源的方案
    wudaye
        4
    wudaye  
    OP
       141 天前
    @yanyao233 有啥方案推荐吗
    TrickTips
        5
    TrickTips  
       140 天前
    我这有足够量的 4v ,一手货源,有需要的欢迎联系 ZHVja2dwdDAwNw==
    zhhmax
        6
    zhhmax  
       140 天前
    识图 API 的价格是按图片像素计算 token 的,我这边的中转站已经对接:luee.net (最低 5 元起充),背后账号池的 RPD 都已提升,一天可以调用几千次。
    MossFox
        7
    MossFox  
       140 天前
    支持了,OpenRouter 那边也可以用了。
    但是靠这个打标签的话可能会有点烧钱。可以用 LibreChat 之类的客户端先测一下走 OpenRouter 的 API 用 GPT-4V 的效果以及计费情况。
    bybyte
        8
    bybyte  
       140 天前
    用开源的 chatgml 打标签吧
    em70
        9
    em70  
       140 天前
    用开源项目 clip 和 blip2 可以零样本描述图片内容,但比不上 gpt4v 观察细致
    yanyao233
        10
    yanyao233  
       140 天前 via Android
    @wudaye clip blip 效果都可以,如果有足够强性能的机子的话可以试试清华的 cogvlm 模型
    akaken
        11
    akaken  
       140 天前
    @x86 这里提供低价的 open ai api ; https://aihubmix.com/
    butterls
        12
    butterls  
       140 天前 via Android
    @zhhmax 大哥,你的登录页 github 和 Google 账号登录点不了?
    Silently
        13
    Silently  
       140 天前 via iPhone
    支持。但是贵
    zhhmax
        14
    zhhmax  
       140 天前 via iPad
    @butterls 预留功能,这个站前不久开发出来,正在完善系统架构,这俩功能还没对接好。
    MEIerer
        15
    MEIerer  
       140 天前
    中转站便宜,不过不是楼上那种。
    AIGC2D
        16
    AIGC2D  
       131 天前
    https://www.aigc2d.com 这里支持,不过每日有限量
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3279 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 12:15 · PVG 20:15 · LAX 05:15 · JFK 08:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.