V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
HeyCaptainJack
V2EX  ›  程序员

批量进行 AI 视频分析,时长 1 小时的那种,求个好的方案🙋‍♂️

  •  
  •   HeyCaptainJack · 2 天前 · 1064 次点击

    需要通过 API 来批量的上传和获取 AI 视频分析的结果。 1 、文字提取和总结 2 、关键帧识别

    请问呢大家有推荐的服务商来处理上述任务吗,准备试试 gemini api ,但是不清楚效果以及单次成本,大家有好的方案组合可以推荐吗感谢😁

    14 条回复    2025-11-13 21:20:35 +08:00
    malusama
        1
    malusama  
       2 天前
    上传到 youtube , 然后使用 gemini
    https://aistudio.google.com/ 现在免费啊
    HeyCaptainJack
        2
    HeyCaptainJack  
    OP
       2 天前
    @malusama 需要通过 API 的方式去调用
    RangerWolf
        3
    RangerWolf  
       1 天前
    @malusama 好方法啊
    kmoui
        4
    kmoui  
       1 天前
    Qwen VL 系列呢,但你视频需要预处理吧,比如降低分辨率和帧率,分割小段。
    dismantle
        5
    dismantle  
       1 天前 via Android
    @malusama 邪修哈哈
    wdoit9
        6
    wdoit9  
       1 天前
    之前捣鼓过本地处理视频提取音频,然后调语音识别模型转文字,然后调 LLM 总结文字内容,关键帧倒是没有啥好办法
    kingofzihua
        7
    kingofzihua  
       1 天前
    https://aistudio.google.com 选择 build->app-> 搜索 video_analyzer

    代码下下来看看,文档说最长支持 2h 的视频,或者你上传到 youtube 给他视频链接

    https://ai.google.dev/gemini-api/docs/video-understanding?hl=zh-cn


    781689002
        8
    781689002  
       1 天前
    推荐 jiekou.ai ,可以用我的码 YGHNZ0 有试用额度,然后他们技术支持响应挺快,有问题可以问哈哈
    wnpllrzodiac
        9
    wnpllrzodiac  
       1 天前
    @kingofzihua 女幽分析器是吧。。。哈哈哈哈
    guaguaguaxia1
        10
    guaguaguaxia1  
       1 天前
    火山引擎里的豆包视觉模型看看
    shellus
        11
    shellus  
       1 天前
    感觉楼上说的方案,或者说使用大模型来实现的方案,都会成本爆炸。
    HeyCaptainJack
        12
    HeyCaptainJack  
    OP
       22 小时 52 分钟前
    @kmoui 好的,我来研究一下,谢谢
    HeyCaptainJack
        13
    HeyCaptainJack  
    OP
       22 小时 52 分钟前
    @wdoit9 嗯,我之前也没怎么研究,但是市面上这种产品倒是挺多,多找找应该没问题
    HeyCaptainJack
        14
    HeyCaptainJack  
    OP
       22 小时 50 分钟前
    @guaguaguaxia1 好的,感谢,我去看看
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2632 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 12:11 · PVG 20:11 · LAX 04:11 · JFK 07:11
    ♥ Do have faith in what you're doing.