批量进行 AI 视频分析,时长 1 小时的那种,求个好的方案🙋‍♂️

1 天前
 HeyCaptainJack

需要通过 API 来批量的上传和获取 AI 视频分析的结果。 1 、文字提取和总结 2 、关键帧识别

请问呢大家有推荐的服务商来处理上述任务吗,准备试试 gemini api ,但是不清楚效果以及单次成本,大家有好的方案组合可以推荐吗感谢😁

933 次点击
所在节点    程序员
14 条回复
malusama
1 天前
上传到 youtube , 然后使用 gemini
https://aistudio.google.com/ 现在免费啊
HeyCaptainJack
1 天前
@malusama 需要通过 API 的方式去调用
RangerWolf
1 天前
@malusama 好方法啊
kmoui
1 天前
Qwen VL 系列呢,但你视频需要预处理吧,比如降低分辨率和帧率,分割小段。
dismantle
1 天前
@malusama 邪修哈哈
wdoit9
17 小时 29 分钟前
之前捣鼓过本地处理视频提取音频,然后调语音识别模型转文字,然后调 LLM 总结文字内容,关键帧倒是没有啥好办法
kingofzihua
16 小时 24 分钟前
https://aistudio.google.com 选择 build->app-> 搜索 video_analyzer

代码下下来看看,文档说最长支持 2h 的视频,或者你上传到 youtube 给他视频链接

https://ai.google.dev/gemini-api/docs/video-understanding?hl=zh-cn


781689002
15 小时 45 分钟前
推荐 jiekou.ai ,可以用我的码 YGHNZ0 有试用额度,然后他们技术支持响应挺快,有问题可以问哈哈
wnpllrzodiac
15 小时 18 分钟前
@kingofzihua 女幽分析器是吧。。。哈哈哈哈
guaguaguaxia1
15 小时 12 分钟前
火山引擎里的豆包视觉模型看看
shellus
8 小时 30 分钟前
感觉楼上说的方案,或者说使用大模型来实现的方案,都会成本爆炸。
HeyCaptainJack
4 小时 25 分钟前
@kmoui 好的,我来研究一下,谢谢
HeyCaptainJack
4 小时 25 分钟前
@wdoit9 嗯,我之前也没怎么研究,但是市面上这种产品倒是挺多,多找找应该没问题
HeyCaptainJack
4 小时 23 分钟前
@guaguaguaxia1 好的,感谢,我去看看

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1172341

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX