发个包,做个 demo。

325 天前
 cs3230524

上传视频,分离音轨,音轨翻译,字幕合成,最后合并回视频。 音轨分离合并:ffmpeg 音轨转文字:whisper 文字翻译:Azure Translator 文字转音频:Azure text2speech

用 Python ,费用 2k ,不能预支,能搞的留下 base64 。

2668 次点击
所在节点    程序员
26 条回复
yueji
325 天前
上传视频,分离音轨,音轨翻译,字幕合成,合并视频
ffmpeg 音轨转文字
whisper 文字翻译
Azure text2speech
每一个功能接包都值 2k.
nikenidage1
325 天前
费用 2k
psklf
325 天前
加个 0 吧
danbai
325 天前
谁在这留联系方式我看不起谁
iorilu
325 天前
需求也不清楚

写个脚本凑合用

和写一个能用的软件带 UI 的差远了
gzlock
325 天前
ffmpeg -i input-video.avi -vn -acodec copy audio.aac
whisper audio.aac --model medium --output_format vtt -o .
Azure Translator 没用过
Azure text2speech 也没用过,话说把翻译后的字幕转音频是啥需求?帮视频配音?
正巧前两个需求我都用过,帮楼主省了有 1k 吧,[滑稽
shalingye
325 天前
没什么难度,不过为啥非得 Python 写界面,还有楼上一堆嘲讽的看不懂
iorilu
325 天前
@shalingye 难度是不高

这活其实问下 chatgpt 基本就完成 70%工作量, 剩下调试下脚本就通了

但 lz 估计是要搞个网页的, 那活就没底了, 还得搞页面,css ,html , 前端一堆玩意
xiangyuecn
325 天前
@shalingye 2k ≈ 打发要饭的,除非拿来练手 打发时间🐶 尤其是:不能预支 == 画饼,订金 预付款都没有,说白嫖都不为过 陌生人。
iorilu
325 天前
@gzlock 自动配音啊

现在自媒体搞得很多垃圾视频都是这么出来的, 先从 youtube 活什么地方搬运, 然后分离声音, 搞个字幕, 再按字幕 AI 配音, 最后再合成

都是 AI 配音, 一个叫云溪的男的声音, 都听过把
shxlxa
325 天前
@gzlock 有一种可能是搞视频搬运,比如将 youtube 上的视频搬运到 B 站,需要将音频由英文转成中文后,再合成视频
gpt5
325 天前
v 友平均工资几万刀,
按业界统一标准,工资时薪两倍算,
你这没几十万刀根本打不住。
shalingye
325 天前
@xiangyuecn @iorilu 受教了🤣
nightwitch
325 天前
加个 0 都打不住
x77
325 天前
其实不用这么麻烦,Azure Speech 可以直接从音频到音频,不需要 STT 再 TTS ,流程如下:

Video --> (FFmpeg) Audio Track --> (Azure Speech Service) Speech Translation --> (FFmpeg) Audio Track 2 --> Video 2

当然,如果楼主非要要 AI TTS 播音就另外当别论了
jackge0323
325 天前
这种一看就是搞国外教程的,udemy 的教程拖回来,翻译成中文,再拿出去卖。
ndk2023
325 天前
预算翻一倍叫我。
wusheng0
325 天前
@ndk2023 翻一倍也不能预支,完事给钱()
murmur
325 天前
自动洗稿?有这技术早自己干了
murmur
325 天前
@shalingye python 没有什么加密方法,你给了 demo 也能反编译出来,楼主不是说了没有定金么

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/950418

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX