[免费/自荐] 开源一个实时翻译的软件 LiveTranslate,使用 Python 调用 ASR 语言转文字, VAD 分割, LLM 翻译, pyqt 绘制界面

3 月 16 日
 MiraiWithRin

适用于看外语视频、直播之类的场景,

不过我个人一般是用来看 Twitch 直播和听 ASMR

项目地址: https://github.com/TheDeathDragon/LiveTranslate

也有视频演示效果,地址: https://www.bilibili.com/video/BV1jQwgzLEjU/

虽然没有商业应用这么准确,但是看个大概还是可以的。

模型的话,推荐用阿里云的 qwen-turbo-latest 速度快,相对准确

以下为截图:

1458 次点击
所在节点    分享创造
7 条回复
zzz22333
3 月 16 日
看着不错,不过有试过 Gemini live 的接口么?
caola
3 月 16 日
看着不错+1 ,可以弄成字幕方式显示最好,类似于酷狗音乐的歌词单行字幕,调整对应显示的大小和屏幕位置后自动隐藏软件本身,相当于悬浮在视频或屏幕上面显示字幕
MiraiWithRin
3 月 16 日
@caola 这个设计之初就考虑不是和字幕一样的,再快还是有两三秒延迟,就和直播间一样的感觉,窗口就只有悬浮窗,然后有个托盘,悬浮窗可以前台置顶的,位置也可以随便拖动,大小颜色都可以设置里面调整
MiraiWithRin
3 月 16 日
@zzz22333 还没有测试过,目前都是用的 OpenAI 标准
hanguofu
3 月 16 日
qwen-turbo-latest 是怎样计价的啊?
MiraiWithRin
3 月 16 日
@hanguofu 看了几个小时直播都没用到五毛钱,用免费的模型额度都完全足够了,但是 qwen-turbo-latest 没有免费额度,其他模型响应基本要 1 秒以上
afkool
3 月 16 日
先星一下。。这个比 CHROME 自带的识别率高一些。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1198525

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX