Windows 平台语音实时转文字解决方案?

2023 年 12 月 24 日
 vegetablebird

在公司和老外 Teams 开会,听不太懂他们讲的英语,需要一个能在本地运行的实时语音转文字的工具来辅助。 我的 Windows 显卡是 4060 ,还有个 Mac 是 M1 ,之前用过一些 whisper 的 GUI 客户端,但是只能导入音频或者实时收听,没办法直接实时识 Teams 别人的声音 (我知道 Teams 有实时语音,但是这个功能只有在新版 Teams 才有,但是公司只能用旧版的)

3105 次点击
所在节点    Windows
23 条回复
vegetablebird
2024 年 1 月 22 日
@wowpaladin windows 自带的对于不标准的口语识别根本无法使用
pimou
2025 年 2 月 18 日
可以看下 DuRT ,DuRT 是 Mac 上的语音识别和翻译软件。
https://apps.apple.com/us/app/durt/id6736675809

目前功能:1. 实时识别音频(支持系统音频和麦克风),转成文本 (支持几十种语言)
2. 实时将文本翻译成需要的语言 (支持几十种语言)
3. 保存音频、保存文本、保存翻译结果。

DuRT 的实时语音识别有两种方式。 一种是使用 Mac 系统内置的语音识别。 一种是使用 whisper 模型。 都是使用的本地服务。
翻译用的是大模型。 支持在本地运行大模型 和使用云端的大模型 API 。
ivyliner
2025 年 2 月 24 日
@vegetablebird 如果你还用 Mac 是 M1 的话, 可以试试 https://www.engineerdraft.com/bemyears/ , 可以试试识别 macOS 上 App (Teams, Zoom, Browser) 的声音生成字幕, 并实时翻译.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1003052

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX