之前一直用 teams 开会讲英文的时候喜欢打开 transcribe ,最近换了一个会议软件没有这个功能了。mac 自带的 caption 在投屏的时候有 bug 显示不出来,想找一个第三方软件,试了两个(应用商店 Noted ,Whisper Transcription )都不太行,要不语音识别质量太差,要不是离线识别。
我感觉以现在的技术在 mac m 芯片上做一个实时转录再结合 LLM 做会议总结完全可行。我之前用过 mac 自带的 speech recognition api ,效果非常好,比 whisper 快且准确,可以结合 VAD (
https://github.com/snakers4/silero-vad ),说话人识别( optional ),做成 AI 会议记录 app 。
不止用在在线会议,线下会议也可以。我感觉大有可为呀,上面两个 APP 我试用的都卖 20-30 刀一年,好评也很多。问问大家目前市面上有类似的 app 吗,没有的话我要自己业余写一个,核心可以开源,只提供 cli 界面,再做一个完整 app 出来卖。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/1104887
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.