完全本地处理与存储,不依赖网络
不依赖 GPU ,CPU 速度飞快
CPU 飞快
i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU )
i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU )
实时识别
支持识别麦克风、系统声音或者双路同时识别。
支持字幕和语音输入模式,支持同步翻译(通过自部署 LLM 模型,推荐 HY - MT1.5-1.8B ,速度极快)
识别音视频文件
支持主流音视频文件。
内置 FFMpeg 处理,可以转换各种格式。
说话人管理
内置说话人管理
可以为每个说话人指定模型进行识别
强大的编辑与搜索功能
支持自定义词典。自动调用词典内容进行后处理。
支持手动编辑,点击识别文本自动跳转到对应音频。
支持批量删除与替换
支持全局搜索
本地 LLM 支持
内置 ollama 接口,支持一键启动,一键处理。
可以自定义提示词,使用本地部署的 LLM 模型进行润色、翻译、总结等任务
语言支持
详细介绍:https://owlmeeting.com/docs/zh/
微软商店链接:https://apps.microsoft.com/detail/9pdf92ts07pf
5.22 号之前免费,已经下载试用版的应该是自动获得正式版签名,不知道他签名更新逻辑是啥
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.