[限时免费] windows 离线语音转文本、语音转文本、实时字幕工具

1 天前
 indexError

功能亮点

功能介绍

  1. CPU 飞快

    1. i5-11400H:30min 的音频 1min 就能处理完(五年前的 CPU )

    2. i5-4210m:30min 的音频 3min 就能处理完(十年前的 CPU )

  2. 实时识别

    1. 支持识别麦克风、系统声音或者双路同时识别。

    2. 支持字幕和语音输入模式,支持同步翻译(通过自部署 LLM 模型,推荐 HY - MT1.5-1.8B ,速度极快)

  3. 识别音视频文件

    1. 支持主流音视频文件。

    2. 内置 FFMpeg 处理,可以转换各种格式。

  4. 说话人管理

    1. 内置说话人管理

    2. 可以为每个说话人指定模型进行识别

  5. 强大的编辑与搜索功能

    1. 支持自定义词典。自动调用词典内容进行后处理。

    2. 支持手动编辑,点击识别文本自动跳转到对应音频。

    3. 支持批量删除与替换

    4. 支持全局搜索

  6. 本地 LLM 支持

    1. 内置 ollama 接口,支持一键启动,一键处理。

    2. 可以自定义提示词,使用本地部署的 LLM 模型进行润色、翻译、总结等任务

  7. 语言支持

    1. 普通话( 97%)、中文方言( 90%)、英语( 95%)、韩语( 94%)、日语( 94%)阿拉伯语、以及意大利语( 97%)、西班牙语( 96%)、葡萄牙语( 95%)、德语( 95%)、法语( 95%)、俄语( 94%)、乌克兰语( 93%)、波兰语( 93%)、荷兰语( 93%)等 25 种欧洲语言、印尼语、泰语、越南语、土耳其语、印地语、马来语、菲律宾语、波斯语

官网:https://owlmeeting.com/

详细介绍:https://owlmeeting.com/docs/zh/

微软商店链接:https://apps.microsoft.com/detail/9pdf92ts07pf

5.22 号之前免费,已经下载试用版的应该是自动获得正式版签名,不知道他签名更新逻辑是啥

263 次点击
所在节点    推广
2 条回复
dmine
12 小时 9 分钟前
加个 gpu/npu 加速?
indexError
8 小时 31 分钟前
@dmine 之前试过,用的 onnx 模型,可能是有的算子或模型导出方式不支持 gpu ,会回退到 cpu ,越加越慢。加的话还得准备两份模型,还得把 cuda 打包进去。现在最慢的模型普通 cpu 的 rtf 不超过 0.2 ,在可接受范围

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1212968

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX