市面上的语音输入法,比如某 GLM ,真的是贵且不好用。
索性手搓一个,用最好的 ASR ,接 sota LLM !
用的阿里云百炼 FunASR 中文英文准确率都很高,响应速度刷刷的,很爽;
接的 Openrouter ,如果开启 AI 能力可以自己定义技能,在你语音输入后自动对输入内容进行改写;
⚠️这东西需要你自己去申请 key ,申请两个 key 一百块感觉够用一年了
LLM 对语义的理解强的很,不怕你说的多,就怕你给的信息不全,所以我现在 用 Codex 或者 Claudecode 已经离不开语音输入了,如果你也是 vibecoding 场景,那必须要试试。
如果你是写小说的作者也可以尝试,AI 润色这时候就有用了,把小说基本信息作为指令的一部分,然后让 AI 帮你转写,是可以直接成稿的。
page 这里有更详细的介绍
https://tianyu19920816.github.io/VoiceInputApp/
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/1180309
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.