[免费] LazyTyper:用「嘴」写代码,给 Claude Code 发语音(Mac 首发)

32 天前
 oldcai

吸上 Vibe Coding 这段时间,我发现和 Claude Code 聊天最大的痛点不是 token 不够,而是要输入的字太多。长 prompt 、长解释,手敲真累。

我把市面上语音输入法都试了个遍:要么贵、要么卡、要么贵还卡。干脆自己写了一个“按住说话、松开出字”的小工具。

越用越顺手:除了和 Claude Code 对需求、调 bug 、写 commit ,各种 prompt……

现在也不用吐槽微信电脑版为啥没有语音识别了

我现在已经很少用键盘长篇打字了。

既然自己爽了,就免费分享给大家。

LazyTyper = 语音写代码,双手解放。

支持的语音识别引擎

四选一,都有用不完的免费额度,还可随时切换

Groq ( Whisper )、Mistral ( Voxtral )、AssemblyAI 、豆包语音

平台 & 价格

官网与下载:https://lazytyper.com/zh

Bug 、建议、Windows 版、支持其他模型,等等,有什么问题都可以留言,我会跟进完善。

7130 次点击
所在节点    分享创造
94 条回复
liulicaixiao
27 天前
@oldcai #60 我是今天逛之前买的一个产品大礼包发现的这个新东西,然后就突然想起来论坛里有人也做了类似的软件了。
oldcai
27 天前
@liulicaixiao

哦哦,了解了。我记得那个大礼包是大概可以免费用一年。
你可以先用用他的,再过来对比一下。
给我一些使用的反馈,比如哪里觉得爽,但是 LazyTyper 没有的,帮助 LazyTyper 提升一下。

其实 LazyTyper 比它支持的 AI 更多(它只支持 Whisper )
中英文混排识别率:它的识别率其实没有 LazyTyper 新加的 ElevenLabs 好
中文的识别率:也没有 LazyTyper 支持的豆包好
qfdk
27 天前
火山引擎凭证验证失败:Invalid VolcanoEngine API credentials: 所有重试都失败了。最后的错误: 无法连接到服务器,请检查网络连接
oldcai
27 天前
@qfdk 奇怪,有没有对照一下引导文档中的 id/key 格式,是长的差不多的吗?
有没有开梯子或者有其他的复杂的网络情况?
LinJunzhu
27 天前
之前一直没办法使用的 BUG 终于修复了,达到可用状态。

提个建议: 如果能一边说一边出文字,就最好了。 参考手机端的微信输入法#语音输入/系统的语音输入
qfdk
27 天前
@oldcai 过两天再试试吧. 没有梯子哈.
qfdk
27 天前
ElevenLabs 还是好用 !
rafa
27 天前
顶一个,已经开始爽用了
s4nd
27 天前
来个 windows 版吧
theo
27 天前
@oldcai 赞一个,正在爽用
确实遇到了「火山引擎凭证验证失败」的问题,还有偶发的触发不成功的问题,都是多次退出重新启动后解决了。
apollo007
26 天前
很不错,不过就是感觉有点慢,不是很快就出来的感觉。我希望的是呢。等我把话说完,他立刻就能出结果。
apollo007
26 天前
@apollo007 #71 用着用着好像它的速度越来越快了,不错。目前来讲体验 99 分。
followad
26 天前
会玩 会玩
november
26 天前
安静,你吵到我用 TNT 了。
ccc00
26 天前
请问豆包可以无限量使用吗?
oldcai
26 天前
@ccc00 可以的,你安装后可以看到引导,有详细说明。
@november 安静,你吵到我用 LazyTaper 了。
leetcode2020
26 天前
@oldcai 想请教一下,这个项目是基于 Tauri 开发的吗?另外,在 macOS 上有试过使用 Apple 自带的 Speech Framework 吗?想了解一下实际效果如何。
oldcai
25 天前
@leetcode2020 对,Tauri+Svelte
Apple 的识别率不太好,中英混输也比较难受,后面提升了再加。
优先加识别率对生产力有帮助的。如果有更好的欢迎提。
xiaket
25 天前
没有泼冷水或者冒犯的意思. 很多时候人说话, 尤其是比较长的内容, 会有不少的语气助词或各种停顿. 所以我自己本地做这个功能( https://github.com/xiaket/etc/tree/master/murmur)的时候, 先是丢给 whisper 识别, 后面再把识别出来的文本拿去给 OpenAI 润色一遍. 这样效果会好一点.
oldcai
25 天前
@xiaket 没有没有,超级欢迎提意见。提到这么深入的问题,说明你肯定是同道中人。

其实我也考虑过这个问题,之前甚至调研过其他的产品,有的也有润色成书面语等功能。
但是实际测试下来,它的确有时候会让你有惊喜(比如口述 emoji 表情),但是更多时候它会添乱。
而且最重要的问题是,它会让我对语音转的文字没有信心。会增加不必要的校对的心力。

我觉得作为一个主要目的是输入的产品,还是要忠于输入。

而且其实不管是 Whisper 还是 ElevenLabs 这两款都会有将你轻微的停顿去除的功能,有大概 5%左右的纠错的能力;
至于豆包语音这种,它会把你的思考的那些声音,发出的“嗯”,“呃”的声音也加进去,我也针对实现了一个功能,去机械化地去除这样的一些停顿。暂时做到了用于 Vibe Coding 的时候我比较满意的程度。

你的建议我先拿小本本记下。我想的也不一定对,先看一下大家的意见,后面我会考虑。
如果你有好的案例,欢迎给我分享一下,我会再考虑考虑。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1151314

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX