我花了一个月时间做了一款开源语音输入法 Typeflux,希望让每个人都能用上 Typeless 级别的体验

4 月 27 日
 mylxsw

事情要从一篇产品体验说起。

年初第一次用到 Typeless,被它的效果震惊了。它能把你口语化、零散的表达转换成结构清晰的专业内容,用起来像是给大脑装了个翻译器。但它太贵了——按年订阅每月 12 美金,按月订阅要 30 美金。

当时我就想:能不能做一个自己的版本?

然后花了一个下午让 Codex 给我搭了个基本框架,居然跑起来了。但因为有其它项目在忙,就搁置了。

直到 3 月底,X 上突然涌现了大量关于语音输入法的讨论,闪电说、西瓜说、智谱语音输入法……那个时间节点让我重新把这个项目捡了起来。

其中智谱语音输入法(AutoGLM)的"人设"功能给了我很大启发——能为不同场景配置不同的指令集和写作风格,这个设计被我借鉴到了 Typeflux 的 Persona 系统里。在这里也记一笔致敬,他们是先把这个想法做成成熟产品的人。

最初我以为花一两天就能跑通。结果发现,做一个"能用的原型"和做一个"可以给别人用的产品"之间,差的是一个月的废寝忘食。

到今天,我终于把它发布出来了。


Typeflux 是什么?

一款开源的 macOS 菜单栏语音输入工具。按住快捷键说话,松开就把文字输入到当前任何 App 的光标位置。

但我对它的定位不仅仅是语音输入法。

我希望它成为一款桌面端的语音 Agent——不仅能帮你输入内容,还能改写、润色、基于桌面内容问答,通过语音控制电脑完成工作。Agent 功能目前在 Beta ,还在持续迭代中,但这是我最终想去的方向。


主要功能:


关于 Typeflux Cloud:

同时上线了 Typeflux Cloud ,提供云端语音和大模型服务。早期测试阶段,目前完全免费

后续如果推出会员服务,也会定价非常亲民。不想折腾的朋友直接注册账号,开箱即用。

核心功能会一直开源,始终支持你自己配置任意语音模型和大语言模型,这是项目的根本基石,不会改变。


我现在是全职独立开发者(开发的一些好玩儿的东西我会在 这里 发布,欢迎关注),这个项目也是我目前最重要的方向。欢迎大家试用、提问题、给建议。一起把它做好。

4488 次点击
所在节点    分享创造
48 条回复
iorilu
4 月 27 日
这个赛道现在已经算事 todo 那种了, 就 v2 就不下 10 个人开发
bs10081
4 月 27 日
想知道它的自動添加詞庫功能,是不是在所有的語音識別模型和大語言模型上都可以使用?另外,操作邏輯是不是和 Typeless 一樣,也就是我在鍵盤上手動修改之後,它就會自動記憶?
yoyoyoyolol
4 月 28 日
做这个项目可能一年半载就被大厂的各种免费语音输入法淘汰了,值得做吗
0xo
4 月 28 日
@FrankAdler 试了一下 GLM 识别率很低 完全不如开源+豆包
stonesirsir
4 月 28 日
可以编译一个 windows 版本吗
mylxsw
4 月 30 日
@stonesirsir 目前这个版本编译不了,它是使用 Swift 开发的,只能在 macOS 平台上使用。
lovdanny
5 月 1 日
当我按下 Fn 键进行语音输入时,它生成的是回应而不是将我的语音转录成归纳文本。这是 bug 还是功能?我只希望转录的话要怎么办,要设定提示词吗
mylxsw
5 月 1 日
@lovdanny 这是 Bug ,第一个版本有时候输出不稳定,下个版本会优化掉这些问题

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1208702

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX