V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
爱意满满的作品展示区。
mylxsw

我花了一个月时间做了一款开源语音输入法 Typeflux,希望让每个人都能用上 Typeless 级别的体验

  •  
  •   mylxsw ·
    mylxsw · 3h 26m ago · 1075 views

    事情要从一篇产品体验说起。

    年初第一次用到 Typeless,被它的效果震惊了。它能把你口语化、零散的表达转换成结构清晰的专业内容,用起来像是给大脑装了个翻译器。但它太贵了——按年订阅每月 12 美金,按月订阅要 30 美金。

    当时我就想:能不能做一个自己的版本?

    然后花了一个下午让 Codex 给我搭了个基本框架,居然跑起来了。但因为有其它项目在忙,就搁置了。

    直到 3 月底,X 上突然涌现了大量关于语音输入法的讨论,闪电说、西瓜说、智谱语音输入法……那个时间节点让我重新把这个项目捡了起来。

    其中智谱语音输入法(AutoGLM)的"人设"功能给了我很大启发——能为不同场景配置不同的指令集和写作风格,这个设计被我借鉴到了 Typeflux 的 Persona 系统里。在这里也记一笔致敬,他们是先把这个想法做成成熟产品的人。

    最初我以为花一两天就能跑通。结果发现,做一个"能用的原型"和做一个"可以给别人用的产品"之间,差的是一个月的废寝忘食。

    到今天,我终于把它发布出来了。


    Typeflux 是什么?

    一款开源的 macOS 菜单栏语音输入工具。按住快捷键说话,松开就把文字输入到当前任何 App 的光标位置。

    但我对它的定位不仅仅是语音输入法。

    我希望它成为一款桌面端的语音 Agent——不仅能帮你输入内容,还能改写、润色、基于桌面内容问答,通过语音控制电脑完成工作。Agent 功能目前在 Beta ,还在持续迭代中,但这是我最终想去的方向。

    Pasted image 20260426233623.png Pasted image 20260426233633.png Pasted image 20260426233657.png Pasted image 20260426233710.png


    主要功能:

    • 按住快捷键说话,松开自动插入当前光标位置,无需切换窗口
    • 选中文字后用语音指令润色 / 翻译 / 缩写,LLM 直接替换选中内容
    • STT 支持:Apple Speech 、Whisper API / Groq 、本地模型( SenseVoice Small / WhisperKit Medium/Large / Qwen3-ASR )、阿里云实时 ASR / Qwen ASR 、豆包实时 ASR 、Google Cloud Speech 、多模态 LLM 、Typeflux Cloud
    • LLM 支持:OpenAI 兼容接口( 15+ 提供商:OpenAI 、Anthropic 、Gemini 、DeepSeek 、Kimi 、Qwen 、Zhipu 、MiniMax 、xAI 、Groq 等)+ Ollama 本地模型
    • 完全本地推理可选(本地语音模型 SenseVoice Small / WhisperKit Medium/Large / Qwen3-ASR + Ollama 本地大模型),不需要任何 API Key ,隐私友好
    • Persona 系统:为不同场景配置不同的指令集(设计灵感来自智谱语音输入法的人设功能)
    • 历史记录:每次对话存档,可回放音频、重新转录

    关于 Typeflux Cloud:

    同时上线了 Typeflux Cloud ,提供云端语音和大模型服务。早期测试阶段,目前完全免费

    后续如果推出会员服务,也会定价非常亲民。不想折腾的朋友直接注册账号,开箱即用。

    核心功能会一直开源,始终支持你自己配置任意语音模型和大语言模型,这是项目的根本基石,不会改变。


    我现在是全职独立开发者(开发的一些好玩儿的东西我会在 这里 发布,欢迎关注),这个项目也是我目前最重要的方向。欢迎大家试用、提问题、给建议。一起把它做好。

    24 replies    2026-04-27 10:53:04 +08:00
    getadoggie
        1
    getadoggie  
       3h 11m ago via iPhone
    支持一下
    xiafuxin
        2
    xiafuxin  
       3h 3m ago
    前排支持,我觉得语音输入 是 ai 时代的 一个刚需。希望 op 能够越做越好!
    Echo28
        3
    Echo28  
       3h 1m ago via iPhone
    typeless 引导印象太深刻了,都操作了至少 5 分钟,价格也是真贵
    mylxsw
        4
    mylxsw  
    OP
       2h 58m ago
    @getadoggie 谢谢支持
    mylxsw
        5
    mylxsw  
    OP
       2h 57m ago
    @xiafuxin 谢谢支持
    mylxsw
        6
    mylxsw  
    OP
       2h 56m ago
    @Echo28 而且还不能跳过引导,必须做完🤣
    xyovo999
        7
    xyovo999  
       2h 56m ago
    支持
    mylxsw
        8
    mylxsw  
    OP
       2h 54m ago
    @xyovo999 感谢支持
    1bo
        9
    1bo  
       2h 4m ago via Android
    没有 windows 版本,遗憾。
    capric
        10
    capric  
       2h 2m ago
    请问是实时识别吗,还是像微信语音那样按住说完松开再识别
    AEDaydreamer
        11
    AEDaydreamer  
       1h 59m ago
    目前 typeless8000 字够用, 不过还是下载试试, 同时我觉得识别首尾吞字也是一个很细节的体验. 有些软件做的一般.
    Crazy07
        12
    Crazy07  
       1h 55m ago
    豆包测试版已出
    mylxsw
        13
    mylxsw  
    OP
       1h 55m ago
    @capric 暂时没有,后面如果 Mac 版本稳定了考虑开发 Windows 版本
    mylxsw
        14
    mylxsw  
    OP
       1h 54m ago
    @capric 分为两个阶段:语音识别支持实时,但是后面的大语言模型改写是要等识别完后再开始的
    mylxsw
        15
    mylxsw  
    OP
       1h 53m ago
    @AEDaydreamer 有任何问题欢迎反馈😄
    mylxsw
        16
    mylxsw  
    OP
       1h 52m ago
    @Crazy07 现在做语音输入的厂家挺多的,Codex 也支持语音输入了🤣
    kaishi123
        17
    kaishi123  
       1h 45m ago
    非常不错。不过有没有类似功能的安卓版输入法?
    mylxsw
        18
    mylxsw  
    OP
       1h 38m ago
    @kaishi123 Typeless 官方是支持安卓版的,用起来还不错
    hoor
        19
    hoor  
       1h 38m ago
    typeless 的平替版,使用中,看看效果
    jeremyding
        20
    jeremyding  
       1h 23m ago
    用于语音识别 性价比和准确度都比较高的模型 有哪些呀
    AEDaydreamer
        21
    AEDaydreamer  
       1h 17m ago
    @mylxsw 目前发现识别完成后貌似不能退出 macos 的 microphone 模式, 会导致其他软件的声音怪怪的.
    mylxsw
        22
    mylxsw  
    OP
       41 mins ago
    @AEDaydreamer 哈喽,方便帮提个 issue 不?详细说说怎么复现,或者直接加我微信 mylxsw 我们聊聊

    https://github.com/mylxsw/typeflux/issues/new
    mylxsw
        23
    mylxsw  
    OP
       38 mins ago
    @jeremyding 本地 SenseVoice, Whisper ,远程 API 用 阿里和豆包的实时语音转写
    mylxsw
        24
    mylxsw  
    OP
       37 mins ago
    @hoor 有问题欢迎反馈
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5992 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 85ms · UTC 03:30 · PVG 11:30 · LAX 20:30 · JFK 23:30
    ♥ Do have faith in what you're doing.