V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
jovix
V2EX  ›  分享发现

新的开源形式

  •  
  •   jovix · 3 月 30 日 · 834 次点击
    开源的是这几天火热的语音输入法 AI 编程指令,具体说是一段一次性完成一个应用开发的指令,原作者使用 claude code ,我使用 codex 复刻。

    原帖: https://x.com/yetone/status/2038183163579810024
    原帖项目: https://github.com/yetone/voice-input-src
    我复刻的项目: https://github.com/jovix0101/voice-ime

    我是用 codex 复刻的,使用 gpt-5.4 模型,一次性成功,可运行使用。

    ```shell
    mkdir -p voice-ime && cd voice-ime && \
    codex exec \
    --full-auto \
    --sandbox danger-full-access <<'EOF'

    请实现一个 macOS menu-bar 语音输入法应用( Swift ,macOS 14+),具体要求:

    1. 按住 Fn 键录音,松开后将转录文字注入当前聚焦的输入框。优先使用流式转录( Apple Speech Recognition framework )。Fn 键通过 CGEvent tap 全局监听,需抑制 Fn 事件传递以防止触发 emoji 选择器。
    2. 默认语言必须为简体中文( zh-CN ),确保开箱即用就能识别中文输入。同时在菜单栏提供语言切换选项(英语、简体中文、繁体中文、日语、韩语)。语言选择存储在 UserDefaults 中。
    3. 录音时在屏幕底部居中显示一个特别优雅精致的无边框胶囊状悬浮窗,不要有红绿灯和 titlebar 。使用 NSPanel ( nonactivatingPanel )+ NSVisualEffectView (.hudWindow 材质),高度 56px ,圆角半径 28px ,包含:
    - 左侧 5 根竖条波形动画( 44×32px ),必须由实时音频 RMS 电平驱动。说话声音大波形就大,安静时波形就小。权重为 [0.5, 0.8, 1.0, 0.75, 0.55],带平滑包络( attack 40%、release 15%),每根竖条加入 ±4% 随机抖动,波形清晰可见。
    - 右侧文字标签(宽度 160-560px 自适应)实时显示转录文本,随内容增长自动扩展
    - 入场弹簧动画( 0.35s )、宽度过渡( 0.25s )、退场缩放动画( 0.22s )
    4. 文字注入使用剪贴板 + 模拟 Cmd+V 。注入前检测输入法,如为 CJK 输入法则临时切换到 ASCII ( ABC/US ),粘贴完成后恢复原输入法,并恢复剪贴板内容。
    5. 接入 LLM 提升识别准确率(支持 OpenAI 兼容 API )。可配置 API Base URL 、API Key 、Model 。LLM 只允许“极保守纠错”:仅修复明显识别错误(如“配森→Python”、“杰森→JSON”),禁止改写或润色。
    6. 菜单栏提供 LLM Refinement 子菜单(启用开关 + Settings )。Settings 包含 API Base URL 、API Key 、Model 输入框,支持清空 API Key ,并有 Test 和 Save 按钮。松开 Fn 后若启用 LLM ,则显示“Refining...”并在完成后注入文本。
    7. 应用使用 LSUIElement 模式运行(仅菜单栏,无 Dock 图标)。使用 Swift Package Manager 构建,提供 Makefile ( build/run/install/clean ),输出为签名 .app bundle 。

    [工程要求]
    - 在当前目录创建完整项目( SPM )
    - 项目名:VoiceIME
    - 自动创建目录结构和所有 Swift 文件
    - 自动生成 Makefile

    [执行策略]
    - 自动 build 项目
    - 如果 build 失败,自动分析并修复
    - 最多循环 5 次,直到成功
    - 最终输出运行方式

    EOF
    ```

    tokens used
    72,670
    guisheng
        1
    guisheng  
       3 月 30 日
    代码全不要,只要提示词。😂
    jovix
        2
    jovix  
    OP
       3 月 30 日
    @guisheng #1 是的,最终产出的质量就看用什么模型了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   938 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 19:44 · PVG 03:44 · LAX 12:44 · JFK 15:44
    ♥ Do have faith in what you're doing.