vibe coding 了一个调用本地 TTS 服务的文字转语音工具

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

MOSS-TTS-Nano Web 工具：本地部署的轻量级语音合成方案

概述

MOSS-TTS-Nano 来自 MOSI.AI / OpenMOSS 团队，属于 MOSS-TTS 系列里的轻量版本。官方介绍里说它是一个开源多语言小型语音生成模型，参数量大约 0.1B ，也就是 1 亿参数级别，目标就是实时语音生成、CPU 可运行、部署简单，所以我尝试用了自己的小水管服务器部署了下，感觉还不错。

核心特性

本地推理：所有语音合成在本地完成，数据不出网，无第三方 API 调用
29 种预置音色：覆盖中文、英文、日语、韩语、法语、德语等 10+ 语言的多口音音色
WAV 无损输出：48kHz 采样率，支持音频元信息解析（时长、声道数、采样率）

使用方式

浏览器打开工具页面：

输入文本（支持中英文及多语言）
选择音色
点击生成，等待合成完成
在线试听或下载 WAV 文件

点我跳转：文字转语音工具

No Comments Yet

语音本地合成