MOSS-TTS-Nano Web 工具:本地部署的轻量级语音合成方案
概述
MOSS-TTS-Nano 来自 MOSI.AI / OpenMOSS 团队,属于 MOSS-TTS 系列里的轻量版本。官方介绍里说它是一个开源多语言小型语音生成模型,参数量大约 0.1B ,也就是 1 亿参数级别,目标就是实时语音生成、CPU 可运行、部署简单,所以我尝试用了自己的小水管服务器部署了下,感觉还不错。
核心特性
- 本地推理:所有语音合成在本地完成,数据不出网,无第三方 API 调用
- 29 种预置音色:覆盖中文、英文、日语、韩语、法语、德语等 10+ 语言的多口音音色
- WAV 无损输出:48kHz 采样率,支持音频元信息解析(时长、声道数、采样率)
使用方式
浏览器打开工具页面:
- 输入文本(支持中英文及多语言)
- 选择音色
- 点击生成,等待合成完成
- 在线试听或下载 WAV 文件
点我跳转:文字转语音工具