体验了下 mimo-v2-tts 模型,感觉效果还可以

3 月 30 日
 zzlove

最近想做写儿童睡前故事相关视频或者绘本,图片搞定了,需要文本转语音,尝试了一些方案感觉效果都一般般,刚好最近 mimo-v2-tts 免费用,就在 miclaw 里面生成了一段龟兔赛跑的语音,效果竟然还不错,对比剪映、edge-tts 感觉效果还要好一些,就是有时候风格控制的不够准确,如果后续支持克隆音色就好了。 官方提供 OpenAI / Anthropic 格式 api 调用,撸了个简单的 ui 界面,大家有需要的可以试试。

Github: https://github.com/evolify/tts-ui

675 次点击
所在节点    分享创造
3 条回复
llll
3 月 30 日
运行在 npm run dev 环境,为什么点击“生成语音”按钮没有任何反应
llll
3 月 30 日
我用 AI 修复了:
点击“生成语音”按钮没有任何反应的主要原因是 app/page.tsx 文件中的 onGenerate 函数逻辑不完整 。在该函数中,虽然检查了 API Key 是否存在,但在 API Key 存在的情况下,并没有调用 useMimoTTS 钩子提供的 generate 方法来触发语音生成。

我已对代码进行了修复。

** 代码修改 **

在 page.tsx 中,我完善了 onGenerate 函数,使其在 API Key 存在时正确调用 generate 方法:

```
// d:\Desktop\tts-ui-main\app\page.tsx

  function onGenerate() {
    if (!apiKey) {
      setIsSettingsOpen(true)
      return
    }
    // 修复:调用 generate 方法触发语音生成
    generate(styledText, voice, format)
  }
```
zzlove
3 月 30 日
@llll 我的锅,被 gemini 删了一行代码,没注意到,已经修复了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1202294

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX