微软 AI 语音合成效果炸裂,进来体验体验

2024-04-11 08:47:28 +08:00
 lemonTreeTop

微软 Azure 新增 9 款逼真 AI 语音,包括中文等多种语言,合成的语音不仅有情绪,还有自然的停顿和语气变化

中文合成语音试听

以下从微软博客复制出来的文本和音频链接

但我现在对这个职业的热爱还是非常的,呵呵,非常的,嗯,怎么说呢?日月可鉴的,哈哈,嗯还是希望可以把这个职业做下去或者做这个声音相关领域的工作,嗯,就是把自己的优势发挥的大一点,尽可能能用到自己擅长的东西,而不是说为了工作,为了挣钱而工作。

https://ttspublic.blob.core.windows.net/nickzhao/conversation.wav

我们需要加的是生抽、老抽、料酒、白糖还有一点点的醋、盐,然后把它翻炒均匀就可以了。接下来就是收汁的阶段了哈,我们加入适量的水淀粉翻炒到这个鸡丁上色,而且汤汁呢,稍稍已经比较浓稠,啊不会轻易的滑落。

https://nerualttswaves.blob.core.windows.net/nttssamples2024/XiaoxiaoML_recipe.wav

体验

微软 Azure 账号注册有一定门槛,为了方便用户简单上手体验,用小程序套壳做了微软这个效果炸裂的语音合成

体验方式:

7907 次点击
所在节点    推广
52 条回复
roding
2024-04-30 18:05:45 +08:00
我注册了微软 Azure 账号,语音库里面找不到这个新的 xiaoxiao 语音,选择来源 openai,一个都没有,界面显示美国中北部支持?我的资源区域是美国中北部,也不到,为什么呢。
lemonTreeTop
2024-05-01 10:28:10 +08:00
@roding 晓晓多语言,地区选美国东部、西欧和东南亚的其中一个,测试东南亚延迟比较低
wyd011011daniel
2024-05-14 19:42:45 +08:00
@zhousir5071 #39 安卓手机 安装 阅读 、TTS Server 。然后配置一下密钥就可以了。
zhousir5071
2024-05-14 20:26:26 +08:00
@wyd011011daniel 我用的是苹果手机
wyd011011daniel
2024-05-14 21:34:50 +08:00
@zhousir5071 #44 我刚刚搞明白,大概流程是
1:美区下载 爱阅记
2:azure 申请密钥( visa 自己注册或者闲鱼买个号)
3: 将 Azure 密钥导入爱阅记 https://tts-importer.yfi.moe/

使用爱阅记就可以听书了
txt equb 都支持

可以去 tts 设置里修改请求以添加风格强度
wyd011011daniel
2024-05-14 21:37:00 +08:00
zhousir5071
2024-05-14 22:32:40 +08:00
@wyd011011daniel 感谢你的耐心指导,我已经根据你说的链接把我申请的 azure 密钥填入 API key 了,但是在爱阅记里面,还是没有找到如何调用微软 tts
zhousir5071
2024-05-14 23:04:37 +08:00
@wyd011011daniel 已经会了,非常感谢你,这个爱阅记,超级好用! so nice of you !
wyd011011daniel
2024-05-14 23:10:14 +08:00
@zhousir5071 #47

如果你完成了 https://tts-importer.yfi.moe/help/ireadnote 这里所说的复制链接导入爱阅记

那么你在爱阅记中打开一本书,点击右下角耳机按钮,然后点击左下角语音库管理,在上方有在线语音库,选择你导入的那个格式就可以。

下面是三张截图可以提供一些参考




zhousir5071
2024-05-21 09:06:05 +08:00
@wyd011011daniel 这个爱阅记有一个很烦人的缺点,读着读着他就自动切到系统机器人的声音了。不知道有没有什么办法解决,或者联系开发者。或者还有更好的软件吗?
wyd011011daniel
2024-05-21 19:15:52 +08:00
@zhousir5071 #50 目前没有遇到过欸,我一般听半小时以内,再长就睡着了。联系开发者可以试试 appstore ? 具体不太清楚 其他软件 如果接受安卓就用阅读

我的博客写了安卓用法可以看看 https://daniel011011-cdn.gitblog.xyz/posts/5
zhousir5071
2024-05-21 21:40:20 +08:00
@wyd011011daniel 好的,我试了这个“语音中心”不错,没有自动切换到机器人的声音。也有一个小问题,就是起步播放时,反应迟钝。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1031492

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX