V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lemonTreeTop
V2EX  ›  推广

微软 AI 语音合成效果炸裂,进来体验体验

  •  4
     
  •   lemonTreeTop · 18 天前 · 4259 次点击

    微软 Azure 新增 9 款逼真 AI 语音,包括中文等多种语言,合成的语音不仅有情绪,还有自然的停顿和语气变化

    中文合成语音试听

    以下从微软博客复制出来的文本和音频链接

    但我现在对这个职业的热爱还是非常的,呵呵,非常的,嗯,怎么说呢?日月可鉴的,哈哈,嗯还是希望可以把这个职业做下去或者做这个声音相关领域的工作,嗯,就是把自己的优势发挥的大一点,尽可能能用到自己擅长的东西,而不是说为了工作,为了挣钱而工作。

    https://ttspublic.blob.core.windows.net/nickzhao/conversation.wav

    我们需要加的是生抽、老抽、料酒、白糖还有一点点的醋、盐,然后把它翻炒均匀就可以了。接下来就是收汁的阶段了哈,我们加入适量的水淀粉翻炒到这个鸡丁上色,而且汤汁呢,稍稍已经比较浓稠,啊不会轻易的滑落。

    https://nerualttswaves.blob.core.windows.net/nttssamples2024/XiaoxiaoML_recipe.wav

    体验

    微软 Azure 账号注册有一定门槛,为了方便用户简单上手体验,用小程序套壳做了微软这个效果炸裂的语音合成

    体验方式:

    • 微信搜索小程序 [七彩工具箱] ,点击底部"微软语音"

    • 或微信内点击链接 #小程序://七彩工具箱/yox3tTy2XGHkA6m

    • 或直接扫码

    微软语音体验.png

    40 条回复    2024-04-21 16:17:42 +08:00
    kingofzihua
        1
    kingofzihua  
       18 天前
    第二个确实可以,和真人一样, 第一个就不行了,明显的断裂感,
    lemonTreeTop
        2
    lemonTreeTop  
    OP
       18 天前
    文案中可以适当加一些表达情感的词,如哇、吗、啊等,效果会更好🤣
    Goooooos
        3
    Goooooos  
       18 天前
    第一个前面几个字开口就听出机器人味道,每个字之间的停顿都那么均匀
    AthensBird
        4
    AthensBird  
       18 天前 via Android
    能不能提供 9 个声音
    iOCZS
        5
    iOCZS  
       18 天前
    的确很逼真,跟真人似的
    lemonTreeTop
        6
    lemonTreeTop  
    OP
       18 天前
    @AthensBird 目前中文只支持了一个声音,其他的非中文语言
    ColoThor
        7
    ColoThor  
       18 天前
    晓晓? api 现在能用吗,https://speech.microsoft.com/portal/xxxxxxxxxxxxxxx/voicegallery 好像还是旧的
    zmqking
        8
    zmqking  
       18 天前
    第二段确定是 AI 合成?
    lemonTreeTop
        9
    lemonTreeTop  
    OP
       18 天前
    @ColoThor 上面新发布的是微软 Azure 商用的,有一定免费额度,按字符计费,名字是 zh-CN-XiaoxiaoMultilingualNeural

    (Female)
    lemonTreeTop
        10
    lemonTreeTop  
    OP
       18 天前
    @zmqking 是的,你可以用小程序自己合成下
    qinfengge
        11
    qinfengge  
       18 天前
    这个语句间的停顿,太真实了吧
    sunziren
        12
    sunziren  
       18 天前
    哇偶,好逼真呀。哈哈。
    SurgaOrange
        13
    SurgaOrange  
       18 天前
    试了一下,完全没有第二段那个效果,明显听得出来是 AI 合成的
    OliverLee
        14
    OliverLee  
       18 天前
    试听了一下,很逼真啊!如果能用来听电子书就好啦😂
    adsltsee94
        15
    adsltsee94  
       18 天前
    我合成出来是第一个效果。。第二个声音是哪里搞的?
    amon
        16
    amon  
       18 天前
    nice ,前阵子做过一个语音产品用的也是 xiaoxiao 。
    lemonTreeTop
        17
    lemonTreeTop  
    OP
       18 天前   ❤️ 1
    微软 Azure 的 9 款新语音包括:

    美式英语 - en-US-AvaMultilingualNeural:明亮、富有感染力的女性声音,音色优美。

    美式英语 - en-US-AndrewMultilingualNeural:温暖、富有感染力的男性声音,让人感觉平易近人。

    美式英语 - en-US-EmmaMultilingualNeural:友善、轻快、悦耳的女性声音,适用于教育和讲解场景。

    美式英语 - en-US-BrianMultilingualNeural:年轻、开朗、多才多艺的声音,非常适合各种各样的环境。

    德语 - De-DE-FlorianMultilingualNeural

    德语 - De-DE-SeraphinaMultilingualNeural

    法语 - Fr-FR-RemyMultilingualNeural

    法语 - Fr-FR-VivienneMultilingualNeural

    中文 - zh-CN-XiaoxiaoMultiligualNeural
    ColoThor
        18
    ColoThor  
       18 天前
    @lemonTreeTop #9 可以了,谢谢
    roding
        19
    roding  
       18 天前
    如果 edge 的大声朗读能用就好了。
    lemonTreeTop
        20
    lemonTreeTop  
    OP
       18 天前
    @roding 哈哈,我也想,希望微软以后可以支持
    shakespark
        21
    shakespark  
       18 天前
    试了一下,晓晓多语言不错
    ColoThor
        22
    ColoThor  
       18 天前
    有 Azure 账号的安卓用户,可以试试我写的 Demo
    https://github.com/Colo-Thor/AzureTextSpeech
    JayZXu
        23
    JayZXu  
       18 天前
    确实效果比原版的 Xiaoxiao 有了巨大进步
    本听书用户已经用微软的 xiaoxiao 两年多了,确实比离线的 TTS 有非常大的差距

    不过 azure 国内价格确实是有点贵了,舍不得
    atalas
        24
    atalas  
       18 天前
    体验了以下,确实不错! 想直到现在克隆出的语音,如何进行进行部署!
    lemonTreeTop
        25
    lemonTreeTop  
    OP
       18 天前
    @atalas 得在微软 Azure 注册账号,有点小麻烦
    lemonTreeTop
        26
    lemonTreeTop  
    OP
       18 天前
    @JayZXu 长文本合成时间有点长😂
    hauibojek
        27
    hauibojek  
       18 天前
    第一段前面不太行,后面部分效果不错,第二段基本听不出来是 ai 了。
    shilyx
        28
    shilyx  
       18 天前
    我早先用过,感觉完全超过了国内的几个提供商,某度和某飞

    微软的支持情绪,支持方言,支持各国语言

    每月 50 万字的免费额度完全够用

    更重要的是他给的 demo 真的能用,而不是编译不过或配置有问题
    WilliamZuo
        29
    WilliamZuo  
       18 天前
    效果惊人,比目前 B 站虚拟主播 AI 唱歌的那些更加自然。
    SeeYouNextTime
        30
    SeeYouNextTime  
       18 天前
    当时我看到的第一反应想的是:如果拿来读 《少妇白洁》 会是什么感觉。。😂
    Andnot
        31
    Andnot  
       18 天前
    微软有离线语音包吗?
    jinxjhin
        32
    jinxjhin  
       18 天前
    @shilyx #28 国产最好的应该是 minimax 的
    bojackhorseman
        33
    bojackhorseman  
       18 天前 via iPhone
    惊了,像极了 Eva 的科技生活这个测评博主的声线
    click
        34
    click  
       18 天前
    想用来做视频配音,Azure 怎么搞免费额度?
    chiu
        35
    chiu  
       18 天前
    还能加 BGM?
    lemonTreeTop
        36
    lemonTreeTop  
    OP
       17 天前
    @click 注册就有了
    lemonTreeTop
        37
    lemonTreeTop  
    OP
       17 天前
    @chiu 不会🤣
    chiu
        38
    chiu  
       17 天前
    @lemonTreeTop #37
    因为我听你 post 的第二段, 好像是有 BGM 的
    zhousir5071
        39
    zhousir5071  
       9 天前 via iPhone
    op ,有没有可以单独长期使用的?可以朗读文章,书籍。目前在用讯飞有声,感觉没有微软这个自然。
    lemonTreeTop
        40
    lemonTreeTop  
    OP
       8 天前
    @zhousir5071 我做的小程序目前支持了公众号文章朗读,书籍还没支持
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1269 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 23:33 · PVG 07:33 · LAX 16:33 · JFK 19:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.