最近 Google DeepMind 放出了他们第三代音乐模型 Lyria 3,试用之后感觉在音质和多模态输入上非常惊艳。于是我趁热打铁,搓了这个封装了 Lyria 3 能力的在线 AI 音乐生成站,今天来 V 站向大家自荐一下,希望能得到大家的反馈。
🌐 网站地址: https://lyria3.pro
和目前市面上的主流 AI 音乐工具相比,我在开发和测试过程中,发现 Lyria 3 有几个非常硬核的特性:
多模态输入(看图生音): 这是我觉得最抓人的一点。除了常规的文本 Prompt (风格、情绪、BPM 等),你现在可以直接上传一张照片。模型会自己读取画面的情绪、色调,直接谱写出贴合氛围的配乐。
真·高保真音质 (48kHz/24-bit): 懂音频的老哥应该知道,很多 AI 音乐的立体声是通过后期算法“伪造”的。Lyria 3 是从底层的波形合成阶段就原生输出 48kHz/24-bit 的立体声,声音的声场和细节非常能打。
高密度的 30 秒短曲: 相比于 Suno 动辄生成几分钟(且后期容易出现结构崩坏幻觉),Lyria 3 专注于生成 30 秒的高质量片段。非常适合直接拿来做 YouTube Shorts 、TikTok 、播客的 Intro 或 Outro 。
多语言人声 & 自动作词: 支持 8 种以上语言(包括中、英、日等),发音极其自然,没有明显的机器口音,而且自带押韵连贯的自动作词功能。
为了让大家有个直观感受,我总结了一个简单的对比:
音质表现: 竞品大多在 44.1kHz ,Lyria 3 原生 48kHz 。
交互方式: 竞品仅支持文本;我们支持文本 + 图片/视频画面。
版权安全:Lyria 3 底层强制集成了 SynthID 水印,平台生成的音乐 100% 免版税( Royalty-Free ),可以直接商用,不用担心后续被 Youtube 警告。
开发过程中难免还有一些 Bug 和体验不佳的地方,欢迎各位 V 友在帖子里或者通过网站向我吐槽,我会重点记录并优化!
🌐 网站地址: https://lyria3.pro 🌐 github: https://github.com/lyria-3-ai
感谢大家的时间!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.