简单来说就是图片转口播的的功能。
用户上传一张图片,然后生成一些简单的动作视频,声音克隆,最后把声音与动作视频合并一起,对口型。
使用本地的电脑生成速度慢,硬件要求高,那改全部使用第三方接口费用高。而且效果一般般,还在研究中怎么优化得更好。
然后,百度的绘想在前段时间就出了类似功能,还有一个叫 gaga 的,他们直接使用图片,然后根据文字的描述就可以生成视频,体验完他们的产品后发现这产口质量比我本地生成的效果好多了。
心情好烦,近期没动力继续动手,想着换个方向干点别的吧。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.