昨天晚上刚看到腾讯混元发布了 HunyuanWorld-Voyager ,这个 3D 世界生成模型还挺有意思的,我花时间整理了一些最新信息,分享给对 AI 和 3D 技术感兴趣的朋友们。
主要特点 单图转 3D 只需要一张图片,就能生成完整的 3D 点云场景 基于腾讯混元的技术,生成质量还不错 支持多种场景类型,从室内到户外都能处理 可交互探索 支持键盘和手柄控制,可以自由在 3D 世界里"飞行" 实时渲染,交互体验比较流畅 相机路径可以自定义,想怎么探索就怎么探索 🌍 世界一致性 这个比较厉害,长时间探索也不会出现几何变形 采用了一些缓存技术,确保 3D 场景的稳定性 直接输出 RGB-D 信息,方便后续开发 技术背景 这是世界首个开源的 3D 世界生成模型,腾讯混元团队在技术报告里提到了一些创新点。相比传统的 3D 生成方案,Voyager AI 在质量和稳定性上都有提升。 开源情况 目前模型权重和代码都已经开源了,可以在 HuggingFace 上下载。技术报告也发布了,对技术细节感兴趣的朋友可以去看看。地址贴在最后。 后续计划 如果腾讯后续开放 API 的话,我可能会考虑接入一些功能,比如在我们的平台上集成这个 3D 生成能力。毕竟这种从 2D 到 3D 的转换还是挺实用的。 体验地址 官方演示页面: https://voyagerai.info 有兴趣的朋友可以去体验一下,看看效果如何。如果有什么新的发现或者想法,也欢迎在评论区交流。
HuggingFace: https://huggingface.co/tencent/HunyuanWorld-Voyager GitHub:https://github.com/Tencent-Hunyuan/HunyuanWorld-Voyager
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.