AI 生成 PPT 方案请教

1 月 30 日
 jsxyzb

最近公司安排做 AI Slides ,我看了下 GitHub 上 ai-slides 这个 topic ,目前活跃的项目基本就两个:

我现在的问题是:有没有办法把 banana-slides 生成的那种高质量页面图,自动转换成真正的可编辑 PPT ?比如识别出标题、正文、图表区域,还原成原生文本和形状?

求教有没有现成工具或技术方案。

3557 次点击
所在节点    程序员
20 条回复
Natumsol
1 月 30 日
试试 lovart ,满足你的诉求
hanssx
1 月 30 日
banana 生成 html ,html->ppt
leeg810312
1 月 30 日
第二个不是 github 的吧?我看不少工具都是生成 html 当作 ppt 用,可能更通用,用浏览器打开看
laowu2012
1 月 30 日
banana-slides 不是有选文字分层解析吗
loopinfor
1 月 30 日
第一个感觉很惊艳,不是说视觉效果很酷炫,而是完全没 AI 味。
市面上很多 AI PPT 做出来的排版都是文字很小、图标巨大,跟普通中文 PPT 模板差异很大。
yrom
1 月 30 日
apacheinsky
1 月 30 日
让 AI 生成 latex ( beamer ),可编辑度绝赞爆表!
CandyMuj
1 月 30 日
可以试试 skills
love060701
1 月 30 日
https://codia.ai/noteslide/

OCR+inpaint ,把图片变成可编辑的 PPT 文件。但是用过你就知道了,还是 AI 生成更方便,现在 Banana 改图会出现字错乱的情况,最多半年就能解决,到时候就是完全 AI 生成和编辑 PPT ,始终是图片格式。
TonyG
1 月 31 日
全自动方案一般效果都不行,vibe coding 16:9 的 html ,引入各种 chart, tailwind css, fontawsome, npm 引入 cheerio ,pptxgenjs ,puppeteer 生成 html 生成截图、生成 ppt 页面的 node 命令,html 用提示词微调不足,图片用各种大模型免费生图形成插入图、背景图,结合 qwen image edit 微调图片内容。然后你就可以得到很漂亮的 ppt 了。
yayoec
1 月 31 日
banana-slides 有导出可编辑的功能,虽然做不到完美,但是确实能用
youyouzi
1 月 31 日
有个技术问题咨询一下各位大佬:
gemini 生成的是图片,他如何做到可以把图片转为 ppt 以后,下载以后可以编辑呢?纯图片》可编辑 ;这个过程是提示词让 gemini 做了什么吗?
hackpro
1 月 31 日
蹲一个 NotebookLM 转可编辑 ppt 方案
syferie
2 月 1 日
我前段时间设计了一个方案,先利用 NanoBananaPro 来生成 PPT 图片,效果与 banana-slides 类似。
之后实现可编辑,核心思路是利用了 Gemini 的视觉思维能力去识别图片中的文字位置和内容样式,从而生成遮罩。
然后利用纯色填充+渐变填充来实现移除文字。
移除之后将上面识别到的文字与样式放置到对应位置,组装为一个完整 PPT ,从而达到可编辑文字的 PPT 效果。

https://github.com/MoonWeSif/NextCreator
syferie
2 月 1 日
@youyouzi 可以参考我这里的开源思路,核心利用了 Gemini 的视觉思维能力去识别图片中的文字位置和内容样式,生成遮罩。
然后利用纯色填充+渐变填充来实现移除文字。
移除之后将上面识别到的文字与样式放置到对应位置,组装为一个完整 PPT ,从而达到可编辑文字的 PPT 效果。

核心还是考虑到作为一个桌面端应用,尽量轻量化,原先是 OCR+Inpaint 的思路,但是依赖外部需要部署的服务,过于繁琐了,现在的话下载即用。
zerovoid
2 月 1 日
题外话,我在想什么不直接用网页替代 PPT 来做演示呢,PPT 能做的事,网页都能做(上下页切换,各种动画效果,浏览器也能全屏),以前用 PPT ,只是很多办公人员不会写代码罢了,现在都交给 AI 写,我看 PPT 可以直接淘汰了。
coobin
2 月 2 日
banana 可以生成 google 的 slides ,slides 可以导出为 pptx
youyouzi
2 月 2 日
@syferie #15 所以是通过提示词让他生成的时候分离背景图片和文字吗?
Jannok
2 月 2 日
我觉得 kimi 的其实还可以,notebooklm 那种很炫酷但是不能编辑,kimi 的是传统 ppt 那种有排版布局的,实用性挺高的,用来做年终总结汇报啥的还蛮好的。
syferie
2 月 7 日
@youyouzi 不是,都是自己处理的。上面说的原理应该挺清晰的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1189630

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX