如何基于 LLM 翻译文图表混排的 PDF 文件?

2 天前
 gosky
有份 PDF ,内容如下图所示。本来也有中文翻译版,但是翻译的太差了。
我曾经自己写脚本,调用 LLM API 翻译 EPUB 文件。
但这种 PDF ,还是文图表混排的 PDF ,完全没头绪。

691 次点击
所在节点    问与答
6 条回复
aikilan
2 天前
试试 paddleOCR
SuperDaniel313
2 天前

是想要这样的效果吗?
gosky
2 天前
@SuperDaniel313 是的。不过你这个没图片和表格
stargo
2 天前
mineru
rpish
2 天前
先转 LaTex
iorilu
1 天前
mineru 有 api 调用方式, 可以官方看看

当然了, 有 gpu 也可以本地运行, 不过很慢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1211926

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX