有没有解析 word 文档为结构化数据的工具

2022-10-20 18:05:17 +08:00
 sdielpf

如题,我这里有一堆 word 文档,内容会按标题格式或者序号的形势来排列,有没有工具能够将这些内容结构化出来存到数据库中呢?

1256 次点击
所在节点    Java
2 条回复
JaguarJack
2022-10-20 18:54:50 +08:00
如果只是文字的话,可以解析成 xml 处理
damai0419
2022-10-21 13:20:15 +08:00
刚做的需求。
我们是解析 word 试卷,里面还包含图片公式之类的。
word --> html ,然后解 html 。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/888493

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX