把 word 里面的信息 按照一定格式抓出来存到数据库里面去 有什么好的办法吗?

2015-11-16 14:52:27 +08:00
 miaotaizi
公司有好多分 word 文档, 现在要抓取里面一些固定的信息, 然后格式化放入数据库里面.
这种需求怎么做比较好啊?
目前想到的办法就是 word->xml->匹配->保存
2348 次点击
所在节点    PHP
4 条回复
blueset
2015-11-16 15:19:31 +08:00
存成 HTML ?
chalio
2015-11-16 15:25:35 +08:00
NPOI
myth
2015-11-16 15:43:56 +08:00
可以试下 python-docx
miaotaizi
2015-11-17 12:44:06 +08:00
@blueset 存成 json 数据

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/236536

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX