外包一个小活儿,需要将 word 的 docx 文档的文字识别出来。

2021-03-06 18:57:36 +08:00
 buptrobin
要求:
用 Python
能把章节号也给识别出来,即
原来的格式有 1,1.2 之类的,转换出来的文字也要有。
952 次点击
所在节点    外包
9 条回复
musi
2021-03-06 20:04:08 +08:00
怎么联系
gulumogu
2021-03-06 20:35:40 +08:00
联系方式发一下
ilucyx
2021-03-06 20:49:07 +08:00
@buptrobin 联系我 telegram `@lwbroxjq`
antpi
2021-03-06 21:51:44 +08:00
YW50eDIwMDYwMQ==
buptrobin
2021-03-07 07:16:32 +08:00
PDF 如果能准确率高的也行。
就是文字都能识别,而且,章节号也能识别出来,也能知道是章节号。
buptrobin
2021-03-07 07:17:20 +08:00
@gulumogu YnVwdHJvYmlu
buptrobin
2021-03-07 07:17:24 +08:00
@musi YnVwdHJvYmlu
bruceche11
2021-03-10 17:03:45 +08:00
还需要吗?
buptrobin
2021-08-03 11:22:03 +08:00
@bruceche11 需要 wx:YnVwdHJvYmlu

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/759108

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX