全职独立开发了几年,一直在更新维护的 APP —— 支持文字/表格/PDF/公式识别

2020-07-26 10:51:59 +08:00
 legend2020
2010 年入行的程序猿,2015 年开始辞职做全职独立开发。因为一直对算法比较感兴趣( 15 年初还参加过 CSDN 的在线算法比赛,阴差阳错地得了第三名),所以打算做跟 OCR 有关的 app 。



当时尝试了很多算法,后面感觉深度学习是个好东西,所以 app 直接就叫“深度识别”。虽然其实没有多少深度学习的东西(-_-||)。不过原创的 OCR 识别引擎还是保留下来了。

一开始只有 OCR 文字识别(调百度的在线接口+本地 OCR 识别双引擎)的功能,后面模仿扫描全能王加入了制作 PDF 扫描件的功能。

接着看到表格识别需求比较高,自己整了个表格识别的算法。在生成不规则表格上有时候比百度的表格识别接口还厉害一点(而且百度的表格识别接口太贵了,咱也用不起啊)。分析表格采用原创算法,但是构造表格调用了 C#。

表格识别搞定后,又添加了个图片转 word 的功能。跟表格识别类似,版面分析算法是原创的,生成 word 在底层调用 C#相关的东西。

PDF 识别就比较简单了,其实就是截图+OCR 文字识别。

公式识别是调用 mathpix 的接口。毕竟业界最强,也就不考虑自己再造轮子了。


======================================================================

16 年上线 ios 版本,app store 官网链接:

https://apps.apple.com/cn/app/%E6%B7%B1%E5%BA%A6%E8%AF%86%E5%88%AB-%E6%96%87%E5%AD%97%E8%AF%86%E5%88%AB%E6%89%AB%E6%8F%8F%E5%85%A8%E8%83%BD%E7%8E%8B/id1179334124
1631 次点击
所在节点    分享发现
4 条回复
jdhao
2020-07-26 10:59:00 +08:00
有没有安卓版
gladuo
2020-07-26 15:45:09 +08:00
还是要专精,类似 mathpix,或者福昕,小方向做到最好,做 api 也有人愿意付费
legend2020
2020-07-26 19:21:15 +08:00
@jdhao 有的,酷安市场有最新版,但是不怎么稳定
sonack
2021-02-25 00:02:30 +08:00
想问下楼主表格识别是采用的什么算法 有参考论文吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/693171

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX