orc 图片识别文字自动记录的构想

2022-02-25 10:18:57 +08:00
 mydingyan
需求描述:通过手机截图自动上传服务器,根据图片相似度进行比对,(例如京东、淘宝订单页面截图比对,服务器可提前预设对比样式),自动 ORC 识别图片所需要的文字字段填写至对应表格字段。
或者有没有类似已经实现的工具。

难点:
1.手机截图自动上传至服务器,目前 WIFI 自动同步工具有,流量同步工具暂时没发现
2.根据图片相似度识别比对原预设图片,不知是否可以实现
3.识别图片文字,并根据文字内容自动填写至预设字段,图片
4.非预设图片(或者没有识别到对应关键字),不填写至数据库
5.文字识别成功后,部分内容根据识别成功的文字,自动发送邮件

实现功能:
1.经常不同平台购物,通过截图记录不同平台订单,随手截图后自动记录
2.公司打卡等,完成某件常规任务后,随手截图后自动记录并邮件提醒已完成。(如规定时间未完成也自动邮件提醒)
1617 次点击
所在节点    问与答
10 条回复
mydingyan
2022-02-25 10:23:35 +08:00
每件小事记录做起来很难,但是截图是很随手的操作,突然想着能不能把截图的图片用起来,实现常规化、日常化
princelai
2022-02-25 10:32:26 +08:00
没有,但一木记账支持手动上传支付宝和微信支付截图,然后自动识别金额,具体类别还是要自己选择的。
nalr
2022-02-25 12:14:34 +08:00
安卓的话装个 termux 然后用脚本同步到对象存储? orc 后再按关键字识别截取应该不难吧
nalr
2022-02-25 12:16:30 +08:00
OCR
Juszoe
2022-02-25 12:26:15 +08:00
1. 不了解,但我觉得这种涉及隐私的在本地识别比较好
234 其实是一个需求,用模板 OCR 即可,有很多现成的服务,https://cloud.tencent.com/product/custom-ocr
5. 发个邮件不难
crokily
2022-02-25 13:14:55 +08:00
最近刚为朋友的小工厂做了一个类似的 Ocr 系统,订单上传,Ocr 提取订单信息需求信息填入数据库,并进行后续的运算与生成相应送货单月结单等物料。
大致上需求跟 OP 的其实很像。主要烦点在于多家客户的订单样式不同,数据格式不同(类比 OP 的多个平台截图样式不同、数据格式不同),于是没法通用一套代码提取出关键信息,要针对不同的订单样式与数据格式各写一套适用的提取代码(或许会有更好的方法但我没有想到)。难倒是不难,但工作量变得很大,而且系统的通用性适用性很低,得作者对不同的图片一套套去写。
mydingyan
2022-02-25 14:01:42 +08:00
@nalr 找到了 ,腾讯云 COS 客户端可以直接自动上传备份。
mydingyan
2022-02-25 14:04:18 +08:00
@Juszoe 腾讯云的这个还没有公测,百度 OCR 有相关的识别。但是图片样式类似 @crokily 描述, 不能用通用代码匹配模板, 截图在于随意性,如果每一张截图都需要单独匹配就非常复杂了。
简易版本应该可以实现
jifengg
2022-02-25 16:35:15 +08:00
百度的 ocr 有自定义模型的,之前看过但是没有具体研究过,楼主可以看看。
fanyingmao
2022-02-25 17:14:57 +08:00
之前给老爸开发了基于 ocr 填表的工具你看下,后端用的百度的 ocr 接口,不过好像没人用,没维护优化了。
https://github.com/fanyingmao/ocr-electron

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/836312

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX