要微调 OCR 产品,提高手机拍屏照片中的序列号识别率(大写字母、数字),字形固定,有什么推荐方案?拍的是内网设备,物理隔离外网

2024-07-16 15:31:01 +08:00
 drymonfidelia
2546 次点击
所在节点    程序员
14 条回复
mMartin
2024-07-16 17:46:04 +08:00
paddleocr 啊 训练部署都简单 只不过是百度的 有恶心人的地方
drymonfidelia
2024-07-16 17:48:28 +08:00
@mMartin 现在用的就是 paddleocr ,每天都内存泄露把 256GB 内存占满,需要每小时重启
mMartin
2024-07-16 20:16:01 +08:00
@drymonfidelia #2 不至于内存泄露吧 我们一直用 应该是你们用法有问题
raycool
2024-07-16 23:24:56 +08:00
排查下吧,换个部署方案。
同用 paddleocr
无内存泄漏问题。
drymonfidelia
2024-07-16 23:36:31 +08:00
@mMartin
@raycool 这个内存泄露的问题我三个多月前就在 v2 问过了,有样本代码 /t/1030071 现在越来越严重了
goxxoo
2024-07-17 08:46:34 +08:00
国外有一家 Tesseract OCR, 我用的识别率 100% 大写字母和数字, C#的 应该也有其他平台,本地调用
ShareDuck
2024-07-17 08:57:06 +08:00
@mMartin #1 之前试用过,没有深入了解。可以具体说说有什么恶心人的东西吗?好让我们今后避坑。
NightFlame
2024-07-17 09:34:20 +08:00
paddleocr + 1
mMartin
2024-07-17 09:42:04 +08:00
@ShareDuck #7 内部代码结构混乱 有路径写死的地方 paddle 臃肿
elboble
2024-07-17 09:45:37 +08:00
cnocr ?可以 docker 部署
KIMI360
2024-07-17 10:31:06 +08:00
intern vl ,glm4v 这些视觉模型也可以试试。
zuiyue123
2024-07-17 10:37:22 +08:00
有好多开源的 可以试试
beginor
2024-07-17 12:12:41 +08:00
没人关注 phi-3-vision 么?
tarasha
2024-07-17 15:06:24 +08:00
换个部署方案吧。转 onnx ,有显卡的话用 trt 更快(启动慢)。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1057733

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX