关于 OCR 以及以图找图识别

117 天前
 fenglirookie

我现在使用 com.google.mlkit:text-recognition:16.0.1 ,com.google.mlkit:text-recognition-chinese:16.0.1 这个库进行 OCR 提取,在确认使用这个库的情况下有什么方法可以提高 OCR 识别的正确率呢? opencv 的图片匹配是否也可以同理提升正确率?

1363 次点击
所在节点    机器学习
2 条回复
NoOneNoBody
117 天前
OCR 是边缘识别,思想是让文字部分的边缘清晰,例如提高对比度

以图找图不是这个思想,有多种方式
1. 哈希,将大矩阵浓缩为只有极少像素的小矩阵,快但不太准确,适用于“一找多”的模糊匹配
2. 色彩匹配,整体均值或分布情况
3. 特征匹配,就是识物,比较准确,但慢些,sift / orb 这些
4. 局部匹配,就是 opencv 的模板匹配,准确,但要求尺寸接近,如果两图不知尺寸的情况下,自动调整尺寸就是个繁杂的工作
fenglirookie
117 天前
@NoOneNoBody 好的 感谢解惑

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1134586

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX