关于 OCR 以及以图找图识别

我现在使用 com.google.mlkit:text-recognition:16.0.1 ，com.google.mlkit:text-recognition-chinese:16.0.1 这个库进行 OCR 提取，在确认使用这个库的情况下有什么方法可以提高 OCR 识别的正确率呢？ opencv 的图片匹配是否也可以同理提升正确率？

NoOneNoBody

117 天前

OCR 是边缘识别，思想是让文字部分的边缘清晰，例如提高对比度

以图找图不是这个思想，有多种方式
1. 哈希，将大矩阵浓缩为只有极少像素的小矩阵，快但不太准确，适用于“一找多”的模糊匹配
2. 色彩匹配，整体均值或分布情况
3. 特征匹配，就是识物，比较准确，但慢些，sift / orb 这些
4. 局部匹配，就是 opencv 的模板匹配，准确，但要求尺寸接近，如果两图不知尺寸的情况下，自动调整尺寸就是个繁杂的工作

fenglirookie

117 天前

@NoOneNoBody 好的感谢解惑

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1134586

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.