新版 PC 微信的 OCR 识别效率和准确度都不错

2022-11-12 23:18:49 +08:00
 happy61

看了一下目录是 WeChatOCR.bin ,估计是模型和引擎都已经合在一起,基本上 PC 上的图片每次打开都能秒识别完成。准确度也不错,不知道是用了哪里的模型,大概 50M 左右

3352 次点击
所在节点    分享发现
10 条回复
qsnow6
2022-11-12 23:54:15 +08:00
能提取出来单独使用的话,就很方便了
zro
2022-11-13 03:10:02 +08:00
@qsnow6 QQ 版的倒是有了。。
yulon
2022-11-13 06:00:23 +08:00
微信 PC 版慢慢比 QQ 好用了,我怎么会做这样的梦?

QQ 我屏蔽了群,就收不到 at 消息,我不屏蔽群,就一直收到所有消息,那这个 at 有什么用?最新的 at 还会把老的 at 顶掉,如果群昵称里带个 emoji 还不给你定位 at 在哪里。明明特别关心可以单独弹消息,为什么 at 就不能单独弹消息?
ShineyWang
2022-11-13 09:32:54 +08:00
powertoys 里面有文本提取器有试过吗?
https://learn.microsoft.com/zh-cn/windows/powertoys/
happy61
2022-11-13 12:29:32 +08:00
@zro qq 我感觉是在线,要点一下等一会儿才有,微信是默认所有都会。
explore365
2022-11-13 14:03:10 +08:00
OCRDetFP32.xnet.nas
OCRParaDetV1.1.0.26.xnet
OCRRecogFP32V1.1.0.26.xnet
sohu_simp.txt

opencv
happy61
2022-11-13 20:11:15 +08:00
@explore365 还有 sohu_simp.txt 是啥?
happy61
2022-11-13 20:13:48 +08:00
<file md5="bec5b066810b8956d101f191d144a3c3" length="1604697">Model\OCRDetFP32.xnet.nas</file>
<file md5="7403d2d994a85edb709e889774da6a66" length="2834840">Model\OCRParaDetV1.1.0.26.xnet</file>
<file md5="a8b4d456577f93937cfdcda03537e149" length="7642697">Model\OCRRecogFP32V1.1.0.26.xnet</file>
<file md5="d1b90d339ae33eed5f5a8b05671d1c8d" length="19919">Model\sohu_simp.txt</file>
Peki
2022-11-21 10:14:34 +08:00
@explore365 我也看到这些文件了,应该是文本区域检测模型,文本识别模型,字典文件。感觉 WeChatOCR 的准确率虽然一般,但是速度真是一绝,不管多大的文件,似乎都是秒识别,这点比较惊人。真的很希望知道他们是怎么做的,有人知道吗?
happy61
2022-11-23 15:01:26 +08:00
@Peki xnet 这是一种什么模型呢。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/894778

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX