众所周知,微信的 OCR 识别又快又准,于是就想提出来代替某某桨的识别
https://github.com/golangboy/wxocr
docker 拉取下来 直接 post 请求即可
docker pull golangboyme/wxocr
curl -X POST http://localhost:5000/ocr \
  -H "Content-Type: application/json" \
  -d '{"image": "BASE64_ENCODED_IMAGE_DATA"}'
|  |      1csx163      219 天前 nb ,不知道是不是和 win 版微信一个代码 | 
|  |      2liuliuliuliu PRO 啊哈哈哈 牛逼 这个套路可以 | 
|  |      3maocat      219 天前 via Android 你是真的牛 | 
|      4GetOctober      219 天前 哈哈哈 牛牛牛 赶快试试 | 
|  |      5Numbcoder      219 天前 🐂🍺,好奇怎么实现的,图片会发到微信服务器吗? | 
|      6x2ve      219 天前 需要联网吗 | 
|  |      7xuangoer666      219 天前 via Android 南山必胜客警告 | 
|      8zgsi      219 天前 好家伙,不需要鉴权吗? | 
|      9someonesnone      219 天前 南山必胜客警告 +1 | 
|      10Blanke      219 天前 楼上的都不看看代码的吗,本地实现,用 ocr 模型这样实现的 | 
|      12ltmst      219 天前 🐂🐸 | 
|  |      13bybyte OP 各位可以进去看看 README 先,本地模型实现的 | 
|  |      14cmsyh29      219 天前 🐮 | 
|      15GetOctober      219 天前 @bybyte 尝试了一下,返回结果是空: ``` {'result': {'errcode': 0, 'height': 190, 'imgpath': 'temp/ed9b119d-dc84-4a77-b3d2-8cd053e62fe5.png', 'ocr_response': [], 'width': 930}} ``` | 
|  |      16ik      219 天前 via iPhone 大哥,哈啤酒🍻 | 
|  |      17bybyte OP @GetOctober 这返回错误码是正常只是没识别到文字吧,是不是你图片上没文字?换张图试试?我这边测过了 | 
|  |      18wqsdfdddd      219 天前 图片翻译能提取出来不? 感觉它的翻译效果挺好的, 主要是能保持原有样式 | 
|  |      20bybyte OP @xuangoer666 我只是把一个大佬的项目整合一下,应该不会吧,有先例吗,有我就删库了 | 
|      21keller      219 天前 666 下午试试 | 
|  |      22sunfly      219 天前 牛逼趁着删库前赶紧 clone 下来 | 
|      23woshivu      219 天前 我去,我怎么感觉微信的 ocr 不如其他的识别精准呀 | 
|      24leyoumake1997      219 天前 牛娃 | 
|      25GetOctober      219 天前 | 
|      26bigtear      219 天前 via Android 不错的项目,starstar | 
|  |      27bybyte OP @GetOctober 我测试返回:OCR 识别成功!结果如下: {'errcode': 0, 'height': 190, 'imgpath': 'temp/4ec69547-1144-42ec-9911-dc1c4c932d01.png', 'ocr_response': [{'bottom': 74.109375, 'left': 36.328125, 'rate': 0.9704948663711548, 'right': 714.9375, 'text': 'WeChat OCR API Docker 微信 OCR API Docker', 'top': 43.59375}, {'bottom': 124.96875, 'left': 36.328125, 'rate': 0.9854483604431152, 'right': 614.671875, 'text': "A Dockerized REST APl service for text recognition using WeChat's OCR engine.", 'top': 108.984375}, {'bottom': 158.390625, 'left': 37.78125, 'rate': 0.9666333198547363, 'right': 494.0625, 'text': '使用微信 OCR 引擎进行文本识别的 Dockerized REST API 服务。', 'top': 139.5}], 'width': 930} | 
|  |      28maxwel1      219 天前 哈哈哈,腾讯出了个 linux 版本亏大了,还有薅腾讯羊毛的。不过微信不同客户端的代码实现不太一样,不知道跟移动端是不是一样效果 | 
|      29lovestudykid      219 天前  1 微信的条码、二维码识别也是遥遥领先,试过很多 AppStore 里专门的条码扫描 APP ,都不如微信。要是能做成一个单独的 APP 就好了。 | 
|  |      30bigtan      219 天前 我看似乎跟 https://modelscope.cn/models/iic/cv_convnextTiny_ocr-recognition-general_damo 这个项目很像。我在本地部署了一个验证码识别的服务,用的是 https://huggingface.co/xiaolv/ocr-captcha, 基于读光训练的。 | 
|      31dbit      219 天前 确实有的图片一个字也识别不出来 | 
|  |      32sunnysab      219 天前 @lovestudykid #29 微信(手机版)的二维码识别貌似用云端的。记得看到过相关技术文章,而且实际也能感觉出来。 | 
|      33dbit      219 天前 @GetOctober #25 这个图片我试了也识别不出来 | 
|  |      34MonkeyJon      219 天前 我刚准备执行,发现公司不让用 docker ,已经卸载了 | 
|  |      35swat199538      219 天前 @sunnysab 求技术文章,最近在优化公司的条形码识别和二维码识别速度 | 
|  |      36yulgang      219 天前 🐂🍺 | 
|  |      37letitbesqzr      219 天前 wxocr-master docker run -p 5000:5000 --name wechat-ocr-api golangboyme/wxocr OCR4: OCR not supported 不支持 linux 么? | 
|  |      38lengrongec      219 天前 一键封神 | 
|  |      39cheese      219 天前 @lovestudykid 真*遥遥领先,又快又准 | 
|  |      40break2002      219 天前 感谢,不会代码的人也用上了. | 
|      41lovestudykid      219 天前 @sunnysab 应该不是云端的,你看一下这个 repo 基于的 repo 就知道了,二维码识别的接口也逆向出来了 | 
|  |      42xuangoer666      219 天前 via Android @bybyte #20 不好意思哈,没细看,看标题以为你是逆向了微信 | 
|  |      43v1      219 天前 @swat199538 别想了。只是提取了 OCR 模型出来用,模型本身是黑盒,你用到公司里准备吃官司 | 
|      44newbee2000      219 天前 怎么用呢,docker 部署完之后提示 OCR4: OCR not supported * Serving Flask app 'main' OCR4: OCR not supported | 
|  |      45ik      219 天前 我用 Linux 也识别不出来 #25 这个图片 , 好奇怪 | 
|  |      46bybyte OP @newbee2000  @letitbesqzr @GetOctober 我在本地 window+docker 测试的都能正常,在云服务器上测试也是错误码 0 但是结果空,我猜测可能是不是模型用到什么硬件相关的 future 但是主机没提供所以出现这个问题 | 
|  |      47zqqian      219 天前 LZ 的项目确实有 bug ,好几个图片都是返回空,跟 15 楼的结果一样 | 
|  |      48zggsong      219 天前  1 我是做成了 C#库、里面带个 demo 挺好用 https://github.com/ZGGSONG/WeChatOcr | 
|  |      49shoaly      219 天前 期待一个二维码的版本出来 | 
|  |      50letitbesqzr      219 天前  2 | 
|  |      51Tink PRO 没 arm64 的 image 吗 | 
|      52TheGreatSage      219 天前 老哥,方便给个 tar 包嘛,某些原因无法在服务器上科学上网 | 
|  |      53SakuraYuki      219 天前 @GetOctober #25 这个没啥识别难度吧,我用苹果自带的离线 ocr 识别出来是:WeChat OCR API Docker 微信 OCR API Docker A Dockerized REST API service for text recognition using WeChat's OCR engine. 使用微信 OCR 引擎进行文本识别的 Dockerized REST AP ! 服务。 就最后那个 api 的 i 被下划线影响识别成感叹号了 | 
|      54yishibakaien      219 天前 老哥,我本地 mac 起了 docker 后,调用接口报错呀,提了 issue 帮忙看看 | 
|      55keller      219 天前 win11 wsl2 部署成功,测试了 2 张图都能识别, 很棒! | 
|      56paopjian      219 天前 微信的相比于 paddleocr 速度更快更精准,还可以部署到 linux 上? | 
|  |      57bybyte OP @letitbesqzr  @newbee2000 https://github.com/swigger/wechat-ocr/issues/36 看看你处理器支不支持 avx2 cat /proc/cpuinfo | grep -o avx2 | uniq | 
|      58Heng20      219 天前 牛逼! | 
|      59GetOctober      219 天前 @bybyte 支持 | 
|      60keller      219 天前 25 楼的图我测试也没啥问题 { "result": { "errcode": 0, "height": 190, "imgpath": "temp/751a6b59-dc79-485c-93e0-94e0bf4bf7ae.png", "ocr_response": [ { "bottom": 74.109375, "left": 36.328125, "rate": 0.9704948663711548, "right": 714.9375, "text": "WeChat OCR API Docker 微信 OCR API Docker", "top": 43.59375 }, { "bottom": 124.96875, "left": 36.328125, "rate": 0.9854483604431152, "right": 614.671875, "text": "A Dockerized REST APl service for text recognition using WeChat's OCR engine.", "top": 108.984375 }, { "bottom": 158.390625, "left": 37.78125, "rate": 0.9666333198547363, "right": 494.0625, "text": "使用微信 OCR 引擎进行文本识别的 Dockerized REST API 服务。", "top": 139.5 } ], "width": 930 } } | 
|  |      61Goalonez      219 天前 微信截图后的翻译也挺好用的,直接在原图上翻译 | 
|      62yusf      219 天前 | 
|  |      63asmoker      219 天前 我操,好使啊,还快,比 pd 啥 ocr 不知道高到哪里去了 😄 | 
|  |      64iorilu      219 天前 原始版本是怎么出来得 不可能逆向 wechat 得把 | 
|  |      65bigmomo      219 天前 支持,给星星了 | 
|  |      66BreezeConfirming      219 天前 呜呼谢谢楼主。从隔壁来的,之前就看到 issue 有说 linux ocr 实现了那不进一步 docker 。之前一直想做奈何没有技术力,现在真的造福社区了! | 
|  |      67IssacTseng      219 天前 能否把微信的截图和 OCR 一起提出来做成一个独立软件,这样就完美了。。。 | 
|  |      68A3m0n      219 天前 @letitbesqzr 和楼主合作下,把这个 U I 做进 Docker 里面。 | 
|  |      69blushyes      219 天前 不能商用吗? | 
|  |      70gwy15      219 天前 mark 一下,看看能不能对接到 mtphotos | 
|      713499      219 天前 | 
|  |      72TanKuku      219 天前 {"error":"400 Bad Request: The browser (or proxy) sent a request that this server could not understand."} | 
|      73Darley      219 天前 只是做识别放不进应用场景啊,我用的图片理解大模型,直接 json 输出想要的格式 | 
|      74sn0wdr1am      219 天前 没有开源协议,有侵权风险。 年轻人就是猛,抄起键盘就是干。 南山必胜客都不怕。 | 
|  |      76gorira      219 天前 日文韩文效果怎么样?可以的话是个翻译本子的好利器( | 
|  |      77daimaosix      219 天前 牛逼,非常好用!配上 czyt 大哥提供的前端屌爆了! | 
|  |      78iorilu      219 天前 看这 docker 实现, 意思是可以在 linux 脱离安装微信 在 win 上能不能做到 意思就是只放必要得文件, 不一定安装微信, 这样可以独立做成一个软件包, 供 python, c 等其他语言直接调用 | 
|      79lloovve      219 天前 via iPhone Docker 下不了了 | 
|      80bzj      219 天前 楼主好人,微信那个软件基本上废了 | 
|  |      81simo      219 天前 一直想做没做的事儿,你搞出来了,nb ! | 
|  |      82yiqiao      219 天前 佩服楼上的行动力。 | 
|  |      83superhuai      219 天前 mac !!! | 
|  |      84paradoxs      219 天前 希望能增加一个功能:支持直接上传本地 pdf 文件(自带 pdf 转 base64 ) 这个功能非常重要。 不然要我们一张一张图片手动的去转 base64 ,很麻烦。 | 
|  |      85conglovely      219 天前 楼上老哥的行动力是真强 | 
|  |      86imNull      219 天前 每次使用次数不多的 macOS 用户也可以试试我开发的这个  https://www.v2ex.com/t/1117414 | 
|  |      88roding      219 天前 支持一下! | 
|  |      89Liqiniu      219 天前 🐂🐸 | 
|      90GetOctober      219 天前 @bybyte linux 不能执行问题解决了,应该是你编译的 wcorc 存在问题 | 
|      91V3geD4g      219 天前 使用 docker run -d -p 5000:5000 --name wechat-ocr-api golangboyme/wxocr 命令 启动失败,查看 log 报错 OCR4: OCR not supported 是咋回事呢 | 
|  |      92Guidoo      219 天前 | 
|      93zjun5556      219 天前 我就说逛 v 站能学到好东西 | 
|  |      94unco020511      219 天前 这个在 windows 上能运行吗 | 
|  |      95lizhenda      219 天前 真厉害,能不能搞成个库调用 | 
|  |      96ko20      219 天前 OP 可以帮我看看为什么 OCR 失败了吗,如下图 https://image.940304.xyz/i/2025/03/25/67e26fd5b19b8.jpg 自部署了,但是返回如下 ``` {"result":{"errcode":6,"height":0,"imgpath":"temp/6ff6e294-115f-4cf2-b897-1e2143f50761.png","ocr_response":[],"width":0}} ``` 看了一下容器日志,如下 ``` xxx - - [25/Mar/2025 08:39:34] "POST /ocr HTTP/1.1" 200 - xxx - - [25/Mar/2025 08:41:44] "GET /ocr HTTP/1.1" 405 - xxx - - [25/Mar/2025 08:41:44] "GET / HTTP/1.1" 404 - xxx - - [25/Mar/2025 08:41:44] "GET / HTTP/1.1" 404 - xxx - - [25/Mar/2025 08:42:44] "GET /ocr HTTP/1.1" 405 - xxx - - [25/Mar/2025 08:44:36] "POST /ocr HTTP/1.1" 200 - ``` | 
|      97000sitereg      219 天前 star fork  一气呵成 | 
|  |      98wq2016      219 天前 我想要语音识别 - - | 
|      99macaodoll      219 天前 人才...... | 
|  |      100mywaiting      219 天前 这个想法我也有过,啧啧,这行动力简直爆炸! |