把微信的 OCR 功能提取出来做 Docker 服务

171 天前
 bybyte

众所周知,微信的 OCR 识别又快又准,于是就想提出来代替某某桨的识别

https://github.com/golangboy/wxocr

docker 拉取下来 直接 post 请求即可

docker pull golangboyme/wxocr
curl -X POST http://localhost:5000/ocr \
  -H "Content-Type: application/json" \
  -d '{"image": "BASE64_ENCODED_IMAGE_DATA"}'
37439 次点击
所在节点    分享创造
246 条回复
lovestudykid
171 天前
@sunnysab 应该不是云端的,你看一下这个 repo 基于的 repo 就知道了,二维码识别的接口也逆向出来了
xuangoer666
171 天前
@bybyte #20 不好意思哈,没细看,看标题以为你是逆向了微信
kk2syc
171 天前
@swat199538 别想了。只是提取了 OCR 模型出来用,模型本身是黑盒,你用到公司里准备吃官司
newbee2000
171 天前
怎么用呢,docker 部署完之后提示
OCR4: OCR not supported

* Serving Flask app 'main'

OCR4: OCR not supported
ik
171 天前
我用 Linux 也识别不出来 #25 这个图片 , 好奇怪
bybyte
171 天前
@newbee2000
@letitbesqzr
@GetOctober 我在本地 window+docker 测试的都能正常,在云服务器上测试也是错误码 0 但是结果空,我猜测可能是不是模型用到什么硬件相关的 future 但是主机没提供所以出现这个问题
zqqian
171 天前
LZ 的项目确实有 bug ,好几个图片都是返回空,跟 15 楼的结果一样
zggsong
171 天前
我是做成了 C#库、里面带个 demo 挺好用
https://github.com/ZGGSONG/WeChatOcr
shoaly
171 天前
期待一个二维码的版本出来
letitbesqzr
171 天前


用 cursor 画了一个 ui 出来.. 这套接口确实好用.. 位置准确 速度快
Tink
171 天前
没 arm64 的 image 吗
TheGreatSage
171 天前
老哥,方便给个 tar 包嘛,某些原因无法在服务器上科学上网
SakuraYuki
171 天前
@GetOctober #25 这个没啥识别难度吧,我用苹果自带的离线 ocr 识别出来是:WeChat OCR API Docker 微信 OCR API Docker

A Dockerized REST API service for text recognition using WeChat's OCR engine.

使用微信 OCR 引擎进行文本识别的 Dockerized REST AP ! 服务。 就最后那个 api 的 i 被下划线影响识别成感叹号了
yishibakaien
171 天前
老哥,我本地 mac 起了 docker 后,调用接口报错呀,提了 issue 帮忙看看
keller
171 天前
win11 wsl2 部署成功,测试了 2 张图都能识别, 很棒!
paopjian
171 天前
微信的相比于 paddleocr 速度更快更精准,还可以部署到 linux 上?
bybyte
171 天前
@letitbesqzr
@newbee2000 https://github.com/swigger/wechat-ocr/issues/36 看看你处理器支不支持 avx2 cat /proc/cpuinfo | grep -o avx2 | uniq
Heng20
171 天前
牛逼!
GetOctober
171 天前
@bybyte 支持
keller
171 天前
25 楼的图我测试也没啥问题

{
"result": {
"errcode": 0,
"height": 190,
"imgpath": "temp/751a6b59-dc79-485c-93e0-94e0bf4bf7ae.png",
"ocr_response": [
{
"bottom": 74.109375,
"left": 36.328125,
"rate": 0.9704948663711548,
"right": 714.9375,
"text": "WeChat OCR API Docker 微信 OCR API Docker",
"top": 43.59375
},
{
"bottom": 124.96875,
"left": 36.328125,
"rate": 0.9854483604431152,
"right": 614.671875,
"text": "A Dockerized REST APl service for text recognition using WeChat's OCR engine.",
"top": 108.984375
},
{
"bottom": 158.390625,
"left": 37.78125,
"rate": 0.9666333198547363,
"right": 494.0625,
"text": "使用微信 OCR 引擎进行文本识别的 Dockerized REST API 服务。",
"top": 139.5
}
],
"width": 930
}
}

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1120897

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX