V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
bybyte
V2EX  ›  分享创造

把微信的 OCR 功能提取出来做 Docker 服务

  •  4
     
  •   bybyte ·
    golangboy · 2025 年 3 月 25 日 · 41131 次点击
    这是一个创建于 314 天前的主题,其中的信息可能已经有所发展或是发生改变。

    众所周知,微信的 OCR 识别又快又准,于是就想提出来代替某某桨的识别

    https://github.com/golangboy/wxocr

    docker 拉取下来 直接 post 请求即可

    docker pull golangboyme/wxocr
    
    curl -X POST http://localhost:5000/ocr \
      -H "Content-Type: application/json" \
      -d '{"image": "BASE64_ENCODED_IMAGE_DATA"}'
    
    246 条回复    2025-04-23 16:33:01 +08:00
    1  2  3  
    ellermister
        201
    ellermister  
       2025 年 3 月 27 日
    @superhack
    @VwEI
    我通过 web 实现了一个方便调用 https://d.852853.xyz/

    acczefly
        202
    acczefly  
       2025 年 3 月 27 日
    @nextvay 苹果都自带 ocr ,也用不上微信的 ocr 呀
    npe
        203
    npe  
       2025 年 3 月 27 日
    @VwEI 支持了 docker 部署,另外可以 fork 之后使用 https://vercel.com/ 直接部署。
    molika
        204
    molika  
       2025 年 3 月 27 日
    @ellermister #201 老哥 你这个在线识别 可以传递 jpg 等格式,但是我启动的服务无法识别,即时我转换成了 png 在调用接口也不行. 是做了什么特殊处理吗?
    momo65535
        205
    momo65535  
       2025 年 3 月 27 日
    搜了一下,已 fork ,感谢。有空了试试
    VwEI
        206
    VwEI  
       2025 年 3 月 27 日
    @ellermister 都能等
    VwEI
        208
    VwEI  
       2025 年 3 月 27 日
    @ellermister 等一个教程
    dongyulin353
        209
    dongyulin353  
       2025 年 3 月 27 日
    有 mac m 系列芯片能跑起来的吗
    nananqujava
        210
    nananqujava  
       2025 年 3 月 27 日
    docker 部署到 debian 上试了下, 有些图片可以识别, 但有很多图片 ocr_response 返回为空, 还有些只返回了部分识别数据, 不知道什么情况, 看服务端日志都是 POST /ocr HTTP/1.1" 200
    swat199538
        211
    swat199538  
       2025 年 3 月 27 日
    @kk2syc 我只想要技术文章参考
    Dreamerwwr
        212
    Dreamerwwr  
       2025 年 3 月 27 日
    @000sitereg 我看仓库是空的,作者已经删掉了吗?可以把你的仓库发我看看吗?我想试试
    superhack
        213
    superhack  
       2025 年 3 月 27 日
    @npe 赞👍🏻
    ellermister
        214
    ellermister  
       2025 年 3 月 27 日
    @VwEI 我试过这个图,通过截取不同尺寸的图片,得到的结果不相同。

    13 行的 力量,我反复通过 Win 客户端软件也会识别为 最、平、距……等奇怪的文字,但确实 Win 客户端识别准确率高很多。
    ellermister
        215
    ellermister  
       2025 年 3 月 27 日
    @molika 什么都没改,可能你 base64 搞错了,或者你服务器不支持?
    molika
        216
    molika  
       2025 年 3 月 27 日 via iPhone
    @ellermister 有些图片可以 有些不可以 和楼上 nana 说的我情况一样。明天换个服务器试一试
    superhack
        217
    superhack  
       2025 年 3 月 27 日
    @npe 试了,很赞👍🏻,要是页面能剪贴板贴图就更完美了
    GoldenDictOCR
        218
    GoldenDictOCR  
       2025 年 3 月 27 日
    @superychen 我觉着不会
    leokun
        219
    leokun  
       2025 年 3 月 27 日
    识别效果比手机上的差很远
    cherishwinner334
        220
    cherishwinner334  
       2025 年 3 月 27 日
    来晚啦?
    luckyc
        221
    luckyc  
       2025 年 3 月 28 日
    看不到了
    VwEI
        222
    VwEI  
       2025 年 3 月 28 日
    @ellermister 我用 G7505 这颗 U 是完全识别不出
    1125677925
        223
    1125677925  
       2025 年 3 月 28 日
    识别效果不好
    1125677925
        224
    1125677925  
       2025 年 3 月 28 日
    @leokun 是这样的,我部署,测试发现也是这样,效果很差
    npe
        225
    npe  
       2025 年 3 月 28 日
    @superhack 支持了,可以在线体验 https://ocr-nextjs.vercel.app/
    samun
        226
    samun  
       2025 年 3 月 28 日   ❤️ 1
    @npe 是什么机器部署的呢 我试了阿里云服务器 本地虚拟机效果都不好
    superhack
        227
    superhack  
       2025 年 3 月 28 日
    @npe 赞👍🏻
    huzhizhao
        228
    huzhizhao  
       2025 年 3 月 28 日
    牛皮,我都来晚了。还好其他老哥 fork 了
    TigerJie
        229
    TigerJie  
       2025 年 3 月 29 日
    @l4ever 有 fork
    luckyc
        230
    luckyc  
       2025 年 3 月 29 日
    授人以鱼不如授人以渔
    wcocr.cpython-312-x86_64-linux-gnu.so 是如何编译的. 能发个包到 pypi 么?
    qwwe01
        231
    qwwe01  
       2025 年 3 月 30 日
    fork 的老哥分享下 gitlhub 让我也 fork 下?
    samun
        232
    samun  
       2025 年 3 月 31 日
    用了阿里云机器 esxi 虚拟机 windows docker 效果都不好 aws 服务器就没问题 这是什么原因
    ShenZhen
        233
    ShenZhen  
       2025 年 4 月 1 日
    谁发个包谢谢
    wxyrrcj
        234
    wxyrrcj  
       2025 年 4 月 2 日
    删库了吗 github 没东西了
    soseek
        235
    soseek  
       2025 年 4 月 4 日
    好像是和 CPU 有关,有些不兼容或者逆向不完全
    isSamle
        236
    isSamle  
       2025 年 4 月 5 日
    {'result': {'errcode': 0, 'height': 117, 'imgpath': 'temp/4ee19412-2ede-4ae6-b19f-dcd276a343e7.png', 'ocr_response': [], 'width': 438}}
    sycxyc
        237
    sycxyc  
       2025 年 4 月 6 日
    @molika
    跟你一样仅识别出 2 个字。
    i7-1165G7 识别率效果很差,很多图一个字都识别不出来。要背景简单,统一字号,字少的的情况才能识别出大部分。
    wangxiaoer
        238
    wangxiaoer  
       2025 年 4 月 14 日
    借楼问一下:

    import wcocr
    wcocr.init(wechatocr_path, wechat_path)
    result = wcocr.ocr("D:\\test.png")

    这里的 wcocr 是一个 python 模块,但是没看到这个模块是从哪里来的?
    sycxyc
        239
    sycxyc  
       2025 年 4 月 14 日
    @wangxiaoer windows 下是 `wcocr.*.pyd`, linux 下是 `wcocr.*.so`
    aaronlam
        240
    aaronlam  
       2025 年 4 月 15 日
    @GetOctober 请问下,不能执行指的是 OCR4: OCR not supported 这个问题吗?还是解析结果错误码为 0 ,但实际没有解析到文字的问题呀?
    Marlon
        241
    Marlon  
       2025 年 4 月 16 日
    @ellermister 请问一下您那边是在 linux 跑的 docker 版本吗,我这边部署到 linux 后识别准确率差很多。
    ellermister
        242
    ellermister  
       2025 年 4 月 16 日   ❤️ 1
    @Marlon 是的,同一个镜像。
    wangxiaoer
        243
    wangxiaoer  
       2025 年 4 月 18 日 via iPhone
    @sycxyc 多谢,原来 pyd 是 c 代码编译成 python 库的产物,https://github.com/swigger/wechat-ocr 的 release 里面 demo 压缩包可以下载。
    armyHcz
        244
    armyHcz  
       2025 年 4 月 18 日
    还有包吗,哪位老哥分享个
    dasi
        245
    dasi  
       2025 年 4 月 19 日 via Android   ❤️ 2
    sparrww
        246
    sparrww  
       2025 年 4 月 23 日
    @npe 怎么你的效果这么好,说下机器呗
    1  2  3  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3241 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 10:20 · PVG 18:20 · LAX 02:20 · JFK 05:20
    ♥ Do have faith in what you're doing.