V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
rm0gang0rf
V2EX  ›  C#

请教 使用 Tesseract 识别 图片文字,一直提示 ArgumentException: 路径的形式不合法。 大神请指教一下 谢谢

  •  
  •   rm0gang0rf · 16 天前 · 239 次点击
    var path = Path.GetDirectoryName(Assembly.GetExecutingAssembly().CodeBase);
    path = Path.Combine(path, "tessdata");
    path = path.Replace("file:\\", "");
    using (var engine = new TesseractEngine(path, "eng", EngineMode.Default))
    {
    using (var img = Pix.LoadFromFile("./0.png"))
    {
    using (var page = engine.Process(img))
    {
    return(page.GetText());

    }
    }
    }
    6 条回复    2021-11-25 09:44:23 +08:00
    sadfQED2
        1
    sadfQED2  
       16 天前 via Android
    路径打印出来看一下,不要用相对路径,tessdata 库在 python 里面是是命令行调用二进制文件,不知道 c#是不是也这样
    rm0gang0rf
        2
    rm0gang0rf  
    OP
       16 天前
    @sadfQED2 好的 谢谢 这折腾一天了快~
    rm0gang0rf
        3
    rm0gang0rf  
    OP
       16 天前
    各种方法 绝对 相对 都试过了~~
    coder001
        4
    coder001  
       8 天前
    把训练数据、Tesseract.dll 放到 exe 旁边

    ```csharp
    new TesseractEngine(".", "chi_sim")
    ```

    一直能正常使用,大概你还需要确认一下子文件夹 x86 、x64 里面的 dll 有没有正确放置

    ```
    bin
    │ chi_sim.traineddata
    │ Tesseract.dll
    │ TSR.exe
    │ TSR.pdb

    ├─x64
    │ leptonica-1.78.0.dll
    │ tesseract41.dll

    └─x86
    leptonica-1.78.0.dll
    tesseract41.dll
    ```
    coder001
        5
    coder001  
       8 天前
    完整代码可以在咕狗搜 TesseractScreenReader 主域名是 topcl ,是个自己搭的 gogs ,怕被当 spam 就不贴出来了
    rm0gang0rf
        6
    rm0gang0rf  
    OP
       8 天前
    @coder001 谢谢 已经解决了
    关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3851 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 07:35 · PVG 15:35 · LAX 23:35 · JFK 02:35
    ♥ Do have faith in what you're doing.