tldr: https://github.com/mayocream/koharu
文字检测模型用了基于 YOLOv5 和 DBNet 的 comic-text-detector ,OCR 模型用了基于 transformers 的 manga-ocr 。
程序用 Rust 和 Tauri 编写,界面用的是 React + Konva.js + TypeScript ;更详细可以看仓库的 README 。
程序支持兼容 OpenAI API 的任何后端,比如 LM Studio ,使用时注意打开 CORS 。
准备加上 segment 和 inpaint 功能,还在施工中……
刚学 Rust 三个月,写出来的第一个程序,还望轻喷 orz
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.