分享一个 OCR 软件(基于 LLM 可识别 Latex)

2025 年 5 月 1 日
 ztfot
3869 次点击
所在节点    程序员
14 条回复
ashing
2025 年 5 月 1 日
看起来还不错,有空体验下。
xuemian
2025 年 5 月 2 日
大佬
SeaSaltPepper
2025 年 5 月 2 日
歪个楼:有没有什么地方能看 LLM OCR 跑分排名的
lchynn
2025 年 5 月 2 日
@SeaSaltPepper ocrBench ,ocrBenchV2 ,docVQA, infoVQA ,ChartQA ,TableVQA , 几个多模态指标都是看视觉模型对文字的识别理解能力的。 都有 leaderboard
yjxjn
2025 年 5 月 2 日
同楼咨询个问题。
我目前在做的项目,也是关于 OCR 识别。但是要识别试卷内容。进行阅卷。现在有个问题,这种大模型可以识别出试卷之类的么?用了 paddleOCR ,客观题,直接就嘎了。
lamses
2025 年 5 月 2 日
loadingimg
2025 年 5 月 2 日
自己基于 qwen vl 可以微调一下
zggsong
2025 年 5 月 2 日
试了一下,prompt 识别公式效果还是蛮好的,理论上使用现有的类似 Bob 配置 llm 服务也能实现该效果

ztfot
2025 年 5 月 3 日
@zggsong 是的,这只是做了个壳,方便用
duzhuo
2025 年 5 月 3 日
@lamses 好变态的字体
lamses
2025 年 5 月 3 日
@duzhuo 領會精神:)
以現在 AI 能力,所有學科本該有手寫閱卷產品落地的。
HaroldFinchNYC
2025 年 5 月 3 日
实际上我用 ocr 的机会不多
但我知道有个行业用的比较多,就是教育行业
ztfot
2025 年 5 月 4 日
@HaroldFinchNYC 害,学生用的多嘛
guaike
2025 年 5 月 5 日
@zggsong 这方法不错

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1129336

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX