GLM-OCR 发布

5 天前

duangthef1rst

GLM-OCR 是一款先进的光学字符识别（ OCR ）工具，旨在从各种文档格式中提取和理解文本数据。其核心特性基于 GLM 模型架构，确保在复杂布局文档中的高精度文本识别。

主要特点：

文本提取：GLM-OCR 高效地从图片、扫描文档或 PDF 中提取文本。

文档结构理解：不仅仅是简单的文本提取，还能理解文档的结构，如标题、段落、表格及混合内容等。

多语言支持：该模型能够识别多种语言的文本，使其在不同地区和使用场景中都能发挥作用。

优化的性能：GLM-OCR 在准确性和计算效率之间找到了平衡，适合云端和边缘计算的部署。

更多信息可以访问官方站点： https://glm-ocr.com

1297 次点击

所在节点

程序员

8 条回复

avenger

5 天前

和那个 glm 有什么关系吗？点 price 显示 404

Akikiki

5 天前

@avenger 就是智谱的

tool2dx

5 天前

能加上 XY 坐标输出不? 一般那来说文字识别不会 100%准确, 总需要二次修改.

avenger

5 天前

@tool2dx 试了一个 api 有返回的，目前百度、阿里、夸克都有类似的接口，置信度还是最关键因素

最近在做一个试卷 ocr 的项目，用了几个 api 准确度都提不上去

avenger

5 天前

api 返回示例

````
{
"task_id": "ce2641ced3e34e67b47f3b0feeb25aee",
"message": "成功",
"status": "succeeded",
"words_result_num": 4,
"words_result": [
{
"location": {
"left": 79,
"top": 122,
"width": 1483,
"height": 182
},
"words": "你好,世界!",
"probability": {
"average": 0.7320847511,
"variance": 0.08768635988,
"min": 0.3193874359
}
}
]
}
```

RuiCBai

5 天前

glm-ocr dot com 不是智谱官网站点吧。。。这样宣传就有点误导大家 😂

Selenium39

5 天前

官方的站点是： https://ocr.z.ai

Maroontor

4 天前

需要什么配置，准确率如何

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1190935

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.