GLM-OCR 发布

5 天前
 duangthef1rst

GLM-OCR 是一款先进的光学字符识别( OCR )工具,旨在从各种文档格式中提取和理解文本数据。其核心特性基于 GLM 模型架构,确保在复杂布局文档中的高精度文本识别。

主要特点:

文本提取:GLM-OCR 高效地从图片、扫描文档或 PDF 中提取文本。

文档结构理解:不仅仅是简单的文本提取,还能理解文档的结构,如标题、段落、表格及混合内容等。

多语言支持:该模型能够识别多种语言的文本,使其在不同地区和使用场景中都能发挥作用。

优化的性能:GLM-OCR 在准确性和计算效率之间找到了平衡,适合云端和边缘计算的部署。

更多信息可以访问官方站点: https://glm-ocr.com

1297 次点击
所在节点    程序员
8 条回复
avenger
5 天前
和那个 glm 有什么关系吗?点 price 显示 404
Akikiki
5 天前
@avenger 就是智谱的
tool2dx
5 天前
能加上 XY 坐标输出不? 一般那来说文字识别不会 100%准确, 总需要二次修改.
avenger
5 天前
@tool2dx 试了一个 api 有返回的,目前百度、阿里、夸克都有类似的接口,置信度还是最关键因素

最近在做一个试卷 ocr 的项目,用了几个 api 准确度都提不上去
avenger
5 天前
api 返回示例

````
{
"task_id": "ce2641ced3e34e67b47f3b0feeb25aee",
"message": "成功",
"status": "succeeded",
"words_result_num": 4,
"words_result": [
{
"location": {
"left": 79,
"top": 122,
"width": 1483,
"height": 182
},
"words": "你好,世界!",
"probability": {
"average": 0.7320847511,
"variance": 0.08768635988,
"min": 0.3193874359
}
}
]
}
```
RuiCBai
5 天前
glm-ocr dot com 不是智谱官网站点吧。。。这样宣传就有点误导大家 😂
Selenium39
5 天前
官方的站点是: https://ocr.z.ai
Maroontor
4 天前
需要什么配置,准确率如何

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1190935

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX