一个 2000 元的图片识别类外包,返回一张图片至少包含多少个中文字符

2020-07-07 18:14:38 +08:00
 albertofwb

一个 2000 元的图片识别类外包,返回一张图片至少包含多少个中文字符

背景

开发一个程序实现图片内容检索,用的 tesseract-ocr 识别图片比较慢,因此想做一个预处理,只识别包含大量文字的图片,忽略风景,人物等不含文字的照片

时间要求

7 天

开发要求

  1. 期望使用 python3 或者 C/C++
  2. 应提供编译,部署文档
  3. 应包含 人物,风景,建筑,扫描件 这 4 种类型的图片各 3 张

联系方式

210 次点击
所在节点    外包
2 条回复
xwhxbg
2020-07-08 22:34:19 +08:00
提供 training set 不?这个场景可以用个小模型先做分类,然后分类是扫描件的再用 ocr 扫描
albertofwb
2020-07-09 00:51:27 +08:00
@xwhxbg 有人接了,因为主要想筛选扫描类文件,特征明显,用传统算法搞

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/687994

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX