如何从五花八门的跑步记录 APP 截图中,提取关键信息?

2018-02-14 12:30:09 +08:00
 93html

需求是实现这样一个功能:fn(图片) => { 距离: 5km, 时间: 00:30:00 }

用"OCR+正则"的思路去做遇到的问题是:

发几张 ocr 的结果图:

自己想到 2 个方案

大家有更好的思路吗?

2184 次点击
所在节点    问与答
3 条回复
GooMS
2018-02-14 19:04:06 +08:00
这个不是很多吧,我觉得机器学习成本要高于人工标注。
93html
2018-02-15 09:00:57 +08:00
@GooMS 嗯,我又想到一种思路,缩小识别范围,做法是找到”公里””时间”等关键字的位置,然后选取这个位置周围 xx 个 px 之内的文字内容
zhangyl
2020-05-24 20:46:08 +08:00
佳明 app 的截图相对很规范,可以用模板。国内的一些 app 截图很花哨,比较麻烦。楼主还在做吗?有什么好的办法分享一下呢?谢谢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/430706

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX