问答辅助建立题库的方式

2018-01-28 19:36:42 +08:00
 madNeal

现在大多数答题辅助对于图像的识别都没啥问题,主要就是最后问题的搜索,在这主要是讨论一种建立题库的方式,仅供大家参考。https://github.com/neal1991/answers

构建题库

目前答题应用最关键的就是搜索算法了,现在利用 ocr 去识别图片已经不是关键问题,最关键的是如何搜索到正确的答案。现在出题的方式也越来越诡异,所以建立题库就很有必要了。

目前来说各种答题辅助对于答题 APP 题目的文字的识别基本都没有太大的问题,主要的问题就是现在答案的搜索上。因为现在的题目出题方式越来越妖,直接去百度搜索或者百度搜索,或者统计搜索的结果数都是不太准确的。所以我希望能通过 elasticsearch 来建立一个问题题库,当然题库的建设需要其他人的建设和参与。

部分代码主要是来自于 TopSup,主要增加的是题库的建立方法以及在题库中搜索的方法。

ElasticSearch

{
  "name" : "69VnU74",
  "cluster_name" : "elasticsearch",
  "cluster_uuid" : "_ApoeosaQO24L7XfZUJ_1A",
  "version" : {
    "number" : "6.1.2",
    "build_hash" : "5b1fea5",
    "build_date" : "2018-01-10T02:35:59.208Z",
    "build_snapshot" : false,
    "lucene_version" : "7.1.0",
    "minimum_wire_compatibility_version" : "5.6.0",
    "minimum_index_compatibility_version" : "5.0.0"
  },
  "tagline" : "You Know, for Search"
}

Config

贡献题库方式

有两种方式你可以贡献题库,一种是通过文本方式,另外一种是上传图片的方式。

文本方式

你只要在 questions.txt 最后一行添加文字就可以了,问题和答案之间应该有一个空格。

上传图片

利用图片创建题库的方式一开始存在一个问题,如何从选项中找到正确的选项呢。一开始想通过选项的数字来判断,但是正确的选项并不一定是选择人数最多的。感谢图像处理这门课程,我想起来彩色的图片转换成灰度图的时候,灰度值应该比灰色图像的高。正确选项的背景颜色是彩色的,所以我们只要截图选项区域,然后通过两个阈值来过滤,设置阈值为 120 可以获得所有选项,设置阈值为 190 则不包含正确的选项,通过这个差别就可以找到正确的选项了。

License

MIT

欢迎大家贡献题目或者 star

1970 次点击
所在节点    分享创造
1 条回复
function007
2018-01-28 19:39:27 +08:00
以后这可以单独弄个编程大赛了,大家把各自的程序提交上去,谁的程序答对的多谁得奖

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/426607

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX