V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
madNeal
V2EX  ›  分享创造

问答辅助建立题库的方式

  •  
  •   madNeal ·
    neal1991 · 2018-01-28 19:36:42 +08:00 · 1964 次点击
    这是一个创建于 2294 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在大多数答题辅助对于图像的识别都没啥问题,主要就是最后问题的搜索,在这主要是讨论一种建立题库的方式,仅供大家参考。https://github.com/neal1991/answers

    构建题库

    目前答题应用最关键的就是搜索算法了,现在利用 ocr 去识别图片已经不是关键问题,最关键的是如何搜索到正确的答案。现在出题的方式也越来越诡异,所以建立题库就很有必要了。

    目前来说各种答题辅助对于答题 APP 题目的文字的识别基本都没有太大的问题,主要的问题就是现在答案的搜索上。因为现在的题目出题方式越来越妖,直接去百度搜索或者百度搜索,或者统计搜索的结果数都是不太准确的。所以我希望能通过 elasticsearch 来建立一个问题题库,当然题库的建设需要其他人的建设和参与。

    部分代码主要是来自于 TopSup,主要增加的是题库的建立方法以及在题库中搜索的方法。

    ElasticSearch

    • 下载地址
    • 使用起来比较简单,直接运行 bin/elasticsearch 或者 bin/elasticsearch.bat( windows 平台)即可。
    • 验证 elasticsearch 是否正确运行, 打开浏览器访问 http://localhost:9200 出现结果为:
    {
      "name" : "69VnU74",
      "cluster_name" : "elasticsearch",
      "cluster_uuid" : "_ApoeosaQO24L7XfZUJ_1A",
      "version" : {
        "number" : "6.1.2",
        "build_hash" : "5b1fea5",
        "build_date" : "2018-01-10T02:35:59.208Z",
        "build_snapshot" : false,
        "lucene_version" : "7.1.0",
        "minimum_wire_compatibility_version" : "5.6.0",
        "minimum_index_compatibility_version" : "5.0.0"
      },
      "tagline" : "You Know, for Search"
    }
    

    Config

    • 主要包括百度 ocr API 的相关配置以及截图区域的配置,按照 config/config.template.yaml来进行配置。

    贡献题库方式

    有两种方式你可以贡献题库,一种是通过文本方式,另外一种是上传图片的方式。

    文本方式

    你只要在 questions.txt 最后一行添加文字就可以了,问题和答案之间应该有一个空格。

    上传图片

    pvsFk6.png

    利用图片创建题库的方式一开始存在一个问题,如何从选项中找到正确的选项呢。一开始想通过选项的数字来判断,但是正确的选项并不一定是选择人数最多的。感谢图像处理这门课程,我想起来彩色的图片转换成灰度图的时候,灰度值应该比灰色图像的高。正确选项的背景颜色是彩色的,所以我们只要截图选项区域,然后通过两个阈值来过滤,设置阈值为 120 可以获得所有选项,设置阈值为 190 则不包含正确的选项,通过这个差别就可以找到正确的选项了。

    License

    MIT

    欢迎大家贡献题目或者 star

    1 条回复    2018-01-28 19:39:27 +08:00
    function007
        1
    function007  
       2018-01-28 19:39:27 +08:00
    以后这可以单独弄个编程大赛了,大家把各自的程序提交上去,谁的程序答对的多谁得奖
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1725 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 16:46 · PVG 00:46 · LAX 09:46 · JFK 12:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.