离高考完全自动化阅卷还有多远?

2020-05-14 14:16:14 +08:00
 gainsurier
现在依靠答题卡的客观题自动化阅卷除了英语听力部分已经几十年没有进步了。

抛去 OCR 部分,假如完全使用机器答题,所有输入都是文本。
理工科的填空题,latex 格式描述 现有技术可以做到
理工科的应用题,某种编程语言描述 现有技术可以做到
文科的作文和主管题,自然语言编译器 还有很远的距离
5813 次点击
所在节点    奇思妙想
56 条回复
npe
2020-05-14 14:23:32 +08:00
手写的汉字千姿百态,OCR 识别难度太高,还没到自然语言那一步就已经“卡”死了。。
tfdetang
2020-05-14 14:38:47 +08:00
其实 OCR 的部分倒不一定是最难解决的部分;

对于证明题,除非出题人已经知道所有解题、证明路径并编码化,不然靠 AI 是不可能阅卷的,毕竟 AI 最不擅长的就是逻辑与推理;

对于解答空间比较小的题目、比如英语填空、阅读理解、生物、历史、地理等填空 / 简答题,自然语言技术应该可以处理;

对于解答空间比较大的题目,像政治等一些题目,用学生的回答与正确回答的语义匹配相似度,可能可以打分,但可能和人打分会有一些出入

对于作文(非英语作文), 由于这个答题空间过于大,而且涉及到对语言审美 思维等,估计这个几乎不可能自动阅卷
fancy111
2020-05-14 14:41:40 +08:00
除了主观题,其他的应该都没问题。
如果有问题,那就设计出能给机器判定的题目即可。
wafm
2020-05-14 14:43:17 +08:00
你这试错成本也太高了吧,这可是普通人的唯一出路。
抛开字体不说,大多数主观体你怎么解决?
像#2 说的都是大问题,依赖机器评分谁服气?

现在人工阅卷每年都有不服要求重新阅卷的(“我小孩平时成绩都很好的!怎么这么低分?肯定是改错卷了”),如果换做机器那就没完没了。
daozhihun
2020-05-14 14:45:24 +08:00
我觉得有一些确实可以自动化。
比如物理的电路图连线(应该顶多几种标准答案)、一些填空题(处理一下等价的情形即可)等,但其他的,比如数学、物理的应用题,尤其是证明题,我觉得暂时还不现实。
为了一些特例自动化也没有什么价值,关键高考不能容忍有误差或错误,所以人工看是相对靠谱的。
lostberryzz
2020-05-14 14:50:15 +08:00
还有 50 年
kop1989
2020-05-14 14:53:11 +08:00
我觉得主观题就不应该自动化阅卷。
因为主观题除了考验知识点之外,其实还有考验学生的表达能力和与阅卷人之间的交流沟通的能力的目的。

虽然目前大家为了分高,主观题答题、阅卷也都普遍倾向于程式化。但这并不代表说要剥夺孩子自己组织答题语言的权利。
一旦进行主观题机器阅卷,那么主观题的答题思路就从给人看,变成了给机器看。长远看对人类的表达不利。
annet
2020-05-14 14:55:13 +08:00
如果非要自动化,应该先电子化考试,单独考书法
Vegetable
2020-05-14 14:57:55 +08:00
什么叫自动化阅卷,我们先讨论机器答题好了。
oppoic
2020-05-14 14:59:24 +08:00
你不知道而已,这条赛道已经有公司创业快 10 年了:七天教育、智学网、云校。。。
现在能做到的是:客观题自动批阅,英语填空题机器识别自动批阅,主观题切块后保存图片后老师用手机批阅。
est
2020-05-14 15:01:41 +08:00
LZ 的思路是对的。我觉得,不能机器阅卷的试题,不如不考。
gainsurier
2020-05-14 15:12:38 +08:00
@npe 停止手写,直接计试。

@tfdetang 证明题用编程语言证明,不需要 AI,填空题,英语几乎全是选择题了,简答题和作文实际归为一类用自然语言处理。
@wafm 现在英语听力不已经全部是机器了,机器评分只不过是时间的问题,要是有谁不服,直接开源评分源代码。

@daozhihun 可以采取多个打分引擎取平均数,并且部分采样采用人工评分,若偏差过大需要人工审核

@lostberryzz 围棋当时也认为是几十年

@kop1989 证明题完全可以用编程语言描述,主观题可以用相对比较严谨的语言描述,那就让语言发展服从机器

@annet 书法可以抛弃,当成小众爱好。
@oppoic 自动批阅和答题卡有什么区别
tabris17
2020-05-14 15:14:02 +08:00
公式识别还凑合,其他嘛……只能说你想多了
xieyudi2
2020-05-14 15:21:38 +08:00
当年 GRE 作文 CTRL+X 结果来不及 CTRL+V 就时间到了…
当时真想打开 spy++ 把那个时间到的窗体切到后台…
Chen332076
2020-05-14 15:24:22 +08:00
那我也有个问题: 在互联网这么发达的今天,为什么有的公交(即使是北京)还会有人工售票员?
Nathanzheng
2020-05-14 15:28:53 +08:00
@lostberryzz #6 懂了,可控核聚变之后
Tianao
2020-05-14 15:33:38 +08:00
我支持适合机考的题型(除了画图之类的)机考、不适合的的扫描,客观题自动化阅卷、主观题人工无纸化阅卷。
wafm
2020-05-14 15:46:04 +08:00
@gainsurier 你试试跟你父母讲一下开源代码。。。
daozhihun
2020-05-14 15:46:56 +08:00
@gainsurier 多个引擎取平均,我觉得这个研发的费用会很高哎。。。可能正在研发吧,只是觉得准确度太低或者成本太高暂时还没用
sugarkeek
2020-05-14 15:52:42 +08:00
计算机目前最多作为辅助

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/671601

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX