6月7日,记者从成都高新区获悉,“成都造”人工智能系统“准星数学高考机器人”AI-MATHS,对2017高考数学科目发起了挑战。最终,在断网断库的情况下,机器人以平均15分钟一套的速度,完成了两套高考试卷的作答,分别获得105分和100分的成绩。
6月7日傍晚6点,离2017年高考数学科目的考试结束已有1个小时,在成都市高新区天府新谷,AI-MATHS蓄势待发,在众多嘉宾媒体的共同“监考“下开始作答。
据悉,此次考试的试卷来自互联网,由工作人员搜寻到之后再人工录入。而AI-MATHS则在完全断网断库的情况下进行答题,11台服务器被单独搁置在房间内,没有任何人员干预,在作答完毕后,由打印机打出其答案。
“联网联库相当于开卷考试,计算机可以依靠其远超人类的搜索匹配能力,而断网断库就和真正的高考一样,是闭卷考试。靠的是对平时练习的消化理解,而非从题库中搜索来解题。”AI-MATHS研发单位成都准星云学科技有限公司CEO、清华大学苏州研究院大数据中心主任林辉说道。
6点28分,2017年高考北京文科数学卷录入完毕,22分钟后,机器人便提交了答卷。而第二场考试使用的2017年高考文科全国卷II,更是仅用10分钟便作答完毕。经过来自成都三所高中的优秀教师现场判卷,AI-MATHS分别取得105分和100分的成绩,两份考卷对比2017年2月中期评测的基础上均有大幅提升。
对机器人的单项成绩分析后不难发现,在选择题和填空题上,“AI-MATHS”表现十分亮眼,北京文科数学卷选择题满分,填空题20分;全国卷二选择题55分、填空题20分,主要的失分点都集中在逻辑复杂、表达灵活的解答题上。有些题目甚至是0分。
而这也暴露了人工智能的一个重要的技术难点,就是如何让计算机理解自然语言。规范化的数学语言,解题没有问题。自然语言复杂的题目就很难。“对于AI-MATHS来说,数学没有做好的主要原因,是因为语文没有学好。”科大讯飞科研院院长胡国平这样说道。
“本次挑战的结果也将运用到该公司对AI-MATHS的技术验证和准星产品迭代中。此后AI-MATHS将接受大样本训练、测验弹性扩展能力,乃至于迁移到其他领域的学习能力。”林辉介绍说。
“目前准星已落地的AI教育产品主要针对中学数学,涵盖几十个章节、四五千个知识点和考点,庞大的题量需要大量的人工来标注知识点、人工解题,低效、成本高昂。”林辉说,AI-MATHS在教育领域的应用,意味着各种模型与人工标注的人财物成本将被大幅降低。AI-MATHS在今后加大训练强度后,可迅速提高质量并实现数学教育的广泛应用。由于AI-MATHS的模型、算法是弹性的、可拓展的,未来AI-MATHS将不仅限于教育领域,可以在金融、医疗、交通等众多领域实现迁移发展。