2025年高考刚刚落下帷幕,考生们还在紧张等待成绩。人工智能的“考生”们交出的答卷也成为社会和技术领域的关注热点。
在高考中,数学则是最能体现大模型推理能力的学科。以教育垂类最有代表性的大模型为例,用学而思旗下的九章大模型针对2025年高考数学全国卷(Ⅰ卷、Ⅱ卷)的选择题和填空题进行测试,结果显示:在Ⅰ卷的14道选择填空题中,九章大模型答对12道;在Ⅱ卷的14道选择填空题中,更是全部答对,展现出强大的逻辑推理和数学计算能力。
值得说明的是,测试聚焦于选择题和填空题,这两类题型有明确的客观答案,便于评估AI的准确率;而解答题、证明题涉及步骤分、逻辑表述等主观评分因素,对于AI输出结果的判断存在差异,因此未纳入本次测试范围。
正确率超90%,AI得分能超不少考生
整体情况如图,在两套全国试卷中的28道选择题中,九章大模型做错了全国Ⅰ卷的6、9两题,在共28道主观题当中,共做对26题,整体正确率约93%。

值得一提的是,单选、多选的最后一题一般为该题型下最难的题目,大模型也都顺利完成了思考和计算,给出正确答案:


正确率高,教育大模型的“解题规范”也在提升
除了答题正确率,九章大模型在公式书写规范性、解题思路清晰度等方面也表现优异。
以文本输出见长的大模型,在面对数学公式、特殊符号的表达时,往往会采用"代偿性表述"——例如用"a的平方加b的平方"代替"a²+b²"。而九章大模型作为教育垂类专用模型,其训练数据中包含了大量教材、教辅资料的专业表达,使得它在输出时能直接使用数学符号。
这种专业性的背后,是模型对教育场景的深度适配。九章大模型在解答后会附加"考点分析"和"易错点提示”,这种结合知识图谱的结构化输出,更接近学生和老师使用大模型辅助学习的真实场景。教育领域的AI不仅要"做对题",更要"讲好题",更可以实现根据学生薄弱点,针对性地讲题、训练的“精准学”。
AI如何赋能教育?专家:目前更适合做“超级辅导老师”
大模型在高考解题上表现出色,但AI的价值当然不是“高考刷分”,而是利用AI技术更好地赋能学习场景。
专家认为,目前大模型在限定领域的客观题上表现优秀,但在开放性、创造性题目上仍有很大空间。现阶段AI赋能教育的体现,更多是在对老师的教学辅助和对学生的个性化学习辅导上。
随着大模型的数据挑战结果不断突破,教育智能化趋势加速。随着大模型产品进一步优化模型在复杂推理、多模态交互等方面的能力,“答题工具”向“学习伙伴”也将加速实现。
责任编辑:kj005
6月5日,下午两点的北京海淀,一位考生家长拆开印着JOY笑脸的包裹,惊喜地发现上午在京东下单的蒙牛211ml纯牛奶已准时送达这些特殊规格的牛奶,是618期间蒙牛...
感觉双十一还没过去很久,今年618的年中大促就接踵而来了今年3月BANILA CO芭妮兰斩获【全球销售额No.1卸妆膏】的认证,充分证明了芭妮兰卸妆膏深受全球各...
6月6日,国务院国资委发布2024年度中央企业品牌建设发展报告,东风汽车在2024年度中央企业品牌建设对标排名跃居央企第7位,连续四年稳居汽车行业榜首这一成绩的...
作为全球智能清洁领域的领军品牌,添可(TINECO)凭借其在洗地机赛道的持续深耕与颠覆式创新,不仅铸就了洗地机销量全球第一*的瞩目成就,同时以销量销额连续5年全...
在人工智能与数字经济蓬勃发展的当下,数据中心作为企业数据资产的关键堡垒,其物理安全防护至关重要据悉,一卡锁具创始于2011年,是一家专注工业锁闭系统解决方案的&...
又是一年高考升学季,无数学子和家庭站在人生新阶段的起点,满怀期待与憧憬自2005年起,海底捞便开始为员工子女提供教育补贴浙江温岭店的后厨员工杨勇的儿子2024年...
伦敦金,作为一种以保证金方式进行交易的现货黄金,因其在伦敦金属交易所的活跃交易而得名然而,在中国大陆地区,由于金融监管政策等因素,目前并没有直接受国内监管机构监...
近日,河马短剧负责人张翔宇在接受媒体采访时透露,目前河马剧场平台每日短剧播放次数已经达到7亿次当前,短剧行业正处于内容储备竞争的白热化阶段,各平台竞相推出各种版...
(2025年6月9日深圳)在国家大力推进深圳建设中国特色社会主义先行示范区的战略背景下,《中共中央国务院关于支持深圳建设中国特色社会主义先行示范区的意见》明确提...
科学睡眠新选择!康姿百德典雅款床垫:精准分层设计,适配每一种体型康姿百德典雅款床垫以其精妙的多层次构造设计,不仅为用户带来了前所未有的舒适体验,更在支撑力与耐用...
紫竹青春健康校园行20周年不忘初心,砥砺再前行夏木成荫,蝉声阵阵在这生机蓬勃的时节紫竹青春健康校园行以活力的姿态炽热的力量拥抱灿烂的青春紫竹青春2025再启航,...