欢迎进入北京惠众教育研究院官方网站!
今天是 2026年 01月 26日 星期一
北京惠众教育研究院
Huizhong Observation
惠众观察
惠众观察
惠众观察
惠众观察 您的位置:主页 > 惠众观察 >
【教育评价】AI时代教育评价的几个关键问题
2026-01-19 返回列表

燕园初冬凝智思,教育创新启新程。2025年12月20日,北京大学SOMIS校友2026新年论坛在英杰交流中心如期举行。作为论坛重要主旨的报告环节,北京师范大学中国基础教育质量监测协同创新中心张生教授以“AI时代教育评价的几个关键问题”为题作主旨报告,立足AI技术发展浪潮与教育评价改革实践前沿,围绕六大核心关键问题,系统阐释了AI时代教育评价的底层逻辑、技术适配、数据应用、实践本质、学校转型与社会共识,为推动素养导向教育评价落地提供了深刻的理论指引与可操作的实践方案。张生北京师范大学中国基础教育质量监测协同创新中心教授
AI已深度赋能各类工作场景,相较于传统PPT等呈现形式,AI技术的普及正重塑教育生态,而教育评价作为教育改革的“指挥棒”,其变革方向直接关系到育人质量与未来人才培养成效。在这一背景下,厘清AI时代教育评价的关键问题,成为推动教育高质量发展的重要课题。

关键问题1:教育评价变革的底层逻辑是什么?

教育评价变革的底层逻辑,源于政策引领、现实需求与生产力发展的同频共振,三者共同推动评价问题日益凸显,倒逼教育评价体系迭代升级。从历史演进来看,教育形态随社会发展动态迭代,教育评价形态同步升级:农业时代对应经验性评价,工业时代形成标准化评价,信息时代迈向多元化评价,如今正进入AI时代素养导向智能化评价,每一次变革均精准回应时代教育需求。其中,第一次工业革命催生大规模教育,第三次工业革命确立班级授课制,第四次工业革命推动个性化教育成为核心趋势。社会发展加剧评价变革紧迫性。世界经济论坛与OECD研究均指出,未来5年全球大量工作岗位将发生变化,低技能岗位被淘汰、中等收入岗位受AI冲击,这要求教育评价必须聚焦未来技能培育,构建适配时代需求的体系。信息技术为评价变革提供生产力支撑。当前社会正加速向数字世界过渡,数据与计算成为核心生产力,DeepSeek V3等大模型在语言理解、逻辑推理等领域表现优异,为教育评价革新奠定技术基础。5G、算法等技术推动物理与数字世界融合的教育生态形成,倒逼课程、教学、测量方式深刻变革。国内外多项政策文件均明确,未来教育核心宗旨是促进人的全面发展、回应社会人才需求,为评价变革指明方向。

关键问题2:评价技术能否测出我们最期待的素养?

核心素养的精准测评,是当前教育评价的核心诉求,而这一诉求的实现,需破解认知技能与素养、结果与过程、学习诊断与学评融合、评价内容全面与核心的多重关系,依托技术创新突破测评瓶颈。教育测量与评价范式经历三级演进:从“关于学习的评价”(结果导向),到“以评促学”(过程反馈),再到“学评融合”(学习者主导)。学评融合的核心逻辑是实现评价的学习性与诊断性深度融合,评价既是结果诊断工具,也是高阶思维发展载体。学评融合聚焦未来核心技能,参考OECD研究,涵盖认知领域的批判性思维、终身学习能力等,非认知领域的同理心、协作能力等,以及技术素养等综合素养。欧盟明确要求将核心素养转化为可观察、可测量的外显表现,并开发对应指标框架与测量工具。全球教育考试构念持续向高阶能力拓展,个体层面聚焦批判性思维、社会情感能力等,群体层面关注小组协作,同时重视环境因素影响。以PISA评估为例,其构念从问题解决、ICT素养逐步延伸至全球胜任力、创造性思维,2025年将新增外语素养与数字世界学习素养评估。以写作评估为例,构念已从“产品导向”转向“过程导向”:传统评价聚焦文字通顺等基础指标,现代评价更关注谋篇布局、论证策略等高阶能力,将写作视为涵盖立意、构思、监控等多维度的复杂认知过程。学评融合的核心特征是提升学习者参与性,构建“教师-同伴-家长”多元评价共同体,引导学生通过自我评价、同伴评价提升反思能力、评他能力与标准意识,实现螺旋式成长。技术创新突破素养测评瓶颈:依托计算机、虚拟场景等技术开发交互式任务测评、游戏化创造力测量等新型工具;整合课堂音视频、可穿戴设备等多模态数据,通过认知诊断模型与机器学习融合,实现对认知能力、心理品质的精准测量,挖掘学习规律。

关键问题3:怎么才能高效使用数据?

高效使用数据,需破解一次与多次、全面与核心、短期与长期、统计与预测、科学规律与表面现象、评价主体与客体的多重关系,构建从数据采集到应用的全流程闭环体系,实现从自适应评测到个性化学习的跃升。数据高效应用的核心方向是从自适应评测迈向个性化学习。基于认知诊断的自适应评测,通过能力值估计与信息函数计算实现题目难度精准匹配,在此基础上可针对个体推送适配的学习资源。个性化学习的核心是构建“学习者-学习材料-评价”精准匹配机制:通过构建涵盖知识技能、人格品质等的学习者模型,以及包含内容结构、教学策略等的学习材料模型,基于测量模型实现双向适配。系统可通过预先路径规划或动态状态调整两种路径优化学习策略。素养导向的学习者建模,需整合认知、生理、心理等多维度数据,建立微观、中观、宏观特征库,构建动态模型追踪素养发展轨迹,为评价决策提供科学依据。融合计算机技术的测量建模可实现精准诊断:通过个人拟合统计量构建学习警示指数,诊断粗心、猜测等异常模式;结合认知诊断模型与机器学习识别作弊、随机作答等行为;以IRT结果为指标对学习过程进行聚类分析,支撑个性化评价。从测量到推荐的技术闭环是数据高效应用的保障。个性化学习推荐算法多样,涵盖学习理论导向、状态预测、强化学习等类型,通过“特征匹配-建模-赋值-映射”实现精准推荐,是AI与教育融合的核心发力点。数据应用需聚焦核心规律,避免表面解读。如学生学习状态分析显示,16.2%的低投高压型学生学业最差,22.5%的高投低压型学生表现优异,而学习态度、意志力和师生关系在客观投入与主观负担间起调节作用,为优化评价策略提供数据支撑。

关键问题4:学生实践的核心本质符合评价要求吗?

学生实践的核心本质,在于契合核心素养培育与全面发展的评价要求,需破解核心素养与全面发展、认知与非认知、知识掌握与数字世界学习能力、外部动机与内部动机、好奇心/成就感与分数的多重关系,通过思维训练、评价参与、项目式学习等路径实现评价与实践的同频共振。提升思维品质是学生实践的核心目标,关键在于实现高阶思维可视化。实践中可通过课堂融入式训练,运用八大思维图示法培养学生对比交互思维,以知识技能为载体推动素养发展。评他能力培育是学生实践的重要内容。评价本身即是高阶学习活动,通过自我评价提升反思能力,通过同伴评价培养评他能力,可借助创新互动、任务探究等形式引导学生参与,提升评价实效性。推行PBL项目式学习是落实素养培育的核心模式,通过强化问题思维、设计思维等培养,注重过程与差异化发展,实现认知与非认知能力的协同培育,契合评价要求。网络学习空间的同伴学习是思维常态化发展的关键。通过资源消费与创生的良性互动,引导学生开展反思、评价与交流,提升数字世界学习能力。如五年级学生通过网络平台交流《为中华之崛起而读书》读后感,深化理解并培育人文情怀。保持学生好奇心是评价育人的本质要求。需突破终结性评价局限,综合运用过程性、增值性等多元评价方式,实现结果与过程并重、数据与创新结合,激发内部动机,规避分数导向的功利化倾向。

关键问题5:学校供给与管理转型了吗?

学校供给与管理的转型,是适配AI时代教育评价变革的核心支撑,需破解物理环境与融合环境、教师管制与教师服务、多次供给与单次供给、科学育人与经验管理的多重关系,从环境、教师能力、资源供给等多维度推动转型。环境供给转型的关键是提升教师线上线下融合教学能力,打造一体化学习生态。如鄂尔多斯准格尔旗沙圪堵镇第一小学通过网络学习空间实现内容探究、互动与交流的有机结合,提升学习实效。学校管理转型核心是提升教师评价能力,将“听评课”转为“评课本”,聚焦学生素养发展。课堂评价需关注教学、学生活动及师生互动,聚焦自主学习、大胆质疑等核心表现,实现教学质量精准评价。精准命题是精准评价的重要保障,需推动教师从“题海”转向“精准命题”,形成命题框架与双向细目表,培养选题、改题及试卷分析能力。如北京市生物高考试题分析显示,内容覆盖率逐年提升,应用、分析等高阶认知目标比重上升,契合核心素养培育要求。教师课程重构能力提升是素养培育规模化落实的关键,需引导教师掌握思维导图、八大思维图示法等工具,并融入教材重构,通过思维可视化深化理解、培育素养。

关键问题6:社会共识形成了吗?

教育评价变革的推进,亟需形成社会共识,破解理论与实践、政府与教育、多主体共识与各有想法、短期与长期、国家意志与家长需求的多重分歧,在关注分数的同时,进一步聚焦素养与能力发展。理论与实践脱节是共识形成的重要障碍,素养导向理念虽获认可,但部分学校仍延续传统评价模式,落地困难。多主体诉求差异进一步加剧协同难度:政府关注公平质量,学校聚焦办学效益,家长看重分数升学,诉求偏差导致改革合力不足。短期与长期目标的失衡,制约了评价改革的深度推进。部分主体过度追求短期成效,将分数提升作为核心目标,忽视了核心素养培育的长期性与系统性,导致评价改革流于表面,难以实现深层次的体系重构。国家意志与家长需求的偏差,是共识形成的关键瓶颈。国家明确提出核心素养培养要求,强调促进人的全面发展,而部分家长仍秉持功利化的教育观念,将分数作为评价学生的唯一标准,两者之间的偏差导致素养导向评价难以落地生根。共识形成需强化多方协同。当前,AI赋能素养培育的实践已逐步推进,多款适配教育需求的AI智能体投入应用,为核心素养培育提供技术支撑。未来需通过技术赋能、政策引导、家校协同等路径,推动形成“关注分数更关注素养、重视结果更重视过程”的社会共识。

结语

技术赋能初心,共筑评价新生态
AI时代的教育评价变革,技术是手段,育人才是根本。无论技术如何发展,教育评价的核心使命始终是促进学生的全面发展,回应社会人才需求。这场变革不是对传统教育评价的否定,而是在传承优良教育传统基础上的创新发展。在教育数字化转型的浪潮中,唯有坚持以育人为本,推动技术与教育评价的深度融合,破解多重核心问题,构建政府、学校、家庭、社会多方协同的共识体系与支撑生态,才能让教育评价真正回归育人本质,为培养适应未来社会的全面发展之人奠定坚实基础。
 
来源:北京师范大学中国基础教育质量监测协同创新中心张生教授的主旨报告,2025年12月20日

版权所有:北京惠众教育研究院