一、问题的提出
大学存在着两种主要的高等教育哲学,一种是以认识论为基础,另一种是以政治论为基础。从这一视角看,对大学的评价应有两个目的:一是认识和了解学生的发展和进步,具有学术性和人文性;另一个是实现和促进学校的发展,具有服务性和工具性。近年来,我国评价政策法规不断完善、组织机构不断健全、评估项目不断丰富、理论探讨不断深入,但在具体实施过程中也存在两个目的相矛盾、评价和育人两张皮的问题。一方面,评价结束意味着万事大吉,评价结果和数据常处于静止、孤立状态,较少用于教育教学一线,限制了评价引导学生发展这一人文性效用的发挥;另一方面,竞争性、选拔性、等级性的评价结果跟各种利益绑定、与资源分配挂钩,放大了评价工具性的消极影响。实际上,当前教育评价改革面临的问题不在评价技术本身,而是在于评价背后的理念和逻辑。2020年中共中央、国务院印发的《深化新时代教育评价改革总体方案》提出新时代教育评价的主要原则是发挥评价指挥棒作用,引导确定科学的育人目标,通过实施综合素质评价,改进结果评价,强化过程评价,促进学生全面发展。育人是高校的根本使命,高校所有事业都应以育人为中心,服务于育人使命,育人理应成为评价的最终目的。实现评价导向科学的育人目标,推进评价工具性和人文性相结合,发挥评价的工具性服务于大学的育人使命,通过评价认识学生的成长、赋能学生的成才,是新时代高等教育评价改革的核心任务。
美国兴起于19世纪80年代的成果导向学生评价运动,是高校评价赋能育人的探索与实践。该评价运动发生了从对教育活动进行价值判断的目标取向到为教育决策提供信息的过程取向,再到关注共同建构的主体取向的转变,评价活动越来越关注个人发展,重在为学习者提供学习支持,引领下一步发展方向。从理念上看,成果是大学生的知识、技能、情感、态度等育人成效集合体,成果导向意味着以学生为中心,评价学生学了什么、能做什么,更加关注本科教育过程中学生的增值;从实践上看,高校围绕育人目标和过程构建评价体系,集中多主体从多维度判断育人情况,以评价结果为依据对育人要素进行不断调整和优化,育人成效得以提升。可以说,成果导向的学生评价模式将评价嵌入到育人体系,有效发挥了评价对育人的引导、改进和提升作用。本研究结合美国高校开展成果导向评价的理论和实践经验,提出评价赋能育人的举措和路径。
二、评价指标与育人目标一致
评价是基于目标的判断过程,育人目标来自社会的期待和学校的使命,来自教师在专业和课程设计时的意愿,来自学生自己的学习期望。明确的、共享的、可执行的目标是有益评价的基础。比格斯指出,在好的教育系统中,教学与学习活动的目的、方法与评价协调一致,共同支持学生学习,他将此类过程称为“建构性一致(Constructive Alignment)”。建构性一致包含三大基本任务:明确定义育人目标;选择能够实现育人目标的教学和学习方法;确定评价方法并实施评价,检查其与预期目标的吻合程度并进行改进。只有育人目标、教与学活动与评价活动相互呼应、协同开展,评价才能真正发挥育人作用,并促进专业教学和学习目标达成以及学校使命的完成。
美国高校的育人目标一般都由一系列核心能力构成,如沟通交流、团队合作、问题解决、批判性思维等。依据育人目标设计的评价指标包括两个方面:一是围绕核心能力确定评价内容;二是围绕评价内容确定等级标准,标准标识了期待能力的达到程度,能够有效向学生传达高校对他们的期待和要求,是一种提升评价有效度的方式。以美国一流文科大学阿维诺学院为例,该学校明确其育人目标是培养学生的交流能力、分析能力、问题解决能力、决策能力、社交互动能力、全球视野、合格公民素养、审美能力等八项核心能力,学校以这八项能力作为评价指标,从初级、中级、高级三个等级描述了各项能力应该达到的标准,形成了评价指标及等级标准体系,(见表1)其中评价指标是学生完成学业需要具备的核心能力;等级标准是区分学生表现的依据。从对知识学习的要求看,初级标准主要关注学生对知识的呈现、观察、识别、说明,中级标准关注学生对知识的思考、分析、理解,高级标准关注学生对知识的应用、运用、创造。在课程和专业学习之前,教师向学生说明评价指标和等级标准,希望学生能够以达到高一级水平的标准为目标。育人目标和评价指标的一致性为评价赋能育人提供了前提条件,用与育人目标一致的指标开展的评价,其结果最终指向育人目标的达成与育人成效的提升。
三、评价活动与育人过程伴随
质量评价是一种主体性描述,本质就是一种价值判断,是由评价主体发出并以评价主体内在尺度和需要为标准对评价客体的衡量而最终作出的价值判断。随着高等教育不断开放、学生个性化教育需求不断提升,评价不再是由教师代表的学校内部主体组织的,而是有了用人单位、第三方机构等外部主体参与其中;也不是通过考试这一单一方法开展的评价,更不是一次性评价,而是逐渐转变为贯穿于整个人才培养过程的多元主体、多种方式的形成性评价。评价活动的多主体、多种方式覆盖育人全过程是评价赋能育人的根本方法。美国高校评价以核心能力为对象,在学生入学前、学习中、毕业及毕业后四个阶段穿插或陆续展开。不同阶段的评价有不同的主体、方法和重点,构成伴随育人全过程的评价体系,主要评价活动包括学生自我评价、课程嵌入式评价、专业集体评价和校外评价等,评价活动与育人过程依据育人进程和需要交替展开。
(一)学生自我评价
学生自我评价是指学生根据评价指标和标准对自己的学习能力、状态和结果进行自我判断。学习开始前,学校公开学习目标、评价指标以及等级标准,学生在诊断性评价中练习自我评价能力,逐渐学会评价自己的学习表现,了解自己的优缺点;在学习过程中,学生不断对照标准将自我评价内化为一种习惯,对学习进行自我监控,定期分析自己的学习情况,制定并优化学习计划。学生自我评价有利于唤醒和增强学生在学习中的主角意识,形成深度的自我认识,反思学习过程中存在的问题并找到可以改善的方式,更积极地为自身的学习承担责任。学生自我评价贯穿于育人全过程。
(二)课程嵌入式评价
课程嵌入式评价是指教师依托课程对学生的学习表现进行持续评价,主要在课程学习阶段开展。所谓“嵌入”是指教师在开展教学之前就将评价活动作为教学活动的一部分进行整体设计并在教学中实施。在课程学习过程中,教师根据知识内容安排不同的考察任务,如考试测验、撰写分析报告、写信、辩论、写申请书、书面沟通专业问题、写商业计划书、角色扮演、作品展和职业模拟等,并根据任务完成情况对学生进行评价。课程嵌入式评价是评价体系的最关键一环,评价方式取决于课程的性质、学习的目的以及教师对展示课程成果所需情境的设计。对学生来说,课程嵌入式评价与学习同时发生,评价不再是学习的终结,而是学习情况的实时呈现,可以成为下一阶段改进学习方法、提高学习能力的依据;对教师来说,课程嵌入式评价可以被整合到教学活动中,无需在课程中增添额外的环节,因此是一种高效的评价方法,不但有更强的指导性,可操作性也更强。
(三)专业集体评价
美国高校强调专业承担的集体育人责任,提出评价不仅是教师个人行为,更是专业和学校的集体行为,因此,学校在专业学习结束后,以专业为单位开展对学生的集中系统评价。专业集体评价体现在两个方面。一是教师们在分享教学和评价经验的基础上,合议学生如何以及是否达到专业要求、专业所需的能力以及必要的教学和学习活动等。教授不同课程的教师组成评价共同体,共同分享他们观察到的学生表现,通过学生表现对专业课程体系的设计是否能够支撑学习目标的达成;课程体系是否连贯、有助于学生连续学习;专业教育对实现学习目标的支撑程度如何;专业学习是否有助于学校人才培养目标的实现等进行思考和判断。二是对学生整个受教育阶段的能力发展情况进行纵向的评价。学校为每位学生建立学习档案袋(Portfolio),将学生完成的课程作业、参研项目、研究报告、毕业论文、艺术作品、表演展示等学习过程资料和学习任务收集起来,像归档一样存放在一起,以便从更长时间、更多视角评价育人结果。随着计算机的普及和网络技术的发展,很多学校还出现了更便捷的电子档案袋(Electronic Portfolio),扩大了储存容量,有益于检索查询和共同评价。基于学生的集成档案,专业教师评价共同体对不同时期的学生或同一学生在不同时期的学习情况进行纵向分析和横向对比,分析学生通过专业学习是否实现了学习目标,以及实现程度,从而达到评价人文性和工具性的双重目的。
(四)外部评价
外部评价是指学校通过积极拓展评价信息来源、收集各类外部评价信息,了解学校育人结果,探究学校课程和学校文化如何影响育人成效,以及学位对于学生、用人单位和社会大众的意义,一般在学生毕业后开展。美国高校外部评价具体包括三种方式。一是客观数据分析,根据入学考试分数、报考人数、就业率和起薪、专业资格考试结果等量化数据对人才培养成效进行终结性评价。这类评价结果直观,数据便于收集和比较分析,是判断育人质量的重要依据。大学生学习评价项目(Collegiate Learning Assessment)是美国比较典型的标准化直接测评工具,评价内容包括科学和实证推理能力、分析与问题解决能力、写作技巧和成效、批判阅读与评价能力、辩驳能力等。该评价采取横向比较和纵向跟踪两种方式,可以测量学生学习的增量价值。二是问卷调查,属于间接评价,调查对象包括用人单位、毕业生、学生和教师等。全国大学生学习性投入调查(National Survey of Student Engagement)是美国影响最为广泛的自陈式量表测试工具,从行为、认知、情感三个投入维度组织开展对不同年级大学生学习投入情况和学业成就调查,以认识学生成长的曲线规律。阿维诺学院研发的行为事件访谈(Behavioral Event Interview)使用行为事件访谈法询问受访校友在特定场景中的行动、想法和感受,建构全景图展示毕业五年的校友在工作、家庭等方面的表现,以确定学生需要的关键能力。三是基准评价,即以量规为依据,构建由评价指标(内容)、评价标准(质量)以及评价等级(分数)构成的矩阵开展评价。美国有诸如教育理事会(American Council on Education, ACE)、高等教育认证委员会(Council of Higher Education Association, CHEA)等全国性,以及新英格兰院校协会(New England Association of Schools & Colleges, NEASC)、南部院校协会(Southern Association of Colleges and Schools, SACS)等地方性的高校和专业认证机构,通过研发各种类型的认证标准、程序及实施办法,采用非政府性的、同行专家评议等方法评价学校和专业的质量水平。这些基于标准的认证将育人成效作为重要的评价对象,以此判断该学校或该专业是否达到既定的标准,增强了美国本科教育的规范性和教育水平的稳定性。此外,还有本科教育学习有效评估项目(Valid Assessment of Learning in Undergraduate Education)是将标准量规作为评价依据,将课程作业等作为直接证据评价学生学了什么、能做什么以及如何改进。
四、评价组织和育人主体协作
评价赋能育人的理念需要有效的组织和运行机制保证评价的有效实施。在评价目标对象、评价方法确定后,关键问题就是如何保证实施效果。美国高校设置专门的评价组织负责实施评价、研发大数据共享和分析中心为评价主体的交流协作提供平台和技术支持,构建有效合作和协商机制保证校内外育人主体共同参与评价以及协同改进,形成评价赋能育人的组织保障。
(一)评价组织与协同运行机制
评价组织机构的专门化是美国高校评价赋能育人的组织基础,大多数高校设置专业的评价组织和管理部门,如教育评价中心、教学与学习中心、院校研究中心等,这些部门一方面承担评价组织职能,负责制定全校的评价计划,研发各类评价标准和量表,形成学校评价框架和流程;组织学院、专业教师和外部评价者开展评价实践,收集和反馈各类评价信息;另一方面承担评价研究职能,定期发布评价结果报告,组织召开评价研讨会,深度分析和解读评价结果,研究如何改善教学效果和学习效果。如圣奥拉夫学院成立教学与学习中心(St. Olaf’s Teaching and Learning Center),负责制定评价方案、实施评价过程,定期从系、学院和其他部门收集相关数据,将评价结果与教师共享,根据评价结果对在校生和毕业生进行纵向研究,和教师们反思研究结果,从学校层面思考出台提升育人成效的举措。此外,美国高校还通过建立结构化的评价组织体系使校领导、职能部门、学院、专业和教师、学生联动起来,形成评价协同运行框架。如詹姆斯麦迪逊大学评价体系由领导层、执行部门及监督部门组成,其中,董事会是评价体系的最高领导层,校长是最高行政领导。在执行层面,评估研究中心是学校评价的核心执行部门,负责评估方案的设计、提供量表编制、组织评估以及评估活动的元评估等。学术事务部和学生事务部是学校评价的主要执行部门。学术事务部负责学生学习评价,主要评价学生与学科相关的知识学习能力,由学术事务副校长兼教务长负责;学生事务部负责学生发展评价,主要评价学生与实践相关知识运用能力,由学生事务副校长负责。这样的分工把学生课内和课外的学习经验整体连接起来,保证对育人成效的评价结果更加全面客观。评价组织结构清晰又相互协作,理论与实践相融合的多主体团队在探索改进和解决评价实践问题的基础上共同构建适合本校实际的评价体系,提升评价的可操作性性和针对性,以及评价结果的全面性,为评价赋能育人奠定扎实的组织基础。
(二)大数据平台支持和协作机制
构建大数据平台是美国高校组织评价的普遍做法,如1982年卡内基梅隆大学成立埃伯利卓越教学中心(Eberly Center for Teaching Excellence),建立数据平台,开展支持教师教学和专业发展的评价。随着评估运动的深入,学校发现更重要的问题是如何利用评价产生的数据推动育人成效的提升。于是,埃伯利卓越教学中心在评价实施后建立闭环(Closing the Loop)优化评价过程,先收集评价结果和基础数据,分析这些数据以确定改进策略,实施改进,然后再次收集数据以衡量改进措施的影响。2013年,该中心与教育技术办公室等部门合并,更名为埃伯利卓越教学与教育创新中心(Eberly Center for Teaching Excellence & Educational Innovation),将原有的数据平台拓展为一个集收集、汇总、呈现、研发、分析和创新等多功能于一体的大型数据共享交互平台,旨在加强卓越教学、评价和教育创新之间的联系。该平台以循证为基础,主要功能包括两个方面。一是公开评价框架和能力指标、评价方法与工具等;呈现数据,公布评价结果;报道学校各种评估动态,并提供不同学院、系、专业评价实践案例。二是智能分析和解释相关的评价数据。中心发现数据平台收集的来自校内外的评价数据信息并没有得到充分有效利用,评价结果还没有被转化为提升学生表现的行动,究其原因是现有的评价结果不够直观,很难被理解并直接转化为行动。随着机器学习的兴起,中心正在研发数据平台的智能分析功能,通过Excel软件、地理信息系统(Geographic Information Systems)将数据分析从主观性向模式化转变。模式化分析可以减少评价主体分析评价结果产生的时间、精力负担以及对评价结果分析是否科学性的质疑,成为当前美国高校数据平台建设的主要趋势。
(三)评价合作和结果协商机制
随着高校的不断开放,人才培养的质量和规格不但要满足高校和专业需求,还要满足社会的期待和用人单位的需要。高校的评价主体也从教师拓展到校内管理、服务和研究人员,以及校外政府、用人单位和企业、第三方评价机构等,评价成为多主体合作活动。利益相关者积极参与评价,有助于提高评价的针对性和客观性。由于评价存在于动态的过程和结构中,有赖于学生、教师、管理者和校外人士等利益相关者的密切合作和互动,为此应加强收集利益相关者的意见,包括各利益相关者在参与评价设计和实施过程、监督环节和反思活动时提出的建议意见,促使各方能基于共同信念开展评价工作;还应加强利益相关者之间的交流和合作,构建起校内外评价主体间的协商机制,推进评价设计、实施和改进过程的有机联系和衔接。美国高校评价体系打破了以往以教师为单一评价主体的模式,引入不同主体共同设计和实施评价、共享和共商评价结果。具体举措是在评价起始阶段让重要的利益相关者(教师、学生、学校领导、管理人员、用人单位等相关群体)参与进来,鼓励每个群体提出感兴趣和需要深入了解的问题和事宜,作为评价框架设计的逻辑起点。建立用人单位、校友、学生、教师、家长等利益相关者持续参与评价体系建设的运行机制,如定期召开例会、咨询会等,以达成共识并不断提升和完善评价指标和等级要求。探讨能够产生各类学生表现和学校育人成效证据的评价方法,确保关键的利益相关者能够理解并使用这些证据。在分析评价结果的过程中再次聚集这些利益相关者,询问他们是否对所关注的问题和事宜有了答案,以及接下来可以采取的改进或提升计划。
五、评价结果指向育人要素改进
评价结果是持续提升育人成效的依据。在成果导向评价体系中,如何使用评价结果,将收集到的海量数据转化为支撑学生进步和发展的有效举措和行动指南,切实提升育人成效是关键环节。但是,由于评价结果内隐着“对谁而言”的主体言说立场,多元主体基于自身的信念、价值、目的等,对同一结果会得出有云泥之别的结论。育人主体对育人质量的判断不同加大了评价结果解读的复杂化。如果忽略对评价主体的关注,只是单一化、孤立化地看待评价结果,评价结果就难以发挥改进育人成效的作用。美国高校一方面通过不同的评价方法得到对学生、课程、专业和学校等不同对象表现的评价结果,从不同层次和维度呈现了育人过程中的问题;另一方面通过建立常态化集体协商机制,组织不同主体参与评价结果解读,使得对育人问题的分析和改进恰好又回到学生学习、教师教学、课程、管理等育人要素,从而扩大了评价结果可作用的范围,育人质量得到协同性、整体性的改进。
(一)学业支持和预警
评价指标和育人目标的一致性使学生一开始就可树立正确的发展观念和学习目标,更积极主动地学习。在育人过程中,教师通过观察学生表现,结合其自我评价结果以及教师在课程教学、班级和学习环境中收集的评价证据,记录学生学习过程中的变化,客观分析育人成效。将等级标准与学生表现进行比照,及时发现有学业困难和障碍的学生,形成学业预警信息并及时干预并调整;通过专业集体讨论对影响育人成效的原因进行深入分析,帮助学生转变学习态度,树立学业目标,制订学习计划,建立学习信心,并指导其对下一步学习做出调整和改进。
(二)教学内容和方法优化
课程嵌入式评价结果是教师开展教学改进的重要依据,课程评价结果能够帮助教师进一步理解课程和教学对学生的全面发展、个性发展、潜能释放和学习兴趣的重要意义。教师通过研究学生在知识学习和核心能力运用等方面的结果表现,解读学生知识和能力的掌握情况,针对学生薄弱环节调整教学方法和教学任务,如在课程中有针对性地增加教学环节和教学活动,优化对学生的指导方式,提升课程质量和学生的学业收获;分析课程中无法支撑能力培养的设计,结合学科最新发展动态,更新教学资源,充分了解学生的现有基础和认知规律,对教学内容进行调整和重新整合,提升教学对育人目标的支撑程度和学习效果。
(三)课程体系重构
专业集体评价和用人单位评价结果往往反馈更加宏观的育人效果。一方面,专业集体评价和用人单位评价将专业课程作为一个整体,有利于专业形成系统性、连贯性、关联性、整体性课程体系,有利于知识学习体系的相互支撑和完整性;另一方面,专业集体评价和用人单位评价能够看出课程体系是否能够支撑育人目标的实现,是否支撑实现学生全面发展、成长成才的教育目的,特别是对学科思维能力、运用知识创新等核心能力培养等方面的支撑。依据专业集体评价和用人单位评价结果,专业和学院能够对课程设计、实施和效果进行整体判断,以形成可以完全支撑学生核心能力培养的课程结构。
(四)管理机制创新
面对学生生源的多样性和差异性,做到以学生为本,重要的是倾听学生的声音和想法、追寻学生的兴趣和特长、激发学生的学习热情,构建学习愿景,这些都需要将培养方案作为一个整体做好顶层设计。外部评价结果主要用于确定更加合适的学习目标和能力框架,即根据用人单位和校友反馈的信息,反思学校育人目标是否合理,核心能力组成能否满足社会发展新形势和新需要,以及学校追求卓越的核心价值;用于激励教师采用多元教学方法,开展人才培养模式改革和实践,促进教师专业化发展,培养更加优秀和卓越的人才;用于提升管理质量,改革管理和运行机制,提升管理效率,更好整合软硬件和教育资源为师生提供指导和服务等,以此形成评价赋能育人体系的有效运行和保障机制。
六、启示
美国以成果为导向的学生评价运动将评价嵌入育人体系,为高校评价赋能育人提供了理论和实践经验,对于我国高校的启示主要有以下四个方面。
第一,树立赋能育人的评价理念和目标。美国高校以成果为导向的评价既注重呈现每个学生的学习表现,又注重通过评价结果改进学生的学习成效,因此被赋予两层意义。一方面,评价以学生的知识和能力为对象,评价结果对学生和学校来说具有总结性意义,展现了评价的工具性价值;另一方面,评价被嵌入到学习过程中,主要目的在于改善学生的学习和发展状况,因此还具有成长性意义,发挥了评价的人文性作用。解决评价和育人两张皮问题,促进评价工具性和人文性相结合,应树立评价赋能育人理念,研制与育人目标相一致的评价指标体系,使评价的最终目的指向育人目标的达成和育人质量的提升。
第二,形成赋能育人的全过程评价活动框架。总体上看,我国高校接受的外部评价偏多,赋能育人的内部评价体系还未形成。要发挥评价的育人作用,有效引导人才培养质量的持续提升,高校不能仅从外部收集数据和评价结果,还要根据自己的育人目标,设计合理的评价内容、方法体系,以得到可靠的、有人文性价值的育人结果。美国高校采取多类型评价方法,推动多主体开展评价活动,形成覆盖育人全过程的评价活动框架,评价层次类型丰富,评价视角多元,呈现结果有针对性,为多角度判断育人质量提供了客观依据。
第三,构建赋能育人的多主体评价运行机制。我国高校有很多不同形式的评价,由不同职能部门负责组织和实施,专业化程度不够高,也难以在全校范围内形成评价合力。美国高校通过设置专门的职能部门负责组织实施评价,建立结构化组织体系使学校领导层、行政管理部门、学院联动起来开展评价;研发专业的数据平台为评价提供数据共享和智能模式化分析;构建常态化合作和协商机制,组织用人单位、校友、家长等利益相关者共同设计和实施评价、共享和共商评价结果。这些举措打破校内外壁垒,集中校内外评价资源,评价的组织者和实施者互联互通、同向同行,形成合力,保障评价赋能育人理念和活动框架的有效落地。
第四,推进赋能育人的全方位评价结果改进。重评价、轻改进是评价工作中的通病,高校往往把评价看成一项任务,评价结束万事大吉。以育人为中心的评价,提升育人质量是根本目的。当前的评价实际上是对前期育人工作的总结,是后续提升育人质量的起点。美国高校评价更加关注改进,通过建立集体协商机制组织不同类型评价主体共同解读和讨论评价结果,引发学校、专业和教师对育人质量影响因素的深度分析,通过调整学生学习计划、优化教学内容和方法、重构课程体系、创新管理机制等方式推进教学、课程、管理等育人要素的全方位改进,构建闭环推进育人质量得到持续提升。