91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

成长百分等级模型对学生进行增值评价分析

  2020-09-07    521  上传者:管理员

摘要:本研究使用成长百分等级模型对北京市某区66所初级中学2018届和2019届学生进行增值评价分析。结果发现:学生层面增值与基线测试无关,学校层面增值与基线测试正相关,学校整体效能较为统一,但跨年一致性与跨学科稳定性存在波动。建议在增值评价中关注能够反映学生进步程度的成长百分等级模型,结合其他指标对学校效能进行综合评价,以更好地促进区域教育公平、优质、均衡发展。

  • 关键词:
  • 义务教育
  • 增值评价
  • 学业评价
  • 成长百分等级模型
  • 教育评价
  • 加入收藏

2019年6月,中共中央、国务院发布《关于深化教育教学改革全面提高义务教育质量的意见》,强调深化关键领域改革,为提高基础教育质量创造条件,并明确列举了健全质量评价监测体系、强化过程性和发展性评价等举措[1]。长期以来,我国教育行政部门及一线学校都十分重视教育评价的重要作用,但使用的评价方式和标准还较为单一,通过计算平均分、及格率、优秀率、升学率等数据,基于终结性评价指标对学校效能和教师教学成果进行评价。这种评价不仅会导致为考试而教,而且会阻碍教育均衡发展的推进[2]。基于此,教育研究者与一线教师都在探寻更为合理的评价方式与手段,其中利用学生的进步程度开展增值评价,被公认为是一种更加公平和精确的学校评价方法[3]。根据不同时间点测量学生的学业表现,可以比较学生在学校、教师的培养下取得了多大程度的进步,将原有的通过单次测验成绩进行终结性评价转变为对发展趋势进行综合性评价,是近些年来教育评价的热点话题。在常用的增值评价模型中,学生成长百分等级(studentgrowthpercentile,SGP)因其更为突出的适用性在美国得到广泛使用,很值得我国教育界关注和借鉴。


1、成长百分等级模型


在学业测试中,可根据成绩将全体学生划分为若干个学业水平相似的学生群体,Betebenner将这样的学生群体定义为“学业伙伴”(academicpeer)[4]。学生成长百分等级模型通过整合学生多次测验数据,计算每个学生在学业伙伴中相对位置的变化,以此来衡量学生的进步程度。与基于单次测验计算的百分位数不同,学生成长百分等级是在前期学业水平条件下计算的百分位数。例如,学生A与其他9名同学的中考成绩均为500分,则将他们10人看作“学业伙伴”;收集这10名学生的高考成绩并进行排序后发现,学生A排名第3,超过了70%的学生,他的成长百分等级为70。对于学生A来说,通过3年的学习,与曾经学业水平相当的学业伙伴相比,他获得了更大的进步。该模型在分位数回归的基础上,对学生多次测验成绩进行分析,模型假设与考生前期学业水平相同的学业伙伴在当前学业测试中所得分数呈正态分布,因此也被称为正态模型[5]。常规的线性回归基于最小二乘法进行分析,存在线性假设和方差齐性假设;但分位数回归不包含上述强假设,能够克服最小二乘法易受极端值影响、随机误差方法不恒定等问题[6]。与线性回归仅能求出一条回归曲线不同的是,分位数回归模型能够根据所关注的不同的分位数,拟合每条分位数回归曲线,其计算公式为:

公式1

其中:τ表示某一百分位数,取值范围为0.01~0.99,每0.01为一个单位;y表示再测成绩;x表示初测成绩;β表示回归系数;i表示第i个样本;ρτ表示分段线性损失函数,其计算公式为:

公式2


通过这种方式可以得到99个分位数回归方程,并计算每一名学生的SGP等级,其数值范围为1~99。一般认为:如果SGP等级高于50,则表明这名学生在学业成绩上获得了进步;反之,如果SGP等级低于50,则表明这名学生在一段时间以来的学习中存在一定问题,进步程度较低[7]。

使用SGP模型进行计算需要较大样本量,一般要求在5000人以上。如果样本量太小,根据学业伙伴获得的SGP等级就会不稳定[7]。使用该模型评价学校效能时,将每所学校所有学生SGP等级的中位数(medianstudentgrowthpercentile,mSGP)作为指标,受异常值的影响较小[4]。根据2015年美国学术机构调研显示,美国共有19个州使用该模型进行增值评价[8]。美国科罗拉多州教育部最初将该模型应用到增值评价中,并以35分、65分为判断标准:学校mSGP低于35分则视为进步程度较低;在35~65分之间则认为进步程度符合预期;高于65分则认为进步程度较高。

成长百分等级模型具有3个优势:首先,该模型受极端值和异常值影响较小。无论学生处于何种位置,均可使用该模型估计出其进步程度。其次,使用该模型能够较为公平地评价起点不同学生的进步程度。每个学生都与各自的学业伙伴进行比较,计算出的进步程度均被统一到1~99的SGP量尺下,与学生的前测成绩不相关[4]。这一变化突破了传统方法对起点不同学生进步情况难以直接比较的困境,改变了依据位次变化评价时存在“天花板”效应的尴尬局面[9],保证了评价的相对公平。最后,该模型操作性强,实施难度较低。SGP的计算方法,由于初测成绩仅起条件作用,在实际操作中并不需要使用垂直等值设计的测验工具[4],因此操作相对简便易行。

SGP模型在美国教育评价体系中已经得到广泛应用,但是否适用于分析我国学校教学效能尚需要更多实证研究加以论证。本研究探索运用该模型进行增值评价,通过衡量学校、学生的进步程度,更全面地评价学校的教育教学效果,以期为我国区域层面开展增值评价提供借鉴。


2、研究方法


2.1数据来源

本研究数据采集于北京市某区。选取区域内2018届和2019届初三毕业生作为样本,这些学生参加了中考,同时在初一入学时参加了7年级基线测试。为保证分析有效性并能进行跨年一致性比较,选取2届学生人数均在20名以上的学校的数据,最终选取66所初级中学,其中:2018届学生共计10471名,2019届学生共计10824名。

2.2变量选取

选取每名学生7年级入学一个月内参与全区统一摸底考试所得成绩作为基线测试成绩。该考试依托该区开展的学业水平监测项目,依据义务教育课程标准和教育质量综合评价指标体系构建各学科测验,由中学教研员和骨干教师共同研讨命制试卷,由一线教师联合完成阅卷工作。选取每名学生在9年级期末参与的全市学业水平考试所获得的中考成绩作为再测成绩,构建增值评价模型,包括语文、数学、英语单科成绩及3科总成绩。

2.3统计方法

本研究运用R软件中的SGP包进行模型拟合与增值计算,运用SPSS26.0进行数据管理和统计分析。


3、研究结果


3.1学生层面分析

表1和表2显示,学生各学科及总分的SGP等级均值为49.96~50.47,标准差为28.73~29.30,各学科SGP等级与基线成绩的相关系数在0.00~0.01(p>0.05),说明学生最终的增值表现与基线测试成绩并不相关。2届学生在各学科的增值表现上较为相似。语文、数学、英语3科的SGP等级两两之间均存在显著的正相关,相关系数为0.26~0.38。各学科SGP等级与总分SGP等级之间均存在显著的正相关,相关系数为0.53~0.80,其中数学与总分的相关系数最高,表明数学的进步有可能带动整体学业表现提升。

3.2学校层面分析

取每所学校学生SGP等级的中位数(mSGP),代表学校效能,各学科mSGP等级的最小值和最大值见表1。分析2届学生数据发现,各校英语学科mSGP等级的离散程度较小,语文和数学学科mSGP等级的离散程度较大。

表3显示,3科及总分的mSGP等级与基线平均成绩之间存在显著的正相关,相关系数为0.52~0.77,与学生层面分析结果不同。说明在学校层面上,起始平均成绩较好的学校,更有可能为学生赋能,获得更大进步。

表1学生层面与学校层面各学科增值的描述性统计结果

表2学生层面各学科增值的相关性分析结果

表2学生层面各学科增值的相关性分析结果

在学校增值的跨学科一致性方面,3科的mSGP等级两两之间均存在显著的正相关,与学生层面分析结果相似且相关系数更高,为0.61~0.84。通过重复测量方差分析发现,各学科mSGP等级两两之间均不存在显著的组内差异(F2018=2.86,p>0.05;F2019=1.42,p>0.05),说明对每所学校而言,各学科增值表现较为近似,跨学科一致性较高。3科mSGP等级与总分mSGP等级之间均存在显著的正相关,数学与总分之间的相关系数最高。

在学校增值的跨年一致性方面,相同学科mSGP等级在2届学生数据之间存在显著的正相关,其中语文、数学、英语3科的跨年相关系数分别为0.79、0.75和0.64。英语学科的跨年一致性略低于另外2科。将各学校同一学科的2届mSGP等级设定为配对变量,通过配对样本t检验发现,在相同学科上,各校2届增值等级之间均不存在显著性差异(t语=-1.17,p>0.05;t数=-0.61,p>0.05;t英=-0.57,p>0.05),说明对每所学校而言,各学科增值表现的跨年一致性较高。

3.3学校个案分析

对66所学校的基线测试平均成绩、中考测试平均成绩、增值评价成绩进行排序并比较,发现2届学生所属学校中考成绩排名与基线测试排名的相关系数为0.97~0.98,中考成绩排名与增值排名的相关系数为0.62~0.66。虽然学校层面各项排名在两两之间都存在较高正相关,但相关系数之间的差异说明,聚焦学校个案时,增值评价所关注的相对量与终结性评价所关注的绝对量相比,结果可能并不一致。以2019届学生的语文成绩为例,在66所样本学校中筛选具有代表性的10所学校,比较它们在全区中的中考平均成绩排名与增值分析排名,如图1所示。其中:9号学校,虽然受生源影响中考成绩排名相对落后,但增值排名有大幅提升,说明使用成长百分等级模型能够更为合理地评价这些学校为学生带来的增值赋能。

图12019届学生所属学校(10所)语文中考、增值分析全区排名情况

学校层面增值排名的跨届一致性与跨学科稳定性较高,但聚焦学校个案时,则与以往研究结论相似,即每所学校在不同届别、不同学科表现上存在一定的波动。以语文学科为例,如图2所示,2018届学生所属学校mSGP等级与2019届学生所属学校mSGP等级在数量与排名上均存在不同幅度的波动。依据美国科罗拉多州教育厅的相关标准对学校增值类型进行切分,发现在2届学生数据中仅3所学校始终保持高增值水平,7所学校保持低增值水平,18所学校的增值类型发生变化,占整体样本校的27.3%。


4、讨论与思考


4.1成长百分等级模型兼具常模参照与标准参照特点

在学生层面,一线学校通常采用常模参照的方法,依据学生在班级、年级或全区中相对位次的变化计算学生增值。这种方法能够大致判断学生是否取得进步,但无法客观比较不同起点学生的进步程度;同时由于存在“天花板效应”和“地板效应”,在评价的公平性上存在缺陷。尽管成长百分等级模型仍采用常模参照方式,但排除前期学业水平因素的影响,将计算学生进步程度的群体范围限定在与该学生水平相当的“学业伙伴”中,将进步程度限定在1~99的SGP量尺中。每个学生的SGP等级都有实际意义,既能反映学生取得了多大程度的进步,也能对不同学生的进步程度进行比较。此外,教育行政部门可依据区域的实际情况设定进步程度的判定标准,界定学生或学校所属的增值类型,使成长百分等级模型兼具标准参照的特点,从多方面保障评价的公平性。

4.2更合理地评判学校增值有利于基于证据改进教学

在学校层面,每所学校在全区的中考成绩排名与增值分析排名之间存在一定的差异,反映了增值评价的意义与价值。基于这种方式评价学校效能,旨在对终结性评价进行补充,助力学校转变评价观念,重新审视一段时间内的教育教学成果。本研究仅使用2次测试成绩作为数据来源,若增加过程性测试数据则能够提供更多的有效信息。学校可以针对不同学科、不同时段学生总体进步表现及分布形态反思教育教学,也可以进一步分析不同群体之间是否存在差异等问题,以便对学生群体或个体进行针对性、个性化指导,基于证据改进教学。

4.3学校增值一致性与稳定性存在波动,仍需结合其他证据综合评价

在区域层面,增值评价结果为教育行政和教研部门进行决策提供了可靠的证据支持。基于分析结果,既可以推广高增值学校优秀的教学管理案例或模式,也需要调研低增值学校在日常教育教学中存在的问题或需求,提出改进建议。然而增值评价也存在一定的局限性,学校的增值表现只能代表其在一段时间内取得的成果,基于单个年份计算的学校增值不建议在高利害性质的学校问责体系中使用[3]。教师配置、生源情况、学生个人努力程度等因素均可能在培养不同届学生的过程中产生差异,影响增值表现。因此,应妥善看待增值评价结果:一方面要肯定成长百分等级模型在学校效能评价中的科学性与必要性;另一方面也要结合其他证据、指标,对学校一段时间内的教育、教学成果进行综合评价,做到及时反馈、充分解释、合理决策,实现对学校的全面客观评价[10]。

图22018届和2019届学生所属学校语文成长百分等级表现


参考文献:

[1]中共中央国务院关于深化教育教学改革全面提高义务教育质量的意见[EB/OL].(2019-06-23)[2020-02-15].

[2]周燕,边玉芳.美国教师效能增值评价研究与应用进展[J].全球教育展望,2011,40(10):72-78.

[3]彭湃,胡咏梅,克里默.学校增值的一致性与稳定性:基于多水平追踪数据的实证研究[J].教育研究,2015,36(7):73-80.

[5]王晓平,齐森,谢小庆.美国学校“成长测量”的7种主要方法[J].中国考试,2018(6):21-27.

[6]焦璨,王宣承,张敏强,等.分位数回归:心理统计方法的重要补充[J].中国考试,2009(1):9-15.

[7]谢小庆.用于成长评估的学生成长百分等级模型:来自美国的经验[J].教育测量与评价,2019(6):3-9.

[9]符华均,王朝阳,程乾,等.基于学生成长百分等级模型的学业进步评价[J].中国考试,2019(2):14-18.

[10]边玉芳,王烨晖.增值评价:学校办学质量评估的一种有效途径[J].教育学报,2013,9(1):43-48.


王帅鸣,姚守梅,王梦,张荣慧.基于成长百分等级模型开展增值评价的实证研究[J].中国考试,2020(09):46-51.

基金:全国教育科学“十三五”规划2016年度教育部重点课题“基于核心素养发展的区域教研转型实践研究”(DHA160351)

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

中小学教学研究

期刊名称:中小学教学研究

期刊人气:902

期刊详情

主管单位:辽宁省教育厅

主办单位:辽宁省基础教育教研培训中心

出版地方:辽宁

专业分类:教育

国际刊号:1674-5728

国内刊号:21-1396/G4

邮发代号:8-234

创刊时间:2000年

发行周期:月刊

期刊开本:大16开

见刊时间:4-6个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定