书城社会科学教育统计与测量研究(教师继续教育丛书)
16405300000014

第14章 学生课业发展的测量与评价(3)

二、评价学生课业发展的参照点体系

无论是相对评价还是绝对评价,要使其结果更有意义,就需要为学生课业发展评价寻找一个参照点。概括地讲,课业考评过程常见的参照点类型主要有个人发展参照、教育目标参照和教育常模参照三大类,其中每一类又可分若干种不同的方法。这些不同的方法有其不同的使用对象和范围。

(一)个人发展参照法

心理科学理论和教育实践表明,能力的个别差异是客观存在的;青少年学生的学习能力差异可以缩小但难以消灭。在评价学生课业发进展进步过程中,为了不伤害儿童的自尊心以及为了尽量减少考试分数对师生双方教学带来的负面影响,教育人员对学生的课业发展进步采用个别化的评价,可以个人发展为参照,尽可能体现儿童的学习进步。参照个人发展进行课业评价时,常用的有下面三种方法:

1.个人发展纵向参照

对于基础较差或学习成绩较落后的学生个体来讲,假如教师按惯例在考试后当场公布其真实的考试分数时,难免会挫伤这部分学生的自尊心。不言而喻,这对学生的个性发展往往是弊大于利。针对这个问题,人们在课业评价过程中主张淡化或不用考试分数,采用婉转和良性的词语并参照学生过去的学习基础或测验成绩,从个人发展纵向比较的角度来评价学生的学习进步幅度和努力程度。至于评定学生课业发展进步实际达到的水平,国外一些中小学校规定,除了学生已经达到优秀(A等级)和良好(B等级)成绩可以直接记录或公布外,其余暂时达不到优良等级的学生,不记录也不公布他们的实际(测验)成绩,但教师需要把考试(测验)情况让学生本人知道,以便明确课业发展情况和今后的努力方向。

2.个人发展横向参照

个人发展横向参照是将不同类型的行为或不同科目的学习在同一时间横断面上进行相互比较,对学生各方面的发展情况作出评价,并提出书面评语和建议。在采用个人发展横向参照评价法时,可以因人而异地选择“揭短法”或“扬长法”。前者是以发展最好的方面为参照,指出其他方面的不足;后者是以发展基础最差的方面为参照,指出其他方面的进步和长处。课任教师及有关评价者,可以根据学生的学习及个性特点,选择不同的评价方法以适应个体化的教育评价和充分发挥教育评价的教育功能。

3.个人潜力发展参照

学生的个人潜力之间不但存在着质、量及时间上的差异,而且在潜力发挥的程度上也不一样。一个学生的潜力在某学科学习过程中得到充分的发挥,则该生应该给予高分数;反之,潜力发挥尚不够的学生,哪怕卷面分数已较高,但相对于该生可能达到的更高的学习水平来讲,教师可能只给该生一个中等或中上的成绩,这就是参照个人潜力对学生课业发展给予评价的思路。如何事先了解与判断学生在各个学科上的学习潜力?这是一个尚未得到解决的问题。不过,在实际需要时,我们不妨可先用如下两种常用的方法:第一种是通过测量学生的智力或一般学习的能力,然后根据已经建立起来的这种能力测验分数(或等级)和某学科特定测验分数(或等级)之间在统计学上的回归关系,再从眼下学生的能力测验结果来预期学生在学科特定测验上的成绩,最后把这预期得到的学科测验成绩看成是学生的潜力所在,并与学生实际学科测验成绩相对照,以判断学生的学习潜力所发挥的程度。第二种方法是依靠课任教师对每位学生的了解,对学生在这门学科上的学习潜力作出分类判断,然后把经验判断得到的学科成绩等级类别同实际的学科测验成绩之等级类别相对比,对学生的课业发展作出判断与描述。

(二)教育目标参照法

学校教育教学有着较明确的教育目标,因此,评价学生课业发展时参照学校教育目标的思想是顺理成章的。下面介绍几种可供选择的方法:

1.专题内容领域参照

教育过程是渐进的,但就课程教育内容而言又往往具有可分解性。当教学进程可按内容专题去划定范围以及待评估的素质可以在这个范围内实施行为抽样时,那么,据此行为样本组成的测验就可以对学生在这个专题内容领域中的素质发展作出推断,这就是内容领域参照测验评价。在教学过程中,如果需要用内容领域参照法来评价学生的课业发展时,我们需要做如下几件事:首先,我们要用某种方式让学生明确待评的内容领域及其具体的行为目标。这个内容领域可大可小,大的可以是篇文章,小的可以是单元或论题,但对它的内容规定却要实际化和具体化。其次,针对某个内容领域进行学习行为抽样,并制定内容领域参照测验。这测验既可包含单个内容领域,也可以涵盖若干个内容领域。最后,由教育者针对每一专题内容领域测验确定一个合格线,它可以是正确解答某一内容领域试题数量的规定(比如6题至少答对5题),也可以是该专题内容领域测验答题得分率。一般说来,不同的专题内容领域测验,其合格线标准是不尽相同的,但某些情况下对不同内容领域也采用同一合格线标准。用内容领域参照法评估学生课业进展,旨在于调控教学、促进发展,有利于运用“掌握学习”策略和大面积提高课堂教学质量。

2.课程目标参照

课程往往可以分解成若干个不同的学习专题内容领域,但课程目标并不是各个内容领域的简单叠加,它是各个内容领域所涵盖的行为目标或素质目标的有机结合、相互促动、功能放大以及从量变到质变的结果。因此,相对于上述的专题内容领域,课程目标更具有广泛性和弥漫性。当课业发展评价需要参照课程目标时,我们不能只局限于零碎的简单的基本知识与技能,还要关注知识的整合与综合应用;不仅关心理论知识,还要关注学生在能力、情感、思维品质等方面的发展。但对于这些不同方面的评估,其采用的方法是不同的。课程目标中那些基本知识技能的考核评价既可通过日常教学过程中行为变化来衡量,也可通过精心设计的测验来反映。而对于学生的高级心智能力,尤其是对情感与个性品质等方面的发展变化,则更主要是通过较长期的观察与记录,包括对解决复杂问题和典型问题的观察记录。为此,采用一定的方法对学生在课堂教学影响下的行为变化作出有价值的信息记录,这是很重要的。

但从我国当前的实际情况出发,促进学生素质教育发展的关键还在于第一课堂教学,对于参照课程目标的学生课业发展评价,有两种方法:第一种方法是以学期或学年的课程目标为参照,按不同学科把课程目标分解为“基础性目标、发展性目标和提高性目标”三类,并通过适当方式让学生乃至社会上所有关心学生发展的人都能明确它们的内涵。教育者提出各类目标的最低要求的掌握标准,而后通过收集学生的多种学习表现去评价学生的课业发展情况。第二种方法则是从“成绩评定等级加评语制”的改革动向出发,借鉴英国在义务教育阶段推行国家课程和学业评定的做法,把一门课程的总目标进行分解(比如20个目标),然后对每个目标设置若干个不同层次的成绩水平(比如各设8个层次),最后对义务教育阶段的学生进行多方面的考察,以确定每个学生课业发展所达到的层次。

3.素质教育阶段目标参照

建立素质教育的目标体系及其科学的评估体系,这是教育实践所迫切需要的。从参照素质教育阶段目标开展对学生课业发展进步进行评价的操作程序来看,我们需要建立做几项工作:首先,要设计学生阶段性课业发展的评价表。由于许多方面的素质发展变化不是短期内可以见效的,因此,这里的阶段性是指在基础教育所经历时期内的若干个关键性阶段。在这阶段性课业发展评价表中包括了课程学习情况评价的项目,也包括对心智发展、技能技巧、行为态度等方面的简要性评价项目。其次,要做好对学生的学习行为记录,包括前面所述以内容领域为参照和以课程目标为参照下的课业进展评价资料。最后,若有可能的话,可在素质教育的若干关键阶段建立起统一的课程评价制度,把统一测验和灵活宽松的校内测验协调起来,既便于提高阶段性课业评价的有效性,又有利于教育部门和学校教师了解学生课业实际达到的水平,更有利于学生本人以及关心学生课业发展的家长们了解学生的真实学习情况。

总之,以教育目标为参照的学生课业发展评价方法,需要贯彻“多元的教育目标与多元的评价方法相适应”的原则。

(三)教育常模参照法

教育常模,就是有代表性的学生团体在通常的教育环境下实际所达到的成绩水平,如平均分数等。它可成为评价学生课业发展进步以及解释有关测验分数的参照点。利用某一教育常模对学生的课业发展作出评价,这种方法被广泛用于教育系统之中,包括管理、教学、诊断、选拔以及研究过程。教育常模参照评价法在本质上是把在某种认知或非认知方面的实际水平同一个学生团体的实际水平(如平均数)相比较来论高低。这个作为参照点的“学生团体的实际水平”,不是指课程教学上的预期达到的那个“标准”,而是实际水平的描述。在教育与心理测量学中,对于那些可用成就测验来测量的学习成果,既可用常模参照测验,也可用标准参照测验。标准参照测验和常模参照测验之间并不存在鸿沟,它们各有优缺点,结合使用,相得益彰。常模参照测验能提供可靠的相对发展方面的信息,使学生知己知彼;而标准参照测验有利于向学生提供期望达到的学习水平,并在测验后可向人们反映学生实际拥有的学习水平。

评价学生发展的教育常模参照,可以采用年级常模参照、年龄常模参照、百分等级常模参照、分等评定常模参照、标准分数常模参照等。

评价学生课业发展进步的主要方法

根据格朗兰德等人教育观点,教育评价就是尽可能地利用测量的和非测量的各种技术方法,来评定教育效果,并作出价值判断。为了改进对学生课业发展的评价,我们应当学习与掌握多样化的教育评价技术与方法。

一、客观题评价法与主观题评价法

在学校教学过程中,教师沿用并创造了丰富多彩的考试题目类型,这些题目类型如第四章中所述,大体可归于两类:一类是客观题,另一类是主观题,它们各自又可分成许多不同的题目类型。由于不同的题型具有不尽相同的测量功能与特点,因此,要使成就测验有效地测量到所计划的教学目标,就必须选择恰当的题型使之与特定学习成就相适应。下面我们先讨论各种客观题型的特点,再讨论主观题型的功能,以便帮助大家获得较全面的认识,从实际出发,选择最适当的题型。

(一)客观题评价法

观察事物讲究客观性,这种思路无疑是进步的。有一些考试题目,如果评分规则一旦明确下来,只要依照这些规则,无论谁去评分,都会得出相同的分数,这种类型的题目称为客观题。典型的客观题,要求学生填写一个词语、一个数字、一个符号或从预先准备好的备择项中选择正确的答案。典型的客观题类型常见的有填空题、简答题、是非题、匹配题、单项选择题或多项选择题等。实际上,除了上述这些典型的客观题型外,还有许许多多其他题型,如概念或术语的解释题、简单计算题、所有在内容受到明确限制后并使评分更为客观的短答案题,以及用典型客观题作为提问的阅读理解题等,都是客观性较强的题型,国外一些文献则称之为半客观题。

选择题可以认为是一种最具典型性且最具良性测量功能的客观题。选择题的用途也最广,它不仅能测量由上述简答题、填空题、是非题以及匹配题等题型所测量的简单的学习成就,而且能测量知识、理解、应用领域某些更复杂和更高级的学习成就。

正因为选择题具有上述诸多优点,因此,选择题型在各种能力测验中得到广泛而重要的应用。比如,美国、日本、韩国等国家的大学入学考试科目中,有些科目基本上都采用选择题。特别是韩国以及我国台湾地区的大学入学考试,近几年来不断开发研究客观题型,充分发挥客观选择题的测量优势,在韩国的“大学修学能力测验”中几乎全部使用选择题,考查学生综合应用知识解决问题的创新能力;而即将在2002年实行的台湾地区“大学入学多元方案”中设立的五个学科基本能力测验中,除了“国语”和“英语”两科中有小部分主观题外,其余皆是选择题,有单项选择,也有多项选择。

毫无疑问,客观题对学习成就以及能力方面的测量是一种高效和有用的题目类型,它们可以测量学习成就领域中从简单到复杂、从低级到高级的广泛的学习结果,测量效率高、信息量大、信度高、测验评分与计分误差控制得好,因而,有相当广泛的应用前景。当然,客观题也确有自己的明显不足,主要是难于有效地、直接地测量学生在语言表达、思维分析过程以及创造技能方面的高级学习成就。特别是在编题缺乏技巧并带有粗制滥造情况下,选择题的许多优点不但不能充分体现,反而会进一步突出选择题的一些缺陷。这一点,读者应当给予重视。寻找其他题型与客观题配合使用,优势互补,这是命题的发展趋势。

(二)主观题评价法

无论中外,在学业成就测验中都使用主观题型,如论述题、证明题、计算题、作图题、作文题等等。主观题和客观题有相同和不同之处,都要在试题中设置问题情境提出作答任务与要求;不同之处是,它允许被试,自由反应作答,作答结果应是由被试者构建的、相对完整而又符合所属科学规范要求的“产品”,如一段逻辑论证或意义阐释文字、由抽象符号与运算规则构成的一项数学证明、步骤规范求值精确的计算问题解答、一幅图或一首诗,等等。

主观题有自己突出的特点和长处,适合于考查学生的分析能力、综合能力、组织表达能力以及计算与推论等较为复杂的心智技能;提倡自由反应,有利于考察应用能力乃至创造能力;可以获得较为丰富的作答反应过程资料,便于分析被试的技能、创意、策略以及知识缺陷;内容和形式更为接近教学与实践中的问题情境,被试,不陌生、好接受,教师命题制卷比较方便等。当然,主观题也有明显的不足,比如:作答过程有大量的书写任务常造成被试“忙于书写而无心遐想”和“手指累而头脑松”;单位时间中施测的题量较少,限制了测验内容的覆盖面,不利测验效率的提高;还有,评分易受评价者主观因素的影响等。