书城社会科学慕课与翻转课堂导论
18443800000015

第15章 进阶作业与诊断性测验(2)

此外,进阶作业是学生在碎片化学习情况下的个性化评价,及时的强化,有助于提升学生学习的自信。在人们不断追求评价的体系化,或竭力构建评价体系的过程中,毛放提出:教育评价是一个相当大的话题,而且这个话题越来越沉重。为此,他质疑说:“我们总把评价看作是一个很全、很完整的体系,认为这个体系能够解决一切问题。所以,这个评价体系搞得越来越庞大,操作起来也越来越困难。……教育评价是否一定要搞体系。……我对这种观点一直是持怀疑态度的。这里有三个现实的难题:第一,这个体系能否穷尽全部的评价因素和内涵;第二,即使能穷尽,是否能操作;第三,用这样一个‘包罗万象’的评价方案去套那么多活灵活现的、有个性的、有鲜明特点的个体,使得千篇一律、千人一面,这到底是评价的初衷呢,还是走到它的反面去了。”为此,他提出,教育评价是否可以走“反体系”的道路。

据毛放介绍:在芝加哥的一所小学里,他看到在学校教室的后面一堵瓷砖墙上印着许多小手印,每个手印上都写着小朋友的名字、某年某月某日、一件什么事情。经校方解释后他才明白,小朋友做了一件什么好事,老师奖励他,让他在墙上印一个自己的手印,写上姓名、事件、日期,然后请他站在手印旁,给他照一张像作为留念。当整堵墙印满了小手印,就请全班同学和这个班的所有教师一起照一张集体照。然后把手印全部擦掉,从头再来。假如说一个孩子从进校到八、九年级,这样一张张的照片可能就说明了他的成长足迹,或许要比我们教师打一个勾、写几句评语要好多了,既形象又全面。虽然没有体系,但他们的评价手段相当灵活,它有一种鲜明的指导思想——就是真正地以学生发展为本。所以,在学生进阶作业完成后,及时地给学生点个“赞”,给予一些奖励性的语言对激励学生的学习是一个必要的举措。

二、诊断性测验的编制

诊断性测验不同于进阶作业,它不是对学生单个知识点掌握程度的测试,而是对包括学生线上与线下,课堂翻转前与翻转后,学生“先学”与课堂中“后教”总体质量的评判与问题诊断。

(一)诊断性测验的性质

诊断性测验是为发现学生在学习过程中存在的问题及其根源而设置的,它与以选拔学生为目的的高考、中考以及以鉴定学生是否为合格毕业生的学业水平考试均有很大的不同。

诊断性测验往往与补救性教学联系在一起。根据诊断性测验发现的问题,教师将会即时地给学生提供有针对性的帮助,而不是仅仅给出“对”与“错”、“好”与“坏”以及学生等第的差别。诊断性测验与等第性测验的差别大体相当于“医生”与“法官”的差别。

在医生面前,病人总是说自己这里不舒服,那里有问题:若医生没做仔细检查,甚至不耐烦地把病历卡还给病人时,病人都会很生气,感到自己被忽视了。

在法官面前,嫌疑犯总是说自己这里没问题,那里没差错,即使在证据确凿的情况下,也会说根源在他人。

所以,坚持诊断性测验的“诊断性”非常重要,这就是说,不要把诊断性测验异化为对学生的分等鉴定,要始终把目标放在服务教学和推动学生学业发展上。

诊断性测验不仅是对学生“学”的诊断,其实它也包含着对“微视频”的诊断,对翻转之后课堂的诊断,甚至包括对地区教育政策与社会影响教育发展因素的诊断。现代大数据技术的发展为诊断性测验这些功能的实现提供了有力的支持。

(二)诊断性测验的编制技术

人们不难看出,在目标导向的教学模式中,各类评价都是服务于教学目标的。

从当代教育发展的价值取向和慕课对诊断性测验的特殊要求来看,人们需要认真把握住以下几个趋势:

第一,从“知识导向”向“综合素质导向”的转变。所谓“综合素质”,既包括学生的能力,也包括学生的情感态度与价值观。本书第二章,在谈到知识图谱时,已经给出了“知识—能力连续体”的图示,它强调:人的认知发展由知识与能力两个维度构成,随着知识的无限扩展,能力也可以不断提高。两者有重要联系,但并不必然地对应。

美国俄亥俄州立大学包雷教授2009年发表的《中美学生科学知识与能力比较的研究》认为:中国学生在经过了近5年系统而严格的自然科学课程的学习后,其对自然科学知识掌握的水平明显好于同年级的美国学生,

而在科学能力方面却和美国学生几乎相当。也就是说,中国学生虽然比美国学生多学习了近3年的极其严谨的科学课程,但是中国学生的科学能力并没有得到相应地提高。当然,这一研究样本的代表性究竟如何尚待验证,但它提示我们,并不能把学生的科学知识必然地等同于他们的科学能力。

这里需要特别强调的是,微视频以知识点的精准传播为特点,然而,人们并不能由此得出结论:中小学慕课与翻转课堂就是以知识传授为重点。其实,恰恰相反,中小学慕课与翻转课堂通过学生在线上高效地学习,从而使得他们在课上有了更多的时间交流、探究。因而,与进阶作业不同,诊断性测验作为对这一过程问题诊断的工具,它理所当然地更关注学生从知识到能力的全面发展。在一定意义上可以说,诊断性测验重在帮助学生找出思维发展中的障碍,以推动学生更好的发展。

第二,考题逐步从“多而密”走向“少而精”。在对考试内容深入研究的基础上,考题要逐步从“多而密”走向“少而精”。目前,我国各类考题太多。以著名的“千分考”为例,在3小时即180分钟内要完成200道题,平均每题不超过一分钟。学生没有经过大题量的训练,无论如何是考不出高分的。

有些科目,比如语言,不管是中文还是英语,熟练掌握是必须的。人们在对话过程中,几乎很少有可能让你停留片刻然后再对一问题作出回答。因而,考题设计关注速度,似乎可以理解。然而,在社会生活的大多数领域,尤其是科学研究与创造发明领域,需要人们沉思静想,并不需要过于强调快速反应。目前的考试逼着中小学用大题量、高强度的题海来训练学生。为此,人们感到非常无奈。

让学生反映出他们思维的深刻程度需要试卷的设计者精心挑选每一道题,要认真研究与每门学科相关联的能力特征。比如,数学中的逻辑推理能力、生物研究中的观察能力以及更一般的解决实际问题中关键难点的突破能力等等。

第三,从关注结果转向过程与结果并重。诊断性测验是在教育过程中进行的评价,当然,也是在教育过程一个阶段结束后的评价,因此,它具有“明晰过去、判断当前、推动未来”的特点。

从认知心理学的观点来看,不知道过程是无法解释结果的,任何结果都是过程的产物。因而,“要想理解行为就必须考虑到这些隐藏的过程。”为了准确地把握学生当前存在的问题并找到根源,人们也必须对已逝去的过程有一定的了解,那样才能对现状做出准确的解释。

学生发展是多因素的综合,他们在知识、能力、动机,以至态度、情感、价值观方面存在哪些问题,具有哪些有利于进一步发展的优势,这是教师有针对性地解决学生群体或个体存在的问题的基础。在这一意义上,它又相当于“定位性评价”,是确定教育起点与选择教育策略不可或缺的条件。

当然,所有这一切都是服务于学生未来发展的,解决学生过去存在的问题,立足学生今天的实际,保障学生未来更好的发展,这就是诊断性评价的基本宗旨。

学生成长记录是当前深受各国欢迎的学生评价的举措,然而,在以往的实践中困难重重,主要原因就在于其保存不便,查找困难,费时费力。在数字化与大数据技术的支持下,这一问题已经得到了很好的解决。因而,它会推动教育评价迅速地走上新的台阶。可以说,从重结果到重过程与结果的结合将会带来我国基础教育评价模式上的一个重大变革。

第四,在测验标准上从统一性到多样性。评价本质上是一种有偏好的价值判断活动。教育评价作为一种通过教育信息的系统采集、分析和利用以发现和增进教育价值的活动,建立在人们对教育价值的认识和选择基础上,而评价标准则集中体现了评价者希望发现和增进的价值。关于个体差异和人类智能多元性的认识,关于成功智力的认识以及对我国基础教育的发展经验的总结反思,为我国教育工作者理解和选择教育教学的价值提供了新的依据,也为基础教育评价标准的制定提供了丰富的启发,即通过多元评价标准衡量学生多方面的进步情况,认可学生在所有领域的成长发展,进而促进教师教学和学生学习的改进,促进学校的发展。

事实上,我国现行的基础教育课程改革政策已经确立了学生知识与技能、过程与方法以及情感态度价值观三维发展目标,为建立健全我国中小学多元学生成就评价标准体系提供了政策和操作依据。建立多元学生成就评价标准体系,已经成为推进我国基础教育改革的核心工作之一。

学生的差异在任何学校都客观地存在。“有教无类”是说学校要给所有的人以公平的教育;“因材施教”是说教育必须从学生个体的实际出发,关注学生发展的差异。对某些方面学习能力较差的孩子,老师不能歧视,而应多关心,甚至根据测验结果给予他们一对一的指导。对于学有余力的孩子,鼓励他们尽可能多地去学、去创造。由此,使每个孩子在学校都能得到各得其所的发展。

在我国,随着义务教育阶段区域均衡发展的要求越来越明确,“有教无类”在总体上已经有了制度性的保障。但是,“因材施教”却需要教师付出额外的努力,它需要教师了解学生,切实地把握学生的兴趣爱好、个性特长以及他们在一些学科领域的知识与技能掌握的实际状态;需要教师在课堂教学、作业布置与课后辅导等各个环节去精心设计切合学生实际的教育活动。这需要教师具有高度责任感与使命感。诊断性测验就要为教师在这一方面的工作提供必要的支持。

(三)诊断性评价的方法

1.纸笔测验。纸笔测验是最传统的测验手段,也是教师最熟悉的测验手段。不幸,它还是目前在我国各类测验与考试中运用最多的手段。

纸笔测验的一种题型是判断题(包括多重判断题)、选择题、匹配题等等。人们通常又把它们统称为“客观性试题”,它们以要求明确、答法单纯、评分客观为特征。1920年,由麦柯尔(W.A.McCall)倡导而风行。由于计算机也能对其评分,所以受到了人们较大程度的欢迎。

纸笔测验的另一种题型是论文题。它包括简答题与论述题。这是最古老与传统的测验方法,我国科举考试采用的就是这一手段。

对纸笔测验,教师与学生都已非常熟悉,熟悉到很多教师不加思索就能随手出一张试卷。其实,纸笔测验作为目前运用最广泛的测验方法,还是最值得每个教师,尤其是命题人员仔细加以研究的。

从教育评价学的角度来说,一份优秀的试卷应当具有下述特征:

第一,结构性。评价是对学生达到教育目标程度的判断。因而,试卷不能脱离教育目标而存在。在本书第二章有关“知识图谱”讨论的过程中,我们已经介绍了布卢姆教育目标分类学的理论与安德森关于认知过程与知识二维发展的研究成果,以及“知识—能力连续体”的理论,这是指导我们编制试卷的理论基础。

试卷,尤其是诊断性测验的试卷要保持与相关学科、相关教学单元目标的一致性,不能遗漏重要的教学目标,也不能脱离目标,随意地增添内容。

目前,在我国课堂教学中,“二八现象”严重,说到底,课堂中的“二八现象”是各类考试测验中“二八现象”的反应。所谓“二八现象”,是指一些考试尤其是“中考”与“高考”等考试,80%为课程标准内的试题,20%为严重超纲超标的试题。其结果必然导致学生在准备考试的过程中,把80%的精力都用于那20%的超纲超标题,只把20%精力用在更为基础的,也是更为重要的基础题。这是造成当前学生课业负担过重的重要原因。

第二,代表性。测验,本质上来说是对学生知识掌握与能力提升抽样检验的过程。因此,反映在试题中的知识与能力只是学生应当掌握的知识与能力的样本。从统计学角度,我们知道,样本一定要有代表性。因此,试题要反映“知识—能力连续体”的各个部分。一份优秀的试卷也要为学生呈现他们的认知过程提供具有一定梯度的“脚手架”。

第三,等价性。等价性要求两份不同的试卷,在用于同一学生时,这一学生得到的考分应当是相同的,至少是相近的,在用于同一学生群体时,学生群体的成绩分布是相同的。我国不少重要的考试,包括高考,学生成绩大起大落,其原因就在于高考试卷缺乏等价性。

等价性对于诊断性测验来说,也很重要。试卷缺乏等价性,人们就无法对教师、学校与地区教育进展作出科学的评价。

2.表现性评价。它最早是运用在心理学领域和企业管理领域,直到20世纪40年代,表现性评价才开始被教育测量学家关注并加以研究,并在20世纪60年代以后获得迅速发展,成为今天在国外学校教育评价中被广泛应用的一种独立的学生评价方式。

表现性评价也被称作“真实性评价”或“替代性评价”。它通过让学生完成某一实际任务来评价学生的学习状况,它的评价方式有别于传统的纸笔测验评价,是对学生能力行为进行直接的评价。

慕课与翻转课堂导论