今年年初以来,新冠病毒迫使全世界众多大学将其几乎所有课程在毫无准备的情况下搬上网络,实行在线教学。如果说如此突然地开启如此大规模的线上课堂(网课)给高等教育界带来了前所未有的挑战,那么正如一些教育专家所言,更大的挑战是网课怎么考试和评分。考试和评分既牵涉到学生的切身利益,也直接反馈到教和学的过程中,影响教和学——传统的考试和评分制度能很好地支持和促进网课的教和学吗?
网课考试涉及考试形式(例如开卷或闭卷)、监考、时差(如果有国际学生)等技术性问题,以及考什么、题型如何(如课程论文、主观题、客观题)等内容方面的问题。考试内容可能受限于考试技术,两者结合共同决定了考试是否符合、能否促进达到设定的教学目标。
比考试更须慎重的是评分。在竞争性教育环境中,考试成绩可以说是学生的生命线。在校内,成绩决定了学生在班级的排名,进而很大程度决定了评奖评优、保研资格等结果。在校外,成绩可能关系到学生在就业、升学等方面的相对竞争力。传统的精细评分方式(百分制或字母等级制,points or letter grades)是否依然适用于网课考试?模糊的评分方式(及格/不及格,pass/fail)会带来什么样的新问题?
网课考试和评分的最大挑战是公平。传统的校园授课,学校提供每个学生的客观条件是平等的,差异只来源于学生本身。但网课暴露出的客观条件差异和学生差异显然尖锐得多,特别是,新冠病毒大流行在基本的结构层面上放大了这些差异。病毒对人的影响是不平等的。在线上教学中,学生的负担也是极不平等的:每个人的无线网络不一样,使用的终端设备不一样,所处的学习环境(居家、疫区等)不一样,背负的生活压力和心理压力不一样(如有人要照顾生病的亲人,有人要照看居家的弟妹,有人要分担家庭生活压力),等等。
在这种情况下,正如一些学者指出的,百分制分数或ABCDF成绩并不能衡量学生在学习什么或如何学习,它们最终反映的是学生在网课学习过程中所面临的困难大小,而不是对他们能力和水平的准确衡量。及格/不及格的模糊评分方式可能会相对模糊掉一些差异性,但又带来与竞争相关的区分度问题。
同样受疫情影响,我国的大学比欧美大学更早将课堂搬到网上,但欧美大学比我们更早面临线上考试的问题。欧美大学已有各种线上考试的实践,也暴露出不少问题。
例如,华盛顿大学是美国最早将所有课程转移到线上教学的大学之一,该大学将考试和评分的决定权完全授与教师,教师可以决定其课程是否评分,或是否使用及格/不及格制。学校会在这种课程的成绩旁加一个星号来解释这些选择,以便竞争性专业的学生不受惩罚。星号看起来很小,但它是对一个字母或数字“代表”一个人在一门课程中所取得成绩这一概念的重要修正。
超过150所美国高校在今年的春季学期采用了及格/不及格制,这其中,绝大多数高校把及格/不及格作为一种选项,把决定权给予学生,担心失去高分从而可能失去高分才值得拥有的工作的学生,也可选择字母或数字分数;包括哈佛大学、麻省理工学院在内的十几所美国顶尖高校则把及格/不及格作为强制要求,目的是保护那些资源不足、突然陷入校外环境和精神创伤中的学生。
把考试和评分的决定权给予学生,看似很人性,但在学生升级或升学时可能遭遇不被认可的风险。例如,包括哈佛在内的几所医学院,在学生既可选择字母或数字评分,也可选择及格/不及格的先修课程时,只认可字母或数字分数。也就是说,如果你注册了一门医学院先修课程,并选择及格/不及格,那么医学院将不会认可这门课程,你必须再选修一次。教育系统内部都如此重视分数和区分度,更何况教育系统之外的社会了。
无论是将网课考试和评分的决定权完全授与教师,还是将评分的选择权给予学生,都展现了高等教育前所未有的灵活性,疫情过后,也许一切恢复往常。但是,有学者指出,疫情驱使的评分变化暴露了长期以来被接受的不公平现象(Pandemic-driven grading shifts illuminate long-accepted inequities),可能会给整个高等教育带来根本性的变化。
现有的考试和评分制度沿袭了100多年,其弊端众所周知,但改变很小。《教学勇气:漫步教师心灵》一书作者Paeker J. Palmer说,实施细称精量的考试,必须具备三个条件:“其一,我们要测量真正教育情境中值得测量的东西,死记硬背在真正的教育情境中是无足轻重的;其二,我们要懂得怎样测量我们准备测量的东西;其三,我们要重视那些可测量的东西,更要重视那些量化工具测量不到但同样重要或者更重要的东西。”我们一直很难舍弃细称精量的考试。但Palmer指出,时至今日,我们仍未具备这三个条件,我们的社会会继续痴迷于教育的外在东西。
教育如果像竞技体育,那么当然要看精细成绩,无论是名次还是分数。教育如果是为了培养独立的个体,帮助每个人发挥其独特价值,就像体育如果是为全民身体健康,那么精细的成绩就不重要,相反,类似于论文审稿意见那样的建设性反馈意见更有用。
有学者提出对课程考试“不评分”(ungrading)做法,它比及格/不及格制更进一步淡化了与竞争相关的区分度。圣母大学人类学教授Susan D. Blum是“不评分”的著名倡导者之一。她指出,分数并不能真正激励学生学习,因为它是外在动机的典型形式;相反,分数鼓励学生害怕冒险,因为分数如此重要,以至于学生们认为他们不能在任何未经证实的事情上冒险,以免犯错导致扣分。
Blum坚持认为,当她开始看到学生之间更大的差异性和多样性时,她开始使用形成性、叙述性的书面反馈,而不是分数。她说:“评分要求统一。它假定统一的输入、统一的过程和统一的输出。我不再相信这是一种激励学生学习的有效方法。学生们的起点不一样。在我们的修课学期,他们没有同样的生活经历,甚至学习经历。之后他们不会去同一个地方。他们有不同的目标。”
高等教育永远不会有像疫苗一样的灵丹妙药来一劳永逸地解决现实问题。网课怎么考试和评分,最终应该由教育目标来决定。考试和评分既要符合教育目标,也要有利于反过来支持和改进教学过程,促使过程走向而不是偏离目标。在老文看来,及格/不及格制是当前网课考试和评分较好的权宜之计,而更激进的“不评分”制可望成为未来高等教育的一种新常态。