“大数据”并不是一个单纯描述数据数量之巨大的概念,同时意味着数据来源的多样化、数据类型的多元化以及在数据处理与分析层面的大容量与高速度。更为重要的是,“大数据”立足于对大量数据的深度挖掘与科学分析寻求数据背后的隐含关系与价值,使得人们可以从基于小样本数据的推测或基于感性的偏好性选择转向基于数据分析与理性证据的决策,可见“大数据”在本质上已经转化为一种新的思维方式、一种新的问题解决方法[1]。近年来,“大数据”的应用受到了各行各业的重视,在教育领域亦是如此,越来越多的教育机构与教育工作人员以及研究者开始关注大数据在教育教学改革与发展尤其是教育评价中的应用价值[2]。
美国自从2001年颁布《不让任何一个孩子落后》教育法案后,开始大力推进数据在教育评价中的应用,认为数据可以为不同层次、不同目标指向的教育评价(例如,对州、学区、学校整体教育质量与进展的评价,对教师教学质量与教学能力的评价,对学生学习绩效与学习发展水平的评价)提供直接、直观、可靠的依据,帮助教育决策者、管理者、教师以及家长全面而客观地了解教育的发展现状、趋势以及改进方向,帮助科学评价学生学习成果与教师教学有效性,为美国教育的发展与变革提供了行进路线图;提出要大力提升教育工作者理解数据、利用数据的意识与能力,同时投入了大量人力、物力、财力发展各级各类数据系统,推进数据在教育评价与决策中的深度应用[3][4]。2012年3月,美国政府提出“大数据研究与开发提案”,其中明确指出要提升教育领域对大数据的应用能力,要利用大数据探寻发展教育的新途径与新思路。
教育评价的核心虽然是对学生学习绩效与成长状态的评价,但又并不限于此,而是涉及对教师教学质量、教育环境与资源现状、教育投入与产出等方方面面的评价。传统的教育评价往往容易因为难以收集评价依据或因为只收集到片段化的评价信息而忽略了一些应该评价的方面,并且容易在评价过程中因为缺乏可靠的依据而过于依赖于经验判断或主观评价。大数据意味着对教育数据进行全方位与全程性采集,不但注意对结构化数据的收集,也重视对非结构化数据的收集。基于大数据的教育评价突破传统教育评价体系中对学生考试成绩的依赖,将碎片化评价整合为系统化评价,保障了评价的全面性与可持续性,支持多主体、多元化评价,丰富了教育评价的功能。例如,针对学生的学习评价,传统教育评价情境下的评价主体常常只有教师,偏重于对知识掌握程度的考核,评价方式也趋于单一化,往往只依赖于学科知识类考试,主要关注对学习结果的评价而常常忽略对学习过程的分析,并且缺乏对分析与评价结果的充分利用。而21世纪的人才需要合作能力,需要培养具备问题解决能力与批判性思维,但是这些本来应该重点考核的内容在一些诸如升学考试、资格考试的决定性考试中却较少涉及,并且很多决定性考试往往都是一年一次[5]。基于大数据的教育评价则充分利用技术手段采集、整合学生学习过程数据与学习结果数据,融合专家评价教师评价、学生自评、同伴互评等多种评价数据,从而可以对学生进行多维、全面、深入而可靠的评价[6]。
基于大数据的教育评价实现了对多维教育数据的深度分析,可以满足不同教育参与者的需要[7]:教师通过数据知道他们的学生表现如何并以此为依据调整自己的教学满足学生的个性化、个别化学习需求;家长通过数据了解自己孩子的强项以及能够提升的领域,了解学校的整体教育质量与环境,从而能够更加主动地为孩子选择最适宜的教育环境;学校与学区的教育管理人员可以通过数据分析哪些教育项目对于提升学生的学习绩效有作用,哪些没有作用;而州与联邦政府的政策制定者则可以综合应用关于学生学术成长与生涯发展需求的数据以便做出科学的教育决策,制定适当的教育政策并分配适当的教育资源。由此可见,借助大数据技术的支持,教育评价不再像以往那样往往是为了支持教育管理部门与教育机构的决策性需求,而是可以服务于一切关注教育、参与教育的群体或个体,甚至一些课外学习支持机构也可以在遵循相关制度、保障学生权益的前提下通过利用教育大数据分析学生的学习需求来提高课外学习支援的针对性与有效性。
(二)大数据支持基于证据的教育教学决策
教育大数据为美国政府、教育管理部门、学校与教师做出合理的教育教学决策提供了可靠的证据。整体上,美国建立了严格的教育问责制度,包括利用州教育问责系统(State Accountability Systems)对各州教育发展情况进行全方位评价,借助于学区级评价系统(District-level Evaluation Systems)评价各学区、各学校的整体教育质量,并要求学校与学区要对后进生进行基于数据的支持性学习干预(Data-driven Interventions)。美国联邦政府以及各州政府基于对教育大数据的分析结果评价各州或州内学区的教育进展水平,并以此作为教育投入的依据以及教育政策制定的根据[8]。
美国学校一般利用基于大数据的教育评价支持本校在规划学校整体发展、优化学生管理、制定教学质量改进计划等方面的教育教学决策。据统计[9],97%的美国中小学利用来自整个年级或整个学校的教育大数据确定学校需要提升的关键领域;分析学生的个体数据以便于分班或安排相关学习支持服务,包括了解哪些学生需要特殊支持或更多支持。47%的美国中小学通过专门的评价人员分析不同教师教授同一教学内容或同一教师以不同教学策略教授同一教学内容时产生的数据,评价教师的教学质量并提出教学方式变革计划。而83%的学校在利用教育大数据尤其是本校产生的大数据了解本校教师教学发展的现状与需求,并据此决策如何支持本校教师的教学发展。
学校教师可以利用教育大数据改进与优化自己的教学决策。整体上,教师可以利用大数据分析需要在何种时机对哪些学生以何种方式安排何种教学内容[10]。教师利用本班学生产生的大数据,或同时借助与外部大数据的对比分析,可以深度评价本班学生的学习表现与学习效果,可以有效分析学生的学习偏好与个性化需求,分析学生群体的学习需求,同时也可以利用数据分析哪些学生更适合在一起进行小组学习,分析怎样分组才更合理。对于那些有学习困难的学生,通过对大数据的利用,可以分析出学生在什么环节、什么类型内容学习方面存在问题,分析哪些因素可能在影响学生的学习,这样便于给出适当的学习支持与干预。
利用大数据的前提是能够获取大数据,美国在教育评价的实施过程中主要依托覆盖全美的立体化教育数据网络,同时注重数据质量保障,有效地解决了教育评价“大数据从何而来”的问题。
(一)覆盖全美的立体化教育数据网络
美国建立了包括国家级、州级(State-level)、学区级(District-level)以及校级(School-level)在内的各级各类教育数据系统(Educational Data System)服务于教育问责体系[11]。这些数据系统之间相互关联,数据互通,形成立体化数据网络,为美国教育评价用大数据的获取提供了基本的依托。在国家层面,美国有由教育部与各州教育管理部门及一些企业协同创建与发展的教育数据机构EDFacts,建设了“教育数据快线(ED Data Express)”,还有美国国家教育统计中心(National Center for Education Statistics),主要任务在于与教育部内部各机构、各州教育管理部门、各地教育机构合作提供可靠的、全国范围内的中小学生学习绩效与成果数据,分析各州报告的教育数据以整合成为联邦政府的教育数据与事实报告,为国家层面的教育规划、政策制定以及教育项目管理提供了有力的数据支持。2005年,美国教育部启动了“州级纵向数据系统项目(The Statewide Longitudinal Data Systems(SLDS)Program)”旨在帮助全美各州“设计、开发与利用州级纵向数据系统以便有效地、准确地管理、分析、分类处理与利用每一位学生的数据”,至今全美有47个州至少获得过一次本项目资助。
州级与学区级数据系统主要为区域性教育评价提供数据支撑,其中主要包括本州/学区学生的成长数据,教育工作人员(包括教师与教育管理者)在工作方面的安排与准备等相关数据,以及其他关于学与教条件的关键数据,比如教师人数、学生入学率、学生与学生家长及学校教职员工对于学校氛围、条件等方面的评价数据等,认为这些数据直接反映学校与学区在让学生做好毕业准备方面取得的进展情况。各州的教育数据系统基本都具有测量学生的成长(Student Growth Measures)、提供高中学习反馈报告(High School Feedback Reports)、实施学业预警(Warning Systems)的功能。在收集学生成长数据方面,州与学区的数据系统目前还主要关注对学生在英语、数学、科学三大学科中学习方面形成的相关数据的收集,针对高中则还包括高中毕业率、大学入学率以及未经过复读的学生大学入学率等数据[12]。
学校层面常常利用四种类型数据系统来收集、整合教学过程数据或评价数据[13]:一是在校学生的实时信息系统(Student Information System),其中包括学生出勤率、人口学特征、考试成绩、选课日程等数据;二是数据软件坊(Data Warehouses),其中保存了学校当前或历史上的学生、教职员工、财政方面的信息;三是教学或课程管理系统(Instructional or Curriculum Management Systems),支持学校教师接入教学设计工具、课程计划模板、交流与协作工具,支持教师创建基准性评价;四是评价系统(Assessment Systems)支持快速地组织与分析基准性评价数据。
(二)美国教育数据质量保障
数据质量对于数据分析结果的准确性有着决定性作用,直接影响教育评价的可信度与可靠性。美国在整体上非常关注教育数据质量,认为高质量的教育数据一般具有以下三个特征[14]:一是纵深持续性(Longitudinal)——针对每一个数据主体(比如学生、教师、学校),数据是持续的且在不同的数据系统中保持一致性;二是行动性(Actionable)——数据更新及时、用户界面友好,并且能够允许用户定制;三是情境化(Contextual)——可分析、可比较,能够表现具体的细节与特定的情境。
为了保障教育数据的质量,一方面,美国非常注重分析可能影响教育数据质量的主要因素以便有意识地防止或提出相应对策。例如,下列因素可能影响教育数据质量从而影响教育评价的质量[15]:一是数据系统缺乏兼容性(System Non-interoperability),致使一个数据系统的数据不能在另一个数据系统中利用,需要经过重新录入、变换数据结构与参数等繁杂、重复的工作,不但浪费资源并且可能导致数据录入错误;二是缺乏标准化的数据定义(Non-standardized Data Definitions),不同的数据提供商利用不同定义与表达方式呈现同一数据元素,使得不同区域、不同学校的数据没有可比性,并且也不能进行有效整合,在很大程度上影响到评价的准确性;三是数据本身的可用性不强(Unavailability of Data),即有价值的数据不多或难以获取;四是针对同一数据元素,不同的数据提供者理解不一样可能提供的数据并不具有一致性(Inconsistent Item Response),不利于同类数据的整合;五是数据缺乏时间持续性(Inconsistency over Time),不同的时间段收集的数据不一致;六是数据录入存在错误(Data Entry Errors),致使数据本身不准确;七是数据更新不及时(Lack of Timeliness),会影响数据的完整性与代表性。
在实践过程中,美国非常重视建立教育数据标准来规范数据的表达与处理。美国教育部组织相关机构研制了《教育数据通用标准》,并且在应用过程中不断调整与优化,2015年已经发展到第五版。
三、大数据如何而用:基于全方位规划与支持
首先,需要对教育评价本身的评价范围(包括地域与时间两个维度)、评价对象、评价内容、评价目标、评价方法等进行整体规划,对于利用大数据支持教育评价与决策形成清晰的预期,充分结合对教育评价本身的需求定位,深入分析需要利用哪些数据来解决评价中涉及的哪些问题。例如,需要先确定评价范围,是针对全国还是某一州、或某学区、或者某学校的整体教育质量或某一方面进行评价?是针对哪一个时间段的教育质量进行评价?以学校层面的教育评价为例,需要进一步确认是面向学校整体教育质量、教育投入、教育决策有效性方面的评价,还是面向教师使用某一教学策略的有效性进行评价,或是对学校中某一类学生在某一方面的发展情况进行评价。只有针对具体的评价需求才能确认需要收集哪些数据加以分析,明确应该根据何种评价原理、选择何种数据分析方法对数据进行有效分析以保障教育评价结果的实效性。
其次,在具体的实施过程中,要结合具体的教育评价情境充分利用可以用于支持大数据有效应用的有利条件并应对可能遇到的风险与挑战。例如,学校在利用大数据实施教育评价时,可以将基于大数据的教育评价及相关应用纳入到学校整体教学发展规划,将学校已有的数字化平台(例如教师协同备课平台、教师实践社区等)与基于大数据的教育评价系统相融合,充实教育评价系统的数据;可以制定一些适合学校实情的大数据使用制度,不要让大数据的使用成为学校教师的负担,将对评价数据的反思活动与学生表现管理活动相对分离,尽量不要将评价数据与教师的工作绩效、工作地位直接关联,让教师在一个相对安全、自信的环境下利用数据支持教学评价,反思并利用评价数据以优化自己的教学[16]。同时要注意到,利用大数据对大数据的来源、质量与处理方法有着高要求,因此基于大数据的教育评价并不意味着一定能够节省成本,尤其是教育数据与一般的商业数据相比显然更为复杂多样,因此需要在规划阶段就充分考虑到可能影响教育评价有效实施的相关因素并提前准备相应的应对措施[17]。
(二)选择适当的大数据处理技术
基于大数据的教育评价虽然并不是一种单纯的技术处理过程,但是却在很大程度上依赖于对数据的技术处理。大数据处理并不是一个简单的统计过程,而是一个需要不断获取、管理、处理与分析数据的复杂过程,只有选择适当的技术手段才能够保障用于教育评价的大数据的来源、质量、安全与处理有效性[18]。美国在技术应用层面主要从以下两个方面保障教育大数据技术处理的有效性。
一是美国统一规划的各级各类的教育数据系统本身并不仅仅是一个数据采集系统,而是一个可以进行数据分析与可视化的综合功能系统,不但为用户提供全面的、可靠的、准确的、及时的数据,还支持用户快速查找到所需要的教育数据,并允许用户选择自己偏好的方式浏览数据结果。例如,美国教育部直接管理的“教育数据快线”包括了美国各州、各学区、各学校的综合数据,例如学生参加州内考试、国家测试、毕业率、学校问责类数据等,提供快速搜索工具,支持用户按照自己的需求便捷地选择不同的数据来源(比如选择某一个州在某一学年的学生学习进展数据,或教师发展方面的数据等),支持生成个性化定制的报告,数据分析结果可以以图表、数据地图、趋势曲线等多种方式呈现。
二是可以借助专业的技术公司提供大数据处理技术支持。(三)提升数据应用人员的数据素养
提升教育决策人员、教育管理人员与教师的数据素养对于大数据在教育评价中的有效应用有着重要意义[19]。一方面,需要提升教育数据应用人员对大数据在教育评价与教育教学决策中的功用与本质的认识。例如,需要教育数据应用人员认识到[20]:数据本身并不重要,重要的是分析数据背后蕴含的问题以及问题解决思路;数据分析并不是完全依赖于电脑技术,有效的数据分析需要建立、共享共同的评价标准以保障数据质量以及对分析结果应用的有效性;在进行数据分析时,重点不是分析学生得了多少分或学生的考试通过率,而是应该注重分析学生究竟知道什么以及不知道什么,分析学校与教师为了提升学生的学习绩效还需要做些什么;要切实发挥数据分析的作用,将数据分析与教学有效整合,改革工作方式支持学生取得更大的进步;要不断提升自身的数据应用反思能力。
美国教育部尤其重视教师的数据素养提升,认为有必要在教师培训项目加强涉及数据技巧、数据决策技术的培训内容,支持教师有效地利用数据来帮助分析学生的学习与自己的教学得失,从而达到优化教学的效果。美国教育部提出教师应该具备以下的数据处理技能,包括[21]:数据定位技能(Data Location)——能够找到自己所需要的数据;数据理解能力(Data Comprehension)——能够理解数据的重要性,理解数据的不同表达形式;数据解读能力(Data Interpretation)——能够知道数据具体意味着什么,能够对其蕴含的教育教学意义做出解释;基于数据的教学决策能力(Instructional Decision Making)——能够通过数据分析具体的教学情境并做出适宜的判断,形成科学的教学决策;提出新问题新思路的能力(Question Posing)——能够利用数据提出拓展性问题与新思路等。为支持教师数据技能的发展,学校、学区则需要从提升数据系统使用的便捷性、丰富数据系统的数据分析功能、为教师提供可靠的分析结果与教学改进建议等多方面增强教师有效使用教育大数据帮助自身优化教学的信心与能力[22]。
(四)提供多方面的保障与支持
为了推动大数据在教育评价与决策中的有效应用,美国非常重视从多方面提供支持与保障,关注如何从政府层面减少各州、学区与学校在应用数据方面的负担,不断发展、优化全国教育数据系统的功能,扩大教育数据的服务面,并在实践过程中提出了若干举措[23]。例如,提出在国家与州层面需要从以下几个方面努力[24]:一是加大投入力度提升州级教育数据系统功能以帮助各学区有效利用教育数据系统;二是数据系统要及时更新,让学校能够及时获取学生数据以早做准备与规划;三是要推进区域性数据系统中暂时性的、间断性的评价数据与基于州立标准或国家标准的教育数据之间的整合;四是鼓励各学区加大投入力度切实提升本学区教育管理部门各机构人员的数据素养;五是鼓励或要求学校管理者要参与一些数据应用相关的培训项目,知道在学校层面怎样有效利用数据系统;六是鼓励或要求教师参与一些利用数据进行教学决策相关的培训项目;七是提供好的数据应用实践案例让学校在有效利用数据系统获得有益借鉴,帮助学校形成利用数据的意识与文化氛围。
学生数据的隐私保护与安全性保障是大数据在教育评价中应用时面临的一个重要挑战。为了应对挑战,美国不但有立法支持而且成立了专门的技术中心提供技术保障。美国联邦政府发布的《家庭教育权利与隐私法》《学生权益保护修正案》以及《学生在线隐私保护法》都被用于保护学生数据隐私。2014年,美国36个州共提议了110个议案用于保障学生数据隐私,其中21个州签署了30个法案用于保护本州的学生数据隐私。例如,科罗拉多州的《Colorado HB 1294》法案明确规定了教育数据允许使用的范围,并要求教育数据提供者要有具体的举措来确保数据使用过程中数据的隐私与透明度的合理性,对制定公共数据清查、对提供与使用教育数据的工作人员进行数据隐私保护相关培训、违反规定的处理程序等方面做了严格的规定[25]。美国教育部在2005年就建立教育数据隐私保护技术中心(Privacy Technical Assistance Center),其职能在于提供一系列技术工具、资源与支持产品与专门服务来帮助保护学生数据系统的隐私、安全性、机密性内容;同时也为各州分享关于数据系统的安全性隐私性的有效实践案例提供平台;并为全国的教育数据系统提供数据安全、隐私保护方面的咨询与技术支持,帮助解决学生数据隐私方面的突发性问题。
加强对教育数据应用相关研究也有助于推动大数据在教育评价中的深入应用,尤其是权威、持续的研究报告往往有着重要的启示与指导意义。例如,美国教育部教育规划、评价与政策办公室从2006年开始研究美国学校的数据系统,每年都发布一个关于学校教育领域数据应用的研究报告,其中2008-2011年的报告主题分别是《教师如何利用学生数据系统提升教学质量》《学校实施基于数据的决策:教师如何介入、获取支持并有效利用》《地方如何利用教育数据:从教育问责到教学改进》《教师利用数据支持教学的能力:挑战与支持》。这些报告为全美发展、利用数据系统推进有效的教育评价提供了重要的指导作用。与此同时,美国各州也在主动推进大数据在教育中应用的相关研究,到2014年,全美有41个州制定了本州详细的教育数据应用研究计划,43个州有意向与相关机构进行联合研究[26]。
参考文献:
[1]金陵.大数据与信息化教学变革[J].中国电化教育,2013,(10):8-13.
[2]武法提,牟智佳.电子书包中基于大数据的学生个性化分析模型构建与实现路径[J].中国电化教育,2014,(3):63-69.
[3]王萍,傅泽禄.数据驱动决策系统:大数据时代美国学校改进的有力工具[J].中国电化教育,2014,(7):105-112.
[4]Duncan,A.Robust Data Gives Us the Roadmap to Reform[EB/OL].http://www.ed.gov/news/speeches/robust-data-gives-us-roadmapreform/,2015-01-06.
[5]Bennett,R.E.The Changing Nature of Educational Assessment[J].Review of Research in Education,2015,(39):370-407.
[6][10][19]US Department of Education,Office of Educational Technology.Expanding Evidence Approaches for Learning in a Digital World[EB/OL].http://tech.ed.gov/wp-includes/ms-files.php?file=2013/02/Expanding-Evidence-Approaches.pdf/,2015-01-05.
[7]Data Quality Campaign.Data for Action 2013:Right Questions,Right Data,Right Answers[EB/OL].http://www2.dataqualitycampaign.org/find-resources/data-for-action-2013/,2015-01-05.
[8]Reed,E.,Scull,J.,Slicker,G.& Winkler,A.M.Defining Strong State Accountability Systems:How Can Better Standards Gain Greater Traction?[EB/OL].http://edexcellence.net/publications/definingstrong-state-accountability-systems.html/,2015-02-06.
[9][13][16][24]US Department of Education,Office of Planning,Evaluation and Policy Development.Use of Education Data at the Local Level:From Accountability to Instructional Improvement[EB/OL].http://www2.ed.gov/rschstat/eval/tech/use-of-education-data/use-ofeducation-data.pdf/,2015-02-06.
[11][15]US Department of Education,Office of Elementary and Secondary Education.Improving Data Quality for Title I Standards,Assessments, and Accountability Reporting [EB/OL].http://www 2.ed.gov/policy/elsec/guid / standardsassessment/nclbdataguidance.pdf/,2015-02-06.
[12]US Department of Education.A Blueprint for Reform:The Reauthorization of the Elementary and Secondary Education Act[EB/OL].http: //www 2.ed.gov/policy/elsec/leg/blueprint/blueprint.pdf /,2015-03-06.
[14][25][26]Data Quality Campaign.Paving the Path to Success:Data Action 2014[EB/OL].http: //www.dataqualitycampaign.org/files/Data ForAction2014.pdf/,2015-02-05.
[17]Shorr,P.W.10 Things You always Wanted to Know about Data-Driven Decision Making [EB/OL].http://www.scholastic.com/browse/article.jsp?id=423/,2015-03-06.
[18]Leek,J.10 Things Statistics Taught Us about Big Data Analysis[EB/OL].http://www.kdnuggets.com/2015/02/10-things-statistics-big-dataanalysis.html/,2015-03-06.
[20]Ronald S.Thomas.My Nine """"""""Truths"""""""" of Data Analysis[EB/OL].http://www.edweek.org/ew/articles/2011/06/15/35thomas.h30.html?tkn=UNZFK1u+dOgIrdSXpbrf/tuim4YZchGy/0Iw/,2015-01-05.
[21]US Department of Education,Office of Planning,Evaluation and Policy Development.Teachers"""""""" Ability to Use Data to Inform Instruction:Challenges and Supports[EB/OL].http://www2.ed.gov/rschstat/eval/data-to-inform-instruction/report.doc/,2015-01-05.
[22]Berger,L.4 Ways to Build Data-Driven Classrooms[EB/OL].http://www.scholastic.com/browse/article.jsp?id=7041/,2015-02-06.
标题注释:本文系教育部科学技术战略研究项目“大数据支持下的学习分析与教学评价研究”(项目编号:2014XX07)阶段性成果。