第一章 PISA 2018概要

一、PISA 2018基本情况

PISA(Programme for International Student Assessment)是由经济合作与发展组织(Organization for Economic Co-operation and Development,OECD)发起的一项大规模的对基础教育进行跨国家和地区、跨文化的国际教育评价项目,旨在通过测验与问卷调查评价15周岁的学生应用知识与技能适应未来生活的能力,探明教育系统、学校、家庭与学生因素对学生素养的影响,为国家内部和国家之间的表现差异提供基准和深入的剖析,形成对整个教育体系的评价,以帮助参与国家和地区了解自身教育体系的优势和不足,为改进和完善教育决策提供依据。

PISA参与成员主要是OECD成员国家和地区,同时也吸收非成员国家和地区参加,每3年针对全世界15周岁的学生举行一轮测试,从2000年首次举办至今,已举办至第7轮,是目前世界上最具影响力的国际学生学习评价项目之一。经过近20年的发展,PISA参与国家和地区由2000年的43个扩大到2018年的79个(包括美国、加拿大、澳大利亚、绝大部分欧洲国家,日本、韩国、泰国等部分亚洲国家,巴西、阿根廷等部分南美洲国家等)。

PISA的主要特征包括[1]

●政策取向:关注教育的效果、效率和公平(effectiveness,efficiency and equity)。把学生的学习结果[认知因素(cognitive domain)]和个人特征,如非认知领域因素[学习动机(motivation)、积极的自我信念(positive self-belief)、坚持(perseverance)和自控力(self-control)]以及在学校内外影响学生学习的关键因素(contextual background information),如教师、学校、家庭、教育制度等联系起来,深入分析学生表现差异的原因,并同时找出那些卓越表现的学校和教育体系的特征,为教育决策服务。

●创新“素养”概念:PISA关注学生对关键概念的整体理解,而不把评估局限在对特定学科知识的理解上。这体现在PISA一方面非常强调学生在关键领域中应用知识和技能的能力,另一方面也特别重视在不同情境中提出、理解并解决问题时,所要具备的有效分析、推理和沟通的能力。

●与终身学习相关:素养的获得是一个终身学习的过程,而终身学习的关键是学会学习。OECD迈向2030年的教育架构中,提出“素养”的教育关键是指知识、技能、态度与价值观的融合(OECD,2018),可见PISA不仅评估学生的认知能力和生活技能,它还试图从多方面了解学生在生活中的体验、经历和感受,同时关注到非认知领域的情感、态度、价值观的培养,调查学生的学习动机、学习自信心和学习策略等。这种“素养”的教育观念不仅可供学校教育改革参考,同时适用于每一个人的终身学习。

●持续定期监测:PISA测试每三年进行一次,让各参与国家和地区可以持续定期监测各项教育政策的成效和重要教育目标的进展。

●覆盖区域的广泛性和合作性:参加PISA的国家和地区数目由PISA 2000开始的43个增至PISA 2018的79个。参与国家和地区体数目的持续增加有利于参与国家和地区从众多的教育体系中找到合适的参照及学习对象。此外,通过深入剖析不同教育体系中影响素养的各个因素,也有助于参与国家和地区彼此间的相互学习与促进。PISA测试的范围、框架及背景信息的收集是由全部参与国家和地区的教育部长和国际专家群所共同决定的,并同时参考各国政府的关注焦点,最后形成共识并制定政策。

(一)PISA的评价内容与方法

1.PISA的评价内容

在评价内容上,PISA关注学生的“素养”,即学生在生活情境中应用知识和技能解决实际问题的能力,而不是对学生学科知识与技能掌握情况的考查。主要关注学生的阅读、数学与科学素养这三类基础素养,并在每一次测试中将其中一个领域作为主测领域(见表1-1),该领域的试题数量占总试题数量的一半以上。除此之外,PISA还积极探索创新测试领域,对一些综合素养进行考查,如问题解决能力、财经素养、合作问题解决能力、全球素养等(见表1-2)。PISA 2018测试领域为阅读、数学、科学、财经和全球公民素养,其中阅读是主要测试领域,中国四省市参加了阅读、数学和科学三个领域的测试。

表1-1 PISA 主测领域的变化

img

表1-2 PISA创新测试领域的变化

img

2.PISA的评价方法

PISA 2018建立在以往的研究成果上,继续推进和深化计算机线上测试方式,包括试题和问卷两个测试环节。PISA测试一般由以半个小时为单位的4个试题群组(cluster)组成,每个试题群组包含数个单元,完成全部试题群组的作答时间为120分钟,PISA 2018由60分钟的阅读问题,以及60分钟的数学和科学问题组成;问卷的填答时间约为45分钟。阅读作为本轮PISA测试的主要领域,试题基本以一个或数个文本、图表,或者由学生在真实生活中遇到的问题,加以组织后成为测试单元,并以仿真的网页环境呈现。

在命题上,PISA对阅读、数学与科学等领域的测试并非考查学生对学科知识和技能的掌握情况,而是坚持“能力立意”的命题导向,重在考查学生素养,即学生在生活中运用知识和技能解决现实问题的能力,通过设置测试情境、设计高阶能力试题、组织问卷调查等多种方式,实现对学生核心素养的深度测评。同时,通过问卷调查的方式收集学生、教师和学校的背景信息,用以分析影响学生素养表现的关键因素及其现实状况,如关于他们的学习、学校、家庭、生活和未来规划,语文课堂上教师教学方式现状如何,在多大程度上影响学生的阅读素养等。

PISA“能力立意”的命题导向主要表现在以下两个方面:

第一,强化对学科高阶素养的测评。如在阅读素养测试中重视考查学生对文本的反思与评估能力,在数学素养测试中重视考查学生阐释、应用和评价数学结果的能力,在科学素养测试中重视考查学生评价和设计科学探究、科学地解释数据和证据方面的能力。为此,PISA进行了大量富有创造性的试题开发,如在阅读素养测试中设置跨文本阅读的试题(为学生提供两篇观点存在差异的文本,让学生综合两篇文本的信息进行反思评价),在科学素养测试中设置大量有关科学实验设计、科学实验结果解读的探究性试题。

第二,设置贴近生活的多元化测试情境。据调查,当前中高考中约有70%的试题没有设置与生活相关的情境。部分强调应用性的试题虽然设置有问题情境,但是不贴近学生真实生活。PISA在测试情境构建方面做了以下探索:一是对测试情境进行了清晰划分。如PISA数学素养测试区分了四种不同情境,包括个体情境(如个体财务、购物),职业情境(如建筑物的测量、工资账单),社会情境(如国家统计)与科学情境(如数学在气候预测方面的应用)。二是加强试题情境的可视化设计。如呈现某论坛的作者主帖和读者跟帖,要求学生从中检索定位相关信息,并作答相关试题(见后续样题)。

在评价对象上,PISA利用抽样的方式对15周岁在校生进行考查,反映教育总体状况,而不是对学生个体与单个学校的测评与考核。每个参与国家和地区需选择至少5000名学生参加,如15周岁学生总数少于5000人(如2018年冰岛和卢森堡),则其所有此年龄段的学生参加测评。

在评价方式上,PISA 2018采用基于计算机的测试,学生需在计算机上作答试题与问卷,而不是采用传统的纸笔测试。

(二)PISA的抽样方法

PISA采用的是两阶段抽样。第一阶段由OECD委托国际承包商采用分层等比抽样(Probability Proportional to Size,PPS)的方法抽取样本学校,样本学校会覆盖城乡学校、普通中学和职业中学,而且会覆盖不同办学水平的学校、公办学校和私立学校;第二阶段由PISA国家中心采用OECD提供的软件在样本学校中随机抽取一定数量的学生,同一学校内部,每个符合PISA条件的学生被抽中的概率相同,不会受到学生表现等方面的影响。PISA会抽取一定数量的随迁子女。由于PISA测试并没有设置对学生户籍的调查,所以无法确切认定学生是否为随迁子女,但是PISA会询问学生的出生地(本省市、大陆其他省市、港澳台地区、国外)。

(三)PISA 2018呈现的新特点

PISA 2018是第七次PISA测试,阅读素养是第三轮作为主要测试领域。PISA 2018在测试的内容、方式与规模上都呈现出一些新的特点,主要表现在以下四个方面。

1.在测试内容上,PISA 2018对学生阅读素养进行了重新界定

PISA 2018认为,学生的阅读素养是指学生为了实现个人目标、增进知识、发掘潜能与有效参与社会生活,而对文本进行理解、运用、评估、反思的能力以及对阅读活动的参与[2]。这个定义有以下变化:

首先,这一定义非常强调学生阅读素养中的评估、反思能力。阅读素养的定义新增了“评估”一词,这是为了强调:在信息爆炸的年代,读者必须衡量文本中论据的真实性、作者的出发点、文本与阅读目的的相关性等多种因素,从而更为谨慎地对文本进行判别与使用[3]

其次,这一定义非常强调学生的数字化阅读素养。定义删去了原有概念中的“书面”二字,将数字化文本的阅读正式纳入阅读素养的内涵之中。在具体测试中,PISA 2018非常强调学生多重文化的阅读素养和评估与反思的阅读素养,这都是数字化阅读素养的重要内容。

2.在测试方式上,PISA 2018采用了基于计算机的测试

从PISA 2006开始,PISA就开始探索基于计算机的测试,即学生在计算机上作答测验与问卷。到了PISA 2018,基于计算机的测试已经成为主流,只有越南、乌克兰、约旦、摩尔多瓦、罗马尼亚、北马其顿、阿根廷、沙特阿拉伯采用纸笔测试。基于计算机的测试不仅可以减少纸笔测试的成本,还为测验情境的拟真化提供了更大的可能。如在PISA 2018释放的样题《家禽论坛》中,测试开发者便搭建了逼真的论坛情境,学生需要通过阅读“帖子”回答相应问题。这样可以更好地评价学生在实际情境中解决问题的能力[4]

3.PISA 2018首次在测验中运用了计算机自适应测验技术

PISA 2018在基于计算机测试的基础上,更进一步突破测评技术,在阅读素养测试环节中,引入多阶段自适应测试设计(multi-stage adaptive testing design),学生分三个阶段作答阅读领域的试题,测试系统会根据学生在前一阶段的测试表现(选择题作答情况)推送不同难度的题组。在这样的设计下,学生会作答更适合其能力水平的试题,不至于因试题过难或过易增加其考试焦虑或倦怠,实现对其能力更为精准的测评[5]

多阶段自适应测试设计原理见图1-1[6]

img

图1-1 多阶段自适应测试设计原理

4.在测试规模上,参测国家和地区进一步增加

PISA参与成员主要是OECD成员国家和地区,同时吸收非成员国家和地区参加。经过近20年的发展,参测国家和地区已经从PISA 2000的43个扩大至PISA 2018的79个。在PISA 2018中,约60万名15周岁在校生参与了测试,能够代表来自79个参测国家和地区的3200万名15周岁学生。测试国家和地区涵盖了美国、英国、德国、荷兰等绝大部分欧美国家,日本、韩国、新加坡等部分亚洲国家,澳大利亚和新西兰,巴西、阿根廷等部分南美洲国家以及部分非洲国家。根据世界银行2018年对全球国家和地区GDP的排名,82.0%排名前50的国家和地区参加了测试,65.0%排名前100的国家和地区参加了测试。

(四)我国四省市在PISA 2018测试中的参与情况

为跟踪、了解世界教育发展趋势,学习、借鉴国际先进评估经验,继上海参加了PISA 2009和PISA 2012,北京、上海、江苏、广东四省市作为整体参加了PISA 2015之后,教育部组织北京与上海、江苏、浙江一起作为整体参加了PISA 2018。教育督导局负责对参测省市的组织统筹和监督指导,国际合作与交流司负责对外的沟通协同,教育部基础教育质量监测中心被委托作为专业机构承担具体的实施工作,并设立PISA国家中心。根据我国教育改革的需求,考虑测试准备工作的时间限制,我国参加了学生阅读、数学与科学测验,未参加全球素养与财经素养测试;参加了由PISA统一组织的学生问卷与学校问卷调查,自行组织了教师问卷调查,未参加家长问卷调查。四省市361所学校的12058名学生代表四省市在校生(其中有1863名非本省市学生,约占四省市参测学生总数的15.5%)参加了测试,361名学校负责人和17634名教师完成了在线问卷调查,见表1-3。

表1-3 中国四省市参加PISA 2018测试学生和学校样本量及其分布情况

img