经验筛选与教育实证研究 | 原上海市教育科学研究院副院长顾泠沅

发布时间:2015-11-17浏览次数:2文章来源:教育学部

gulingyuan

各位专家学者各位老师们,大家上午好!本人毕业出身是中小学老师,后来才做了相关的肤浅研究。本人所讲属于微观问题,前面一个词叫“教学”,教学的经验筛选跟教学经验的实证问题。主要说两个问题。第一,教学实证两难问题和困难。做实证很难。第二,过程变式与教师的过程。我认为实证与思辨不可分割,是洞察理论教育的重大接口。

我做了那么多年的教师,教学留给我们的都是“两难问题”,两难问题当中怎样找着力点?第一,教育提供的信息很软,是软性的。第二,教育的判断判断的依据多种多样,判决很复杂,因此要做出决策有多种困难。

从我经历的过程来说,从上世纪77年到92年,有15年在上海地区教学改革,从“经验筛选”到“开展教学实验”。1986年到2010年,跟随老教育家吕型伟,有了25年的教育改革积累,其中还有面向未来基础学校的研究、关于教师以校为本的研修制度建设等教育部全国推进的项目。在学习理论和教学经验之间,还是一个未曾跨越的断层。王善迈先生说研究要发现问题,这是至理名言,从发现问题到发现解决问题的办法,从概念分析到概念的深化,几十年来感觉是“很较劲”的过程。所以说,软信息、多判据、难决策。教学的信息少量是刚性的,大量是软的。比如态度、思维等等。

1984年我们上海市教科院做了中小学生15种常见的不良道德观念的评估,改进为多指标选项排序,课堂观察则从28个视角评估,25年评估下来发现了一些情况。20多年的视角稍微发生了变化。这个测评是否真正正确?逻辑依据是什么?

思维活动(认知),思维活动是内部的,很难外显。外延是思维的外壳,学生在解决问题时只言片语把它讲出来,发出声音,通过“出声想”这个方法来评估学生解题思维过程。这个过程花的时间精力比较多,还要取得录像资料。录像资料转化为口语材料,不同类别学生在解决这种问题时思维准确性从哪几种指标判断?敏捷性、深刻性、准确性怎样判断?这些都说明思维的复杂特性。

我们常常说学生得主动起来,为什么说他主动?哪些指标可以表明他主动起来?90年代我们作了一个实验,看师生之间语言互动情况。把语言分为几个类别,哪些类别可能体现学生在主动思考,哪些类别是老师起的主导作用等等。这件事情花了大概两年时间,课堂改进前课堂改进后,哪些语言和哪些动作反映出他主动起来?有了这些资料可能会比较准确、客观地反映一个结果。就判据多元化而言,1982年“拨乱反正”刚刚有所成果时,老师用聚类分析方法分出来,A是问题取向,当时也有问题解决取向的价值取向。B是概念取向。

教师如何评价课堂?80年代末、90年代初我们曾经归纳了很多专家教师的经验,发现教师判断教育过程的长处、短处都是由几方面特征构成一个判据,另外几个特征也可以构成另外一个判据。所以用了等级判据,还有一个模型是M值构造判断函数,这个软件很难操作,因为计算太复杂。后来出现计算机之后,把它计入程序,难度有所降低。所以判据不是单一判据,是多元判据。近几十年,判据的多元常常产生碰撞,甚至擦出火花、孕育创造。逻辑分析有一个很好的长处,贵在抛开所有的判据,一切从真实的观察出发,然后进入到真正意义上的“解释”。课堂录像今天因为时间关系被我略去了,我只想再次强调,判据是多元的,信息是软的,判断的依据是很多很复杂的,因此出现了决策上的困难。根据判别依据的多样,1982年到2007年做了上述分析,我们得到了课堂视角有十条变化。这十条分析都是引入了一些实证研究,得到分析之后得到的十条变化。

关于教育决策合理性问题,我们常常考虑到两个方向。一是课堂是否符合一定的教学原理?二是由原理指引的决策,还有由目标导向的决策?

这项工作我们曾经在上世纪,“文革”刚刚结束,教育要拨乱反正,需要调查关键期和关键问题,如果在调查中带有一定的实验因素,可以增加调查的敏觉性。我们发现有敏感性的人可以把问题看得比较准,后来的创造针对着这样一些很敏感的问题。这就用了三年时间。

后来我们又用了三个学期进行经验筛选,把采集到的一个地区,甚至全国的一些典型经验,也有国外的一些东西搜集起来。总共采集了160多项专题的课堂教学,或者叫教学经验。做了一件事我觉得倒有一点价值,3个学期用50次小循环,相对于一个礼拜一次循环,这个星期里面教育上要开展哪些主题?就这些主题已有的经验,哪些可以体现出来?接下来就在班级或课堂里面做一定的事实验证,进行深入观察,哪些是适用的,哪些需要修改,哪些可以保留并发展的。

50次循环就相当于一个礼拜要有一次小的循环论证。经过三个学期之后,比较大面积提升学生学习质量,涉及到四方面:第一,情感方面的若干措施。第二,教育内容组织有层次的推进问题,这叫循序渐进。第三,鼓励学生主动尝试的举措。第四,决策反馈。

我们坚持了11年。10个班级440名学生分为实验、控制两组展开四因子实验,在440名学生当中选取基础智能相近,性别一样,家庭环境类似等100个学生对偶跟踪观察,跟踪了3年,得到了一些符合原理,符合当时实际情况的做法,取得了不错效果。这里有大规模数据分析就不再介绍了,我写过一本书《教学实验论》中有所涉及。后面举两个辅助分析的微型实验,对某些特定关系的处理很敏感。

例如,情感意志跟认知有没有关系?我们曾经做过一个很小的实验,这个实验选择了对孩子作业的处理,。孩子完成学业之后有一个作业,一般老师本子上批改错、对,就发下去了,这个叫一般的批改办法。反馈很重要,及时了解情况,作业的作用在于了解到学生掌握了知识没有,以后有哪些新的出发点?第二种办法,是进行实时反馈,请孩子过来,当面跟他说你现在存在的问题在哪里。还有一条,除了当年的批改之外,当面针对孩子说的鼓励语言,说他能成功,说他在进步,或指出一些认知性上的问题,对孩子正确率提升的作用比具体某个问题纠正一下好像还要大。因此我们在四个举措当中,把情感意志放在第一位。通过实验,我们发现,尝试活动对提升能力与后续学习有效,反馈调节是大幅度提高学习成绩的主因,两者应相辅相成。

在实验过程中,我们常常需要追问:实验理论目标在哪儿?取向在哪儿?微观的实证显示出,对孩子好的成长作用率会很大。微观实证给出了我们对老师、研究者一个重要启示。

我们常常说目标导向,情感意志的目标,认知的目标。各位,我们曾经花了大力气,1990年和2007年,为什么选择这两个年代?1990年是刚刚拨乱反正,2007年是上海两轮课程改革的年代。华东师大心理学左任侠教授曾经指出,一般的统计不能反映事物深层次问题,统计中间有一个叫组成分析、因素分析,恐怕是分析层次比较深的一个方法。但是各位学这个方法很艰难,我本人是数学系,花了半年时间看懂这本统计学,看了之后就做了第一个实验。过了17年再做一轮实验,看看两轮课改到底有没有变化?实验中所取得的很多结论和经验,后来被上海市中小学数学课程标准采纳了。

举两个例子,一件是跟教学有关的。我最近跟袁振国老师也在讲,外国对我们有一个论点叫“悖论”。20世纪80年代,数学教育界有所谓“中国学习者悖论”,在世界上炒得沸沸扬扬。说“被动灌输、机械训练”,的中国教学。却产生了优于西方的结果。2011年、2013年上海参加的国际PISA测试,再度引起国际社会瞩目。中国教育可能是有自己的问题,但是不是有独特的价值在里面呢?

PISA之后,中国的基础教育好像被认为里面有亮点,有自己的中国特色。例如,教研制度,60余年的历史,分为3个层级,国外的评论认为它对课堂教学贡献良多,是PISA测试成功的重要因素,堪称“国宝”。但是我们却缺乏深入细微的考察和真正意义上的理性审视。中国教研关于行动智能的指导,明显集中于课堂设计与课后的反复改进。十分贴合教师在职学习的效率特征。当年我们跟日本、美国合作,日本还害怕,做到今天这个程度,我希望在座的各位专家和一线教师,能在这块做出自己的贡献,我认为这是一个很重要的方向。

时间正好到了,提三个问题。第一,教学理论的根到底在哪里?是在各种文本上呢?还是在学校、在班级、在课堂?物理学的根是在实验室,教学理论的根在哪里我不太清楚,大家可以讨论。第二,老师需要哪些专业支持?是否能多到中小学去做做看?因为呼声太高,我常常在中小学跑,老师呼声很高,很希望有这种指导,否则太可惜了。第三,平野何处见高地?本国特色不是一句空话。如何深化?如何改进?正当其时,影响一个民族。

我就说到这里,谢谢大家!