NCLB弊大於利

(2017年4月26日星期三)

美國No Child Left Behind Act (NCLB) (至 Every Student Succeeds Act (ESSA))帶來各州統一測考,強令學校公開成績作比較,好聽的措詞上是「促進學校改進」,其實是推行高風險測試政策,學校為存亡要跟制度「搏奕」(gaming the system),「分數高低」與「教學改進」證實毫無關係。

學者在期刊批評NCLB的「測評問責制」,二十年來文章不斷,其中包括測評學者 Robert LinnJames PophamLorrie ShepardEva Baker,擅長研究教學的David Berliner,教育政策學者Diane Ravitch等。Ravitch 還當過副教育部長,掌管NAEP長達7年。

Shepard 在去年的Educational Researcher 文章中這樣說:在1990年代,發展勢頭很好,學科專家都在設計較有深度的課程,希望強化學生思考、解難、概念理解,讓他們追求深層學習 deep learning)而非忙碌於機械式操練,他們又鼓勵教師多使用開放式考題、專題探究等測評工具。這時卻來了一個 NCLB,就是因為要訓練學生考統一標準試,把一切美好的都打翻了。

她續說:今天的教育研究者,應設法說服政府,高風險測試給教育帶來破壞性影響 corrupting effects)。這些測試的負面作用早已人所共知,只是政策辯衛士和反對者對問題的嚴重性看法不一致。但時至今天,我們已可以斷定,弊大於利。若時光倒流,專家應把力量放在設計課程和教師培訓上。要真有成效,應以課程設計為主體,而非獨自發展測評工作;政府也應放棄懲罰性措施,少舉行測試,把資源放在課程和非為公布成績的測試工具上。

我想,那些以提供「學校報告」為擋箭牌,嚮往 NCLB式測考,或希望把 TSA /BCA變為學校「知衰、故知所改進」的人,請讀讀上述學者金石之言。

讓你知所改善,怕你滑落不自知

(2017年4月19日星期三)

校長召見甲老師:「我們對大考作過統計,你教的 D班,成績比 A, B, C班都差。你要調整教學,成績若不改善,可能 ……

甲老師向乙老師訴苦。乙安慰他說:「校長用心良苦呀!TSA給學校派成績表,他當然也要給老師做「體檢」喇!這是讓你清楚自己的教學問題,怕你滑落而不自知。

「不過,校長並沒有說,學校是按成績編班的,整體學生叻極,總會有人派去讀 C D班,而每年派給我教的,不是C班就是D班。年尾就召見我,話我班表現最差,不用做研究都知喇!」

「替教師作成績「體檢」,是一種新型TSA,也非我校獨有,大勢所趨呀!有些校長還頂著千百倍壓力,在學校門口貼出個別老師和學生的「成績排名榜」,好讓落後的「知所改善」!我們校長算仁慈,沒有這樣做;不過據他說,有學校做開的,只停了幾年,全校成績即下跌喎!」

「怎樣可以「改善教學」呢?D班表現總比不上 A B班。我並非不重視成績,但不是說過,求學不是求分數嗎?我努力班級經營,培育學生自尊自信,師生關係不錯,同學都愛回校,無人要自殺,有些還開始對讀書有興趣。當然,這些不算是「成績」吧!」

「我們都是老師,對學生的表現其實最清楚,哪用等大考才知道?不過,既然上頭有這樣的嗜好,我們只好對準目標,一開學就操練歷屆試卷,專心研究題形,隔天模擬大考一次,天天練習,學生低分都難。看,我現在年年都派去教 A B班了。」


(上述是虛構故事。)

測考成績與學校質素

(2017年4月12日星期三)

趙勇(Zhao Yong)去年再次在美國獲選10大最有影響力的教育學者。他在四川長大,到美國求學,現為堪薩斯大學教授。

趙勇說美國自1983 A Nation at Risk 出版後,經過 No Child Left Behind Act Every Student Succeeds Act,形成一股「測考問責」文化。政客拿亞洲國家的成績比較,產生落後恐懼,於是通過法例令每州實行統一考試,以成績向學校問責。可惜20年後,成績目標沒達到,美國的「國際」排名也沒進步。

這段歷史,講過的人很多,趙勇文章吸引,是由於他來自中國。在《誰怕那條大惡龍?》裡,他說各國都在爭「國際排名」,上海排名高,大家都說要學上海;但PISA成績發放日,他正在上海,領導並沒有為成績慶祝;相反,他們問:究竟「高分」真否顯示有價值的學習?為了爭成績,學生沒時間花在哪些事物?那些事物是否更有價值?為甚麼成績這樣好卻出不到一個 Steve Jobs

趙勇勸告美國人不要盲目抄襲別國,也不要搞 standardised tests讓學校跑成績,或誤信「測評成績」就是學校質素。要問:贏了排名,輸了甚麼?中間產生了甚麼不良後果 (side effects)

香港TSA爭論中,近日又有人宣揚美式的測考文化。其實,要製造一個標準測試(PISA也好,香港的TSA也好),替教育系統作「體檢」,並非不可能,但切勿誤信這些成績可用來論斷個別學校的教學效能。著名學者 James Popham (1999) Why Standardised Tests Don’t Measure Educational Quality中解釋過,這樣做猶如把鐵匙羹用作溫度計,非常不準確;影響學校成績的因素眾多,教學只是其一,還有學生本身的能力高低,在學校以外得到的學習機會等。


所謂的TSA「外國經驗」


(這篇文章是特稿,刊於 2017年 4月6日星期四《明報》的觀點版)

吳克儉局長最近舉例,謂加拿大Manitoba(緬省)在1999年取消了類似TSA的評估工具,學生表現因而跌至全國最差。

在加拿大,要找跟香港TSA類似的「系統性評估」,應是由Council of Ministers of Education Canada 負責的Pan-Canada Assessment Program (PCAP)。立法會秘書處的資料研究組,曾研究各地的「全國性系統評估」,發表的《資料摘要》(下稱《摘要》)亦以PCAP 為代表。該試3年一次,隨機抽選學生進行,是個低風險測試。

據我所知,緬省參與了所有年份的PCAP2007, 2010, 2013, 2016),從沒間斷過,未知吳局長所指緬省取消了的是哪個試?

州內的統一測試

身兼檢討TSA委員會成員的中大侯傑泰教授曾謂:「美國的TSA/BCA,會貼出評估成績,令很多學校困擾,壓力比香港大千百倍。」那又是甚麼一回事?

在美國 (也按《摘要》),可與香港TSA相類比的,應是 National Assessment of Education Progress (NAEP)。該試是全國性系統評估,始自1969年,也是抽樣進行。NAEP地位崇高,但從不報告個別學校或學生的成績,實行了半世紀,並沒有引起太大的爭議,也沒聽過該試引發操練壓力。

日前侯教授再發文,大家才知道,原來他所指的(同時又謂葉建源不懂的),並非NAEP,而是在Every Student Succeeds Act (ESSA) 法例下美國各州自行舉辦的統一測試。

美國各州本無統一課程考試,2001年通過 No Child Left Behind Act (NCLB) 法例,原意是幫助弱生達到一定學業水平,卻演變成一種「測考問責制」(assessment accountability) 。法例下各州必須對指定年級學生進行統一測試,並公布個別學校的成績。

然而,各州的考試內容仍不相同,達標分數不一,但新制度把個別學生的分數連繫到學校甚至老師身上,學生成績不好,可辭退個別教師,關掉學校,故有說這是「懲罰性的測考問責」(punitive assessment accountability)。NCLB本稱要全國學校在2014年全達標,但證實做不到。2015年通過ESSA,是NCLB的延續,只是給各州政府多一點彈性和時間。

侯教授並沒有指出這種「測考問責制」引起了嚴重的社會分化。美國學校的確想出多種辦法「改善」成績:操練學生,大量家課,因考施教,減教非測考科目,借故不收有特殊教育需要的學生,老師通水作弊等。不少家長也不滿,認為測試扭曲學習本質和妨礙子女正常成長,又無助改善教學,故發起「罷考」運動。

與香港TSA/BCA理念不符

回看香港的TSA,侯教授的說法有兩大問題。

一、香港的 TSA,原意只在於追蹤學生的整體表現,並無打算用成績評估作工具對學校施壓(雖然的確有官員這樣做)。侯教授不選擇 NAEP而談ESSA(或NCLB)下的懲罰性考試,並稱之為各省自行舉辦的「TSA」,這類比是否恰當?

二、或許有人認為,美國的教育過份鬆散,教師不濟學生懶惰,因此得用方法修整鞭策。但請明白NCLB下的考試,目的已超越了「系統性評估」,而是耍手段要學校加強成績表現。近年我們嚐過了TSA操練異化的苦頭,還希望TSA/BCA變成美國的NCLB ESSA嗎?再者,就算今天當局改變了想法,要跟從美國的做法,是否也應該先清楚交待,讓公眾討論?

香港的具體情況

相信大部分人會同意,香港的課程統一,學生成績不錯,國際成績比較中經常佔優,學校的成績壓力不是太輕而是太重,測考功課不是過少而是過多,競爭不是過弱而是過劇,教師太辛勞而不是懶閒;學生若果成績不好,香港教師會慚愧自責。我們還需要多一個試,加強個別學校的成績問責嗎?
香港學校收生,基本上已是成績為先,而非歐美般的按居住地區入學。已當上 Band 1 學校的,要它們貼出學生成績,支持成績問責,當然容易。但社會上總有收容 Band 2 Band 3 學生的學校,要貼出他們的成績,用成績進行「學校間比較」,真會提升成績,消滅「落後」的學校嗎?

社會心理學家Donald Campbell曾說:「愈多使用量化指標來制訂社會決策,就愈容易令這些量化指標腐化,同時也就愈容易曲解和破壞原本該指標所要關注的事物。」(The more any quantitative social indicator is used for social decision-making, the more subject it will be to corruption pressures, and the more apt it will be to distort and corrupt the social processes it is intended to monitor.

TSA原初以為是「基本能力」的忠實指標,卻被扭曲引發操練,結果它測量的,再不是「基本能力」了。以為有了數據就有政策的依歸者,請勿忘Campbell 定律。


罷考越勁,成績越好?

(2017年4月5日星期三)

吳克儉局長稱,加拿大有省份在數年前取消他們的 TSA/BCA測試,結果該地區學生表現「排全國尾二」,他相信香港若取消,這個後果數年後就會見到。

這種「因果關係」真奇特。建議局長也看看美國紐約州情況。長期以來,美國已有 NAEP進行全國抽樣的「系統評估」,但近年各州又每年自辦「標準測試」(standardised tests),令學生和學校進行比較;家長反對並發起罷考 Opt Out),去年120萬名學生中,24萬不應考。

結果收集回來的數據,學生的英語達標率升了7%,數學也上升1%。我們可否接受以下荒謬的「因果」結論:有罷考的地方,學生成績就越好?紐約州的罷考運動已進入第4年,今年更多罷考個案,可否因此預測,今年的成績會更好?

類似香港,州政府為求平息罷考風波,曾對考試作出「改善」,例如把試題改淺、減少題數、保證分數不會用來向學校施壓等。

也類似香港,家長並不領情,政府說數據有助學校問責,家長則認為該試干擾學校課程,只肥了出版試題的書商;成績分發之日,子女已升了級甚至轉了校;考試給學生徒添壓力,無助學習或改進,弊大於利。

美國心理學會 (American Psychological Association) 訂明,專業者在測試前必先取得接受測者的「知情同意」(informed consent)。紐約教育局也「公道老實」,雖然宣傳考試,仍告訴家長,送不送子女考試,權在家長手裡。

香港似乎並沒有這回事,TSA/BCA收集個人數據和成績後,交到誰的手裡,會作甚麼分析,事前並沒有徵求家長「知情同意」,家長若不同意,看來只有轉私校一途。