在线观看av毛片亚洲_伊人久久大香线蕉成人综合网_一级片黄色视频播放_日韩免费86av网址_亚洲av理论在线电影网_一区二区国产免费高清在线观看视频_亚洲国产精品久久99人人更爽_精品少妇人妻久久免费

首頁 > 文章中心 > 正文

畢業(yè)論文高考語文測試?yán)砟钊笔轿?/h1>

前言:本站為你精心整理了畢業(yè)論文高考語文測試?yán)砟钊笔轿龇段?,希望能為你的?chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。

畢業(yè)論文高考語文測試?yán)砟钊笔轿? /></p> <p><a href=畢業(yè)論文

高考語文測試理念缺失探析

一.從一些統(tǒng)計和調(diào)查談起

(1)教師評定(前20名左右)與高考成績相關(guān)性統(tǒng)計(擬作)

(筆者以為教師的評定應(yīng)該是一個較好的效標(biāo),美國的很多大型關(guān)聯(lián)效度調(diào)查都以老師對學(xué)生一年以上的觀察作為效標(biāo))。語文應(yīng)該最差。

(2)學(xué)生成績波動性調(diào)查。(擬作)

語文的波動性肯定最大。

(3)對中學(xué)語文教師的調(diào)查采訪(擬作)

對語文高考命題科學(xué)性的認(rèn)識采訪一些參加過高考閱卷的老師(評卷誤差)

并調(diào)查中學(xué)語文教師的處境

(4)對大一新生的調(diào)查(擬作)

(主要就高考各科命題的效度進(jìn)行調(diào)查。先給學(xué)生一個通俗易懂的“效度”定義---能測量出你真實水平的程度。然后讓他們回答諸如此類的問題:請你按照效度水平給高考各科排序;按成績波動性排序.)

(5)高考成績與大學(xué)成績相關(guān)調(diào)查:

語文“高考成績與大學(xué)成績相關(guān)極低”,說明語文“高考的預(yù)測性很差,作為一種選拔性測驗現(xiàn)行高考是不成功的”(轉(zhuǎn)引自北師大心理系高考研究組《改革高考,更加準(zhǔn)確有效地選拔人才》第83和89頁)(再查出處)

(6)歷年的高考抽樣統(tǒng)計結(jié)果

已有93、97、98(在自抄的信紙上)、2000(在小筆記本上)、2002年的,無論信度效度(好像沒有公布)標(biāo)準(zhǔn)差(反映考生成績離散程度,即試卷的區(qū)分功能,在150分的試卷中標(biāo)準(zhǔn)差20分以上說明離散程度較好。),還是成績的正態(tài)分布曲線,語文都基本上是最不理想的,而且和其他科(尤其英語和理科各科)相去甚遠(yuǎn)(語言測試略低一些可以理解,低得太多,就需反思)。

官方對于低信度的解釋往往是:語文屬于異質(zhì)性測試(國內(nèi)的確也作過一些這方面的調(diào)查).我們不禁要問:為何國外的語文測試信度比我們高得多呢?為何高考英語試卷的信度往往是各科中最高的呢?再者,我們用來作異質(zhì)性調(diào)查研究的試題其命題和批閱質(zhì)量(尤其作文批改的誤差控制)有足夠的擔(dān)保嗎?

而且,我國每年的高考抽樣統(tǒng)計公布都缺少最重要的一項統(tǒng)計指標(biāo):效度.(效度測起來的確更復(fù)雜更麻煩,但并非“沒有數(shù)學(xué)方法,只能靠定性分析”.分析請參照后面的“實踐性缺失”一章.)

“信度比效度更容易證明,所以附在測驗一起的技術(shù)說明通常只報告信度數(shù)據(jù)。測驗發(fā)表者打算通過顯示信度而暗示其效度。這種做法不好,它只是做了一半的工作?!保ǔ鲎孕」P記本-書名作者待查)

另外,許多知名專家學(xué)者不止一次對語文高考測試提出了嚴(yán)厲的批評:

"我讀了,非常吃力,首先是弄懂題目要求就費(fèi)了極大的勁,有的至今也沒有弄得太清楚……"(錢理群評1998年高考試題)

"語文綜合能力強(qiáng)的學(xué)生在高考中反而得不到高分"(待查)

錢夢龍也指出:現(xiàn)在的語文考試測不出學(xué)生的真實水平.

顧德希:“從十幾年來我所教的高三學(xué)生來看,每年總有不少于四分之一的學(xué)生,語文高考成績與平時成績存在較大反差.盡管這比十幾年前已是不小的進(jìn)步(以前誤差更大),但問題仍然是嚴(yán)重的?!?<<中國考試>>2002年第三期<<學(xué)科能力等級研究與素質(zhì)教育>>)

“現(xiàn)在優(yōu)生得分不高差生得分不低的現(xiàn)象越來越突出…學(xué)生的積極性受到了嚴(yán)重打擊?!保ɡ钊?、張中環(huán)《關(guān)鍵是怎樣操作》《中學(xué)語文教學(xué)》2003,6)…

每一個理智的語文工作者應(yīng)當(dāng)承認(rèn),我們的語文高考存在著很大的問題,其信度和效度離語言測試科學(xué)化的要求尚有很大差距,迫切需要改革.

筆者于高中語文教學(xué)一線工作九年有余,深感執(zhí)教的困惑和艱難。我對于高考語文測試最大的不解在于:學(xué)生高考成績與其平時成績和能力(老師對自己起碼一半左右的學(xué)生還是十分了解的)嚴(yán)重不符-其程度遠(yuǎn)遠(yuǎn)超過其他各科,波動幅度之大,范圍之廣怵目驚心。

反思是枚苦澀的果子,也是語文界同仁不得不品嘗的果子。大發(fā)牢騷沒有用,怨天尤人沒有用,擺出一幅任人宰割的架式只會使問題更加嚴(yán)重。我們應(yīng)當(dāng)首先虛心聽取別人的批評,然后靜下心來,仔細(xì)調(diào)查研究,實事求是地分析,進(jìn)而拿出改進(jìn)措施。

令人遺憾的是,五六年過去了,批斗余音猶在,認(rèn)真的反思,尤其是業(yè)內(nèi)人士的腳踏實地的分析研究寥若晨星,高考測試問題依舊。

筆者不敢稱內(nèi)行,僅憑自己的一些體驗和調(diào)查,試圖對高考測試信度和效度不高的原因作些反思。筆者以為,之所以出現(xiàn)這么嚴(yán)重的問題,肯定與命題指導(dǎo)思想上的缺失,制度建設(shè)不完善,很多工作環(huán)節(jié)欠科學(xué)有關(guān)。

傳統(tǒng)偏見、習(xí)慣勢力、既定的規(guī)范、固有的理論、盲從的心理,把我們禁錮在狹小的天地里。本文主要就命題指導(dǎo)思想方面作些探討.

二.測試指導(dǎo)思想方面存在的問題

以我看來,主要有以下幾個方面:

(一)過于相信經(jīng)驗,測試?yán)碚撉啡?/p>

我國的高考帶有濃厚的“行政”色彩,命題人員普遍缺少足夠的系統(tǒng)的科學(xué)測試知識,或是不大買測試?yán)碚摰膸?測試?yán)碚搶<彝鶎φZ言學(xué)科的特點(diǎn)又不是非常熟悉.他們依靠的主要是經(jīng)驗.

譬如,試題命制完成后的預(yù)測分析,各種標(biāo)準(zhǔn)化測試量表的研制(量化研究不可或缺的工具,其嚴(yán)謹(jǐn)?shù)木幹瞥绦蚺c信效度檢驗,使測量的品質(zhì)得以確保--邱皓政《社會與行為科學(xué)的量化研究與統(tǒng)計分析》五南圖書出版公司2000,8第一版)以及考試完成后成績的統(tǒng)計分析和解釋(“西方發(fā)達(dá)國家十分重視考試成績的研究開發(fā)利用。如,美國每年對大學(xué)入學(xué)考試成績的統(tǒng)計分析就達(dá)幾十種甚至上百種信息資料,然后將其分送給考生畢業(yè)中學(xué)和政府有關(guān)部門,作為中學(xué)教育教學(xué)和政府制定相關(guān)政策的參考?!保R文卿劉文超著《中國高考走向》山東人民出版社2002,3,一版,121~122頁)),這些環(huán)節(jié)都十分欠缺.這就使得我們很難有效地控制試題的各項指標(biāo),不能及時的吸取往年的教訓(xùn)并迅速的作出調(diào)整.我們的高考改革步伐緩慢,試題多少年難以改變模樣,與此有直接關(guān)系.

“我國高考工作者由于缺少教育測量學(xué)的理論與技巧,主要憑經(jīng)驗進(jìn)行工作,在試卷編制上一般只有初步的編制計劃及按這初步計劃編寫試題的簡單步驟,試卷初步編成后,不經(jīng)預(yù)測和數(shù)量化分析,只由編制人員根據(jù)經(jīng)驗作一些主觀的討論、審核,即交付使用.致使試卷編制者本身對他的各項指標(biāo)心中無數(shù),造成歷年來高考難度波動很大,甚至還有出錯題目或出題不當(dāng)?shù)那闆r發(fā)生.”(北京師范大學(xué)心理系高考研究組《改革高考更加準(zhǔn)確有效的選拔人才》)(出處再查)

實行了十幾年的高考標(biāo)準(zhǔn)化考試竟然仍采用老掉牙的原始分相加的方法來計分,說明我們的測試?yán)碚撌嵌嗝吹那啡?“很多實行了標(biāo)準(zhǔn)分制度的六七個省份已經(jīng)取消(山東省于2001年取消)或正在取消,據(jù)說原因僅僅在于某些領(lǐng)導(dǎo)欠缺基本的測試知識.”(馬文卿劉文超著《中國高考走向》山東人民出版社2002,3,一版,32頁)“癥結(jié)主要有兩個,一是統(tǒng)計測量理論沒有為高層決策者所熟悉;二是大眾對其陌生排斥?!保R文卿劉文超著《中國高考走向》山東人民出版社2002,3,一版,118頁)

國際上的語言測試早已發(fā)展到第三個階段--“交際測試”(communicativetesting)階段,而我國的語文高考測試仍停留在第二階段--心理計量-結(jié)構(gòu)主義測試(psychometric-structuralisttesting)的初期,仍然在圍繞著“要不要選擇題”“語文測試要不要精確量化”等本已無需再爭辯的問題糾纏不休.

“交際測試”以完形填空、短文聽寫等題型為典型特征,強(qiáng)調(diào)語境中運(yùn)用,側(cè)重考查學(xué)生運(yùn)用語言的靈活性,對能力認(rèn)識更為全面深刻。而我國的語言測試在這點(diǎn)上幾乎為空白.

“高揚(yáng)科學(xué)的大旗,…走出行政性評價的窠臼.…評價方式上力求創(chuàng)新,走科學(xué)評價的道路,既要做到倫理的善,更要做到邏輯的真和形式的美.”(孔祥沛《淺論傳統(tǒng)文化對我國教育評價制度的影響》《教育科學(xué)研究》年月待查)

(二)重書面表達(dá)輕聽說閱讀

中國古代相對封閉的社會實際以及重人文輕科學(xué)的傳統(tǒng),此外還有“以文取士”科舉制度的影響,使得“寫文章”得到了高得不能再高的社會地位,所謂“天子重英豪,文章授爾曹”,而“聽說”“閱讀”卻被大大的冷落了。此種偏差時至今日依然相當(dāng)嚴(yán)重,并在語文高考上體現(xiàn)出來。

高考試卷中一篇作文幾乎占據(jù)半壁江山(60/150),而意義非常的聽說測試始終不能提上議事日程。(我們的高考第二語言聽說測試早已起步,而且也積累起了不少經(jīng)驗)

這種偏頗的測試方式,遠(yuǎn)遠(yuǎn)不能滿足現(xiàn)代信息社會的需求.在現(xiàn)今社會,“聽”“說”“讀”“寫”四種語言活動中,“寫”的地位應(yīng)該是最低的,前三者的重要性遠(yuǎn)遠(yuǎn)超過后者.“據(jù)專家研究,聽說在一生的語言活動中占到75%,而讀寫只占25%.”(吳昌順<<語文教學(xué)需要科學(xué)化>>,出自<<中學(xué)語文教學(xué)>>2000年第九期)

而傳統(tǒng)觀念里,“讀”也是從屬于“寫”的:“中國以前所謂‘讀寫結(jié)合’只不過是把讀物作為寫作的樣本,作為一種仿效的對象.所謂的‘讀’,只是揣摩作者是如何‘寫’的.閱讀教學(xué),也只是把教材作為一種寫作的模式加以分析,以便對寫作有所裨益.這種觀念,實質(zhì)上是以寫作為中心,閱讀不過是寫作的附庸.”(章熊<<中國當(dāng)寫作作與閱讀測試>>四川教育出版社2000,10第二版47頁)

國外多數(shù)國家的語言測試則不然,其比例很注意和社會的需求相吻合.聽說測試受到高度重視,而且很多國家也舉辦的非常成功.此外,閱讀測試在書面語言測試中的分量也遠(yuǎn)遠(yuǎn)超過寫作測試.以美國的SAT(相當(dāng)于我國的高考)為例,其閱讀領(lǐng)會能力的考查占總分的51%,閱讀短文為五篇(以前為六篇),字?jǐn)?shù)約為2500~3000字;而我國高考閱讀領(lǐng)會短文大致為兩三篇,字?jǐn)?shù)約為1000~1500字,分?jǐn)?shù)比例也低得多。我國高考各科中試題命制科學(xué)性最高(有統(tǒng)計數(shù)據(jù)為證)社會信譽(yù)最好的英語科試題閱讀的短文數(shù)量達(dá)七篇左右,占總分一半還多。

而且,現(xiàn)今寫作能力測試模式迫切需要改革的最重要的理由是:它是導(dǎo)致語文高考信效度不高的罪魁禍?zhǔn)住T蚝芎唵危何覀兊淖魑脑u閱雖經(jīng)不斷改進(jìn),但主觀誤差始終得不到有效控制。

“九十年代初,有關(guān)部門曾經(jīng)連續(xù)做過幾年研究,結(jié)果表明高考語文試卷中的主觀性試題(主要是作文)誤差達(dá)到總分的40%,盡管我們采取了多種方法(制定作文評分量表,計算機(jī)監(jiān)控評分等)…但誤差仍然較大?!保◤垈ッ鳌陡呖颊Z文科考試內(nèi)容與形式的改革》《中國考試》1999,1期)

作文的評分誤差巨大是個不爭的事實,很多的調(diào)查早已給出了駭人的評分差距.但筆者認(rèn)為,在大規(guī)??荚囍?誤差還要大得多,因為這里面有個“動機(jī)效應(yīng)是值得注意的。黃煜烽等人的研究中曾經(jīng)讓一位教師在不到一年的時間里兩次批閱同一篇作文。第二次批改時,作文前加上‘組織教師批改這篇作文的目的旨在測試語文教師對學(xué)生作文水平的鑒定水平,以此作為衡量教師批改作文能力的指標(biāo)’這樣一段話作為動機(jī)暗示。結(jié)果,第一次評85分,第二次評72分,相差13分;第一次的評語是‘文章結(jié)構(gòu)完整,用詞恰當(dāng),注意了旁征博引,語言老練、簡明’第二次的評語是‘本文結(jié)構(gòu)欠嚴(yán)謹(jǐn)和完整,觀點(diǎn)和材料不盡統(tǒng)一,語言上也有毛病’,從肯定變成了否定,截然相反?!?章熊<<中國當(dāng)寫作作與閱讀測試>>四川教育出版社2000,10第二版69頁)

高考閱卷很大程度上還帶有大鍋飯性質(zhì),監(jiān)督不嚴(yán),建立老師評卷檔案等工作幾乎為空白,閱卷老師的認(rèn)真度是有限的;而應(yīng)付調(diào)查時,作為調(diào)查對象,因為特別在意調(diào)查結(jié)果對自己造成的影響,必然慎之又慎,再加上調(diào)查時的勞動強(qiáng)度也無法和高考這類大規(guī)??荚囅嗵岵⒄?。

高考作文評閱存在的主要問題是:

(1)投入少時間短,導(dǎo)致勞動強(qiáng)度大

時間過長會增大誤差,但太短更會草菅人命.由于時間太短作文批改打保險分的現(xiàn)象非常嚴(yán)重

“《南方周末》曾對高考閱卷作過報道:近30萬份作文,規(guī)定180位老師在10天內(nèi)改完,除去每天高溫休息一小時,其余七小時不喝水不上廁所不與人說話,在每篇作文上也只能停留70秒?!保ɡ钊骸堉协h(huán)《關(guān)鍵是怎樣操作》《中學(xué)語文教學(xué)》2003,6)

“集中全日閱卷,根據(jù)各試驗省份的經(jīng)驗,以日平均90份左右為宜”(章熊<<中國當(dāng)寫作作與閱讀測試>>四川教育出版社2000,10第二版265頁),實際的批閱數(shù)量若干倍于此.

(2)趨中主義

.評分既不高也不低,高度集中在中部偏上的狹小區(qū)間內(nèi),既能夠保證閱卷速度,又不容易讓復(fù)查人員抓住把柄.

“據(jù)江西戴海崎、曹紹游就1987年高考試卷隨機(jī)抽取的2700人樣本統(tǒng)計,二類卷和三類卷占總數(shù)的86%,一類卷和五類卷合起來僅占6.6%,四類卷占7.4%,成峰值極高的偏態(tài)分布…產(chǎn)生的原因大約有兩個:一是‘打保險分’,二是連續(xù)作戰(zhàn)統(tǒng)一疲勞,反應(yīng)的靈敏度降低,區(qū)分能力減弱.、據(jù)江西省1990年高考閱卷7月13日、14日和十六日三天的抽樣統(tǒng)計(樣本數(shù)一千左右),平均分從22.69分(滿分40分)上升為24.33分,標(biāo)準(zhǔn)差則從7.67降為5.97,說明分?jǐn)?shù)的離散程度越來越小,趨中傾向越來越嚴(yán)重?!?章熊<<中國當(dāng)寫作作與閱讀測試>>四川教育出版社2000,10第二版67~68頁)

(3)思維定勢:

由于閱卷強(qiáng)度過大,所以文章的書寫、篇幅、謀篇(開頭結(jié)尾的安排受到格外重視)等外在因素很大程度上決定了考生的得分。主要由這些因素構(gòu)成的第一印象一旦確立,就很難再改變.

(4)責(zé)任心差

很大原因歸咎于制度不全監(jiān)督不力.這兒既有閱卷老師的責(zé)任心問題,也有復(fù)查領(lǐng)導(dǎo)的責(zé)任心問題.

“有的閱卷的研究生經(jīng)常遲到早退,‘一位女博士戴著隨身聽,一邊聽音樂一邊改卷’;‘一高校的副研究員不知為什么年年來閱卷,它改作文判分一半有誤,有一次查他改的三篇作文,總誤差竟達(dá)三十多分’;一位老師30份作文錯判十分以上的有三份(那一年是40分的大作文)…有一本30份的作文幾乎全是42和43兩個分?jǐn)?shù)。有個組長表揚(yáng)一個青年教師,說他一天改了二十多本作文…復(fù)查能挽救幾個人呢…每次閱卷結(jié)束時,心里都很沉重?!保ɡ钊?、張中環(huán)《關(guān)鍵是怎樣操作》《中學(xué)語文教學(xué)》2003,6)

目前的高考寫作測試模式必須改革,而且,此改革是切實可行的。國外的成功經(jīng)驗早已證明了這一點(diǎn).

改革的方向當(dāng)然首先是增加聽說測試;其次,是改變大作文占分過多的局面,途徑又有二:(1)大作文題轉(zhuǎn)化為小型作文題(有兩個小作文的語文試卷信度效度明顯高于一個大作文題的試卷)和各種靈活的主觀題(2)使用客觀題來考查寫作能力.

圍繞是否繼續(xù)使用選擇題的爭論,尤其是對使用選擇題來考查寫作能力的爭議.美國最大的考試研究機(jī)構(gòu)教育測驗服務(wù)中心(ETS),從1954年起進(jìn)行了長達(dá)三年的試驗研究??荚嚨挠行詷?biāo)準(zhǔn)是語文教師對學(xué)生作文水平一年或一年以上的觀察結(jié)論。結(jié)論是:SAT(學(xué)習(xí)能力傾向測驗,主要是客觀題)的效度最高,與語文教師基于長期觀察對學(xué)生寫作能力作出的主觀評價最一致;其次是由客觀性試題組成的ECT(英文寫作水平考試,全為選擇題),最差的是由作文題目組成的GCT(普通寫作測驗,兩個小時的作文考試)。(D.Owen:Noneoftheabove,Rowman&LittlefieldPublishers,INC,Lanham,1999,27~29頁)“正是基于這樣的研究,才使其后的40年中客觀性選擇題成為美國語言能力測試的主要題型.”(謝小慶《談?wù)Z言能力的考查》《中學(xué)語文教學(xué)》2003,6)

有人質(zhì)疑:現(xiàn)在的國際趨勢是增大主觀題的數(shù)量,特別是增大作文的分量,咱們怎么能逆國際潮流而動呢?這兒有一個前提,國外主觀題的評分比我們更有保障。尤其是國外作文量化水平較高,評分的客觀化程度較高.(電子記分員的啟用明顯提高了打分的客觀性)

“美國長期使用選擇題,出現(xiàn)了‘高分低能’的現(xiàn)象,轉(zhuǎn)而求助于主觀性試題.我們始終主要采用主觀性試題,結(jié)果導(dǎo)致了更加嚴(yán)重的‘高分低能’,這不能不引起我們的深思.”(于新鳳《考試學(xué)引論》遼寧人民出版社)

由此看來,題型的選擇未必是測試中最重要的因素.相對而言,試題的命制水平、施測的標(biāo)準(zhǔn)化水平和客觀化水平應(yīng)該是更重要的因素.

還有人說漢語和英語等語言不同.的確,我們承認(rèn)漢語的彈性張力模糊性是更強(qiáng),但我們同時認(rèn)為:同為語言,漢語和其他語言沒有質(zhì)的差別,夸大這一點(diǎn)就缺少了最起碼的科學(xué)態(tài)度;而且,作為量化集中體現(xiàn)的測試,更不宜在模糊性上大做文章,那樣只能使得試題變得更加玄乎其玄.

有人擔(dān)心,降低大作文的分值勢必影響中學(xué)作文的教學(xué).當(dāng)然,這種擔(dān)心不無道理,但審視現(xiàn)在的中學(xué)作文教學(xué),我們不僅充滿了疑惑:(1)我們的應(yīng)試作文都訓(xùn)練了些什么呢?很多中學(xué)將主要的精力都放在了‘新八股’的制造上了,形式主義泛濫,作文教學(xué)日益走向死胡同。“‘三個一’工程”(即寫一手好字,擬一個好題目,起一個貌似不俗的開頭)長期以來風(fēng)靡全國很多地區(qū),一點(diǎn)也不令人感到奇怪.(2)看看我們學(xué)生的作文就知道我們投入了那么多精力大搞特搞的作文訓(xùn)練究竟有多大成效.以筆者看來,靈活多樣的寫作能力測試方式(通過聽說測試、各種類型的主客觀題)對中學(xué)教學(xué)的引導(dǎo)作用或許更好.

總之,提高作文測試信度效度的途徑主要有二:(1)加快主觀題(尤其作文)評分的客觀化進(jìn)程(制定科學(xué)的評分量表;嘗試無紙化評閱-廣西在這方面已有較為成功的嘗試;啟用電子閱卷員等等)(2)主觀題型的客觀化

而且,就我國的實際情況而言,后者可能是近期內(nèi)比較可行的辦法.

(三)實踐性缺失

前面曾提到語言測試?yán)碚摰那啡?實際上,相對測試?yán)碚摱?我們的高考更欠缺的是實踐性.

我國傳統(tǒng)重主觀體驗,輕客觀實證,加上“官本位”和“大一統(tǒng)”思想的影響,我們的測試向來不大善于從實際出發(fā),思維行事從來就是一種“自上而下”式的,上層的官員專家多憑自己的學(xué)識和對下面有限的了解,想當(dāng)然的組織測試。

“‘德性’文化傳統(tǒng)使得評價更多的是一種人文主義的評價模式,過分強(qiáng)調(diào)了評價的民主性和倫理性,而忽視了評價以客觀事實為基礎(chǔ)的原則.”(孔祥沛《淺論傳統(tǒng)文化對我國教育評價制度的影響》《教育科學(xué)研究》年月待查)

我國政府及團(tuán)體組織的大規(guī)模實際調(diào)查與國外相比少得可憐.我們的借口總是很多,但我看主要原因是惰于實踐,譬如,關(guān)聯(lián)效度的調(diào)查研究,我們的借口總是效標(biāo)難以確定.實際的原因是懶于嘗試,怕麻煩,不敢直面現(xiàn)實改革.美國的很多大型關(guān)聯(lián)效度調(diào)查都以老師對學(xué)生一年以上的觀察作為效標(biāo).筆者也覺得,將教師綜合評估的一部分學(xué)生的平時成績(比如說每班選二三十名,最少基于一年以上的觀察)作為效標(biāo),來衡量高考成績的有效性,可能是個不錯的參照標(biāo)準(zhǔn)。可惜沒有人深入做調(diào)查,偶爾有人嘗試,要么淺嘗輒止,輕率結(jié)論;要么阻力重重,不得不放棄.(在我國,民間性質(zhì)的調(diào)查由于種種原因更是難上加難)

1.試題內(nèi)容和測試方法忽略學(xué)生實際

(1)對課本的徹底拋棄

在我國目前這種‘一考定乾坤’的人才選拔制度下,徹底不考課本,只會導(dǎo)致拋棄課本;無本可依、見效緩慢(再加上成績偶然性大),只會導(dǎo)致放棄語文學(xué)習(xí).

多年來高考命題在內(nèi)容選擇上有一個指導(dǎo)原則:所選材料應(yīng)主要來自課外,以測試考生運(yùn)用已知知識來解決未知問題的能力。應(yīng)當(dāng)說這一原則是對的,但筆者認(rèn)為近些年的高考命題在這一點(diǎn)上做得有些絕對,一定程度上忽略了中國的國情。“主要”不是“不出”,近十幾年的題目幾乎杜絕了課本上的內(nèi)容。這導(dǎo)致了高中生不愿意上語文課,不重視語文課文學(xué)習(xí)的現(xiàn)狀。

筆者想提醒命題者的是:語文考試不應(yīng)完全模仿數(shù)學(xué)類考試--定理公式是課內(nèi)的,題目完全是課外的。(這樣,只要學(xué)生學(xué)好了課本,就能考出好成績.語文呢?課本對于考試的作用微乎其微,學(xué)與不學(xué)差不多.)語言的學(xué)習(xí)畢竟有它自己的一些特點(diǎn),譬如說,名言佳篇的背誦默寫就完全是考查學(xué)生的記憶情況,這往往是語言學(xué)習(xí)和語言測試所必不可少的。

語文學(xué)科平時的教與學(xué)缺乏一個有效的抓手和平臺,由此導(dǎo)致語文課本使用的困惑和混亂.(有些學(xué)校甚至用一年的時間就能完成三年的任務(wù))

語文是應(yīng)該更開放更靈活,但目前的國情是:大學(xué)尚不能普及,大學(xué)入學(xué)選拔只依靠僅有的一次考試,全國各地發(fā)展?fàn)顩r極不平衡,高考競爭依然激烈;此外,語文高考測試科學(xué)化水平較低,學(xué)生成績波動太大太經(jīng)常.鑒于此,掌握好試題的開放度和靈活度就顯得尤其重要.否則,學(xué)生必然會將語文學(xué)習(xí)時間轉(zhuǎn)向其他學(xué)科.

并非只有考課外才能有效地區(qū)分學(xué)生。課內(nèi)知識一定比例講究方式的考查,不僅能夠在一定程度上解決中學(xué)語文無本可依的尷尬,而且照樣能夠測出學(xué)生的真實水平.舉個例子,考成語,完全可以從中學(xué)語文課本內(nèi)部出些題目,選學(xué)生學(xué)過的常用詞語的常用義項,改變語境,進(jìn)行考查.

(2)遠(yuǎn)離學(xué)生實際

高考語文測試,既不能離開語文學(xué)科的特點(diǎn),也不能脫離高中學(xué)生的實際--政治、科技、文化類已有的學(xué)科基礎(chǔ)知識以及他們生理心理的發(fā)育狀況.

我們的高考命題卻常常忽略這一點(diǎn),存在著較為嚴(yán)重的“專業(yè)化”“成人化”傾向

很多現(xiàn)代文閱讀題內(nèi)容具有明顯的專業(yè)化傾向--古文化探源、詩的哲理、基本粒子中的中微子、智力結(jié)構(gòu)模式、應(yīng)激激素和迷走神經(jīng)等等,離學(xué)生的生活太遠(yuǎn).

科技短文考查力度的確應(yīng)該加大,這符合現(xiàn)代社會的需求.但有一點(diǎn)必須要搞清楚:我們必須在平時的教材里和學(xué)生的生活中,補(bǔ)充大量的科技時文,有了這個鋪墊,學(xué)生在考試時就不會感覺到突兀.然而,我們中學(xué)的教材編排和教學(xué)活動,在這一點(diǎn)上做得很不夠.“國內(nèi)教材忽視現(xiàn)代科技時文不能不說是個遺憾.而國外更加注重從現(xiàn)代社會的實際需要出發(fā)選文,以培養(yǎng)學(xué)生的現(xiàn)代科技意識,增長學(xué)生的現(xiàn)代科技知識,增強(qiáng)學(xué)生對現(xiàn)代社會的適應(yīng)能力…他們的選材內(nèi)容十分廣泛,幾乎涵蓋了生活的各個方面-報刊新聞,規(guī)章條文,科技說明文,推理小說,科幻小說都進(jìn)入教材.例如法國有一套語文閱讀教材,每冊十幾個單元都有個中心主題,其中包括‘現(xiàn)代生活’‘科學(xué)技術(shù)’‘時代問題’等等.而國內(nèi)僅有的說明文大多是些實體說明文,涉及現(xiàn)代科技的是少之又少.”(張承明《中外語文教育比較研究》云南教育出版社2000,10第一版)

此外,很多閱讀文段的文字表達(dá)和中學(xué)生的實際生活距離遙遠(yuǎn).“以往往往選擇二三十年代的文章,這些文章在詞語的用法上與現(xiàn)代人有些差別,文章中的一些背景知識學(xué)生不了解,這就增加了學(xué)生答題的難度”(張偉明《再談?wù)Z文到底考什么》《語文教學(xué)通訊》1999,2)

“前幾年高考中出現(xiàn)的成語誤用和病句,材料大多來自報刊雜志,應(yīng)該說他們是專業(yè)編輯人員認(rèn)可或通過的東西,雖有不當(dāng)之處,但很隱蔽,一般人看不出來,而且也不十分影響表達(dá),有的則完全是大學(xué)中文系語法教材里面的例子,拿這些東西來考涉世未深的高中生是勉為其難的…決不是要所有的學(xué)生都成為語言學(xué)家或語法學(xué)家.”(《語文教學(xué)通訊》2001,22期,盛華明《讓語文考試更貼近實際》)

作文命題“政治化”“成人化”等傾向,無意中加重了學(xué)生“說假話”“空洞無物”的弊病,從而又在一定程度上降低了作文的區(qū)分度(都覺無話可說,都撒謊瞎編).試看下面一些題目:“毀樹容易種樹難”“致光明日報編輯部的信”(關(guān)于環(huán)境污染問題)“樹木·森林·氣候”“議論‘花與刺’”(關(guān)于辯證的看待事物)“‘近墨者黑’或‘近墨者未必黑’”“先天下之憂而憂,后天下之樂而樂”“看‘截肢’漫畫寫感受”(關(guān)于責(zé)任心問題)“讀材料‘紅雨衣踢碎玻璃罐’寫感受”(關(guān)于社會公德心)“堅韌-我追求的品格”“誠信”“心靈的選擇”…

我們的高考作文承載了多少“政治教育”“道德說教”的重任,承載了多少成年人對于年輕人的良苦用心!

然而,這些用意到底能產(chǎn)生多少實際效果,有誰做過實際的調(diào)查研究呢?

看一看我們的孩子們作文時苦思冥想來適應(yīng)成年人思路的痛苦模樣,看一看高考作文試卷上幾乎千篇一律的翻來覆去重復(fù)著的空話和為了贏得高分編造出來的一個個‘凄慘’的故事,看一看孩子們“談作文色變”避之唯恐不及的神情…

我們?yōu)槭裁床蝗シ此甲陨淼膯栴},而是一味的批評孩子們沒有實際生活感受,寫作能力差呢?

2.命題對閱卷執(zhí)行實際缺乏足夠考慮

我們的閱卷情況很不理想,這是個不爭的事實.要提高命題的科學(xué)性就必須充分考慮這一點(diǎn).

從理論上講,主觀題相對客觀題目應(yīng)該具有更高的效度,但從批閱實際角度來看則不然.既然高考試卷的首要職責(zé)是區(qū)分選拔學(xué)生,那么我們?yōu)楹畏炊浟烁径プ非蟊砻娴目茖W(xué)呢?

關(guān)于作文的問題及改革方案,請參照上文.

3.制定的作文評分標(biāo)準(zhǔn)缺乏可操作性.

我們制定的作文評分標(biāo)準(zhǔn)貌似科學(xué),很難落實,以至于閱卷老師們試批時或批閱之初,還按評分標(biāo)準(zhǔn)打分.之后很快就又回歸到打一個囫圇的總分的老路上去了.批閱時間短,勞動強(qiáng)度大,制定的標(biāo)準(zhǔn)形同虛設(shè).

4.閱卷教師的選拔標(biāo)準(zhǔn)缺少實踐調(diào)查的支持,多憑想當(dāng)然.

我們?nèi)狈茖W(xué)嚴(yán)格閱卷老師資格審查制度.

“1991和1992年,河南省招辦和河南大學(xué)教育系、中文系聯(lián)合對高考閱卷人員的組成問題進(jìn)行了大規(guī)模的調(diào)查,結(jié)果出乎一般人預(yù)料,也是令人深思的。結(jié)論是:高校教師、職稱高的老師、年齡大的老師評分誤差明顯大于中學(xué)教師、職稱低的老師、年齡小的老師?!?章熊<<中國當(dāng)寫作作與閱讀測試>>四川教育出版社2000,10第二版70~72頁)

由此可見,我們平時想當(dāng)然的觀念里面潛藏著多少主觀臆想的成分,我們的行動多么缺少實際調(diào)查的支持!而現(xiàn)在很多省份的高考閱卷仍然主要由一所大學(xué)承包(閱卷老師主要由大學(xué)老師及一些碩士生和博士生組成)的事實,說明了我們的有關(guān)部門是多么不重視此類的調(diào)查研究(此后沒再做類似的調(diào)查研究),改革是多么的困難!

(四)“數(shù)量”觀念匱乏

國人向來重主觀體驗輕理性實證,重定性分析,輕定量研究,語文因而長期停留在一種“運(yùn)用之妙,存乎一心”的撲朔迷離的狀態(tài)。語文的量化水平低下,語文效率很不理想.

葉老在20世紀(jì)80年代初就曾呼吁,對學(xué)生語文方面的能力“必須達(dá)到什么程度”,進(jìn)行認(rèn)真的調(diào)查研究,從而“形成一個周密的體系”.可惜的是,這種心中無數(shù)的狀況至今沒有多大改變.

無論是教學(xué)大綱,還是考試說明,都十分缺乏量的規(guī)定.教者只能憑感覺,憑大致的把握.這樣的教學(xué)也能培養(yǎng)少數(shù)的語文精英,卻絕不適合大批量的生產(chǎn)――我們中學(xué)語文教育的目的在于培養(yǎng)大批量的具有合格的聽說讀寫能力的現(xiàn)代青年,而不在于培養(yǎng)少數(shù)的語文精英.

“效率”是現(xiàn)代社會的重要特征,“量化”是“規(guī)模效益”之必需,無“規(guī)模效益”何談高效率?

自人類社會進(jìn)入信息時代以后,科技的發(fā)展更加日新月異,人們生活的節(jié)奏越來越快,辦事效率也越來越高--需要更快的處理更多的信息(尤其是高速膨脹的科技信息).語言的學(xué)習(xí)運(yùn)用以及測試?yán)響?yīng)緊跟時展的步伐.我們祖上傳下來的語言學(xué)習(xí)和運(yùn)用上的“體悟癥”“探究癖”理應(yīng)遭到信息化社會的唾棄.處理語言信息的敏捷性和靈活性應(yīng)該是語言測試的一個極其重要的目標(biāo).

顧德希說:“母語教學(xué)如何適應(yīng)現(xiàn)代化的問題一直沒有解決”

“數(shù)量”這個概念,在語文界乃至我們整個社會都十分缺乏.鑒于此,有必要再重新認(rèn)識幾個概念.

1.再談“量”“量化”

唯物辯證法告訴我們,“質(zhì)”是一事物成為它自身并區(qū)別另一事物的內(nèi)在規(guī)定性,“量”是表示事物存在的規(guī)模、程度、速度以及構(gòu)成事物要素在空間中的排列組合等的數(shù)量的規(guī)定性.任何事物都是質(zhì)和量的統(tǒng)一.質(zhì)是具有一定量的質(zhì),量也總是一定質(zhì)的量,一定事物的值總以一定的量來表現(xiàn),世界上不能量化的質(zhì)是不存在的.因此,只有既作定性分析,又作定量分析,才能正確認(rèn)識事物.

按一般規(guī)律,社會科學(xué)的研究由定性到定量再到二者結(jié)合,是學(xué)科成熟的表現(xiàn),是其科學(xué)化的表現(xiàn).

“量化,簡單的說就是要數(shù)字化,即用數(shù)字說明問題.它具有客觀性,準(zhǔn)確性,廣泛性(建立在大量抽樣統(tǒng)計的基礎(chǔ)上,遠(yuǎn)勝于個案分析),深刻性(描述和解釋是基礎(chǔ)的,預(yù)測和控制才是科學(xué)研究的最高目標(biāo),這些都要借助于量化),普及性”(佟慶偉等著《教育科研中的量化方法》)

量化標(biāo)志著分析方法的科學(xué)水平,其主要功能是實證.而且,量化研究早已成為當(dāng)代社會與行為科學(xué)的強(qiáng)勢典范

“人類追求知識的活動,逐漸從啟蒙運(yùn)動之后的唯心傳統(tǒng),配合19世紀(jì)末數(shù)學(xué)與邏輯的發(fā)展,走上一條量化、實證、非歷史、非心理的科學(xué)實證典范.以數(shù)學(xué)為基礎(chǔ)的符號邏輯思考體系,取代了亞里斯多德以來的形式邏輯概念,發(fā)展出以量化研究為主軸的科學(xué)研究典范.…實證主義下的符號邏輯思考體系,仍是當(dāng)代科學(xué)研究的主流思想,量化研究仍是學(xué)術(shù)訓(xùn)練的主要研究方法.”(邱皓政《社會與行為科學(xué)的量化研究與統(tǒng)計分析》五南圖書出版公司2000,8第一版)

桑代克和麥柯爾有兩句名言:“凡是客觀存在的事物都有其數(shù)量”“凡是有數(shù)量的事物都可以測量”(轉(zhuǎn)引自范偉達(dá)《現(xiàn)代社會研究方法》復(fù)旦大學(xué)出版社)有些事物現(xiàn)在不能量化,只能說明量化的水平還不夠,將來某一天肯定能量化.

“馬克思說:一門科學(xué)只有成功的運(yùn)用了數(shù)學(xué)時,才算真正成為科學(xué).”(孫建軍等著《定量分析方法》南京大學(xué)出版社2002,9第一版,第三頁)

“科學(xué)的本質(zhì)是數(shù)”(笛卡爾)“宇宙這本書是用數(shù)學(xué)語言寫成的,沒有它們,人就在一個黑暗的的迷宮里勞而無功的游蕩著.”(伽利略)(轉(zhuǎn)引自郭俊義《廣義量化引論》江西高校出版社91,9第一版)

“缺乏數(shù)字處理技巧和文盲一樣,將被這個社會拋棄.透過復(fù)雜瑣碎的數(shù)字抓住問題本質(zhì)的技巧,將鼎力助您作出英明決策.”〖(英)約翰·鮑威爾著《定量決策分析》李潔、林毓銘等譯上海遠(yuǎn)東出版社1998,8第一版第一頁〗

不重視量化是小生產(chǎn)者的狹隘眼光和傳統(tǒng)觀念.

孟子說“權(quán)然后知輕重,度然后知長短?!保ㄞD(zhuǎn)引自范偉達(dá)《現(xiàn)代社會研究方法》復(fù)旦大學(xué)出版社)“考試既然是對人的知識與能力的測量,就必須用數(shù)量表示它的結(jié)果,有考試就有統(tǒng)計分析,甚至可以說,考試就是經(jīng)過測量所作的統(tǒng)計分析。”

2.我們的高考語文測試特別欠缺“數(shù)量”“效率”觀念

(1)考試題量有限,不重視對學(xué)生反應(yīng)敏捷性的考查.

一般的來講,試卷長,覆蓋面廣,題目多,區(qū)分度高.題量小,覆蓋面就小,這勢必會增大考試結(jié)果的偶然性.

好的命題要兼顧質(zhì)量和數(shù)量,一道題設(shè)計得再高明,也不能準(zhǔn)確測出全體學(xué)生的真實水平.

此外,思維的敏捷性作為語文基本能力的重要組成部分,其重要性在現(xiàn)代社會越來越凸顯.忽視這方面的考查,無疑是高考測試的一大失誤.

“伊薩克(Eysenck)說:感知及其過程的速度,實際上是重要的高級認(rèn)知技能.”〖(英國)阿美·戴維斯《語言測試學(xué)原理》任福昌、吳平等譯,經(jīng)濟(jì)科學(xué)出版社1997,12第一版〗

先對中美語言測試的閱讀量作一個比較:

美國的SAT(相當(dāng)于我國的高考)言語部分特別注重閱讀領(lǐng)會能力(占總分的51%),要求考生通過閱讀獲取新的信息回答有關(guān)問題?!皖}量而言,新SAT言語部分的題量為78題,時限為75分鐘,為我國高考語文的兩倍?!覈呖奸喿x領(lǐng)會的短文大致為2~3篇,字?jǐn)?shù)約為1000~1500字;新SAT閱讀領(lǐng)會的短文為五篇,字?jǐn)?shù)約為2500~3000字,再加上40個問題的題干,閱讀量是我國的兩倍多。舊SAT為六篇,閱讀量更大。

再和高考英語試題比較一下.英語閱讀大概有八篇(包括聽力,閱讀理解短文和完形填空等),其余語法、詞匯等客觀題的題量更為語文試題的若干倍,只是作文少了些.為何英語測試的效度和信度在各科中是名列前茅的呢?同是語言類學(xué)科,相去天壤,這難道不值得我們語文同仁反思嗎?難道僅僅是因為英語在難度上要求低嗎

以數(shù)量有限的試題來區(qū)分學(xué)生,必然會在題目的“質(zhì)量”上下功夫,而這很容易導(dǎo)致“難”“偏”“怪”題泛濫.

遺憾的是,現(xiàn)在有很多人呼吁減少高考題的題量,以便讓學(xué)生有充足的時間思考,更利于水平發(fā)揮.(筆者認(rèn)為,再增加一個小時,也不見得有多少改觀.病根在于試題難度過大,而不在于題量過大.)

(2)很多領(lǐng)域的數(shù)量指標(biāo)嚴(yán)重欠缺,各種標(biāo)準(zhǔn)化的測驗量表亟待完善.

譬如,詞匯量表的制定.這應(yīng)該是教學(xué)和測試中量化的基礎(chǔ)一環(huán).

特定領(lǐng)域中哪些詞匯是最基本最常用的;詞義中的哪個義項是常用的.這些情況都要借助大規(guī)模的統(tǒng)計分析來搞清楚.否則,對詞匯量的科學(xué)考查便無從談起.我們的高考詞匯題目往往考查一些不大常用的偏僻詞匯和偏僻義項來區(qū)分學(xué)生,這也是這些題目屢遭詬病的主要原因之一.而英語測試早已解決了這一問題.師生平時學(xué)習(xí)的目標(biāo)很明確.考試所測也主要是平時所學(xué)詞匯(當(dāng)然也有少數(shù)超綱的).學(xué)生水平區(qū)分主要體現(xiàn)在反應(yīng)的敏捷性、判斷的準(zhǔn)確性和運(yùn)用語言的靈活性上.所以,英語的教學(xué)和測試就相對實在,好把握得多,師生的怨言也少得多.

再如閱讀量表的制定.閱讀能力可以從閱讀速度、閱讀材料難易度和閱讀理解等方面來進(jìn)行定性和定量分析.前二者是可以量化的.

國外對閱讀速度的重視由來已久,也早已制定了非常完備的閱讀速度量表.“世界范圍內(nèi)的快速閱讀已從理論發(fā)展到實際訓(xùn)練階段,最近20年里,法、美、英、前蘇、日、巴西等國先后成立了全國性的閱讀指導(dǎo)組織.速讀是其指導(dǎo)的重要內(nèi)容.”(祝新華《語文能力發(fā)展心理學(xué)》杭州大學(xué)出版社1993版)

國內(nèi)的英語考試也早已制定了閱讀速度的指標(biāo).(大學(xué)四級考試要求50w.p.m,六級70w.p.m)(查高考指標(biāo))

閱讀材料易讀度(readability)的計算公式國外也有很多種。例如Flesh公式:RE=206.84-0.85wl-1.02sl(RE為易讀度指數(shù)wl為每100詞音節(jié)數(shù)sl每句平均詞數(shù))(楊惠中《語言能力的分級測試》,《考試研究》2002年第一輯61頁)我國的英語考試常用Flesh公式來計算閱讀材料的難易度。易讀度只有合于一定的范疇才能入選某種類型的試題。而我們的高考閱讀考試說明只有類似“閱讀‘淺易的…文章’”“閱讀‘一般的…作品’”這樣一些模糊的要求。

閱讀理解主要屬于定性分析。這一點(diǎn)國外也有很多成果值得我們借鑒。

此外,國外還有很多關(guān)于語言微技能的量化標(biāo)準(zhǔn)。

作文能力量化標(biāo)準(zhǔn)更是急需完善的一個項目。

譬如說,錯別字、詞語誤用、病句,這些方面到底扣不扣分?達(dá)到幾個開始扣分?扣多少分?這些一直都是糊涂帳。閱卷人員多是憑感覺來減分。然而,高溫高強(qiáng)度下的感覺又有多少準(zhǔn)確性可言呢?或許一篇不錯的文章,因為題目是個病句就給槍斃了;或許無意中瞅見的一個非常反感的錯別字(可能自己在教學(xué)中強(qiáng)調(diào)過幾百次了),就使得閱卷老師的情緒一下子激憤起來,此作文因而失去多少分只有天知道。凡此種種,舉不勝舉。

當(dāng)然,即使有了比較科學(xué)的量化標(biāo)準(zhǔn),如果仍然采用人工高強(qiáng)度閱卷的話,這些標(biāo)準(zhǔn)仍然難以落到實處。所以,要使這些量化標(biāo)準(zhǔn)發(fā)揮作用,還得加快作文批閱的客觀化進(jìn)程,尤其要積極嘗試計算機(jī)閱卷。這在上文已經(jīng)探討過。

美國的“托?!焙虶MAT寫作評分中,共有“詞匯使用、句子結(jié)構(gòu)、文章組織、寫作邏輯、修辭、論述條理、文章內(nèi)容等諸多因素,統(tǒng)計了包括文章長度、平均詞長度、平均句長度、詞頻率、句式結(jié)構(gòu)、標(biāo)點(diǎn)使用等在內(nèi)的共60多種可以定量分析的指標(biāo)…”(謝小慶《談?wù)Z言能力的考查》《中學(xué)語文教學(xué)》2003,6)

他們這些量化標(biāo)準(zhǔn)能得以很好的落實,主要在于啟用了“電子評分員”。

3.令人遺憾和不解的是,時至今日,反對語文“量化”之聲仍不絕于耳.

“追求語言水平的精確量化,或試圖把人的語言能力發(fā)展劃分出精細(xì)的等級,諸如此類的努力,其意義和價值都值得懷疑?!?/p>

“百年來,語文教學(xué)最大的失誤是什么?是所謂‘科學(xué)化’--理性的分析研究,已經(jīng)使語文這個生命體沒有了生命的感覺?!?/p>

主要原因在于,一些傳統(tǒng)的獲取知識的方法在我國仍然很有市場,對各種定量分析方法缺乏足夠的信心,同時也是過分相信充滿人類智慧的文化知識不能簡化為純粹的數(shù)字的結(jié)果

.“Helmstadter(1970)指出:傳統(tǒng)的獲取知識的方法有(一)慣常法(themethodoftenacity):基于慣例、傳統(tǒng)及先入為主的印象或觀念,過去總是如此或天經(jīng)地義之事,便認(rèn)為是真實可信的。(二)權(quán)威法(themethodofauthority):權(quán)威的個人團(tuán)體或典籍。(三)直覺法(themethodofintuition):人們的觀念與知識訴諸于直觀與直覺,人們相信自己的經(jīng)驗判斷與知覺,從個人的頓悟與奇想中,發(fā)現(xiàn)新的想法與概念。(四)強(qiáng)調(diào)推理或推論的可靠性,認(rèn)為只要推理或推論是對的,所得的結(jié)論便是真實或可信的?!保ㄇ耩┱渡鐣c行為科學(xué)的量化研究與統(tǒng)計分析》五南圖書出版公司2000,8第一版)

我們承認(rèn),語文有很多模糊難以量化的地方(例如語文中的文化因素、情感因素等等),這樣的地方就不妨先讓它模糊著。但不可否認(rèn),有更多的地方是可以量化也必須要量化的,尤其是中小學(xué)領(lǐng)域里的基礎(chǔ)知識和基本能力方面。

"我認(rèn)為現(xiàn)在的中學(xué)語文教學(xué)和測評倒不是科學(xué)主義泛濫,而是科學(xué)主義嚴(yán)重不足"(顧德?!墩Z文教學(xué)的病根》)

令人遺憾的是,我們的高考閱讀量很少,測試方法還深深地打著傳統(tǒng)的“體悟癥”“探究癖”(悟文析法,一切為寫作服務(wù))的痕跡.閱讀題目的設(shè)置玄玄乎乎,像擺迷魂陣.

“前幾年的高考精讀題目,任意挖壁打洞,圈圈點(diǎn)點(diǎn),條條框框,搞得面目全非。選擇項的設(shè)置差別微細(xì),玄玄乎乎,云里霧里…我們不禁要問:我們是否是在培養(yǎng)老學(xué)究?人們平時的閱讀是這個樣子嗎?”“1996的科技說明文閱讀中的‘示范廠’‘小規(guī)模工廠’‘正式規(guī)模的工廠’‘小型廠’等概念,文章本身就表達(dá)不清,令人費(fèi)解…選材欠當(dāng);97年科技文中的‘顱腦’和‘腸腦’,不用說中學(xué)生聞所未聞,就是生物老師和一般醫(yī)務(wù)人員也不太清楚,用如此專業(yè)化的東西考學(xué)生實在太離譜”(《語文教學(xué)通訊》2001,22盛華明《讓語文考試更貼近實際》)

“對效度威脅的因素之一:每個目標(biāo)的項目太少。有時候一個成績測驗的是某種技能是否存在,而依靠的卻只是一兩個題目…”“一個工具需要的財力人力越多,那么如果它的信度是低的話,越是要慎重考慮是否采用。”(出自小筆記本-書名作者待查)

“我國學(xué)科成就考試偏重測量學(xué)科知識及其應(yīng)用,例如,我國語文高考強(qiáng)調(diào)常識、語法、文章結(jié)構(gòu)等等知識;美國的SAT言語部分則強(qiáng)調(diào)言語概念的把握、詞匯量,重視概念之間的關(guān)系的揭示及邏輯推理(類推),特別注重閱讀領(lǐng)會能力(占總分的51%),要求考生通過閱讀獲取新的信息回答有關(guān)問題。…就題量而言,新SAT言語部分的題量為78題,時限為75分鐘,為我國高考語文的兩倍。…我國高考閱讀領(lǐng)會的短文大致為2~3篇,字?jǐn)?shù)約為1000~1500字;新SAT閱讀領(lǐng)會的短文為五篇,字?jǐn)?shù)約為2500~3000字,再加上40個問題的題干,閱讀量是我國的兩倍多。舊SAT為六篇,閱讀量更大?!覈呖歼m當(dāng)降低知識難度,注重聯(lián)系實際,加強(qiáng)思維的敏捷性和靈活性?!}周期約為18個月,每年都要準(zhǔn)備多套等值的測驗試卷…先進(jìn)的心理計量技術(shù)…其完善性是國際測量界所公認(rèn)的。…其信度和效度均比較理想。…ETS的研究表明:完成四分之三試卷的考生比例一般都在95%以上。”

“正是基于這樣的研究,才使其后的40年中客觀性選擇題成為美國語言能力測試的主要題型…從上世紀(jì)90年代開始,美國的語言考試逐漸開始了作文考試。伴隨它出現(xiàn)的是借助計算機(jī)給作文評分的‘電子評分員’…用自然語言處理技術(shù)與信息擷取技術(shù)研究開發(fā)的一種主要基于語言特征分析之上的計算機(jī)程序,考慮了詞匯使用、句子結(jié)構(gòu)、文章組織、寫作邏輯、修辭、論述條理、文章內(nèi)容等諸多因素,統(tǒng)計了包括文章長度、平均詞長度、平均句長度、詞頻率、句式結(jié)構(gòu)、標(biāo)點(diǎn)使用等在內(nèi)的共60多種可以定量分析的指標(biāo)…”(謝小慶《談?wù)Z言能力的考查》《中學(xué)語文教學(xué)》2003,6)

4.適當(dāng)增加試題數(shù)量是增加考試信度效度的有效手段,這是測試學(xué)中被反復(fù)驗證了的真理.

而加大題量的最好辦法是多出選擇題

選擇題的良好品質(zhì)早已在世界上得到公認(rèn),并早已確立了其在大規(guī)模語言考試中主要題型的地位,持續(xù)了半個多世紀(jì)未曾被動搖,為什么偏偏在我們國家得不到應(yīng)有的重視呢?是由于漢語和其他語言有著本質(zhì)的區(qū)別呢,還是由于我們批閱主觀題的誤差遠(yuǎn)比別人來的小而達(dá)到了較為理想的程度呢?

自1987年語文大批判開始至今,對于選擇題的批評就從來沒有停止過。雖經(jīng)許多專家闡釋糾正,仍未獲得足夠的信任。鑒于此,筆者想再就此說幾點(diǎn)。

(1)選擇題的“天然”優(yōu)勢特別適合我國國情

(2)其命制的科學(xué)性也亟待提高

選擇題特別便于考查被試思維的敏捷性和準(zhǔn)確的判斷力。

筆者認(rèn)為,客觀題不僅不能取消,反而應(yīng)適當(dāng)加大題量.因為這種題型有其天然的"客觀"優(yōu)勢,特別適合我國國情(主觀題很難增大題量,而且批閱的主觀誤差太大,需更多的人力物力財力)

"在一份試卷中,這樣的試題需要有一定數(shù)量。若只一道這樣的題,就有四分之一"蒙對"的可能;若夠一定數(shù)量,"蒙"就失去了意義,客觀性就可得到保證”再說,“猜測”有時也是一種能力.國外的考試很多試卷上面就有鼓勵猜測的提示語.

其實,客觀性試題的優(yōu)越性是多方面的:能根據(jù)考生的認(rèn)知實際合理設(shè)置選項,使考查目的明確;避免受考生表達(dá)能力干擾而答題不準(zhǔn)確;考查點(diǎn)更明確、單一;在大規(guī)模測試中能做到答案唯一,保證測試的權(quán)威性。大范圍抽樣檢測發(fā)現(xiàn),高質(zhì)量客觀性試題與主觀性試題所獲分值十分吻合。這說明客觀性試題是完全可用的,片面地否定它就可能妨害高考。至于這類試題對教學(xué)可能產(chǎn)生的負(fù)面影響,應(yīng)在教學(xué)中實事求是地加以解決。

當(dāng)然,我們的選擇題命題的科學(xué)性繼續(xù)提高.當(dāng)前亟待深入研究的課題是,如何克服漢語的模糊性,達(dá)到精確量化的目標(biāo),而不是什么取消選擇題的問題。

"從學(xué)生考試的結(jié)果來看,這些客觀題起到了積極作用。因為這比過去高考只考一篇作文出的"冤假錯案"要少得多。我先后送走過近30個高三畢業(yè)班,對使用"客觀題"與不使用"客觀題"的結(jié)果做過反復(fù)對比。結(jié)論是:客觀題出得好,頭腦清楚的學(xué)生少受委屈;考主觀題則要憑運(yùn)氣,主觀題的成績與學(xué)生實際水平有時出現(xiàn)極大反差。所以采用一定數(shù)量的客觀題,有利于公平選拔,相對而言是對考生比較負(fù)責(zé)的做法。"

“況且,在沒有引進(jìn)客觀題之前,語文教學(xué)的少慢差費(fèi)早就長期存在。我們對客觀題引進(jìn)前后的語文教學(xué)質(zhì)量根本沒有足資憑信的對比,便斷言一種命題方法能對語文教學(xué)起決定性作用,而且口誅筆伐,恐怕過分輕率了。"還有一些人批判選擇題不過是為了趕世界反對科學(xué)主義的潮流。"(顧德?!墩Z文教學(xué)的病根》)

美日高考全為客觀題,法國主要考大題.(康乃美等著《中外考試制度比較研究》華中師范大學(xué)出版社2002年版)

“SAT是美國最具代表性的團(tuán)體學(xué)術(shù)能力傾向測驗之一,其功能相當(dāng)于我國的高考。它以基本的言語能力為核心部分。它是一種預(yù)測性測驗,注重測量與未來學(xué)習(xí)成功有關(guān)的能力測驗時間短,題量大,對思維和反應(yīng)的敏捷性與正確性要求較高。全部采取多選一的客觀題方式。嚴(yán)格按照科學(xué)化標(biāo)準(zhǔn)化的程序編制并實施,具有較堅實的心理計量學(xué)基礎(chǔ)。它這種學(xué)能測驗和我們的學(xué)科測驗只是處于同一測量連續(xù)體的不同位置。前者側(cè)重依據(jù)校內(nèi)外經(jīng)驗而發(fā)展起來的能力,后者側(cè)重教學(xué)中發(fā)展的能力,前者可以為后者加強(qiáng)能力考查方面提供借鑒。它努力創(chuàng)設(shè)新的問題情境或采用新的材料,力求與中學(xué)課程及教材無直接聯(lián)系。(1)各科均如此(2)體制和我們不一樣,壓力差別很大?!?/p>

現(xiàn)在該是結(jié)束爭執(zhí)的時候了.將精力放到…努力提高語文高考的科學(xué)化水平.

(一)試題難度過大,有“專家化”傾向,重學(xué)科知識的運(yùn)用,輕基本能力的考查

想對于高考其他科目而言,與文科題目的“偏”“難”“怪”是早已出了名的.學(xué)生戲稱考語文是"跟著感覺走"

這是高考語文遭受批評的焦點(diǎn)之一.

很多語文界專家(劉國正等)和作家(如王蒙),甚至不惜以身試法,以自己慘不忍睹的成績(嚴(yán)格的按標(biāo)準(zhǔn)答案批閱基本不及格),向語文高考提出了強(qiáng)有力的質(zhì)疑.

對此,有關(guān)考試官員和專家的解釋卻是:“對試題不熟悉”“沒經(jīng)過專門訓(xùn)練”“所操之術(shù)多異”…

這些托詞雖含有一點(diǎn)道理在里面,但包含著更多的狡辯,缺乏起碼的自我批評精神。我們不禁要問:連漢語專家都及不了格的試題其科學(xué)性又有幾何?如此考試到底是為了考查學(xué)生的語文基本功,還是為了顯示命題者的水平呢?

顯然,我們對“語文基本功”的定位出了問題.我們?nèi)鄙僮銐虻乃絹砜茖W(xué)的提高試題的區(qū)分度

那么,到底應(yīng)該如何來定位“語文基本功”呢?

“作為基礎(chǔ)教育階段的語文教育,對于絕大多數(shù)學(xué)生來說,無疑應(yīng)注重語文基本能力的培養(yǎng)”(顧德希)(<<中國考試>>2002年第三期<<學(xué)科能力等級研究與素質(zhì)教育>>)

“SAT是美國最具代表性的團(tuán)體學(xué)術(shù)能力傾向測驗之一,其功能相當(dāng)于我國的高考。它以基本的言語能力為核心部分。它是一種預(yù)測性測驗,注重測量與未來學(xué)習(xí)成功有關(guān)的能力測驗時間短,題量大,對思維和反應(yīng)的敏捷性與正確性要求較高。全部采取多選一的客觀題方式。嚴(yán)格按照科學(xué)化標(biāo)準(zhǔn)化的程序編制并實施,具有較堅實的心理計量學(xué)基礎(chǔ)。它這種學(xué)能測驗和我們的學(xué)科測驗只是處于同一測量連續(xù)體的不同位置。前者側(cè)重依據(jù)校內(nèi)外經(jīng)驗而發(fā)展起來的能力,后者側(cè)重教學(xué)中發(fā)展的能力,前者可以為后者加強(qiáng)能力考查方面提供借鑒。它努力創(chuàng)設(shè)新的問題情境或采用新的材料,力求與中學(xué)課程及教材無直接聯(lián)系。

美國的SAT(相當(dāng)于我國的高考)言語部分則強(qiáng)調(diào)言語概念的把握、詞匯量,重視概念之間的關(guān)系的揭示及邏輯推理(類推)

“美國明顯重基本能力,輕基礎(chǔ)知識考查,內(nèi)容廣泛,體裁靈活多樣,知識覆蓋面廣,題量大.中日法則重知識掌握.”(康乃美等著《中外考試制度比較研究》華中師范大學(xué)出版社2002年版)

作文考查應(yīng)大大降低對“藝術(shù)才能”(如想象力情感力感悟力形象思維力以及思維的創(chuàng)造性和批判性;高的格調(diào)境界)的要求,-略有體現(xiàn)足矣,畢竟高考的選拔是一種基礎(chǔ)性選拔,這方面要求過高勢必會扼殺大批具有其他專長的精英。確實有寫作才華的學(xué)生可以通過其他渠道破格錄取。

有很多科學(xué)家、政治家的文章,的確缺乏文采,但卻有足夠的魅力吸引人們。由此可見,解決作文能力等級量化問題,不能不在緯度上加以劃分。

“作文教學(xué)盡管可以提倡文采,但顯然不必以此為每個學(xué)生作文的劃一尺度。能文采飛揚(yáng),固然值得鼓勵;不能的,盡可在不同方面發(fā)展。文字清楚,意思明確,作為文學(xué)刊物用稿的尺度是不行的,但作為語文表達(dá)能力的一種基本要求,為什么就不值得大力提倡呢?”(顧德?!秾W(xué)科能力等級研究與素質(zhì)教育》《中國考試》)

作文批閱是過于重格調(diào),重境界,也扼殺了不少敢說真話,抒真情的性靈之作.

語文由于是母語,再加上高考屬選拔性測試,所以考題必須有一定的難度,這是正確的。問題是如何來增加難度,是不是增加難度就一定意味著將題目搞的神秘兮兮呢

“我國學(xué)科成就考試偏重測量學(xué)科知識及其應(yīng)用,例如,我國語文高考強(qiáng)調(diào)常識、語法、文章結(jié)構(gòu)等等知識;美國的SAT言語部分則強(qiáng)調(diào)言語概念的把握、詞匯量,重視概念之間的關(guān)系的揭示及邏輯推理(類推),特別注重閱讀領(lǐng)會能力(占總分的51%),要求考生通過閱讀獲取新的信息回答有關(guān)問題?!皖}量而言,新SAT言語部分的題量為78題,時限為75分鐘,為我國高考語文的兩倍。…我國高考閱讀領(lǐng)會的短文大致為2~3篇,字?jǐn)?shù)約為1000~1500字;新SAT閱讀領(lǐng)會的短文為五篇,字?jǐn)?shù)約為2500~3000字,再加上40個問題的題干,閱讀量是我國的兩倍多。舊SAT為六篇,閱讀量更大?!覈呖歼m當(dāng)降低知識難度,注重聯(lián)系實際,加強(qiáng)思維的敏捷性和靈活性?!}周期約為18個月,每年都要準(zhǔn)備多套等值的測驗試卷…先進(jìn)的心理計量技術(shù)…其完善性是國際測量界所公認(rèn)的?!湫哦群托Ф染容^理想?!璄TS的研究表明:完成四分之三試卷的考生比例一般都在95%以上?!?/p>

讓我們選擇幾個題型,來具體的看看語文試題的難度有多大.

應(yīng)該承認(rèn),把高考題卷上的多數(shù)題分別孤立地看,并無太大難度,但是,以整張試卷來看,難度是很大的。每年高考學(xué)生得分很少有上130分的(150分為滿分),而外語考分上140分則不為少數(shù);許多語文專家試做高考題也往往難以及格。語文專家劉國正先生有一次很認(rèn)真地答了一張高考語文試卷,按標(biāo)準(zhǔn)答案,嚴(yán)格計算,結(jié)果只能達(dá)到70分。王蒙稱自己很難及格.

深圳市紅嶺中學(xué)的胡立根老師曾作過一個數(shù)據(jù)統(tǒng)計,是關(guān)于91年到97年高考語音題目中部分漢字的使用頻率的:

試題年份9193949495959697

漢字抔涔鋌捭皈帙戕殄

85年字次10439567

使用度0.55.02.21.86.53.13.74

十科分布11235333

“使用度在10以下的字,是使用度極低的字…在7000通用漢字中,至少有6500個漢字的使用度超過了0.5?!?《語文學(xué)習(xí)》1999年第八期)

2000年識別錯字題考了兩個冷僻字“圜”“禎”,占總數(shù)的__分之一

前些年盛行的字音字義字形題,一道選擇題目中考查36個知識點(diǎn),且都是比較難的或者說報章雜志都經(jīng)常錯的,只要有一個點(diǎn)掌握不好,此題得分的可能性就和純粹猜測差不多。如此測試能公平客觀的評定、區(qū)分考生的實際水平層次嗎?這兒僅舉一個例子:

且看高考命題提高難度的手段1.合多為一法

如考卷第一題,要求辨別幾個字的讀音或字型或解釋(有時一道題目包含上述三個方面)的正誤,四個選擇肢每肢至少包含四個知識點(diǎn),這實際上是將很多道題合并到了一起.

2.避熟就生法.如考一些常用詞語中相對不很常用的詞語或熟詞生義(附統(tǒng)計結(jié)果);出一些專業(yè)性較強(qiáng)的文章(命題者稱是從語文角度考查,但如果文章的大概都把握不了,答題又從何說起呢)

3.將水搞渾法.這突出表現(xiàn)在客觀題中選擇項的設(shè)置上.命題者唯恐考生輕易答出,于是處處設(shè)疑置絆,將選擇項搞的玄玄乎乎,使人如墜云里霧里.

語文考題中致難之因還有,這兒就不再列舉了。我們要注意的是這種"難度"的性質(zhì)與它帶來的后果,它的難不在于考及的知識如何艱深,而主要是考查的繁瑣復(fù)雜,廣布疑陣,因而使程度差的人反可籍猜測答案得分,而程度較高的人卻因錯誤人人難免而無法得到高分。這種考試不可能有大的區(qū)分度,不利于人才的選拔。

“我國高考使用的標(biāo)準(zhǔn)化考試并不是嚴(yán)格意義上的標(biāo)準(zhǔn)化考試。第一,我們的試卷編制過程不標(biāo)準(zhǔn)。采用的還是我們老祖宗的出題方式,沒有建立題庫,試卷形成后沒有預(yù)測;這樣就很難保證試題的難度、區(qū)分度,以及試卷的信度和效度達(dá)到一定的指標(biāo)。第二,我們的分?jǐn)?shù)解釋沒有標(biāo)準(zhǔn)化,我國至今(在標(biāo)準(zhǔn)化考試使用了十幾年之后)基本上還在使用卷面分?jǐn)?shù)報告成績,還在采用將各科的卷面成績相加來計算總分的方式。有一點(diǎn)統(tǒng)計學(xué)和測量學(xué)常識的人都知道,這種做法是錯誤的。”(余明輝《我國中小學(xué)語文教學(xué)的病根到底是什么》《中學(xué)語文教學(xué)》2000,9)

中國傳統(tǒng)思維具有求同與封閉性特點(diǎn).“法古”“法師”“去異”

東方:宗法專制文化;西方:科學(xué)民主精神.(李宇升《教學(xué)藝術(shù)比較研究》天津大學(xué)出版社1998,第一版23頁)

“‘德性’文化傳統(tǒng)使得評價更多的是一種人文主義的評價模式,過分強(qiáng)調(diào)了評價的民主性和倫理性,而忽視了評價以客觀事實為基礎(chǔ)的原則.”“科學(xué)主義的教育評價忽視了教育評價的主體性的一面,形成了單一凝固的教育價值觀及指標(biāo)體系,‘抹煞了豐富的教育活動的多樣性和教學(xué)的藝術(shù)性’…而在教育評價的實際操作中,定性評價往往也比定量評價更容易進(jìn)行,自覺不自覺的陷入了人本主義的泥坑.…高揚(yáng)科學(xué)的大旗,,定性和定量相結(jié)合,充分利用現(xiàn)代科學(xué)技術(shù),特別是計算機(jī)技術(shù)…使評價結(jié)果是建立在大量信息基礎(chǔ)上的一種判斷,走出行政性評價的窠臼.…文化是一個民族的特質(zhì),傳統(tǒng)文化對一個民族的影響是潛意識的,揮之不去的.…我國的教育評價制度既要學(xué)習(xí)西方的先進(jìn)經(jīng)驗,又不能脫離本國的文化背景.評價主體宜具有官方的背景,評價機(jī)構(gòu)性質(zhì)宜‘半官半民’,評價方式上力求創(chuàng)新,走科學(xué)評價的道路,既要做到倫理的善,更要做到邏輯的真和形式的美.”(孔祥沛《淺論傳統(tǒng)文化對我國教育評價制度的影響》《教育科學(xué)研究》年月日待查)“中國文化是強(qiáng)調(diào)人文精神、倫理道德、中庸和諧關(guān)系的‘道德理性文化’,西方文化是注重科學(xué)主義的‘工具理性’文化.”(顧冠華沈廣斌《中國傳統(tǒng)文化與高等教育》海洋出版社1999年版,23頁)

“考試機(jī)構(gòu)不宜制造一個錯覺,讓外界誤以為考試是一門精確的科學(xué),這樣的定位并不表示考試機(jī)構(gòu)自貶身價,而是一種負(fù)責(zé)任和實事求是的態(tài)度.考試政策必須經(jīng)過縝密的考慮,有理有據(jù),合情合法;運(yùn)作程序的設(shè)計必須算無遺策,把人為因素減至最低,務(wù)求考生的成績得到公平、正確的處理.對于考試的局限,以坦誠的態(tài)度處理.這樣,把有關(guān)政策和運(yùn)作程序公諸于世,不但不會削弱考試機(jī)構(gòu)的權(quán)威性,反而有助于提升其公信力.揭開面紗,責(zé)無旁貸.”

馬克思恩格斯說過:“科學(xué)就是在于用理性的方法去整理感性材料.”(劉堯《論教育評價的科學(xué)性與科學(xué)化問題》《教育研究》2001,6)

考試原則:科學(xué)性、客觀性、公平性、實踐性(廖平勝等著《考試學(xué)》)

命題只有少數(shù)人“入闈”突擊進(jìn)行,試題質(zhì)量缺乏科學(xué)管理的指標(biāo),對以往考試很少統(tǒng)計分析,試題水平往往不穩(wěn)定。評卷每年抽調(diào)近十萬教師,耗資千萬,閱卷人員水平參差不齊(缺乏必要的選拔資格認(rèn)證體系),缺少控制評卷質(zhì)量的有效方法。

筆者想,我們的高考卷如果像世界上很多國家一樣可以復(fù)查(當(dāng)然這在高考競爭異常激烈的時候施行起來是很困難的),肯定會輿論大嘩!但這對于增加考試的透明度,提升考試的公信力,是多么有益的事呀!我們的改革步伐好像總是如此緩慢,我們只能翹首企盼了。

從實際效果來看,筆者建議還是多聘請中學(xué)高水平教師批閱為宜

缺少立法?!坝捎谌鄙賹φ猩贫鹊纳钊爰?xì)致的科學(xué)研究,沒有一個總體的規(guī)劃,缺少一個‘法’,所以多年來高考政策不穩(wěn)定,反復(fù)大,領(lǐng)導(dǎo)意志明顯。招生政策幾乎年年有變化,有時甚至今年完全推翻了去年的做法?!保R文卿劉文超著《中國高考走向》山東人民出版社2002,3,一版,41頁)

“無紙化考試在國外已很流行成熟,而我國尚處于試驗階段.雖然西方人運(yùn)用考試的歷史比我們晚整整一千年,卻早已形成了一些更為科學(xué)的考試觀念,就像他們雖然從我們這兒學(xué)會了造紙術(shù)和印刷術(shù),今天卻向我們出口造紙和印刷的成套設(shè)備.”(《關(guān)于考試公平性的一些思考》《考試研究》2002第二輯作者待再查)

閱讀測試忽視現(xiàn)代社會實際需求

自人類社會進(jìn)入信息時代以后,科技的發(fā)展更加日新月異,人們生活的節(jié)奏越來越快,辦事效率也越來越高--需要更快的處理更多的信息(尤其是高速膨脹的科技信息).語言的學(xué)習(xí)運(yùn)用以及測試?yán)響?yīng)緊跟時展的步伐.我們祖上傳下來的語言學(xué)習(xí)和運(yùn)用上的“體悟癥”“探究癖”理應(yīng)遭到信息化社會的唾棄.處理語言信息的敏捷性和靈活性應(yīng)該是語言測試的一個極其重要的目標(biāo).

“量化研究是當(dāng)代社會與行為科學(xué)的強(qiáng)勢典范.統(tǒng)計分析則是量化研究的核心.…標(biāo)準(zhǔn)化的測驗量表,是量化研究不可或缺的工具,其嚴(yán)謹(jǐn)?shù)木幹瞥绦蚺c信效度檢驗,使測量的品質(zhì)得以確保.”“人類追求知識的活動,逐漸從啟蒙運(yùn)動之后的唯心傳統(tǒng),配合19世紀(jì)末數(shù)學(xué)與邏輯的發(fā)展,走上一條量化、實證、非歷史、非心理的科學(xué)實證典范.以數(shù)學(xué)為基礎(chǔ)的符號邏輯思考體系,取代了亞里斯多德以來的形式邏輯概念,發(fā)展出以量化研究為主軸的科學(xué)研究典范.…實證主義下的符號邏輯思考體系,仍是當(dāng)代科學(xué)研究的主流思想,量化研究仍是學(xué)術(shù)訓(xùn)練的主要研究方法.”)

“我國的中學(xué)生每學(xué)期只不過認(rèn)真學(xué)三十篇文章(教材規(guī)定的),而美國初中生每學(xué)期達(dá)一百篇左右,德國有近六十篇.”(張承明《中外語文教育比較研究》云南教育出版社2000,10第一版62頁)

“思想內(nèi)容”的合理構(gòu)成又是怎樣的呢?“品德修養(yǎng)”到底應(yīng)不應(yīng)該占分?若占,占多少分?這也是個很迫切的問題。以筆者之見,應(yīng)弱化這方面的考查。原因如下:(一)追求“品德”的高境界,對學(xué)生抒寫真生活真情感是個極大的束縛,助長了“假、大、空”的惡習(xí)。(二)紙上的“品德”是很靠不住的,言行不一的現(xiàn)象畢竟太普遍。(三)很難定位量化。而我們的命題一旦去除了背負(fù)在肩上的這份“道德教化”的額外負(fù)擔(dān),會一下子輕松許多。文言片段的選材不必再拘泥于“英雄事跡”,作文命題也可根本上避免“政治化”傾向,學(xué)生可以放開手腳,“我手寫我口”,局面會一下子生動活潑許多。

密云县| 方正县| 平阳县| 重庆市| 芷江| 白朗县| 平江县| 深泽县| 光泽县| 茂名市| 桃源县| 黔江区| 宁强县| 南川市| 泰安市| 兰考县| 海安县| 富平县| 吐鲁番市| 玉门市| 商丘市| 济宁市| 安塞县| 沙坪坝区| 宁远县| 徐汇区| 江华| 巴马| 漳州市| 苗栗县| 云霄县| 西盟| 三门峡市| 和静县| 方城县| 南充市| 深州市| 抚顺市| 十堰市| 富川| 卓资县|