高校教學評價證據調查研究

時間:2022-05-17 09:27:21

導語:高校教學評價證據調查研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

高校教學評價證據調查研究

一、國外高等學校教學評價的基本做法及經驗

1.學生評教的有效性和偏差

很多關于教學評價的早期研究都涉及了對學生評教有效性問題的關注。學生性格、教學條件、教師性格以及師生互動關系等都是影響學生評教結果的可能因素[3];學生成績也是可能干擾學生評教因素中的一個;課程類型、課程負擔、教師嚴厲程度和學生成績等都有可能使評價結果產生偏差[4]。雖然如此,還是有很多研究者相信,精心設計的學生評教的確是教學評價的有效手段。現有研究表明,學生評教的不足之處還體現在學生沒能力對有效教學的所有環節進行評價。他們可以對教師的課堂表現、組織能力、閱讀材料與作業的相關性、教師教學熱情、師生關系、教學內容的覆蓋面、考試內容、課程難度以及課程負擔等方面進行評價,但對課程內容和學生學習是否充分等就不能評判了。學生有時并不能真正意識到他在一門課程中究竟學到了多少。學生并不能判斷某些課程中的教學內容是否新穎,教師的專業知識是否淵博[5]。

2.多渠道收集教學評價證據

研究者普遍認為,學生評教并不能起到對教師教學效果進行全方位評估的作用。雖然學生評教的使用非常普遍,但仍不能確保學生有能力對教學效果做出準確的判斷。學生反饋對反映教學活動的某些方面是有用的,如師生關系、成績評定、課程內容、教師的課堂呈現和組織技巧等,但教學內容、相關性和教師投入等方面卻超出了他們的直接經驗。專注于有限的證據來源無法捕獲教學活動的諸多方面,下列因素都需要依靠其它的證據來源:教師知識、教學過程的創新性、教學內容的質量和價值、課程效果、教學內容與專業培養目標的密切性、教師貢獻等。單純利用學生評教無法評估教師的學識、課程的中遠期效果,以及教學內容與學科專業目標和任務的相關度。

二、研究問題和研究方法

最近的一項研究考察了美國某大學商學院在教學評估中多大程度上使用了多渠道的證據來源。我們在中國也進行了類似的調查,利用開放式問卷了解教學評價證據的使用情況。美國、澳大利亞以及很多歐洲國家在利用多樣化評估證據方面取得了有意義的經驗,中國在此方面似乎經驗不足。在美國大學,學生評教已有近40年的歷史,中國大學使用學生評教的歷史平均只有8.5年,很多被調查學校只有5年甚至更少的時間。由于逐漸意識到需要利用多源證據對教學進行評估,加之對不同評估證據的了解越來越多,我們預計,中國大學的管理者們會越來越強調使用除學生評教之外的其它評估證據。我們研究的問題是:(1)教學管理者對學生評教有效性的看法如何?(2)教學管理者利用學生評教的機率如何?(3)用以教學評估的證據類型和使用機率是否因學校類型而異?(4)用以教學評估的證據類型和使用機率是否因管理者對指標的信任度和經驗而異?我們從不同高校中選取了50個院系,通過電子郵件向系主任(院長)發出了問卷調查申請。之所以選取系主任作調查對象,是因為他們對教學評估負有最直接的責任,對用于教學評估的證據來源了解得最為透徹。在郵件中我們邀請被調查者登陸提供的網址來完成問卷(見附錄)。三周后,我們發出了第二次調查請求并很快收到了31位系主任的回應,其中27份答卷是可用的,回應率為54%。被調查院系的具體信息如表1所示。在27份有效答卷所涉及的學校中,有6所“211工程”院校(占22.22%),21所普通院校(占77.78);有20所院校已接受過教育部本科教學工作水平評估,其中17所成績為優秀(占62.96%);有8個院系擁有博士學位授予權(占29.63%),15個院系有碩士學位授予權(占55.55%),16個院系授予學士學位(59.26%),9個院系為其它層次(占33.33%)。受調查者個人工作所限,被調查對象多為外語院系。但考慮到國內高校的教學評估工作多數由學校教務處統一布置,調查結果應該具有代表性。

三、調查結果及其分析

1.對學生評教有效性的看法

我們在問卷中設計了8個問題來了解被調查人對學生評教有效性的看法。使用的是五級量表,5表示非常同意,3表示不確定,1表示非常不同意。我們利用具有p值的t檢驗統計量來檢驗系主任對有效性的認識與中立回答(3.0)是否具有顯著差異。統計結果表明,系主任基本上同意(3.74)學生能夠回答學生評教問卷中的大部分問題,如表2所示。他們的認識顯著地高于中立(p=0.0004)。這與對美國大學的調查結果類似,其平均值為4.23。顯然,就調查樣本而言,美國大學的系主任更傾向于對學生回答評教問卷問題的能力感到滿意。這也許是源自美國大學開展學生評教歷史更久的緣故,但也可能是由于中美學生評教證據中的不同細節內容所致。我們認為后者的可能性更大,因為中國的系主任在判斷學生是否在超出自己經驗進行評價問題上基本上保持中立(3.04),在判斷評價證據是否與專業領域相關時低于中立(2.85),在判斷評價證據與學校專業設置的相關性上更是低于中立(2.63,p值=0.0651)。被調查者基本上同意學生評教是一種很好的教學評估手段(3.44,p值=0.0394),但也同時承認有些細節內容可能會有負面效應(3.33,p值=0.0951)。與對美國大學的調查結果類似,在“我相信學生評教結果”問題上系主任保持中立(3.15)。有鑒于此,我們認為在對教師教學進行評估時應該利用一些其它評價證據。

2.用于教學評價的證據類型和使用頻率

有27位系主任認為可以把學生評教當作是教學評估的首要工具。這種對學生評教的高依賴與國外同類研究的結果是一致的,不同的是,在國外大約有81%的院系使用除學生評教之外的其它證據來源,而我們的調查表明,在中國這樣做的只有52%。在中國高校,用于教學評價的指標來源平均為2.19種,而在美國平均為4.16種。中國高校只有22.21%的系主任使用了4種或以上的評價證據,如表3所示。表4列舉了27位被調查對象提供的9種評價證據,其中使用頻率最高的4種依次為:學生評教(100%)、同行觀察(37.04%)、非正式評論(29.63%)和教學獎勵(14.81%)。同行觀察可以由系主任或其它教學管理人員完成,也可以由其它教師完成。非正式評論既可以來自學生,也可以來自其他同事。在美國最常用的4種評價證據依次是:學生評教(97%)、同行觀察(63.93%)、課程大綱(40.98%)和隨堂測驗(37.70%)。相比而言,美國高校似乎更傾向于使用那些和課堂教學關系更直接的評估手段,而中國高校雖然也使用學生評教、課堂觀察這樣一些直接手段,但還使用非正式評論和教學獎勵這些間接方式。我們認為,來自學生或其他同行的非正式評論比較主觀,也許并不能反映課堂的真實情況。教學獎勵并非是對課堂的直接評價,盡管很可能參照了多方面的指標,但也只能是間接證據,獲得教學獎勵并不能說明該教師在課堂上講授了哪些內容,也不清楚其組織能力如何。被調查者希望能夠增加教學評估的證據類型,以便有機會對教學活動的各個側面進行全方位的評估。

3.不同類型院校的證據使用情況

不同類型院校使用評估證據類型和頻率的情況,如表5所示。具體分為教育部評估成績不同院校、有無博士學位授予權院校、是否“211工程”院校等情況。最常使用的評估指標依次是學生評教、課堂觀察、非正式評論和教學獎勵。在教育部評估成績優秀的高校中,隨堂考試和教學獎勵的使用頻率相同。在無博士學位授權和非“211工程”院校當中,隨堂考試比教學獎勵的使用頻率稍微高一些。總的看來,不同院校所使用的評估證據在類型方面似乎沒有區別,但在使用頻率上稍有不同。無教育部評估優秀成績院校,無博士點、非“211工程”院校,似乎更傾向于使用課堂觀察(50.00%:29.41%;42.11%:25.00%;38.10%:33.33%)和非正式評論(50.00%:17.65%;36.84%:12.50%;33.33%:16.67%)。無教育部評估優秀成績院校,無博士點、非“211工程”院校分別要比對此類院校使用更多類型的評價證據(2.40:2.06;2.42:1.63;2.29:1.83)。對以上區別一種可能的解釋就是,無博士點、非“211工程”院校相對于有博士點、“211工程”院校更注重教學,因而也更重視教學評估。根據被調查者信任學生評教的程度和使用年限對評價證據類型和使用頻度進行分類,如表6所示。首先根據對學生評教的信任程度把被調查者分成A、B兩組,A組為5分或4分(非常同意、同意),B組為1到3分(很不同意、不同意、不確定)。雖然兩組使用的證據類型完全相同,但分布的頻率卻有變化。相信學生評教的A組對其它證據類型也都更信任:不太相信學生評教的B組平均使用1.71種評價證據,而A組平均使用2.69種證據。按常理來講,不太相信學生評教的B組應會使用更多其它證據來與學生評教搭配和補充使用,但事實卻恰恰相反。該區別還可以在使用學生評教年限不同的分組中得到體現。我們同樣把被調查對象分為A、B兩組,A組至少有7年的學生評教經驗,B組不足7年。兩組在使用不同評價證據的類型和重要性排序方面是等同的,但不同的是,A組比B組使用了更多的評價證據(2.38:2.00)。這也許是由于使用學生評教更久的A組更好地認識到了單純依賴學生評教的不足所致。如前所言,學生可以依靠自己的直接經驗來對教師的課堂呈現技巧、教學內容的選擇或組織做出判斷,但對于教師的學識、教學內容的新穎、教學內容與教學目標之間的關系等方面是不能判斷的,這些方面的評價需要利用其他一些評價證據,如同行課堂觀察、教學大綱、隨堂測試、教師筆記等。前期研究表明,除學生評教外,所調查的美國大學經貿系的系主任,會經常利用同行觀察、教學大綱、測試、教師課堂筆記、教學材料和課程成績等作為常用的評估證據。

四、結論

研究發現,對教師的教學行為進行評估時,多數大學都把學生評教看作是可以信賴的證據來源。調查發現,系主任基本上認為學生可以基于經驗回答問卷中的大部分問題,在判斷是否有些問題超出了學生的經驗范圍時態度不明確。他們認為有些評價內容會產生負面效應,因而在是否完全相信學生評教結果上態度不明確。幾乎一半的被調查院校在教學評估中只使用學生評教,總體平均只使用兩種評價證據。顯然這與教學活動多方面、全方位的評估要求相差甚遠。雖然有些被調查院校還使用課堂觀察、非正式評論和教學獎勵等手段,但后兩種手段并不直接支持教學評價。為了對有效教學的各方面進行全方位評估,我們建議除學生評教外,還要利用同行觀察、課程大綱、測試和教師課程記錄等其它評估手段。調查還發現,非博士學位授權院系、非“211工程”院校和沒有教育部評估優秀成績的院校更傾向于使用多種類的評估手段,而有博士學位授予權的院系使用的指標種類最少。這也許是由于后者更重視科研的緣故。我們還發現,那些更信任學生評教或使用學生評教歷史更久的院系會傾向于使用更多種類的評估證據。這也許是由于他們從總體上更重視教學評估,并且同時也認識到單純學生評教并不能對教學效果的所有方面做出評判。本研究仍有一些局限性。首先,我們的調查取樣院校較少。其次,調查對象只涉及了系主任,沒有普通教師。雖然調查結果顯示了不同院校間的共同點和差異,但還無法了解各評價手段在實際中是如何使用的。最后,調查結果也許并不適用于樣本外的院校。來自無教育部評估優秀成績院校的回應偏少。未來研究也許可以調查教師對個別評價證據的看法,考察不同評價證據所包含的具體內容等。(本文來自于《高教發展與評估》雜志。《高教發展與評估》雜志簡介詳見.)

作者:王廣成1BrianPatricGreen2工作單位:1.曲阜師范大學公共外語教學部2.DepartmentofAccounting