高等教育績效評估問題分析

時間:2022-04-28 09:22:11

導語:高等教育績效評估問題分析一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

高等教育績效評估問題分析

一、高等教育績效評估面臨的困境

(一)高等教育機構是生產多種“產品”的組織

高校生產“產品”的多樣性是評估高等教育產出的主要障礙之一。高等教育產出的范圍和性質決定了較其他大多數產業在績效評估上具有更大的復雜性。有學者指出“測量教育產出確實非常困難……教育中最根本的一些困難如考試成績、班級規模以及類似的屬性至今沒有得到深入的討論,雖然這些相關問題的測量是值得關注的。更重要的是,因為他們是多元產出的組織,他們不只是產生唯一的教育,他們也生產其他產品”[2]。大型研究型大學培養本科生,提供專業性及研究生學位,參與公共服務活動和研究,創造文化等等。高職學院和一些地方院校,為直接就業的畢業生提供職業證書,為考入研究型大學的學生設計學位課程,為滿足當地勞動力市場和特定雇主需求設置專業課程。面對這些任務,開發能囊括各種不同類型大學的所有產出增值的財會體系是非常困難的。許多專家對如何改善大學投入和產出的測量提出了很多建設性建議,但仍有一個難題無法解決。研究及其他學術創新性活動作為大學聯合生產的一部分應該被納入績效綜合核算。然而聯合生產帶來的分析問題的困難在于如何從學位生產成本中將研究開發生產成本分離出來;如何比較研究與學位產出的相對價值;如何分配教職員工在每項任務上的時間投入。在區分高等教育產品功能的教育與非教育成分的過程中必須做出判斷是件困難的事情。同時,大學具有提升大學畢業生的社會責任感和未來職業責任感等精神境界的任務。然而如何測量確實仍未找到合適的工具。

(二)高等教育的非市場性和外在效應

非市場性進一步使計算高等教育的投入與產出比復雜化。學生的時間和學校非金錢收益等因素,不能買賣,不能輕易用貨幣衡量。此外,并不是受教育的公民的全部利益都能轉化為為教育付出的人的利益。這樣的特點就使得這些因素很難測量。因此,在生產率測量中這些因素會經常被省略掉。那些關心國家在教育上投資回報的政策制定者應該對院校為個人和社會創造的全部價值感興趣。這些社會價值大多是無形易變的,例如,就同輩影響而言,寄宿院校要比走讀院校創造更多的社會資本。盡管上述社會價值不能被準確地測量,但是這種非市場性維度無疑是高等教育功能的重要組成部分。這通常也是高等教育作為一項優先的公共支出項目的原因之一。高等教育創造的積極外在效應被認為是刻意地將學費都制定得低于市場均衡價格。國家給予院校多種形式的定量配給和補貼以滿足特殊行業的需求,如國防生、免費師范生。經濟補助和其他形式的交叉補貼可以使院校增加錄取弱勢學生群體的人數。這種非市場指導的價格導致最終的邊際成本與價格不一致,總收入不能與院校產出相等;不同活動收入的分配也不能被用來建構反映相關消費者價值產出的總指數。有學者為了避免測量產出存在的問題,假設教育價值與學生將來收入貼現價值相等。他們基于畢業生終身收入評價教育對人力資本的貢獻[3]。然而除去其他假設,這種測量不能簡單回歸到一個具體的教育片斷,對成果的關注可能包含教育作為區分不同能力個體的篩選機制的角色。這就潛在地夸大了教育的貢獻。

(三)高等教育中投入異質性

異質性是指具有不同產出的院校組織功能具有不同的特點。影響質量的因素幾乎寓于高等教育投入的各個方面。這種復雜數據和分析需要精確和靈敏的質量測量,需要長期研究調查。高等教育生產率的全面具體的測量將會解釋質量隨時間的變化以及個體、院校在投入和產出的質量變量。鑒于學生和教師的天賦不同,他們學與教的準備和有效性也就不同。很顯然,高職院校、普通大學和重點大學的學生存在明顯差異,師資條件也不同。1.學生因素對績效評估的影響。學生群體以下因素明顯地對教育投入與產出之間的關系產生影響:(1)家庭經濟地位的不同。(2)學生高中知識基礎的不同。(3)學生學習性投入。學生動機和能力變量強烈地影響學習過程及效率。(4)同輩影響。學生互動影響高等教育的投入和產出。如果準備較差的學生能受到周圍準備較好的學生熏陶,提高學習成績,那么這種提高也是高等教育體驗價值的一部分。一般來說,院校學生群體的構成將影響院校績效測量的得分。如果測量的標準是畢業成果的話,學生的低水平學術程度將轉化成低生產率。如果考量的是附加值或者邊際效益,知識基礎較低的學生可能導致高生產效率,因為可彌合的學習差距大。近年來,國內學者引入了學生學習性投入測量,其優勢在于可以洞察指定院校學生的體驗。這種方式日漸重要,因為學生為教育活動投入努力的程度是學習過程的一個至關重要的因素。學生投入性的測量在了解院校對學生學習和自身發展方面的影響是有益的。即使如此,學生學習性投入測量調查仍有其局限性。首先,有關學生投入度的調查更多地關注學生學習性投入,但是當涉及學生持有率和滿意度的相關問題時,社會投入性的數據同樣很重要[4]。其次,任何有關學生特點的測量都必須記住就質量測量方面院校之間的方差總是小于院校內部的方差。這是因為院校內部學生個體的表現總是比院校之間平均表現具有更多的變化。這適用于每一個層次的教育。NSSE對大學一年級和四年級學生做的14個測量指標中,除了一個指標之外,院校之間的學生學習性投入的方差都不足總方差的10%,而在學院或者大學內的學生中剩余的方差超過95%[5]。因此,只在一個學院機構層面測量質量在估計生產率時可能會產生誤導。2.教師因素對績效評估的影響。大學教師可以簡單地分為兩類:教授和助教、講師。教授承擔教學、科研和公共服務。一般來說,在研究型大學,教授的主要時間顯然要用于研究;而高職學院,主要精力要用于教學。在動力和能力方面,助教、講師與教授相比孰優孰劣是一個經驗問題。正是這些問題突出了更合理的績效測量的必要性。不同情況下,得到的答案也會不同:在某些情況下,研究和行政責任可能改進教學質量;在其他情況下,學術成果發表的壓力會促使教授不關注教學質量,忽略教學。在所有類型的院校中,助教、講師幾乎都會被安排教授具體課程,研究型大學中助教、講師還會承擔科研任務。如上所述,科研創新性很難被測量。因此,有必要分析教授和助教、講師的授課質量。就具體授課的質量來講,助教、講師和教授可能具有相同的質量。教師質量通常依據成績和學生評價來測量。然而,這些結果可能會嚴重地受到外部因素的影響,因此院校很難弄清楚教師質量對學生成功的貢獻。在一項控制研究中,將大學生隨意分配給終身教師或者兼職教師,分析學生課程分數評估教師質量。研究發現,兼職教師(更具體地說,沒有獲得最終學位,缺乏經驗的教師)教授的學生在較低級別的課程(微積分1)所取得的成績更好。然而,高級課程評估結果就截然相反了(微積分2)。兼職教師更可能通過教授入門級課程從而提高學生考試成績,但終身教師更可能提升學生對知識的理解[6]。即使研究提供了測量教師質量的有用方向,但不可能使所有的大學和學院進行這樣的可控制的研究,如此豐富的數據用于分析還不是很容易獲得。

(四)高等教育產出的異質性

高等教育產出方面,高校頒發不同級別和學科的學位。這些不同,影響了教育過程和畢業生勞動力市場的價值。院校服務多樣的學生群體追求不同的使命。雖然大學都致力于培養受過良好教育的合格公民,事實上,一些院校僅僅提供四年制本科的學位證書,一些院校努力培養學生有能力考入研究型大學,高職院校培養學生的職業技能,其他一些研究型大學提供不同學科領域學士和研究生學位。一些產出注定比其他產出昂貴,然而由于異質性,人們無法判斷哪種更優。理想化來說,衡量高等教育的產出價值,需要識別質量維度,整合相關的學習、課程預備、就業準備和收入效益等相關指標。即使信息全面,衡量這些特點還是需要主觀評價。我們強調用清晰無誤的定量質量指標定義高等教育產出在現階段是不可行的。盡管大學通常使用學分作為每個課程重要性和挑戰度的測量標準,但是他們不能完全代表課程對學生和社會的全部價值。1.畢業學生的經濟報酬問題。已往的經濟學文獻研究了教育產出的市場導向型評估,注意到薪水效益隨學習領域和院校質量的不同而不同。一些研究試圖評估學院成本與學生和院校績效之間的關系。除了工資成果外,畢業后一定時間內找到工作的畢業生的數量;校友對他們受到教育的滿意度;當地工商業界對大學提供技能職員角色的滿意度;繼續取得高級學位的學生的數量。這些都作為對院校績效評價的指標。教育經濟學領域在這方面做了很多工作,但即使目標是估算教育的經濟報酬,但是還有許多難題沒處理。如何更好地運用工資數據進行計算,哪項工資數據最重要:第一份工作,五年以上的薪水或者終身收入貼現?此外,代際、商業周期效應以及變化的勞動力市場條件都會造成相關工資的持續變動。最重要的是,影響收入的因素如學生特點、人口異質性、可達性和機會以及其他因素在這些經濟研究中必須是可控的。產出測量的全面質量調整還只是預想,因為還有諸多問題有待解決。2.學生學習性投入對產出的影響。除了測量學分、學位、相關的工資收益是測量學生學習的附加價值的指標。測量學位和學分數本身不能成為高等教育產出的全部指標。如果學生取得學士學位,但是沒有獲得勞動力市場及社會中真正需要的知識、技術和能力,那么所得學位也不過是一個空洞的符號。測量指標應該注重的是學位質量,例如,學習的數量以及校園后的價值(如收入、職業地位以及其他測量標準),超越學位和證書本身。忽略學習質量或者學生投入性的測量,單純強調學生的數量,可能誤導院校績效評估制定出狹隘的政策。人們是能接受一個學校學生畢業數量很多但學習性投入和成果較低,還是學生接受較高的學術挑戰,顯示出高水平的技能和實力,院校能夠更好地滿足個人和公共的利益,即使畢業生數量較少呢?學生學習性投入和成果與規模數量的績效并不是彼此排斥的,但是每一項都代表了院校績效和學生發展不同的方面。帕斯卡雷拉和特瑞茲尼(PascarellaandTerenzini)指出,大學對學生學習和自身發展的影響主要取決于學生個人的努力程度和在學術、人際及校內課外活動中的投入程度。學生對中等后教育體驗的收獲承擔主要責任。一旦院校變量(例如選拔性)是可控的,學生自身的動力就成為影響大學后收入差距的重要因素[7]。為了估算教育生產率,對院校質量作出分級,大學排行榜應運而生。大多數排行榜的主要缺陷是,他們幾乎不提學生在大學的體驗和收獲。涉及學生質量指標的排名系統局限性具體體現在只是參照一個數字進行排名,那就是錄取學生的高考分數。這并不是說選拔性與學院質量無關。高選拔性的學校環境至少對某些學生的本科教育是有益的。院校的選拔性與學業成就、生源人口特征和質量差異等因素的控制緊密相關。但相反的觀點認為,高校“生產率”也會受到“欠匹配”的嚴重損害,準備良好的學生加入富有挑戰性的學校也頻繁失敗,尤其是那些來自貧窮家庭的孩子。換句話說,選拔性與有效教育實踐不是顯著相關的。院校的選拔性對學生在校期間的學習和認知發展有最低程度的貢獻。如有學者對大學排行榜批評道:鑒于他們對最佳本科教育的測量主要基于資源和聲望,而不是基于我們認為最重要的學生校內體驗。大學排名的更精確的名字應該是“最具優勢大學”[8]。相比之下,同輩因素更加重要,因其廣泛地影響了學生的態度、價值觀和個人及社會發展的其他維度。

二、高等教育績效評估的展望

(一)高等教育績效評估應當謹慎實施

盡管一些指標的測量是可以達到的,但美國統計局目前不提供教育部門生產率的測量。在美國,此類研究大多數都集中在中小學教育。此外,歐盟成員和其他國家也在研究如何測量教育的產出和投入,但在如何測量高等教育投入和真正產出的問題上還沒有達成一致。高等教育生產率的現實測量要比教科書模型更具挑戰性。多樣的產出、異質性的投入和產出、質量隨時間的變化、院校間和體系間的質量變量都增添了任務的復雜性。為了改進生產率測量,有必要認識到不是上面列舉的所有的復雜性都能獲得充分解釋,至少現階段是這樣。單一的測量不能全面組織和總結一個部門的績效,我們應時刻牢記其復雜性。沒意識到這點,測量將必定被誤用并且誘發不恰當的動機。例如,受到物質刺激鼓勵的“文憑工廠”的危險確實存在。績效測量是開發利潤構成的前提,但也會造成激勵某些“受歡迎”的特定行為。任何單一績效考量,不足以實現大多數目標,尤其是那些與利益相關者需求有關的目標。高校績效的部分測量對改善院校績效沒有多大作用。只有總體測量高等教育績效,才能形成更佳的政策環境,進而間接地改善院校的績效。

(二)高等教育績效評價可借鑒方法

經合組織和高等教育院校管理機構在世界范圍內聯合開展高等教育領域優質教育實踐研究。研究指出,全面了解教學與學習質量之間的因果關系,需要具有開創性并且深入的評估方法和工具[9]。美國國家研究委員會有關研究博士課程質量測量的報告概述了博士課程教師質量的評估方法。評估基于大量數據,較過去的評估包括更多具體題目,例如,出版數量、引用的數量、獲得校外研究撥款情況、跨學科的參與度、人口統計的信息、獲得獎勵和榮譽的數量。該報告解決了一個復雜問題,強調教師質量測量的重要性,適合四年制研究型大學研究博士課程的績效評估[10]。理解高等教育產出的另一個方法將是采取間接測量。經合組織制訂了《成人能力國際評估計劃》(PIAAC)。PIAAC將評估成人的讀寫和計算能力以及在技術支持的環境解決問題的能力。該項目將從參與調查的成人那里搜集大量信息,包括他們如何將技能運用到工作和其他環境,例如家里和社區。最理想的情況是,基于PIAAC收集的信息,除了教育收獲,學院專業,已往工作經歷、加入高等教育院校的時間和類型有關的信息,可被用來估算高等教育產出。因此,PIAAC和其他基于技能的調查可能會為高等教育產出或生產率評價提供有益借鑒[11]。

作者:苑健工作單位:北京航空航天大學