教育數(shù)據(jù)挖掘和信息技術(shù)教學診斷探索
時間:2022-03-04 03:59:31
導語:教育數(shù)據(jù)挖掘和信息技術(shù)教學診斷探索一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:近年來,隨著信息化技術(shù)發(fā)展和信息化教學改革的深入,大量非結(jié)構(gòu)化教育數(shù)據(jù)給常規(guī)教學診斷方法帶來挑戰(zhàn)。教育數(shù)據(jù)挖掘技術(shù)隨著“大數(shù)據(jù)”時代的到來日益成為學者研究熱點。本研究首先闡述數(shù)據(jù)挖掘應用于信息化教學的一般流程,隨后從數(shù)據(jù)預處理、教育數(shù)據(jù)挖掘和模型評估三個方面展開分析,探索教育數(shù)據(jù)挖掘技術(shù)應用于信息化教學數(shù)據(jù)中,實施教學診斷的途徑。研究表明,教育數(shù)據(jù)挖掘技術(shù)的引入,可以解決對于多樣性數(shù)據(jù)建模分析的痛點,進而反哺信息化教學,提升教學質(zhì)量。
關(guān)鍵詞:教育數(shù)據(jù)挖掘;信息化教學;教學診斷
一、引言
“互聯(lián)網(wǎng)+”時代的到來給傳統(tǒng)的教育教學帶來了巨大的變革,在教育創(chuàng)新的大背景下,教育理念、教學技術(shù)、教學方法不斷發(fā)展。2018年4月,教育部出臺《教育信息化2.0行動計劃》,進一步明確了教育信息化在教育新時展中的重要地位。利用信息化手段開展教學改革,日益成為高校教育教學改革的研究熱點。信息化教學要求教師學習研究先進教學理念,輔助以適合的信息化技術(shù)手段,結(jié)合典型的工作情境開展教學活動。其中,信息化教學的一個典型特征就是現(xiàn)代教育技術(shù)手段的運用。教師在課堂上需要根據(jù)教學設(shè)計的安排,合理地調(diào)用盡可能豐富的教學媒體、信息化資源,構(gòu)建良好的學習環(huán)境,有時候也可以利用微彈幕、問卷星等方式進行實時互動,以達到充分調(diào)動學生的學習主動性的目的,使得學生真正成為知識信息的主動建構(gòu)者,達到良好的教學效果。由于信息化技術(shù)手段的介入,教師可以在有數(shù)據(jù)相佐證的情況下,全程跟蹤學生的學習情況。教師課前可以基于網(wǎng)絡(luò)平臺統(tǒng)計學生預習工作的完成情況,課中可以實時得到學生的問卷結(jié)果、測驗數(shù)據(jù),課后也可以及時接收學生反饋。由于傳統(tǒng)的教學診斷方法往往只能給出教學環(huán)節(jié)中的單個節(jié)點信息,忽視了不同環(huán)節(jié)之間的相關(guān)性,教學質(zhì)量分析結(jié)果的體現(xiàn)形式也只局限于比例分布、平均差、方差等信息。上述傳統(tǒng)方法的特性顯然不能滿足信息化教學改革對于全過程、多樣性教育數(shù)據(jù)的分析要求。因此,開展一種可以能夠與信息化教學相匹配甚至利用教育學、計算機科學、統(tǒng)計學等多學科融合理論進行教學質(zhì)量評估、教學方法診斷的方法研究,具有較強的實際意義和現(xiàn)實價值。
二、基于信息化技術(shù)數(shù)據(jù)的教育挖掘方法
教育數(shù)據(jù)挖掘包含的研究內(nèi)容可大致分為預測和描述兩類。其中,預測主要傾向于通過已有數(shù)據(jù)的分析,揭示其規(guī)律,預測未知的數(shù)據(jù)。而描述更強調(diào)在分析數(shù)據(jù)的過程中發(fā)現(xiàn)新的模式和結(jié)構(gòu)。本研究關(guān)注在信息化教學中引入EDM的途徑和方法。因此,從這個角度出發(fā),將一個典型的信息化教學中EDM工作籠統(tǒng)分為數(shù)據(jù)預處理、數(shù)據(jù)挖掘和效果評估三個階段。其中的信息化課堂并非特指真實的課堂教學,而是包括課前、課中和課后的開放式教學環(huán)境。它不僅是信息化數(shù)據(jù)的來源,也是EDM介入后最終需要改進的目標對象。從教育的角度來看,這是一個從教育環(huán)境(信息化課堂)產(chǎn)生的數(shù)據(jù)中發(fā)現(xiàn)知識,再利用這些知識改善教育環(huán)境的循環(huán)過程(見下圖)。1.數(shù)據(jù)收集及預處理。數(shù)據(jù)是教育數(shù)據(jù)挖掘研究的基礎(chǔ)。具體到信息化教學的數(shù)據(jù)收集,是指在開放式課堂過程中充分利用網(wǎng)絡(luò)教學平臺、信息化手段和資源庫資源,收集的整個教育教學過程中靜態(tài)和動態(tài)的所有數(shù)據(jù)。理論上可以在不影響教師和學生活動的情況下,連續(xù)記錄整個教學活動的所有數(shù)據(jù),如課前預習、教學資料、課堂實時互動甚至學生在每個知識點上停留的時間等。收集到數(shù)據(jù)之后,由于數(shù)據(jù)挖掘算法需要處理的數(shù)據(jù)通常是符合固定標準或者規(guī)范的數(shù)據(jù)。我們收集到原始數(shù)據(jù)包含諸如問卷調(diào)查、網(wǎng)絡(luò)統(tǒng)計、平臺在線測試等多個來源。其中有可能包含有噪聲(如學生隨意評分)、缺失(如沒有學生數(shù)據(jù))和不一致(如數(shù)據(jù)分項和總項前后矛盾)等無效數(shù)據(jù)。如果直接基于原始數(shù)據(jù)進行數(shù)據(jù)挖掘,那么最終得到的結(jié)果質(zhì)量將大打折扣。此時,就需要對于原始數(shù)據(jù)進行預處理,以達到消除數(shù)據(jù)中存在的噪聲,合并及歸類不同數(shù)據(jù)源數(shù)據(jù),進行數(shù)據(jù)壓縮提升挖掘效率等目的。常用的數(shù)據(jù)預處理一般包括數(shù)據(jù)清理、數(shù)據(jù)集成和數(shù)據(jù)融合、數(shù)據(jù)變換和數(shù)據(jù)規(guī)約等步驟。由于新型教育數(shù)據(jù)的多樣化、大量化、非結(jié)構(gòu)化等特征,大大加劇了預處理的復雜度。因此,通常來說,數(shù)據(jù)收集和預處理環(huán)節(jié)往往是EDM研究中工作量最多的。2.教育數(shù)據(jù)挖掘。數(shù)據(jù)經(jīng)過預處理之后,已有的結(jié)果變量和真實值將會被完全標注。下一步就需要選擇合適的數(shù)據(jù)挖掘算法進行挖掘分析。信息化教學數(shù)據(jù)的教育挖掘一般用于在數(shù)據(jù)中建立預測模型。其常用的數(shù)據(jù)挖掘方法包括分類、聚類、回歸、關(guān)聯(lián)規(guī)則挖掘、文本挖掘、馬爾可夫模型、序列模式挖掘以及推薦算法等等。在上述方法中,根據(jù)訓練數(shù)據(jù)是否擁有標記信息,學習任務可大致劃分為“監(jiān)督學習”和無監(jiān)督學習。無監(jiān)督學習用于未知情況下,特定的組織或模式。監(jiān)督學習是使用一個已知的結(jié)果的記錄,研究該組數(shù)據(jù)的背后規(guī)律行為。其中,分類和回歸是監(jiān)督學習的代表,而聚類則是無監(jiān)督學習的代表。數(shù)據(jù)挖掘開始,通常假設(shè)樣本空間中全體樣本服從一個未知的分布,所有前期獲得的樣本數(shù)據(jù)都是獨立地從這個分布采樣獲得的,及“獨立同分布”。一旦一個模型表現(xiàn)良好,分析師可以將之遷移到新的數(shù)據(jù)集上去,用于預測新的數(shù)據(jù)集會產(chǎn)生的結(jié)果。3.模型評估及知識生成。在預測模型訓練的時候,不論是采樣諸如決策樹和回歸樹算法,還是各種關(guān)聯(lián)規(guī)則、貝葉斯模型等手段。為了考量模型的正確性和泛化能力,往往需要對于模型進行評估。具體的做法是將原有的實驗數(shù)據(jù)分為訓練集、驗證集和測試集三個部分。其中,訓練集用于模型訓練;驗證集用于模型的優(yōu)化選擇;測試集則用于對于模型的實際效果進行評估。劃分方法可以使用“留出法”(直接將數(shù)據(jù)集劃分為兩個互斥的集合)、“交叉驗證法”(數(shù)據(jù)集劃分為k個數(shù)據(jù)子集,子集多次交叉)、“自助法”(從原始數(shù)據(jù)集中隨機不刪除選取樣本)等。其中,自助法在數(shù)據(jù)集較小,難以有效劃分訓練/測試集時很有用。在得到不同部分的數(shù)據(jù)集之后,通常采用模型的準確率、召回率、精度、FScore以及AUC等指標對于模型進行性能衡量,選取最優(yōu)的模型以及模型參數(shù)作為學習到的知識,繼而反饋到信息化教學過程中。4.教學診斷應用實例。在信息化教學診斷研究中,最終目的是找到影響教學效果的關(guān)鍵因素,并預測學習效果。以常州信息職業(yè)技術(shù)學院《虛擬儀器應用技術(shù)》課程的“機器視覺物品分類檢測”項目為例,本次課的目標主要是讓學生理解視覺系統(tǒng)的硬件選型依據(jù),掌握基于顏色和圖案紋理的視覺圖像檢測分類處理算法流程。教學設(shè)計環(huán)節(jié)運用課程團隊提出的“三角環(huán)式課堂模型”開展教學。對應模型中的“概念探索、應用分析、展示成果”三步驟分別設(shè)計課前、課中和課后拓展任務,分層、逐級實現(xiàn)技能提升和崗位對接。采用的信息化手段包括課程教學平臺(課程資源,課程測試),微視頻(真實案例展示)、硬件仿真軟件和交互式圖像處理軟件等。為了達到信息化教學診斷的目的,確定本次數(shù)據(jù)與處理的目標主要是清楚除噪聲,統(tǒng)計每個學生在開放教學環(huán)境中的課前平臺使用頻次及時間、測試成績以及錯誤部分統(tǒng)計,從中確定分類器的特征。分別統(tǒng)計得出學生網(wǎng)絡(luò)平臺使用時間、課程測試及格情況和主要錯誤失分點作為特征集,用于接下來的預測模型。數(shù)據(jù)挖掘階段,我們利用SPSS統(tǒng)計軟件工具包創(chuàng)建提純現(xiàn)有特征和特征空間縮減。選取樸素貝葉斯分類法開展模型訓練。最終的對比結(jié)果表明,該分類器在特異度指標以及敏感度指標上都好于其他常用分類器效果。因此,在得到該分類器模型時,我們將之反饋到信息化教學中用于預測某位學生課程中存在的問題以及最后不合格的可能性。如果預測的數(shù)值大于設(shè)定的警示閾值,那么教師就可以及時的為該學生提供幫助。
通過信息化教學改革嘗試,學生反映這種上課方式充滿新鮮感,同時試點班相較傳統(tǒng)班的應用技術(shù)水平有了較大的提升。課程結(jié)束后,組織學生參加由美國NI公司組織的CLAD(虛擬儀器助理開發(fā)工程師)認證考試,2018年試點班學生的通過率為60%,高于NI公布的2017年全國高校的CLAD平均通過率24%。以上成果進一步證實了EDM引入信息化教學改革的有效性。
參考文獻:
[1]王珠珠.教育信息化2.0:核心要義與實施建議[J].中國遠程教育,2018
[2]張一春.信息化教學設(shè)計精彩紛呈[M].北京:高等教育出版社,2018
[3]GarcíaE,RomeroC,VenturaS,etal.Acollaborativeeducationalassociationruleminingtool[J].Internet&HigherEducation,2011
[4]牛杰,李晴,戴艷.以翻轉(zhuǎn)課堂優(yōu)化高職工科教學設(shè)計[J].職業(yè)技術(shù)教育,2015
[5]陳雯雯,夏一超.教育數(shù)據(jù)挖掘:大數(shù)據(jù)時代的教育變革[J].中國教育信息化,2017
[6]周志華.機器學習[M].北京:清華大學出版社,2016
作者:戴艷 牛杰 單位:常州信息職業(yè)技術(shù)學院電子工程學院