數(shù)據(jù)挖掘技術(shù)深化數(shù)據(jù)采集應(yīng)用系統(tǒng)

時(shí)間:2022-10-08 05:53:16

導(dǎo)語(yǔ):數(shù)據(jù)挖掘技術(shù)深化數(shù)據(jù)采集應(yīng)用系統(tǒng)一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘技術(shù)深化數(shù)據(jù)采集應(yīng)用系統(tǒng)

摘要:大數(shù)據(jù)使現(xiàn)代化信息技術(shù)實(shí)現(xiàn)了高速發(fā)展,利用現(xiàn)代化信息技術(shù)建立狀態(tài)數(shù)據(jù)采集系統(tǒng)進(jìn)行院校評(píng)估,是院校管理的發(fā)展方向。數(shù)據(jù)采集系統(tǒng)不應(yīng)只注重平臺(tái)服務(wù)而忽視了功能的挖掘與發(fā)揮。數(shù)據(jù)挖掘技術(shù)對(duì)高職狀態(tài)數(shù)據(jù)采集的應(yīng)用系統(tǒng)建設(shè)方法應(yīng)注重關(guān)聯(lián)規(guī)則方法和聚類分析方法的構(gòu)建與使用。

關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);狀態(tài)數(shù)據(jù);數(shù)據(jù)采集;應(yīng)用系統(tǒng)

數(shù)據(jù)采集應(yīng)用系統(tǒng)又被稱之為高職院校人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng),該數(shù)據(jù)采集應(yīng)用系統(tǒng)在2008年得到教育部門批準(zhǔn)并公布實(shí)施,這使數(shù)據(jù)采集應(yīng)用系統(tǒng)成為高職院校進(jìn)行方案評(píng)估的重要組成部分,并越來(lái)越受到各個(gè)高職院校的關(guān)注與重視。不過(guò),由于數(shù)據(jù)采集應(yīng)用系統(tǒng)出現(xiàn)的時(shí)間較短,各個(gè)高職院校還沒(méi)有真正認(rèn)識(shí)到數(shù)據(jù)采集應(yīng)用系統(tǒng)的作用,對(duì)數(shù)據(jù)采集應(yīng)用系統(tǒng)的框架體系與邏輯關(guān)系的理解仍舊需要一段時(shí)間,對(duì)應(yīng)用系統(tǒng)中相關(guān)聯(lián)的數(shù)據(jù)進(jìn)行聚合,使其成為一種能夠幫助學(xué)院進(jìn)行教學(xué)決策與管理的價(jià)值信息,更需要探索一種新的數(shù)據(jù)分析方法,再加上高職院校只注重系統(tǒng)的服務(wù)評(píng)估功能而忽視了其他功能的挖掘與應(yīng)用,這就造成許多高職院校只是在填報(bào)時(shí)才會(huì)用到該系統(tǒng),而在填報(bào)過(guò)后便成為了擺設(shè),這使數(shù)據(jù)采集應(yīng)用系統(tǒng)的作用未得到真正發(fā)揮,利用率較低。為此,針對(duì)以上問(wèn)題,通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)進(jìn)行深化分析。

1數(shù)據(jù)挖掘技術(shù)

大數(shù)據(jù)具有增長(zhǎng)速度快、海量、多樣、真實(shí)、價(jià)值密度低五大特點(diǎn),從數(shù)據(jù)本身進(jìn)行分析,所謂數(shù)據(jù)挖掘技術(shù)便是通過(guò)算法搜索,從海量的大數(shù)據(jù)中對(duì)價(jià)值密度低的價(jià)值數(shù)據(jù)進(jìn)行挖掘與收集的過(guò)程。數(shù)據(jù)挖掘技術(shù)和計(jì)算機(jī)科學(xué)有著緊密的聯(lián)系,通過(guò)數(shù)據(jù)的統(tǒng)計(jì)、處理、機(jī)器學(xué)習(xí)、模式識(shí)別、情報(bào)檢索等諸多手段來(lái)達(dá)成價(jià)值數(shù)據(jù)挖掘目的。這些手段能使企業(yè)決策者根據(jù)價(jià)值數(shù)據(jù)來(lái)對(duì)策略進(jìn)行調(diào)整,以此降低風(fēng)險(xiǎn),并做出正確決策。數(shù)據(jù)挖掘由三個(gè)階段構(gòu)成:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果表達(dá)。

2數(shù)據(jù)挖掘技術(shù)在高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)中的深化基礎(chǔ)

高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)屬于一種數(shù)據(jù)倉(cāng)庫(kù),該系統(tǒng)每進(jìn)行一次數(shù)據(jù)采集便會(huì)采集到超過(guò)50萬(wàn)條的數(shù)據(jù),通過(guò)將狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)與互聯(lián)網(wǎng)技術(shù)進(jìn)行結(jié)合,還能使數(shù)據(jù)采集應(yīng)用系統(tǒng)一次性采集到的數(shù)據(jù)量更多。以知識(shí)管理理論對(duì)數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)自身是不會(huì)提供太多價(jià)值信息的,因此,需要將這些采集到的數(shù)據(jù)進(jìn)行轉(zhuǎn)化,使其成為有效信息,并利用科學(xué)的數(shù)據(jù)分析方法,通過(guò)關(guān)聯(lián)、聚類、聚合等方法來(lái)對(duì)這些海量的數(shù)據(jù)進(jìn)行分析。現(xiàn)如今,數(shù)據(jù)分析在各行各業(yè)中發(fā)揮越來(lái)越重要的作用,數(shù)據(jù)挖掘技術(shù)的相關(guān)理論與方法也使數(shù)據(jù)采集應(yīng)用系統(tǒng)具備極高的應(yīng)用價(jià)值與意義。可以說(shuō),數(shù)據(jù)挖掘技術(shù)作為一種新型信息處理技術(shù),能對(duì)大量數(shù)據(jù)中人們所不知道而又潛在的有用信候進(jìn)行提取,屬于一種更深層次化的數(shù)據(jù)分析方式,其與傳統(tǒng)分析方法的最大不同是傳統(tǒng)分析方法具備非常明顯的指向性特征,而其目的是通過(guò)結(jié)果來(lái)對(duì)預(yù)設(shè)命題的正確性進(jìn)行驗(yàn)證,或是通過(guò)對(duì)預(yù)設(shè)模型的機(jī)理進(jìn)行量化分析。而數(shù)據(jù)挖掘技術(shù)則是在沒(méi)有任何比較明確的假設(shè)情況下對(duì)信息進(jìn)行挖掘,找出信息的關(guān)聯(lián)性,并獲得那些難以通過(guò)直覺(jué),甚至?xí)`背直覺(jué)的相關(guān)信息,這樣挖掘出的信息極有可能出人意料而又富有價(jià)值,可以說(shuō),數(shù)據(jù)挖掘技術(shù)是傳統(tǒng)分析方法不斷變革后的結(jié)晶。

事實(shí)上,經(jīng)過(guò)教育界諸多專家對(duì)數(shù)據(jù)采集應(yīng)用系統(tǒng)的不斷完善,在數(shù)據(jù)采集應(yīng)用系統(tǒng)頒布應(yīng)用的三年里,系統(tǒng)結(jié)構(gòu)與信息的采集量都發(fā)生了極大改變,以版本來(lái)說(shuō),最初的數(shù)據(jù)采集應(yīng)用系統(tǒng)是08c版的,之后經(jīng)過(guò)不斷的改進(jìn)已經(jīng)成為現(xiàn)今的10a001版,原有采集字段僅為594字段,現(xiàn)如今已經(jīng)增長(zhǎng)到了750個(gè)字段,采集字段的大幅增加,也使數(shù)據(jù)采集應(yīng)用系統(tǒng)的信息容量得到了大幅度擴(kuò)充,其數(shù)據(jù)倉(cāng)庫(kù)特征也越來(lái)越明顯,尤為重要的是數(shù)據(jù)間的關(guān)聯(lián)度不斷增加,使其成為數(shù)據(jù)挖掘技術(shù)的深化基礎(chǔ),從客觀上來(lái)說(shuō),通過(guò)數(shù)據(jù)挖掘技術(shù)的應(yīng)用來(lái)進(jìn)行數(shù)據(jù)分析,能為數(shù)據(jù)采集應(yīng)用系統(tǒng)創(chuàng)造更加有利便捷的條件。

3數(shù)據(jù)挖掘技術(shù)深化高職狀態(tài)數(shù)據(jù)采集的應(yīng)用系統(tǒng)分析

數(shù)據(jù)挖掘技術(shù)在高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)中的應(yīng)用方法主要有關(guān)聯(lián)、分類、聚類、估計(jì)、細(xì)分或預(yù)測(cè)等,數(shù)據(jù)挖掘技術(shù)的自身理論與思維方式給數(shù)據(jù)采集應(yīng)用系統(tǒng)帶來(lái)了廣闊的發(fā)展空間。在這些應(yīng)用方法中,以聚類分析方法和關(guān)聯(lián)規(guī)則分析方法最為易于理解和實(shí)施,以下便對(duì)這種主要方法在高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)中的深化應(yīng)用進(jìn)行探討。

3.1關(guān)聯(lián)規(guī)則分析

在關(guān)聯(lián)規(guī)則方法中,數(shù)據(jù)是以孤立、單獨(dú)的形式分散存在的,這也使單獨(dú)的數(shù)據(jù)不能形成信息,不過(guò)將這些單獨(dú)、分散而又相互關(guān)聯(lián)的信息數(shù)據(jù)收集起來(lái),則能多角度、全方位地對(duì)某一對(duì)象進(jìn)行高效的價(jià)值辨別。而對(duì)于剛開始接觸數(shù)據(jù)采集應(yīng)用系統(tǒng)的用戶來(lái)說(shuō),在數(shù)據(jù)采集應(yīng)用系統(tǒng)使用過(guò)程中,應(yīng)以海量信息數(shù)據(jù)作為依據(jù)來(lái)對(duì)高職院校在人才培養(yǎng)過(guò)程中的各個(gè)方面進(jìn)行判斷與價(jià)值辨別,這就造成系統(tǒng)用戶往往感覺(jué)無(wú)從下手,只會(huì)對(duì)各個(gè)表格中的數(shù)據(jù)進(jìn)行割裂而孤立地分析,更加難以找出數(shù)據(jù)之間的關(guān)聯(lián)性與內(nèi)在規(guī)律,同樣難以對(duì)這些相互關(guān)聯(lián)的數(shù)據(jù)進(jìn)行聚合,這使高職院校難以將人才培養(yǎng)工作過(guò)程中的關(guān)鍵要素進(jìn)行全面呈現(xiàn),以此幫助管理人員進(jìn)行工作決策。而通過(guò)關(guān)聯(lián)規(guī)則挖掘方法的應(yīng)用,則由數(shù)據(jù)采集應(yīng)用系統(tǒng)提供數(shù)據(jù),并對(duì)人才培養(yǎng)工作的所有關(guān)鍵要素進(jìn)行分析,通過(guò)挖掘與之相關(guān)的所有數(shù)據(jù),能更加清晰地呈現(xiàn)數(shù)據(jù)與指標(biāo)間的相關(guān)關(guān)系及關(guān)聯(lián)規(guī)則。例如,在對(duì)高職院校的“兼職教師隊(duì)伍”建設(shè)現(xiàn)狀進(jìn)行分析時(shí),利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則分析方法,能將兼職教師的人數(shù)和整個(gè)高職院校的教師總數(shù)量進(jìn)行對(duì)比,能清楚地知道兼職教師在整個(gè)高職院校的教師隊(duì)伍中占據(jù)的比例,再將兼職教師數(shù)量和高職院校所設(shè)置的專業(yè)數(shù)量進(jìn)行對(duì)比,還可清楚地知道各個(gè)專業(yè)所安排的平均兼職教師數(shù)量等等。這些與之對(duì)比的數(shù)據(jù)均分散在整個(gè)系統(tǒng)中,但它們都和兼職教師隊(duì)伍有著很強(qiáng)的內(nèi)在關(guān)聯(lián),通過(guò)對(duì)這些與之關(guān)聯(lián)的數(shù)據(jù)進(jìn)行采集,能非常直觀地對(duì)某個(gè)方面的具體工作情況進(jìn)行真實(shí)反映。通過(guò)將這些數(shù)據(jù)進(jìn)行聚合,還能非常直觀地反映高職院校對(duì)專業(yè)教師隊(duì)伍建設(shè)的重視程度及總體規(guī)則,并將其與預(yù)期的高職院校教師隊(duì)伍規(guī)劃進(jìn)行比較,能清楚地知道當(dāng)前教師隊(duì)伍建設(shè)能否滿足學(xué)校師資建設(shè)的發(fā)展需要,具體的實(shí)施情況如何等問(wèn)題。

3.2聚類分析

在聚類分析中,對(duì)于不同的數(shù)據(jù),通過(guò)關(guān)聯(lián)規(guī)則分析,能獲得大量的價(jià)值信息。而對(duì)于同一類的數(shù)據(jù),則將這些數(shù)據(jù)利用聚類分析思路進(jìn)行相應(yīng)整合,這樣能使信息的呈現(xiàn)更加豐富,并能對(duì)某項(xiàng)工作的進(jìn)程及各個(gè)部門間的差異進(jìn)行真實(shí)可靠的反映。例如,在對(duì)高職院校的師生比情況進(jìn)行分析時(shí),利用聚類分析將歷年的院校招生情況及教師人數(shù)情況進(jìn)行對(duì)比,能非常直觀地對(duì)院校在歷年中的師生比情況進(jìn)行衡量,當(dāng)發(fā)現(xiàn)每一年的學(xué)生數(shù)量都有所增長(zhǎng),而教師數(shù)量增長(zhǎng)不大時(shí),則可以通過(guò)師生比來(lái)衡量院校的教師增長(zhǎng)數(shù)量難以滿足學(xué)院的教學(xué)要求,應(yīng)加強(qiáng)師資隊(duì)伍建設(shè)。

3.3聚合分析

對(duì)于不同系數(shù)中的同類數(shù)據(jù)來(lái)說(shuō),可以通過(guò)聚合分析的方法來(lái)對(duì)系部間的差距進(jìn)行直觀衡量與觀察,僅僅對(duì)同一系部中的數(shù)據(jù)進(jìn)行分析,是難以獲得較多有價(jià)值信息的,而通過(guò)聚合分析方法將不同系部中的同類數(shù)據(jù)進(jìn)行聚合,則能使數(shù)據(jù)信息變得更加豐富,進(jìn)而可以非常直觀地了解到不同系部在相同工作之間的差距,從而使院校管理人員能根據(jù)這種差距來(lái)對(duì)工作差距較大的系部進(jìn)行加強(qiáng)。

4結(jié)語(yǔ)

綜上所述,數(shù)據(jù)挖掘技術(shù)在高職院校狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)中的應(yīng)用案例比比皆是,這也證明了數(shù)據(jù)挖掘技術(shù)能使院校狀態(tài)數(shù)據(jù)采集系統(tǒng)的作用得到更進(jìn)一步的發(fā)揮,使數(shù)據(jù)采集應(yīng)用系統(tǒng)能對(duì)各類數(shù)據(jù)進(jìn)行有效挖掘與轉(zhuǎn)化,并將其應(yīng)用到高職院校的管理與教學(xué)工作中,提高了高職院校的管理服務(wù)水平,為高職院校管理人員提供大量的有效信息。可以說(shuō),數(shù)據(jù)挖掘技術(shù)在很大程度上促進(jìn)了高職院校狀態(tài)數(shù)據(jù)采集系統(tǒng)的深化應(yīng)用。

參考文獻(xiàn):

[1]張曉蕾.基于Android平臺(tái)的人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].成都:電子科技大學(xué)碩士論文,2014.

[2]蘇世文,王國(guó)慶.高職院校人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集平臺(tái)的柔性UML模型設(shè)計(jì)[J].江蘇經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院學(xué)報(bào),2013(2).

[3]伍丹.高職院校信息化管理系統(tǒng)建設(shè)與應(yīng)用的思考——以網(wǎng)絡(luò)版《高等職業(yè)院校人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集平臺(tái)》為例[J].中國(guó)信息技術(shù)教育,2010(2).

作者:畢誠(chéng) 單位:安徽國(guó)際商務(wù)職業(yè)學(xué)院