高職院校學生消費行為分析

時間:2022-12-05 04:05:14

導語:高職院校學生消費行為分析一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

高職院校學生消費行為分析

摘要:校園一卡通積累了海量的學生消費數據和日常行為數據,通過對這些海量數據進行分析,可以輔助教務處和學生處的教學管理和學生管理,甚至能改變傳統教育模式。本文嘗試將數據挖掘技術應用于校園一卡通的數據挖掘,采用K-means聚類算法,對預處理后的學生日常消費、圖書借閱、寢室門禁等進行聚類,分析高職院校在校學生的消費水平和行為偏好。

關鍵詞:校園大數據;聚類算法;消費行為;一卡通

隨著高校智慧校園建設[1]的不斷推進,以及相關業務系統逐步上線,校園信息化環境中積累的數據也在逐漸膨脹,已經形成了一個比較完整的校園大數據環境[2],校園一卡通系統作為智慧校園的重要組成部分,是高校核心業務系統之一,記錄了學生校園生活當中的行為痕跡,通過對消費數據分析,了解當前學生的消費水平與在校生活情況,為提升學校管理決策能力提供了數據基礎。

1高校一卡通系統概述

校園一卡通(架構如圖1所示)作為智慧校園建設下基礎業務系統[3],整合學校的資源,將學生在校的各類消費行為、學習行為、生活行為等功能集中于一張IC卡上,將學生在校的各類信息與資源進行有效的整合與集成,方便了學生的生活與學校的管理。圖1一卡通架構圖一般來說,高校的一卡通系統均包含以下功能:金融服務功能、身份認證功能、信息服務功能、整合服務功能。(1)金融服務功能:包含日常消費、充值功能(在線)、電子錢包的圈存、繳費管理功能等,實現了校園內貨幣結算的數字化和電子化。(2)身份認證功能:包含簽到功能、會議簽到功能、圖書借閱功能、樓宇門禁、上機認證等,用于識別在校人員身份的基本功能。(3)信息服務功能:包括流水查詢功能、線上查詢功能(公眾號、APP)等。(4)整合服務功能:主要目的是實現各不同系統與部門之間數據共享、數據對接等要求,通過校園一卡通系統實現與圖書系統、教務系統之間的數據整合。這四類功能系統在發揮作用的同時產生了大量的數據,比如消費數據、學校門禁數據、計算機上機數據等,這些數據通過一卡通系統平臺最終進入數據庫之中,形成了一個龐大的數據資源。

2基于一卡通的學生消費、行為數據的分析

2.1原始數據來源。本文的數據來源于浙江農業商貿職業學院校園一卡通及其相關系統,研究對象是2018學年上半學期的800個學生的一卡通使用數據,其中包含學生的基本信息數據、一卡通消費記錄數據(食堂、超市、洗浴)、圖書館借閱數據和寢室門禁數據。通過編寫SQL語句,將所需要的數據從數據庫(SQLServer2008)中篩選出來,以csv文件導出,作為學生消費行為數據挖掘的原始數據。2.2原始數據預處理。要進行大數據分析,需對一卡通原始數據進行預處理轉換成統計數據,預處理一般包含數據清洗、數據集成、數據轉換三個部分。(1)數據清洗:是指發現并糾正數據文件中可能存在錯誤的過程,包括缺失值數據(不完整數據)的處理和噪聲數據的清理。如原始數據中退學、休學的學生消費數據就是噪聲數據,需將其剔除,實現數據降噪。(2)數據集成:學生的成績數據,圖書借閱數據,一卡通消費和數據在經過數據清理后得到各自維度的數據,利用相關中間件技術將各維數據進行整合,如通過學生證號碼的唯一性將已處理好圖書借閱信息進行累加、消費金額進行加權平均等操作。(3)數據轉換:數據轉換是將已經經過數據清理和數據集成兩步之后的數據格式和結構進行轉化的過程,這一過程使數據具有一致性,適合數據挖掘。經過上述數據處理環節,我們選取了相對全面、完整的學生行為特征字段(如表1所示),形成基礎數據集之后我們針對具體問題的分析選擇這個基礎數據集中特定的字段。2.3算法的選擇與實現。本文將采用數據挖掘中的K-means聚類分析算法,K-means是一種使用最為廣泛的基于劃分的聚類方法。它以特征距離作為標準,即數據對象間的距離越小,則它們的相似性越高,它們劃分在同一類的可能性越大。K-means聚類算法[4]的偽代碼,如表2所示。

3聚類結果分析

通過選取預處理后的學生消費行為數據中的相關字段,對學生的行為數據、消費數據分別進行K-means聚類分析,表4、表5分別展示學生行為數據聚類結果和學生消費數據聚類結果。從上述行為數據聚類的結果中來看,第一類學生:早餐的頻率較低,中餐、晚餐比較正常,說明該類學生可能存在晚起的現象,作息不太規律;第二類學生:三餐規律,基本在食堂就餐,圖書借閱、打水和洗浴頻率也較正常,說明該類學生生活比較規律;第三類學生,早餐和晚餐就餐頻率極低,打水、洗浴無相關記錄,說明該類學生不住校,應該以走讀為主,較少參加班級活動;第四類學生,三餐次數和打水、洗浴次數較第二類同學略少,說明該類同學可能周末經常回家;第五類學生,打水次數較低,可能存在違規電器,三餐在食堂就餐頻率較少,晚餐叫外賣的可能性比較大,說明該學生生活不規律。從上述消費數據的聚類結果來看,第一類學生:消費總額、午餐均價、消費總次數均接近樣本總量均值,說明該類學生消費水平中等,消費穩定,校內消費占整體消費水平較高;第二類學生:超市消費占總消費比例較高,消費總次數偏低,可能較多的校外消費(外出就餐、外賣等);第三類學生:消費總金額和食堂消費金額兩項水平高,說明該類學生校內消費水平較高,生活水平較好;第四類學生:消費水平居中,消費總金額較少,該類學生可能走讀或者存在大量的校外消費。第五類學生:各項消費指數均低于均值,該類學生消費水平較低或者生活比較節儉。

4結語

筆者通過學生一卡通數據進行清洗、集成、轉換等數據預處理手段,將原始數據轉化成包含學生行為特征字段的統計數據,結合數據挖掘技術,使用K-means算法將學生分為5個群體,分析不同類別學生的行為特征和消費特征。然而本文在對行為數據分析的過程中,研究對象所在的學生行為數據還不是很完善,并未包含其他業務系統數據(教務系統、學工系統等),所以將在后續的研究中獲取更加全面的數據,對學生的在校行為更加精準的判斷,有利于對行為分析更好的研究。

參考文獻

[1]王曦.“互聯網+智慧校園”的立體架構及應用研究[J].中國電化教育,2016(10).

[2]劉志宏,喻曉旭.基于數據挖掘的校園一卡通消費行為分析[J].信息記錄材料,2018(12).

[3]蔣東興,付小龍,袁芳,等.大數據背景下的高校智慧校園建設探討[J].華東師范大學學報(自然科學版),2015(S1).

[4]譚俊.一個改進的YOLOv3目標識別算法研究[D].中華中科技大學,2017.

作者:錢濤 陳樹偉 徐朝鋼 單位:浙江農業商貿職業學院