智能化數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)

時(shí)間:2022-05-06 09:34:29

導(dǎo)語(yǔ):智能化數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢(xún)客服老師,歡迎參考。

智能化數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)

1引言

現(xiàn)代化科技水平的不斷進(jìn)步導(dǎo)致人們對(duì)互聯(lián)網(wǎng)數(shù)據(jù)挖掘技術(shù)的應(yīng)用有了更高的要求。如今,互聯(lián)網(wǎng)數(shù)據(jù)挖掘技術(shù)具有相對(duì)獨(dú)特的特點(diǎn),尤其在電子銀行、電子商務(wù)、企業(yè)、政府之間有著愈發(fā)重要的作用,作為不同類(lèi)型用戶(hù)關(guān)系的重要處理通道,智能化數(shù)據(jù)挖掘系統(tǒng)的設(shè)計(jì)有助于企業(yè)根據(jù)用戶(hù)的數(shù)據(jù)請(qǐng)求實(shí)現(xiàn)更好的商業(yè)服務(wù),借助于先進(jìn)的數(shù)據(jù)挖掘技術(shù),企業(yè)同樣能根據(jù)用戶(hù)重心發(fā)展相應(yīng)的業(yè)務(wù)類(lèi)型。智能化數(shù)據(jù)挖掘系統(tǒng)的應(yīng)用能夠縮小人工成本,依賴(lài)其智能化的特點(diǎn),企業(yè)也能夠確定更好的未來(lái)發(fā)展趨勢(shì),提升綜合競(jìng)爭(zhēng)水平,在互聯(lián)網(wǎng)市場(chǎng)份額中占據(jù)較大比例。

2Web數(shù)據(jù)挖掘系統(tǒng)架構(gòu)

互聯(lián)網(wǎng)作為包含龐大數(shù)據(jù)信息、用戶(hù)聯(lián)系廣泛的集合體,現(xiàn)存的數(shù)據(jù)管理信息系統(tǒng)無(wú)法有效處理大規(guī)模的半結(jié)構(gòu)化信息數(shù)據(jù),由于用戶(hù)類(lèi)型也呈現(xiàn)復(fù)雜化、多樣化,這些對(duì)相對(duì)傳統(tǒng)的信息管理系統(tǒng)來(lái)說(shuō)有一定執(zhí)行難度。其中,對(duì)于企業(yè)之間的電子商務(wù)運(yùn)行而言,為數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用提供了有效支撐,在此基礎(chǔ)上更為優(yōu)良的智能化數(shù)據(jù)挖掘系統(tǒng)也有了更為廣闊的應(yīng)用前景。本文以B/S架構(gòu)為基礎(chǔ)進(jìn)行互聯(lián)網(wǎng)數(shù)據(jù)挖掘系統(tǒng)的設(shè)計(jì),并且,電子商務(wù)的潛在模式需要充分借助于數(shù)據(jù)倉(cāng)庫(kù)管理技術(shù)進(jìn)行合理挖掘,繼而對(duì)相關(guān)企業(yè)知識(shí)庫(kù)進(jìn)行構(gòu)建,實(shí)現(xiàn)供企業(yè)發(fā)揮指導(dǎo)作用的智能化綜合系統(tǒng)。該系統(tǒng)的整體架構(gòu)有三個(gè)層次組成,即數(shù)據(jù)訪問(wèn)層、業(yè)務(wù)邏輯層、用戶(hù)操作界面管理層。通過(guò)業(yè)務(wù)處理邏輯層可以實(shí)現(xiàn)對(duì)不同用戶(hù)的數(shù)據(jù)請(qǐng)求進(jìn)行有效處理,通過(guò)互聯(lián)網(wǎng)服務(wù)器對(duì)相關(guān)用戶(hù)網(wǎng)站請(qǐng)求傳送至應(yīng)用服務(wù)器,依賴(lài)于應(yīng)用服務(wù)器中的程序算法、分析技術(shù)對(duì)數(shù)據(jù)管理倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行有效挖掘提取;對(duì)于數(shù)據(jù)訪問(wèn)層而言,其有如下部分組成,即知識(shí)儲(chǔ)存庫(kù)、數(shù)據(jù)集、數(shù)據(jù)倉(cāng)庫(kù)三個(gè)方面,數(shù)據(jù)倉(cāng)庫(kù)是至關(guān)重要的一部分,其由針對(duì)數(shù)據(jù)主題的動(dòng)態(tài)變化集成數(shù)據(jù)集合工程,企業(yè)中不同類(lèi)型的數(shù)據(jù)處理系統(tǒng)、數(shù)據(jù)文庫(kù)、企業(yè)之間或者企業(yè)政府之間的商務(wù)文件記錄提供了倉(cāng)庫(kù)中的數(shù)據(jù)源[1]。

3系統(tǒng)主要模塊設(shè)計(jì)

智能化數(shù)據(jù)挖掘系統(tǒng)中的功能模塊設(shè)計(jì)主要依據(jù)不同用戶(hù)的數(shù)據(jù)請(qǐng)求頻率、數(shù)據(jù)查詢(xún)興趣重點(diǎn),繼而進(jìn)行功能模式的分析與實(shí)現(xiàn),這也有助于企業(yè)對(duì)既存的互聯(lián)網(wǎng)界面結(jié)構(gòu)進(jìn)行優(yōu)化改進(jìn),更好地提供企業(yè)服務(wù),其基本流程如下,首先對(duì)企業(yè)面臨的商業(yè)問(wèn)題進(jìn)行定義分析,繼而對(duì)相關(guān)數(shù)據(jù)進(jìn)行采集,對(duì)數(shù)據(jù)進(jìn)行歸一化預(yù)先處理,最終獲取評(píng)定結(jié)果,為此,系統(tǒng)功能模塊可以分為如下,即數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)模式挖掘功能模塊。對(duì)于數(shù)據(jù)采集模塊的設(shè)計(jì)而言,其主要包含如下兩個(gè)方面內(nèi)容,用戶(hù)訪問(wèn)查詢(xún)活動(dòng)數(shù)據(jù)信息、互聯(lián)網(wǎng)界面文檔拓?fù)浣Y(jié)構(gòu),其數(shù)據(jù)來(lái)源可以進(jìn)行兩個(gè)方面的分類(lèi),首先是互聯(lián)網(wǎng)服務(wù)器的log文件、錯(cuò)誤日志、cks;其次是在線(xiàn)用戶(hù)的網(wǎng)站注冊(cè)信息、交易活動(dòng)數(shù)據(jù)、請(qǐng)求反饋信息等,數(shù)據(jù)挖掘可直接以信息記錄的方式進(jìn)行。其中,常見(jiàn)的互聯(lián)網(wǎng)服務(wù)器日志內(nèi)容有如下方面,即不同用戶(hù)的網(wǎng)站瀏覽數(shù)據(jù)、鏈接相關(guān)聯(lián)的序列數(shù)據(jù),涉及到的字段信息為事件、日期、現(xiàn)有狀態(tài)、字節(jié)發(fā)送、數(shù)據(jù)請(qǐng)求的種類(lèi)、IP地址等。數(shù)據(jù)采集工作主要為了后續(xù)的數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建提供必要的基礎(chǔ)準(zhǔn)備,數(shù)據(jù)分析過(guò)程中工作是對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)聚集等[2]。模式挖掘經(jīng)過(guò)收集、清理、轉(zhuǎn)換、集成而形成的數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)上應(yīng)用數(shù)據(jù)挖掘的算法,挖掘出有用的模式和規(guī)則來(lái)幫助企業(yè)決策,這是企業(yè)開(kāi)發(fā)數(shù)據(jù)挖掘系統(tǒng)的主要目的。路徑分析技術(shù)利用鏈接日志文件項(xiàng)中訪問(wèn)者的訪問(wèn)路徑,并將路徑按時(shí)間排序。這種分析對(duì)企業(yè)在布置web站點(diǎn)頁(yè)面內(nèi)容有指導(dǎo)意義;也可以通過(guò)關(guān)聯(lián)規(guī)則分析挖掘出頻繁頁(yè)面集,比如某購(gòu)書(shū)網(wǎng)站,對(duì)于書(shū)A的頁(yè)面A和書(shū)B(niǎo)的頁(yè)面B,通過(guò)關(guān)聯(lián)規(guī)則分析得出頻繁頁(yè)面集{A,B},在用戶(hù)訪問(wèn)A時(shí),將頁(yè)面B調(diào)入緩存,從而改善web緩存,提高性能,并且還能說(shuō)明書(shū)A,B的相關(guān)性,企業(yè)可以實(shí)踐一些更有效的廣告策略[3]。

4小結(jié)

總而言之,隨著互聯(lián)網(wǎng)信息技術(shù)的高速發(fā)展,數(shù)據(jù)新的膨脹化導(dǎo)致數(shù)據(jù)挖掘技術(shù)的優(yōu)化勢(shì)在必行,智能化數(shù)據(jù)挖掘系統(tǒng)的應(yīng)用有助于企業(yè)在業(yè)務(wù)開(kāi)展過(guò)程中能夠獲取更大的客戶(hù)源,提升自身的綜合水平,優(yōu)化業(yè)務(wù)處理效率,智能化數(shù)據(jù)挖掘系統(tǒng)的研發(fā)在未來(lái)有著更為客觀的前景。作者簡(jiǎn)介:周小春,1975年生,男,助理工程師,研究方向:智能化系統(tǒng)集成。

參考文獻(xiàn)

[1]楊金勞.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用研究[J].電子技術(shù)與軟件工程,2018(2):188.

[2]王向.大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘技術(shù)對(duì)管理會(huì)計(jì)職能的影響[J].經(jīng)貿(mào)實(shí)踐,2018(5):22.

[3]許兆新.基于元知識(shí)的數(shù)據(jù)挖掘系統(tǒng)研究[D].哈爾濱:哈爾濱工程大學(xué),2003.

作者:周小春 單位:江蘇展揚(yáng)系統(tǒng)集成有限公司