數(shù)據(jù)挖掘在網(wǎng)絡病毒預防的應用

時間:2022-02-22 08:33:14

導語:數(shù)據(jù)挖掘在網(wǎng)絡病毒預防的應用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘在網(wǎng)絡病毒預防的應用

摘要:在網(wǎng)絡不斷普及的過程中,其逐漸被應用于金融、財產(chǎn)、人際關系等多種領域,在網(wǎng)絡的應用過程中所產(chǎn)生的大量數(shù)據(jù)會造成網(wǎng)絡病毒,因此,對海量網(wǎng)絡數(shù)據(jù)進行挖掘不僅能夠幫助用戶更好使用數(shù)據(jù),同時能夠預防使用過程中的網(wǎng)絡病毒。數(shù)據(jù)挖掘技術在網(wǎng)絡病毒預防中的應用,首先提出挖掘原理,建立數(shù)據(jù)開采模型和挖掘過程,同時在挖掘過程中建立數(shù)據(jù)倉庫,利用貝葉斯算法預防病毒,幫助提高網(wǎng)絡安全性。

關鍵詞:數(shù)據(jù)挖掘;網(wǎng)絡病毒預防;貝葉斯

1引言

隨著數(shù)據(jù)庫、數(shù)據(jù)倉庫等數(shù)據(jù)倉儲技術的發(fā)展,信息系統(tǒng)逐漸被金融、財產(chǎn)、人際關系等多種領域運用。數(shù)據(jù)化時代的來臨,給人們帶來便利的同時,如此海量的數(shù)據(jù)也讓人難以消化。從表面來看,海量數(shù)據(jù)中蘊含著許多有用信息,但是這些數(shù)據(jù)不能運用到實際工作中。同時隨著數(shù)據(jù)的增加,負面作用也越來越明顯[1]。巨大的信息量難以處理,同時真?zhèn)坞y辨,為信息安全帶來威脅。在這種情況下,人們開始意識到數(shù)據(jù)挖掘的重要性。信息挖掘技術能夠被應用于網(wǎng)絡防護、危險評估等,有效檢測網(wǎng)絡病毒和入侵行為。挖掘是一門混合型的學科,其中涉及數(shù)據(jù)庫技術、統(tǒng)計學知識、可視化、信息學科等。數(shù)據(jù)挖掘技術能夠將已有的數(shù)據(jù)進行整理,同時對其中隱藏數(shù)據(jù)進行提取。數(shù)據(jù)挖掘技術能夠有效監(jiān)測出網(wǎng)絡病毒的活動并進行預防[2]。數(shù)據(jù)挖掘技術能夠實現(xiàn)病毒的預防與檢測,對入侵病毒的數(shù)量和形式進行反饋。數(shù)據(jù)挖掘技術對數(shù)據(jù)起到重要的保護作用,在實際生活中得到廣泛應用。

2數(shù)據(jù)挖掘技術在網(wǎng)絡病毒預防中的應用原理

數(shù)據(jù)庫在數(shù)據(jù)挖掘過程中被作為數(shù)據(jù)管理系統(tǒng)廣泛使用,隨著數(shù)據(jù)庫中數(shù)據(jù)的不斷儲存,數(shù)據(jù)分析處理技術需要不斷發(fā)展。數(shù)據(jù)庫中,人們能夠利用的數(shù)據(jù)僅僅是其中的一小部分,其中大部分有用數(shù)據(jù),由于使用工具的局限性不能被人們很好利用。數(shù)據(jù)庫中的數(shù)據(jù)被人們所利用的僅僅是很小一部分,但是這些信息在決策生成的過程中具有重要的參考價值。為此,研究數(shù)據(jù)挖掘技術在網(wǎng)絡病毒預防中的應用[3]。數(shù)據(jù)挖掘就是“對數(shù)據(jù)庫中蘊涵的、未知的、有潛在應用價值的、非平凡的模式的提取”。數(shù)據(jù)挖掘基本原理可分為六個過程,具體如下。(1)明確任務:了解應用領域與知識背景,并且明確所要完成的數(shù)據(jù)挖掘任務;(2)數(shù)據(jù)選擇:從大數(shù)據(jù)中提取需要的數(shù)據(jù),對其進行數(shù)據(jù)挖掘;(3)數(shù)據(jù)預處理與轉換:對數(shù)據(jù)進行挖掘,提取所需要的數(shù)據(jù),處理后轉變成為有效數(shù)據(jù),方便后期進一步進行數(shù)據(jù)挖掘;(4)數(shù)據(jù)挖掘:根據(jù)數(shù)據(jù)挖掘的任務要求,選擇合適的數(shù)據(jù)挖掘方式,將挖掘結果轉變成為易理解的形式;(5)模式解釋:對發(fā)現(xiàn)的模式進行解釋與評估,需要精確數(shù)據(jù)時,重復以上步驟處理數(shù)據(jù);(6)知識評價:將挖掘處理過后的數(shù)據(jù),轉變成為用戶能夠理解的方式,方便使用。

3網(wǎng)絡數(shù)據(jù)挖掘目標和方法

在網(wǎng)絡信息數(shù)據(jù)挖掘過程中,根據(jù)挖掘任務和目標的不同,在挖掘數(shù)據(jù)過程中,將主要能夠將發(fā)現(xiàn)的典型知識分為以下幾類。(1)關聯(lián)規(guī)則(AssociationRule):根據(jù)數(shù)據(jù)之間的關聯(lián),從數(shù)據(jù)庫中發(fā)現(xiàn)那些確信度(Confidence)和支持度(Support)都大于給定值的強壯規(guī)則。目前,從數(shù)據(jù)庫中發(fā)現(xiàn)關聯(lián)規(guī)則的概念已從單一概念層次發(fā)展到多個概念層次[4]。在實際的網(wǎng)絡數(shù)據(jù)中,需要用到的相關規(guī)則數(shù)量都較大,并且其中一些規(guī)則會影響用戶的判斷。(2)分類(Classification):分類作為網(wǎng)絡數(shù)據(jù)挖掘中最基本的認知形式,就是對網(wǎng)絡數(shù)據(jù)庫中的每一項數(shù)據(jù)進行分類。通過數(shù)據(jù)庫的建立,作為數(shù)據(jù)挖掘的重要基礎。(3)聚類(Clustering):聚類方法區(qū)別于機器學習中將數(shù)據(jù)分類的監(jiān)督學習,被稱為非監(jiān)督學習[5]。數(shù)據(jù)聚類通常會采用將對象分成幾個群體的方法,每一個群體中都存在較高相似度,不同群體中相似度較低。

4數(shù)據(jù)挖掘技術在網(wǎng)絡病毒預防中的應用

數(shù)據(jù)挖掘在網(wǎng)絡病毒預防中的應用有著多變、需要管理、信息豐富、需要進行決策等領域特點[6]。所以首先需要對網(wǎng)絡數(shù)據(jù)建立數(shù)據(jù)倉庫,利用數(shù)據(jù)挖掘和分析工具,將網(wǎng)絡數(shù)據(jù)中需要的信息進行挖掘。通過對系統(tǒng)中相關數(shù)據(jù)的抽取、加工、整理以及加載到數(shù)據(jù)倉庫中,形成數(shù)據(jù)庫中基礎的數(shù)據(jù)。在建立數(shù)據(jù)倉庫后,利用貝葉斯算法,它可以很好地從任務的分類中進行區(qū)劃,能夠很好地對網(wǎng)絡數(shù)據(jù)進行挖掘和檢測保護。在計算過程中,以A1,A2,A3,A4,A5,…,Am作為m的屬性,屬性分類為V,讓每個屬性A,有一個領域(a1,a2,a3,a4,a5,…,ad)和分類V領域(v1,v2,v3,v4,v5,…,vd),其中的分類數(shù)據(jù)點更加傾向于(a1,a2,a3,a4,a5,…,Am+v1),得到公式:()1111arg()miv=manPv∏Pav=丨(1)()()()11111#,arg##miavvmanvv=∏=(2)這個方法能夠有效應用于數(shù)據(jù)挖掘的網(wǎng)絡病毒預防中。

5結語

隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡逐漸被應用到生活的各個領域中。網(wǎng)絡信息安全變得尤為重要,這不僅關系到網(wǎng)絡安全,更關系到各個領域的隱私問題。利用信息挖掘技術能夠有效提高互聯(lián)網(wǎng)信息安全系數(shù),做到更加具有針對性的網(wǎng)絡信息安全保護和病毒預防。在數(shù)據(jù)挖掘技術在網(wǎng)絡病毒預防中的應用過程中,首先建立開采模型,并且提出數(shù)據(jù)挖掘過程,建立網(wǎng)絡數(shù)據(jù)倉庫,通過關聯(lián)工具和解構對計算機數(shù)據(jù)進行挖掘,對數(shù)據(jù)挖掘算法進行描述,利用貝葉斯算法預防網(wǎng)絡病毒的入侵,解決網(wǎng)絡病毒防御中的問題,有效提高網(wǎng)絡安全性。

參考文獻

[1]錢維揚,王俊義,仇洪冰.基于Hadoop的數(shù)據(jù)挖掘技術在測光紅移上的研究[J].電子技術應用,2016,42(9):111-114.

[2]張子昂,黃震方,靳誠,等.基于微博簽到數(shù)據(jù)的景區(qū)旅游活動時空行為特征研究——以南京鐘山風景名勝區(qū)為例[J].地理與地理信息科學,2015,31(4):121-126.

[3]張加余,蔡偉,李云,等.HPLC/LTQ-OrbitrapMSn結合MDF數(shù)據(jù)挖掘技術快速鑒定藏白蒿綠原酸類似物[J].質譜學報,2015,36(4):321-327.

[4]和敬涵,劉琳.基于冗余信息的智能變電站協(xié)同后備保護及故障預判算法研究[J].電力科學與技術學報,2015(2):3-8.

[5]萬祥,胡念蘇,韓鵬飛,等.大數(shù)據(jù)挖掘技術應用于汽輪機組運行性能優(yōu)化的研究[J].中國電機工程學報,2016,36(2):459-467.

[6]潘鴻,王洪峰,王宇峰,等.基于數(shù)據(jù)挖掘技術探究治療糖尿病周圍神經(jīng)病變的針灸取穴規(guī)律[J].中國針灸,2016,36(10):1111-1114.

作者:張凱斐 王翠娥 單位:呂梁學院