神經網絡綜述范文
時間:2024-03-28 17:40:40
導語:如何才能寫好一篇神經網絡綜述,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
關鍵詞:神經網絡;VC維;數據挖掘
中圖分類號:TP183文獻標識碼:A文章編號:1009-3044(2008)30-0710-02
A Review of the Research and Development of the Artificial Neural Nets
WANG Hui
(Xinjiang Petroleum Institute,Urumqi 830000,China)
Abstract: This paper reviews the history and the current situation of the theory of neural nets. It discusses two aspects: the Vapnik-Chervonenkis dimension calculation and the data mining in neural nets. It also touches upon such research areas as calculation theory, methods and application of neural nets.
Key words: neural nets;Vapnik-Chervonenkis dimension;Data Mining
1 引言
本世紀初,科學家們就一直探究大腦構筑函數和思維運行機理。特別是近二十年來。對大腦有關的感覺器官的仿生做了不少工作,人腦含有數億個神經元,并以特殊的復雜形式組成在一起,它能夠在計算某些問題(如難以用數學描述或非確定性問題等)時,比目前最快的計算機還要快許多倍。大腦的信號傳導速度要比電子元件的信號傳導要慢百萬倍,然而,大腦的信息處理速度比電子元件的處理速度快許多倍,因此科學家推測大腦的信息處理方式和思維方式是非常復雜的,是一個復雜并行信息處理系統。1943年McCulloch和Pitts結合了神經生理學和數理邏輯的研究描述了一個神經網絡的邏輯演算。他們的神經元模型假定遵循一種所謂“有或無”(all-or-none)規則。如果如此簡單的神經元數目足夠多和適當設置突觸連接并且同步操作,McCulloch和Pitts證明這樣構成的網絡原則上可以計算任何可計算的函數,這標志著神經網絡學科的誕生。
2 發展歷史及現狀
2.1 人工神經網絡理論的形成
早在40年代初,神經解剖學、神經生理學、心理學以及人腦神經元的電生理的研究等都富有成果。其中,神經生物學家McCulloch提倡數字化具有特別意義。他與青年數學家Pitts合作[1],從人腦信息處理觀點出發,采用數理模型的方法研究了腦細胞的動作和結構及其生物神經元的一些基本生理特性,他們提出了第一個神經計算模型,即神經元的閾值元件模型,簡稱MP模型,他們主要貢獻在于結點的并行計算能力很強,為計算神經行為的某此方面提供了可能性,從而開創了神經網絡的研究。50年代初,神經網絡理論具備了初步模擬實驗的條件。Rochester,Holland與IBM公司的研究人員合作,他們通過網絡吸取經驗來調節強度,以這種方式模擬Hebb的學習規則,在IBM701計算機上運行,取得了成功,幾乎有大腦的處理風格。但最大規模的模擬神經網絡也只有1000個神經元,而每個神經元又只有16個結合點。再往下做試驗,便受到計算機的限制。人工智能的另一個主要創始人Minsky于1954年對神經系統如何能夠學習進行了研究,并把這種想法寫入他的博士論文中,后來他對Rosenblatt建立的感知器(Perceptron)的學習模型作了深入分析。
2.2 第一階段的研究與發展
1958年計算機科學家Rosenblatt基于MP模型,增加了學習機制,推廣了MP模型。他證明了兩層感知器能夠將輸入分為兩類,假如這兩種類型是線性并可分,也就是一個超平面能將輸入空間分割,其感知器收斂定理:輸入和輸出層之間的權重的調節正比于計算輸出值與期望輸出之差。他提出的感知器模型,首次把神經網絡理論付諸工程實現。1960年Widrow和Hoff提出了自適應線性元件ADACINE網絡模型,是一種連續取值的線性網絡,主要用于自適應系統。他們研究了一定條件下輸入為線性可分問題,期望響應與計算響應的誤差可能搜索到全局最小值,網絡經過訓練抵消通信中的回波和噪聲,它還可應用在天氣預報方面。這是第一個對實際問題起作用的神經網絡。可以說,他們對分段線性網絡的訓練有一定作用,是自適應控制的理論基礎。Widrow等人在70年代,以此為基礎擴充了ADALINE的學習能力,80年代他們得到了一種多層學習算法。
Holland于1960年在基因遺傳算法及選擇問題的數學方法分析和基本理論的研究中,建立了遺傳算法理論。遺傳算法是一種借鑒生物界自然選擇和自然遺傳機制的高度并行、隨機、自適應搜索算法,從而開拓了神經網絡理論的一個新的研究方向。1976年Grossberg提出自適應共振理論(ART),這是感知器較完善的模型,即superrised學習方式。本質上說,仍是一種unsuperrised學習方式。隨后,他與Carpenter一起研究ART網絡,它有兩種結構ART1和ART2,能夠識別或分類任意多個復雜的二元輸入圖像,其學習過程有自組織和自穩定的特征,一般認為它是一種先進的學習模型。另外還有Werbos提出的BP理論以及提出的反向傳播原理;Fukushima 提出了視覺圖象識別的Neocognitron模型這些研究成果堅定的神經網絡理論的繼續研究。
2.3 第二次研究的階段
Hopfield于1982年至1986年提出了神經網絡集體運算功能的理論框架,隨后,引起許多學者研究Hopfield 網絡的熱潮,對它作改進、提高、補充、變形等,至今仍在進行,推動了神經網絡的發展。1983年Kirkpatrick等人先認識到模擬退火算法可應用于NP完全組合優化問題的求解。這種思想最早是由Metropolis等人在1953年提出的,即固體熱平衡問題,通過模擬高溫物體退火過程的方法,來找全局最優或近似全局最優,并給出了算法的接受準則。這是一種很有效的近似算法。1984年Hinton等人提出了Boltzmann機模型,借用統計物理學中的概念和方法,引入了模擬退火方法,可用于設計分類和學習算法方面,并首次表明多層網絡是可訓練的。Sejnowski于1986年對它進行了改進,提出了高階Boltzmann機和快速退火等。
1986年Rumelhart和McClelland 合著的Parallel Distributed Processing: Exploratio n in the Microstructures of Cognition兩卷書出版,對神經網絡的進展起了極大的推動作用。它展示了PDP研究集團的最高水平,包括了物理學、數學、分子生物學、神經科學、心理學和計算機科學等許多相關學科的著名學者從不同研究方向或領域取得的成果。他們建立了并行分布處理理論,主要致力于認知的微觀研究。尤其是,Rumelhart提出了多層網絡Back-Propagation法或稱Error Propagation法,這就是后來著名的BP算法。
2.4 新發展階段
90年代以來,人們較多地關注非線性系統的控制問題,通過神經網絡方法來解決這類問題已取得了突出的成果,它是一個重要的研究領域。1990年Narendra和Parthasarathy提出了一種推廣的動態神經網絡系統及其連接權的學習算法,它可表示非線性特性,增強了魯棒性。他們給出了一種新的辨識與控制方案,以multilayer網絡與recarrent網絡統一的模型描述非線性動態系統,并提出了動態BP 參數在線調節方法。尤其是進化計算的概念在1992年形成,促進了這一理論的發展。1993年誕生了國際性雜志Evolutionary Computation。近幾年它成為一個熱點研究領域。1993年Yip和Pao提出了一種帶區域指引的進化模擬退火算法,他們將進化策略引入區域指引,它經過選優過程,最終達到求解問題的目的。
從上述各個階段發展軌跡來看,神經網絡理論有更強的數學性質和生物學特征,尤其是神經科學、心理學和認識科學等方面提出一些重大問題,是向神經網絡理論研究的新挑戰,因而也是它發展的最大機會。90年代神經網絡理論日益變得更加外向,注視著自身與科學技術之間的相互作用,不斷產生具有重要意義的概念和方法,并形成良好的工具。
3 神經網絡的發展趨勢
3.1 神經網絡VC維計算
神經計算技術已經在很多領域得到了成功的應用,但由于缺少一個統一的理論框架,經驗性成分相當高。最近十年里,很多研究者都力圖在一個統一的框架下來考慮學習與泛化的問題 。PAC(Probably Approximately Correct)學習模型就是這樣一個框架。作為PAC學習的核心以及學習系統學習能力的度量,VC維(Vapnik-Chervonenkis dimension)在確定神經網絡的容量(capacity)、泛化能力(generalization)、訓練集規模等的關系上有重要作用。如果可以計算出神經網絡的VC維,則我們可以估計出要訓練該網絡所需的訓練集規模;反之,在給定一個訓練集以及最大近似誤差時,可以確定所需要的網絡結構。
Anthony將VC維定義為:設F為一個從n維向量集X到{0, 1}的函數族,則F的VC維為X的子集E的最大元素數,其中E滿足:對于任意S?哿E,總存在函數fs ∈F,使得當x ∈ S時fs(x) =1,x?埸S但x∈E時fs(x) =0。
VC維可作為函數族F復雜度的度量,它是一個自然數,其值有可能為無窮大,它表示無論以何種組合方式出現均可被函數族F正確劃分為兩類的向量個數的最大值。對于實函數族,可定義相應的指示函數族,該指示函數族的VC維即為原實函數族的VC維。
3.2 基于神經網絡的數據挖掘
1996年,Fayyad、Piatetsky-Shapiro和Smyth對KDD(Knowledge Discovery from Databases)和數據挖掘的關系進行了闡述。但是,隨著該領域研究的發展,研究者們目前趨向于認為KDD和數據挖掘具有相同的含義,即認為數據挖掘就是從大型數據庫的數據中提取人們感興趣的知識。
數據挖掘的困難主要存在于三個方面:首先,巨量數據集的性質往往非常復雜,非線性、時序性與噪音普遍存在;其次,數據分析的目標具有多樣性,而復雜目標無論在表述還是在處理上均與領域知識有關;第三,在復雜目標下,對巨量數據集的分析,目前還沒有現成的且滿足可計算條件的一般性理論與方法。在早期工作中,研究者們主要是將符號型機器學習方法與數據庫技術相結合,但由于真實世界的數據關系相當復雜,非線性程度相當高,而且普遍存在著噪音數據,因此這些方法在很多場合都不適用。如果能將神經計算技術用于數據挖掘,將可望借助神經網絡的非線性處理能力和容噪能力,較好地解決這一問題。
4 結束語
經過半個多世紀的研究,神經計算目前已成為一門日趨成熟,應用面日趨廣泛的學科。本文對神經計算的研究現狀和發展趨勢進行了綜述,主要介紹了神經網絡VC維計算、基于神經網絡的數據挖掘領域的相關研究成果。需要指出的是,除了上述內容之外,神經計算中還有很多值得深入研究的重要領域,例如:與符號學習相結合的混合學習方法的研究;脈沖神經網絡(Pulsed Neural Networks)的研究;循環神經網絡(Recurrent Neural Networks)的研究等;神經網絡與遺傳算法、人工生命的結合;支持向量機(Support Vector Machine)的研究;神經網絡的并行、硬件實現;容錯神經網絡的研究。
參考文獻:
[1] McCulloch W S, Pitts W. A Logical Calculus of the Ideas Immanent in Nervous Activity, Bulletin of Mathematical Biophysics, 1943.
[2] N.維納著,郝季仁譯,控制論,科學出版,1985.
[3] Von Neumann J. The General and Logical Theory of Automata, Cerebral Mechanisms in Behavior; The Hixon Sympsium, 1951.
[4] Hebb D O. The Organization of Behavior, New York:Wiley, 1949.
[5] 陳世福,陳兆乾. 人工智能與知識工程[M]. 南京: 南京大學出版社,1998.
[6] Simon Haykin.神經網絡原理[M].機械工業出版社(第二版),2004.
篇2
【關鍵詞】極限學習機 故障診斷 神經網絡
引言
隨著設備復雜化程度的提高,對故障診斷的快速性和準確性提出了更高的要求。將神經網絡應用于故障診斷中已成為一個非常活躍的研究領域。利用神經網絡強大的分類能力,進行故障模式的分類與學習,診斷出故障。
Huang在前人研究的基礎上提出了一種稱為極限學習機(Extreme Learning Machine,ELM)的學習方法,在保留計算精度的同時可以大幅度的縮減訓練的時間。將ELM運用到設備故障診斷中,極大提高了診斷的快速性和準確性。
一、極限學習機研究現狀
ELM自2004年提出就一直受到學者的極大興趣。我們從ELM的理論和應用兩方面進行闡述。
1.1 ELM的理論
對于傳統ELM算法,網絡結構、激活函數類型以及隱層神經元的選擇對其泛化性能都有重要的影響。為了提高計算效率,使得ELM適用于更多應用領域,研究者提出了許多ELM擴展算法。
1.2 ELM的應用
研究人員已嘗試利用ELM方法解決現實中各種模式分類問題。隨著ELM自身理論的進一步發展和完善,在人臉識別、文本分類、醫療診斷等領域中應用廣泛。
二、故障診斷技術研究現狀
故障診斷技術是由于建立監控系統的需要而發展起來的。其發展至今經歷了3個階段。新的診斷技術帶來了領域內算法的革新,設備精密程度的提高也對診斷實時性提出了更高的要求。如何保證故障的快速準確診斷成了診斷技術發展重要內容。
基于神經網絡的故障診斷運用廣泛,然而傳統的神經網絡學習方法存在許多問題。與傳統的神經網絡相比,極限學習機方法通過隨機選取輸入權值及隱層單元的偏置值,可以產生唯一的最優解,并具有參數易于選擇以及泛化能力好等特點,在眾多領域有著廣泛應用。
三、基于極限學習機的故障診斷方法研究
3.1基于ELM的故障診斷流程
(1)數據預處理。按照選取的特征向量和故障類型對故障樣本進行預處理,并將處理后的樣本按比例分為訓練樣本集和測試樣本集。
(2)ELM的學習算法主要有以下3個步驟:確定隱含層神經元個數;隨機設定輸入層與隱含層間的連接權值和隱含層神經元的偏置;選擇隱含層神經元激活函數,進而計算隱含層輸出矩陣計算輸出層權值。
(3)用訓練好的ELM模型對測試樣本集進行分類,并輸出分類結果。
3.2基于改進ELM的故障診斷
針對極限學習機神經網絡初始權閾值對算法性能的影響問題,提出融合遺傳算法(GA)與粒子群算法(PSO)的GA-PSO算法,用于優化ELM神經網絡初始權閾值。該算法將群組一分為二,分別采用GA和PSO算法,再將優秀個體進行合并,改善了PSO算法全局搜索能力,同時增強GA算法的局部搜索效能。
篇3
隨著計算機網絡、信息技術、自動化技術的進步,極大的改變了我們的生活。人工神經網絡技術是一種全新的控制技術,通過互聯網進行動態模擬,從而建立一種新的控制互聯網的系統。經過十幾年的發展,人工神經網絡技術研究取得了巨大的進步,已經廣泛應用在社會各個領域,使現代計算機中的難題得到了解決。本文主要從人工神經網絡技術的概念出發,探討了它在現代社會領域的具體應用。
【關鍵詞】人工神經網絡 信息技術 發展趨勢
人工神經網絡技術在處理實際問題主要包括兩個過程,一個是學習訓練過程,另外一個是記憶聯想過程。近年來隨著人工網絡技術的發展,人工神經網絡技術在信號處理、圖像處理、智能識別等領域已經取得了巨大的改變,為人們研究各類科學問題提供了一種新的方法和手段,使人們在交通運輸、人工智能、軍事、信息領域的工作更加便捷,近年來隨著AI的l展,人工神經網絡技術得到了快速的發展階段。
1 人工神經網絡技術
人工神經網絡技術也稱ANN,是隨著上個世紀八十年代人工智能發展興起的一個研究熱點,它的主要工作原理對人腦神經網絡進行抽象處理,并仿造人腦神經網絡建立簡單的模型,按照不同的連接方式組成一個完整的網絡,因此學術界也直接將它成為神經網絡。神經網絡其實就是一種運算模型,它是通過大量的節點――神經元連接起來的,其中不同的節點所代表的輸出函數也不同,也就是所謂的激勵函數;當有兩個節點連接起來時稱之為通過該連接信號的加權值,也稱為權重,這就相當人腦神經網絡記憶。人工神經網絡技術是采用并行分布式系統,這種工作機理與傳統的信息處理技術和人工智能技術完全不同,是一種全新的技術,它克服了傳統基于邏輯符號的人工智能處理非結構信息化和直覺方面的缺陷,具有實時學習、自適應性和自組織性等特點。
2 人工神經網絡技術應用分析
隨著人工神經網絡技術的發展,它在模式識別、知識工程、信號處理、專家系統、機器人控制等方面的應用較廣。
2.1 生物信號的檢測分析
目前大部分醫學檢測設備都是通過連續波形得到相關數據,從而根據所得數據對病情進行診斷。人工神經網絡技術就是應用了這樣的方式將多個神經元組合起來構成,解決了生物醫學信號檢測方面的難題,其適應性和獨立性強,分布貯藏功能多。在生物醫學領域該技術主要應用于對心電信號、聽覺誘發電位信號、醫學圖像、肌電荷胃腸等信號的處理、識別和分析。
2.2 醫學專家系統
傳統的醫院專家系統是直接將專家的經驗、學歷、臨床診斷方面取得的成績等存儲在計算機中,構建獨立的醫學知識庫,通過邏輯推理進行診斷的一種方式。進入到二十一世紀,醫院需要存儲的醫學知識越來越多,每天產生新的病況和知識,過去的一些專家系統顯然已經無法適應醫院的發展需求,因此醫院的效率很低。而人工神經網絡技術的出現為醫院專家系統的構建提出了新的發展方向,通過人工神經網絡技術,系統能夠自主學習、自己組織、自行推理。因此在醫學專家系統中該網絡技術應用面較廣。麻醉醫學、重癥醫學中生理變量分析和評估較多,目前臨床上一些還沒有確切證據或者尚未發現的關系與現象,通過人工神經網絡便能有效地解決。
2.3 市場價格預測
在經濟活動中,傳統統計方法受到一些因素的制約,無法對價格變動做出準確的預測,因此難免在預測的時候出現失誤的現象。人工神經網絡技術能夠處理那些不完整的、規律不明顯、模糊不確定的數據,并作出有效地預測,因此人工神經網絡技術具有傳統統計方法無法比擬的優勢。例如人工神經網絡技術可以通過分析居民人均收入、貸款利率和城市化發展水平,從而組建一個完整的預測模型,準確預測出商品的價格變動情況。
2.4 風險評價
在從事某一項特定的活動時,由于社會上一些不確定因素,可能造成當事人經濟上或者其他方面的損失。因此在進行某一項活動時,對活動進行有效的預測和評估,避免風險。人工神經網絡技術可以根據風險的實際來源,構筑一套信用風險模型結構和風險評估系數,從而提出有效地解決方案。通過信用風險模型分析彌補主觀預測方面的不足,從而達到避免風險的目的。
3 人工神經網絡技術未來發展
人工神經網絡克服了傳統人工智能對語言識別、模式、非結構化信息處理的缺陷,因此在模式識別、神經專家系統、智能控制、信息處理和天氣預測等領域廣泛應用。隨著科學技術的進步,AI的快速發展,AI與遺傳算法、模糊系統等方面結合,形成了計算智能,很多企業和國家開始大規模研發AI,人工神經網絡正在模擬人類認知的方向發展,目前市場已經有很多不少人工智能產品面世。
4 結語
通過上述研究分析,人工神經網絡技術已經取得了相應的發展,但還存在很多不足:應用范圍狹窄、預測精度低、通用模型缺乏創新等,因此需要我們在此基礎上不斷尋找新的突破點,加強對生物神經元系統的研究和探索,進一步挖掘其潛在的價值,將人工神經網絡技術應用在更多領域中,為社會創造更大的財富。
參考文獻
[1]周文婷,孟琪.運動員賽前心理調控的新策略――基于人工神經網絡技術的比賽場地聲景預測(綜述)[J].哈爾濱體育學院學報,2015,33(03):15-21.
[2]張紅蘭.人工神經網絡技術的應用現狀分析[J].中國新通信,2014(02):76-76.
[3]張廣軍.人工神經網絡技術在光電檢測中的應用[J].北京航空航天大學學報,2001,27(05):564-568.
篇4
關鍵詞:智能交通 ;預測 ;短時交通信息
中圖分類號:U491文獻標識碼:A0
引言
智能交通(ITS)是將人工智能技術、自動控制技術、計算機技術、先進的信息通信技術及傳感器技術等有效的集成,并應用于整個地面交通管理系統而建立的一種大范圍、全方位發揮作用的綜合交通運輸管理系統,包括先進交通管理系統(ATMS)、先進的駕駛員信息系統(ATIS)、先進公共運輸系統(APTS)、出行指導系統等[2,3]。
短期交通信息預測是對城市交通系統或高速公路系統中某條道路或某個交通網絡在未來一段時間內(時間跨度通常不超過15分鐘)交通流等信息的變化情況進行預測,其結果可以用于制訂和實施交通管理,對交通流進行調節,實現路徑誘導,也可以直接送到先進的交通信息系統和先進的交通管理系統中,為出行者提供實時有效的信息,以更好地進行路徑選擇,縮短出行時間,減少交通擁擠。目前,短期交通信息預測的研究越來越受到重視,已經成為智能交通領域的重點研究內容之一[3]。
本文對短時交通信息的幾種主要預測方法進行了介紹,重點分析了時間序列、神經網絡、非參數回歸、支持向量機等幾種預測方法的優缺點、應用場合,并對當前研究中的問題和未來發展趨勢作了介紹。
1短時交通信息預測方法分類
短期交通信息的預測包括對交通流三大參數,即交通流量、車流速度和密度預測,以及對行程時間等其他信息的預測。從20世紀50年代中期開始,國內外的研究人員對交通系統的短時交通信息的預測方法進行了廣泛的研究,從早期的歷史平均法、指數平滑法、譜分析方法、時間序列分析,到近十幾年發展起來的神經網絡方法、小波分析方法、混沌預測、支持向量機、動態交通分配等預測方法,應用于智能交通領域的短時預測方法有幾十種[10]。根據各種預測方法本身的性質和研究問題的角度不同,常見的預測方法可以分為兩大類:一類是基于數據驅動的預測方法,結合統計經驗進行分析,如神經網絡、支持向量機等方法;另一類是基于機理的預測方法,即以交通理論的為基礎,從交通工程上的供求關系角度進行分析,如動態交通分配法(DTA,Dynamic traffic assignment)[2][12]。常見的預測方法具體分類如圖1所示。
交通流是一個時變過程,不同的空間位置環境其狀態特征差異大,各種預測方法也都有各自的優缺點和相應的適用場合,因此對各種環境條件下的交通信息預測應當是一個綜合運用各種方法相互補充的過程。一個成功的交通流預測過程應能正確反映被測過程及其環境變化并及時調整模型結構,使預測具有適應性。
圖1 短時交通信息預測方法分類
2短時交通信息主要預測方法
2.1時間序列模型
時間序列分析主要指采用參數模型對觀測到的有序隨機數據進行分析和處理的一種數據處理方法。其預測原理是將預測對象隨時間變化形成的數據序列看成一個隨機時間序列,該序列的未來發展變化與對象歷史變化存在依賴性和延續性,包括自回歸模型(AR,Auto-Regressive)、滑動平均模型(MA,Moving Average)、自回歸綜合滑動平均模型(ARIMA,Auto-Regressive Integrated Moving Average)等[1]。其中單變量ARIMA是典型的時間序列方法,適用于短時交通信息預測,它實際上是用二項式差分消除了非平穩時序中的多項式趨向,從系統角度分析,就是分離出了系統中相同的一階環節,從而可以按照平穩時序建模。ARIMA適用于穩定的交通流。但是時間序列方法的缺點是:1)交通狀況變化時由于計算量大,該算法具有預測延遲的特點,且算法本身依賴于大量不間斷的數據,若實際中數據遺失則預測精度變低,算法的魯棒性差;2)模型是通過研究交通流過去的變化規律來外推或預測其未來值,只利用了歷史數據,沒有考慮其他影響因素,如相鄰路段、天氣變化影響等,所以交通狀態急劇變化時,預測結果與實際情況差別很大;3)模型參數的求解一般是離線進行的,并且在預測過程中的模型參數是固定的,不能移植,不能很好的適應不確定性強的短時交通流動態預測要求[5][13]。與單變量ARIMA相似,多變量時間序列預測也得到了廣泛研究,包括多變量時間序列模型包括向量ARIMA、空間時間ARIMA等,這些模型主要考慮交通網絡中多個節點交通流之間的相互聯系,一定程度上更能反映交通流的本質特征,但由于模型過于復雜,在實際中很難實現。
2.2神經網絡模型
神經網絡是一種并行的、分布式的智能信息處理方法,具有非線性映射和聯想記憶功能,非常適合解決強非線性、時變系統的預測問題。利用神經網絡對環境變化的較強的自適應學習能力和較好的抗干擾能力,可以克服傳統交通信息預測方法的局限性,所以在智能交通系統得到了廣泛的應用。目前,在交通信息預測方向的神經網絡預測研究主要分為三個層次[18]:
1)將某一類神經網絡方法直接用于短時交通信息預測的方法有:例如BP神經網絡、RBF神經網絡、時滯神經網絡等;
2)將兩種或多種神經網絡相結合的混合預測模型:例如神經網絡集成方法;
3)將神經網絡與其他方法結合,進行綜合預測的方法:例如模糊神經網絡、粗神經網絡、以及小波神經網絡等。粗神經網絡建立在粗神經元基礎上,基于粗糙集理論和近似概念建立的粗神經元可以看作由兩個存在重疊的常規神經元組成。粗神經網絡中的常規神經元對應于確定性變量,如交通流量密度、速度以及行程時間,粗神經元用于描述不確定性變量或變量波動情況,如偶發事故、天氣原因引起的交通流參數波動[3]。小波神經網絡是在小波分析基礎上提出的前饋網絡,與傳統神經網絡的區別是隱含層節點激勵函數不是Sigmoid函數而是小波函數。小波神經網絡原理是:交通流在不同時間尺度上具有自相似性和多尺度特征,低頻部分反映的是總體變化趨勢,高頻部分是隨機性和不穩定性的表現,因此可以利用小波分析方法將交通信息中的高頻部分和低頻部分預測。
不過,將神經網絡用于實際交通系統預測的難點是神經網絡的訓練時間較長,普適性差,交通狀態變化時難以在線調整,不適用于大規模網絡。
2.3非參數回歸
非參數回歸是利用模式匹配算法,找到一組與輸入數據相對應的數據或相似的數據來預測[8],對應關系不需要精確的函數表達式,而是一個近似的關系。在每次模式匹配算法中,隨著輸入數據模式變化,這個近似的關系也會有變化,從而達到動態預測的目的[18]。非參數回歸方法本質上是一種數據驅動的智能方法,認為系統所有因素之間的內在聯系都蘊含在歷史數據中,從大量的歷史數據樣本中找到所需的匹配數據,依賴匹配數據預測。
利用非參數回歸進行短時交通流預測的原理是:對于固定的道路狀況,車流的上下游因果關系是具有重復性的,同時這種因果關系也是隨著時間變化的,由于交通流的時變性和非線性,尋找這種動態的具體映射關系是不現實的,采用基于數據驅動的非參數回歸方法是一種較好的解決方法[21]。文[20]對非參數回歸方法在短時交通預測中的可行性進行了分析。文[8]利用反饋機制對系統變量和輸入變量進行動態調節,提高了非參數回歸方法的預測精度,并通過北京市路網的交通流預報實例證明了這種方法的有效性。
非參數回歸方法的優點是:1)不需要先驗和大量的參數識別,不必確定任何模型參數,只需要足夠的歷史數據,尋找歷史數據中與當前點相似的近鄰,并用這些近鄰預測下一時段的流量;2)應對突發事件能力強,預測準確性和誤差分布較好算法原理清晰,魯棒性好,尤其適用于交通狀態不穩定時的系統預測。非參數回歸方法的缺點是:存儲的歷史數據較多時查找近似點的效率就會降低,影響預測速度,另外交通環境變化時導致狀態和流量的對應關系發生變化,需要更新數據庫信息[18,19]。
2.4混沌預測
交通系統是一個復雜的大系統,它表現出來的非線性動力學性質之一就是混沌現象。實際上,在一個較短的時間段內(例如10分鐘),每條道路的車流量、路口總體流量和交通控制網絡流量的變化具有豐富的內部層次有序結構,有很強的規律可尋,是一種介于隨機和確定性之間的現象,即混沌。具體來說,車輛間的非線性跟馳和交通系統的狀態參數的變化都存在混沌現象。
基于混沌理論的進行交通信息短時預測主要以混沌理論、分形理論、耗散理論、協同理論、自組織理論等為基礎,利用混沌理論中的相空間重構、奇怪吸引子、分形方法等建立預測模型[18]。研究可分為兩個方面:基于交通流理論模型的混沌研究和基于實測交通流數據的混沌研究。混沌時間序列預測方法有:全域預測、局域預測、加權零階局域預測、加權一階局域預測、基于最大Lyapunov 指數的預測、自適應預測等方法。文[28]分析了短時交通流的非線性特性及其對預測的影響,并討論了兩個方面的問題,即交通流隨著觀測時間尺度不同時混沌和分形特征的變化情況及對交通流預測的影響。文[17]對交通混沌研究的現狀進行了分析和展望。
從理論上利用混沌理論對非線性和不確定性很強的交通流進行預測是非常合適的,所以這種方法將有很好的應用前景。不過目前交通混沌預測的研究中也有許多問題需要解決,例如:1)短時交通信息的混沌預測對實時性要求高,因此需要研究快速判別混沌方法,解決樣本數據和實時性之間的矛盾;2)應用混沌解釋一些原來解釋不了的交通問題相對容易,而應用混沌解決實際交通問題非常困難。即混沌預測的實用化方法還是一個難題。
2.5支持向量機
支持向量機(SVM)是機器學習的一個重要分支,也是模式識別、統計學習等領域研究的熱點。SVM在智能交通領域的應用主要包括車輛檢測、交通狀況識別等,目前SVM越來越多的被應用在時間序列分析上,即支持向量回歸(SVR,Support vector regression),具體包括有-支持向量回歸機、-支持向量回歸機和最小二乘支持向量回歸機(LS-SVM,Least square SVM)等[4][24]。利用SVR預測短時交通信息包括交通流量預測和行程時間預測兩個方面。
基于支持向量回歸的交通信息預測思想在于:首先選擇一個非線性映射把樣本向量從原空間映射到高維特征空間,在此高維特征空間構造最優決策函數,利用結構最小化原則,同時引入損失函數,并利用原空間的核函數取代高維特征空間的內積運算。支持向量回歸可以解決神經網絡的一些固有缺點,在解決小樣本、非線性和高維模式識別問題中表現出許多特有的優勢[25]。與基于神經網絡的預測方法相比,SVR的預測精度高,預測結果一般好于神經網絡[11][14]。文[9]基于支持向量機對行程時間進行短時預測,并與BP神經網絡的方法進行了對比,實驗結果表明對于小樣本和高維的數據集,SVM在行程時間預測中的效果較好, 誤差較BP神經網絡的方法小。文[22]利用在線支持向量機(OSVR,Online SVR)進行短時交通流預測,與BP神經網絡預測相比,預測的精度、收斂時間、泛化能力都有提高。文[27]利用LS-SVM對行程時間指標(TTI,Travel time index)進行預測,LS-SVM與SVM區別是LS-SVM采用一組線性方程訓練,SVM采用的是二次規劃方法,所以LS-SVM的優點是快速收斂,精度更高,計算量小,預測性能更好。
但是基于支持向量機的預測方法缺點是訓練算法速度慢,預測的實時性還難以保證,另外對核函數及其參數以及損失函數的選擇也沒有確定方法。
2.6 組合預測方法
由于短時交通信息預測的隨機性和不確定性,單一的預測方法很難取得好的預測效果,各種預測方法都存在不同程度的缺點和相應的適用范圍,如果將各種方法有機的結合起來,則可能會取得更好的效果,這也是組合預測方法的出發點。組合預測方法是指將兩種或兩種以上的預測方法在中間預測過程結合或者將最終的預測結果融合[7][18]。現在已有的組合模型包括:數學模型與智能方法的結合、時域方法與頻域方法的結合等。如表1所示。
表1組合預測方法分類
組合模型 作用
數學模型
時域方法 智能信息處理方法
(模糊、神經網絡、灰色模型等) 數據分類
頻域方法(傅立葉變換、小波模型等) 數據分解、消噪
常用的一類組合模型是利用模糊方法、神經網絡、灰色模型等智能信息處理方法對短時交通流的數據聚類,然后對每一組聚類數據用線性或非線性方法預測。文[26]利用組合方法進行交通流預測,目的是將不同模型的數據和知識結合起來,最大化的利用有用信息,將MA、ES、ARMA作為神經網絡的輸入,實驗結果表明組合方法比單一預測方法精度更高。文[23]利用模糊神經網絡進行城市交通流預測,提出了一種模糊神經模型(FNM)預測城市路網的交通流,首先利用模糊方法對輸入數據進行劃分,再利用神經網絡建立輸入輸出關系,并在線滾動優化訓練FNM,根據實際交通條件,通過模型系數自適應變化,提高預測能力。利用智能信息處理方法對交通信息進行分類可以減少預測時間,但是很難對不同的交通條件給出確切的定義,而且聚類處理可能破壞時間序列的內在機理,失去交通流原有的動態信息[12]。
另一類組合模型是用頻域方法對數據先分解,再對分解后的數據再預測,典型的是基于小波分解的預測模型。通過小波分析,可以將信號逐層分解到不同的頻率層次上,分解后的信號的平穩性比原始信號好的多,利用小波變化將交通流序列分解為多個分量,對個信號分量分別進行預測,可以極大的提高預測準確性。例如文[15] 提出基于小波分析與神經網絡的交通流短時預測方法,把多維輸入進行小波降維分解,預測由多個子網絡獨立完成,實驗結果表明,該方法比典型的神經網絡預測準確度更高。文[16]提出基于小波包和LS-SVM的交通流短時組合預測方法。小波分析的另一個應用是對交通原始數據進行消噪處理,文[6]將小波分析方法和ARIMA相結合,取得了更好的預測效果。文[23]利用離散小波變換(DWT)去除交通數據中的噪聲后進行交通流量預測。DWT的多分辨率分析(MRA,Multi-resolution analysis)可以在保留交通流量快變特性的同時,消除噪聲信息利用小波消噪,提高預測精度。缺點是每次分解信號樣本減少一半,存在信息丟失,影響模型重構。
3結束語
通過智能交通中短時交通預測主要方法的歸納、分析、比較,可以看出無論是傳統的時間序列預測方法還是神經網絡、小波分析、支持向量機等智能預測方法都存在各自的適用范圍和優缺點。交通流本質上時空函數,即從時間上看,短時交通流信息可以作為時間序列處理,同時,交通流也具有空間上的相關性,上下游的路段之間存在必然的因果聯系,所以如何在現有預測方法的基礎上融入更多的交通流的時空信息將是一個值得研究的方向,另外將其他工程、金融等領域的預測方法借鑒到智能交通領域,并將各種預測方法有效融合在一起,處理短時交通信息預測中的不確定性和隨機性,提高預測的精度和可靠性,并保證實時性也是一個需要繼續探索的方向。
參考文獻(References)
[1]楊叔子.時間序列分析的工程應用(第二版)[M].武漢:華中科技大學出版社,2007.
[2]朱順應,王紅等.交通流參數及交通事件動態預測方法[M].南京:東南大學出版社,2010.
[3]許倫輝,付惠.交通信息智能預測理論與方法[M].北京:科學出版社,2009.
[4]陸海亭,張寧等.短時交通流預測方法研究進展[J].交通運輸工程與信息學報.2009, 7(4):84-91.
[5]賀國光,李宇等.基于數學模型的短時交通流預測方法探討[J]. 系統工程理論與實踐.2000(12):51-56.
[6]竇慧麗,劉好德等.基于小波分析和ARIMA模型的交通流預測方法[J].同濟大學學報(自然科學版).2009, 37(4):486-494.
[7]張益,陳淑燕等.短時交通量時間序列智能復合預測方法概述[J].公路交通科技.2006, 23(8):139-142.
[8]張曉利,陸化普.非參數回歸方法在短時交通流預測中的應用[J].清華大學學報(自然科學版).2009, 49(9):1471-1475.
[9]姚智勝,邵春福等.支持向量機在路段行程時間預測中的應用研究[J].公路交通科技.2007, 24(9):96-99.
[10]劉靜,關偉.交通流預測方法綜述[J].公路交通科技.2004, 21(3):81-85.
[11]徐啟華,楊瑞.支持向量機在交通流量實時預測中的應用[J].公路交通科技.2005, 22(12):131-134.
[12]王正武, 黃中祥.短時交通流預測模型的分析與評價[J].系統工程.2003, 21(6):97-100.
[13]韓超, 宋蘇等.基于ARIMA 模型的短時交通流實時自適應預測[J].2004, 16(7):1530-1533.
[14]楊兆升,王媛等.基于支持向量機方法的短時交通流量預測方法[J].吉林大學學報(工學版),2006,36(6): 881-884.
[15]張曉利.基于小波分析與神經網絡的交通流短時預測方法[J].信息與控制.2007, 36(4):467-470.
[16]姚智勝,邵春福等.基于小波包和最小二乘支持向量機的短時交通流組合預測方法研究[J].中國管理科學.2007, 15(1):64-69.
[17]王東山,賀國光等.交通混沌研究綜述與展望[J].土木工程學報.2003, 36(1):68-73.
[18]王進,史其信.短時交通流預測模型綜述[J].智能交通.2005, 1(6):93-98.
[19]李振龍,張利國等.基于非參數回歸的短時交通流預測研究綜述[J].交通運輸工程與信息學報.2008, 6(4):34-39.
篇5
關鍵詞:運動目標檢測 光流法 神經網絡
中圖分類號:TP242 文獻標識碼:A 文章編號:1007-9416(2016)11-0084-01
1 前言
機器人在未知環境中運動時,檢測出環境中的動態目標非常重要,它能為機器人提供更加詳盡的信息與策略。而腿式機器人要比輪式機器人具有更多的優點,但是腿式機器人行動時相對穩定性差,使得圖像背景變化的模式和規律更加復雜,對于檢測環境中的運動物體帶來了更大的挑戰。本文提供了一種方法,使足式機器人能在較高速度下準確的檢測環境中物體的移動。該方法首先不對圖像進行預處理,減少了信息計算量;其次在神經網絡的輸出中加入了實質性的后期處理步驟;最后對得到的差異信息進行重構,從而識別出動態目標。本文提供的方法對于一個以最高速度10CM/S自由行走的機器人來說是有效的。
2 外部運動檢測方法
圖1描述的是我們使用的算法。首先,我們需要計算圖像中的光流,將得到的向量場作為神經網絡的輸入,同時根據從三個加速度傳感器獲得的機器人當前步態循環中的位置信息作為神經網絡的另一個輸入。根據以上兩方面信息輸出下一幅圖像的預期光流信息。機器人對接收到的下一幅圖像進行光流計算并且和神經網絡的預期進行比較。用后期處理算法尋找兩幅圖像中不一致區域的不連續處,從而判斷在圖像中是否發現移動的物體。
我們用自己搭建的電子狗機器人平臺獲得光流的訓練和測試序列,并且作為一系列圖形文件傳輸到個人計算機上進行光流計算,計算出來的光流場重新儲存到硬盤中用于后來預期光流的產生和與其進行比較。
利用獲得的最新的光流場的圖像和機器人的加速度及在整個步態中的位置,神經網絡能有效的獲得下一個光流場的圖像。經過和獲得的光流場對比,我們就能看到圖像中哪一部分存在著沒有預見的運動。我們用已有的光流場序列來訓練這個網絡,得到不同速度下的神經網絡預測器。
通過比較預期的和真實獲得的光流場,我們能獲得向量場。捕捉向量場中每個元素的梯度我們將獲得一個相同大小的矩陣,稱之為差異場。如果場景中由外部移動的物體,那么在差異場中就會出現急劇的不連續,通過在每個差異場中運行邊緣檢測算法就會檢測出來。
最后利用邊緣檢測進行后期處理,首先通過找到它的最大像素點,將和最大像素點差距大的像素點賦值為0,其他賦值為1,可以獲得一個二進制版本的差異場,接下來用一個常規的邊緣檢測算法對二進制差異場進行分析,獲得動態目標的形狀。
3 實驗及結果
我們用自主搭建的電子狗機器人獲得實驗圖像,電子狗的四肢和頭部都有3個自由度。它的頭部有一個CMOS的攝像頭,1秒鐘能大約能采集25幅圖像。機器人嘗試識別出白色背景下運動的2-3個黃色不規則目標,我們設定機器人的運動速度為10CM/S。在光流計算前,圖像也會從全色轉化成灰度級。
機器人獲得的圖像和光流場由35列,27行組成。低分辨率的圖像能使用一個簡單的神經網絡進行處理,并且使光流場計算的運行時間減少。在神經網絡訓練中用到了循環架構,網絡有120個單位的隱藏層。網絡通過數據回溯的方法進行訓練,訓練的數據來自于機器人在空場地的10次行進,每次行進大約由80幅連續的圖片組成。
多次實驗證明,利用訓練好的神經網絡預測器,系統能正確的標定出圖像中包含大部分運動的小塊, 大約95%的動態圖像塊均被正確的標注。
4 結語
本文提出了一種快速移動四足機器人檢測外部動態目標的方法。通過對神經網絡進行訓練,系統不僅能快速準確的識別出環境中的動態目標,同時系統計算量也大幅減少。實驗證明系統具有較高的可靠性。
參考文獻
[1]屠大維,江濟良.改進的光流運動圖像分析方法及其應用[J].光學精密工程,2011(05).
[2]朱克忠.基于光流法對移動目標的視頻檢測與應用研究[D].合肥工業大學,2007.
[3]邵文坤,黃愛民,韋慶.動態場景下的運動目標跟蹤方法研究[J].計算機仿真,2006(05).
篇6
關鍵詞:神經網絡 入侵檢測;自動變速率;隨機優化算子
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2014)03-0614-03
隨著互聯網應用的發展,更現顯了網絡安全的重要性。入侵檢測技術在安全防護中是一種主動防護技術,能及時地檢測各種惡意入侵,并在網絡系統受到危害時進行響應,因此在為安全防御體系中入侵檢測系統占有重要的地位。但是在現實的應用中,入侵檢測系統沒有充分發揮其作用。這是因為,不斷變化的入侵方式要求入侵檢測模型必須具有分析大量數據的能力。無論這些數據是不完全的,是非結構化的,或者是含有噪音的。而且,有些攻擊是由處于不同網絡位置上的多個攻擊者協作進行的,這就要求入侵檢測模型又必須具備處理來自非線性數據源的大量數據的能力。神經網絡具有聯想記憶能力、自學習能力和模糊運算的能力。因此將神經網絡應用入侵檢測中,它不僅可以識別出曾見過的入侵,還可以識別出未曾見過的入侵。該文首先介紹了一種改進的神經網絡算法,然后分析了該算法在入侵檢測中的應用,并給出試驗仿真結果。
1 BP神經網絡與入侵檢測
1.1 BP神經網絡的特點與不足
BP神經網絡是神經網絡模型中應用最廣泛一種。它基于成熟的BP算法,主要有以下幾個特點:1)它能夠實現自組織、自學習,根據給定的輸入輸出樣本自動調整它的網絡參數來模擬輸入輸出之間的非線性關系。2)在存儲上采用分布式存儲,所有的信息分布存儲在每一個神經元中。3)它還可以實現并行處理,下一層的每個神經元可以根據接收到的上一層信息同時獨立地計算。這些特點使其很適合應用于入侵檢測技術,滿足入侵檢測的適應性、可靠性、安全性和高效性的要求。
但是傳統的BP算法也存在著以下幾個方面的不足:1)局部極小;2)學習算法收斂速度慢;3)隱含層節點選取缺乏理論;4)加入新的樣本會影響已經學完的樣本;5)每次輸入樣本特征的數目必須確定且相同。
1.2 入侵檢測技術
通過對系統數據的分析,當發現有非授權的網絡訪問和攻擊行為時,采取報警、切斷入侵線路等措施來維護網絡安全,這被就是入侵檢測技術。采用此技術設計的系統稱為入侵檢測系統。根據采用的技術來說入侵檢測系統應具有以下幾個特性:1)監視用戶及系統活動;2) 分析用戶及系統活動;3) 異常行為模式分析;4) 識別已知的進攻活動模式并反映報警;5) 系統構造和弱點的審計,操作系統的審計跟蹤管理;6) 評估重要的系統和數據文件的完整性,并識別用戶違反安全策略的行為。
目前最常用的攻擊手段有:拒絕服務、探測、非授權訪問和非授權獲得超級用戶權限攻擊。而且這些攻擊手段在實際中還有很大的變異,因此給入侵檢測帶來了一定的難度。BP神經網絡的自組織自學習能力,使得經過訓練后的BP神經網絡對以前觀察到的入侵檢測行為模式進行歸納總結,除了可以識別出已經觀察到的攻擊,還可以識別出由已知攻擊變異出的新的攻擊,甚至是全新的攻擊。
2.3 改進的神經網絡算法
人工神經網絡在模式識別、非線性處理、信號檢測等領域應用非常多,這是由于人工神經網絡具有的良好的自適應和自組織性,高度的非線性特性以及大規模并行處理和分布式信息存儲能力的特性。BP神經網絡算法實質上是非線性優化問題的梯度算法,該算法在收斂性問題上存在限制與不足。即該算法學習的結果不能保證一定收斂到均方誤差的全局最小點,也有可能落入局部極小點,使算法不收斂,導致陷入錯誤的工作模式。因此本文選擇了改進的神經網絡,改進主要有以下幾點:
2)自動變速率學習法
傳統的BP算法是以梯度為基礎,采用LMS學習問題的最陡下降法,學習步長是一個固定不變的較小值,不利于網絡的收斂。因此,選擇了基于梯度方向來自動調節學習速率的方法。利用梯度確定學習的方向,由速率決定在梯度方向上學習的步長。因此,如果相鄰兩次的梯度方向相同則說明在該方向是有利收斂的方向,如果相鄰兩次的梯度方向相反則說明此處存在不穩定。因此,可以利用兩次相對梯度變化來確定學習步長,當兩次梯度方向相同時則增大學習步長,加快在該方向上的學習速度;而如果兩次梯度方向相反那么減小學習步長,加快整個網絡的收斂速度。這種方法的自適應速率調節公式如下:
2)引入遺忘因子
本文所采用的自適應變速率學習法是依據相鄰兩次梯度變化來確定學習步長的算法,但單純的學習速率的變化還不能即完全地既保證收斂速度,又不至于引起振蕩。因此考慮變相的學習速率的學習。即在權值的調節量上再加一項正比于前幾次加權的量。權值調節量為:
我們將[τ]稱為遺忘因子。遺忘因子項的引入就是對學習過程中等效的對學習速率進行微調的效果。遺忘因子起到了緩沖平滑的作用,使得調節向著底部的平均方向變化。
3)隨機優化算子
雖然采用自動變速率學習法,并引入遺忘因子的神經網絡算法可以對學習速率進行微調,但是仍存在著BP神經網絡的限制與不足因此引入隨機優化算子。也就是當網絡的權值誤差迭代一定的次數后,仍沒有明顯的收斂,或者系統誤差函數的梯度連續幾次發生改變,這說明網絡進入了一個比較疲乏的狀態,需要借助外界的推動力來激活網絡。當發現上述的兩種情況時,就產生與權值維數相同的隨機數,并將隨機數與權值直接相加,然后判斷系統誤差的變化。如果誤差沒有降低,那么就再繼續產生隨機數來修改權值,直到誤差減少,再從新的權值開始繼續BP算法。隨機優化算子可以令搜索方向隨機變化,從而擺脫局部極小點。
4)改進算法與傳統算法比較
以200個訓練樣本為例,分別采用改進的BP神經網絡和經典BP神經網絡的方法進行學習、訓練。兩種算法的誤差收斂對比曲線如圖1所示。
3 采用改進算法的入侵檢測仿真實驗
入侵檢測系統進行測試和評估需要標準的、可重現的并包含入侵的大量數據。本仿真實驗選取DARPA數據集網絡連接數據集作為實驗數據。然后,對這些數據選三組特征值進行實驗,并給出實驗結果。
3.1 數據源的選取
該實驗的數據采用DARPA 1988入侵檢測評估數據庫的數據。該數據有大量的連接數據記錄。每個一記錄代表一次網絡連接,且每個記錄均有41個特征值,其中各個特征的含義不同,大致可分為三類:1)表示網絡連接內容特征;2)表示網絡連接基本特征;3)表示網絡連接流量特征。
模擬的入侵主要有以下四種類型:DOS 、 R2L、U2R、Probing,考慮到設計的實用性分別對三類特征值用神經網絡分別進行訓練和識別。實驗選取了13000組數據進行仿真實驗,其中3000組用于訓練神經網絡,10000組用于系統測試。
3.2 仿真實驗結果
對三類特征組的訓練集數據應用改進神經網絡分別訓練出三個神經網絡,表示網絡連接內容特征的神經網絡,表示網絡連接基本特征的神經網絡以及表示網絡連接流量的特征的神經網絡在訓練成功時的迭代步數分別為7056,386,3030。然后再對測試集數據進行測試,結果如下:
1)表示網絡連接內容特征組,利用改進神經網絡進行檢測識別,結果如表1所示。
2)表示網絡連接基本特征組,利用改進神經網絡進行檢測識別,結果如表2所示。
3)網絡連接流量特征組,利用改進神經網絡進行檢測識別,結果如表3所示:
從表中數據可以看出對常見的四種攻擊,不同的特征分組在改進神經網絡的作用下檢測各有優勢。
4 結論
論文采用自動變速率學習法,利用遺忘因子進行微調,同時引入隨機優化算子對BP神經網絡進行了改進。改進神經網絡的收斂速度比經典BP神經網絡更快,同時穩定性也較好。并將該算法應用于入侵檢測實驗,實驗結果顯示改進后的算法具有較好的識別攻擊的能力。
參考文獻:
[1] 肖道舉,毛輝.BP神經網絡在入侵檢測中的應用[J].華中科技大學學報,2003(5).
[2] 汪潔.基于神經網路的入侵檢測系統的設計與實現[J].計算機應用與軟件,2013(5).
篇7
關鍵詞:強化學習;神經網絡;馬爾科夫決策過程;算法;應用
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2012)28-6782-05
在機器學習領域,大致可以將學習分為監督學習、非監督學習和強化學習三大類。強化學習以其在線學習能力和具有無導師制的自適應能力,因此被認為設計智能Agent的核心技術之一。從20世紀80年代末開始,隨著數學基礎日益發展的支持,應用范圍不斷擴大,強化學習也就成為目前機器學習的研究熱點之一。在研究過程中,隨著各種方法、技術和算法大量應用于強化學習中,其缺陷和問題也就日漸顯現出來,尋找一種更好的方式和算法來促進強化學習的發展和廣泛應用,是研究人員探討和研究的重點。因此,神經網絡及其算法以其獨特的泛化能力和存儲能力成為眾多研究人員重視的研究對象。
在此之前,已有大量研究者通過神經網絡的特性來加強強化學習的效果及應用。張濤[2]等人利用將Q學習算法和神經網絡中的BP網絡、S激活函數相結合,加上神經網絡的泛化能力,不僅解決了倒立擺系統的一系列問題,而且還進一步提高了強化學習理論在實際控制系統的應用。林聯明在神經網絡的基礎研究Sarsa強化算法,提出用BP網絡隊列保存SAPs,解決由于過大而帶來的Q值表示問題[3]。強化學習理論在機器控制研究中也應用廣泛。段勇在基于行為的移動機器人控制方法基礎上,將模糊神經網絡與強化學習理論相結合,構成模糊強化系統,解決了連續狀態空間和動作空間的強化學習問題和復雜環境中的機器人導航問題[4]。由此可見,將神經網絡與強化學習相結合,已經是現今強化學習研究的重點方向,也已經取得了頗豐的成果。但是,如何將神經網絡和強化學習理論更好的融合,選擇何種算法及模型,如何減少計算量和加快學習算法收斂速度,以此來推動強化學習理論研究更向前發展,解決更多的實際應用問題,這些依然還是待解決的研究課題之一。下面,根據本人對強化學習的研究,朋友給予的指導以及參照前人的研究成果,對基于神經網絡的強化學習作個基本概述。
1 強化學習
強化學習(reinforcement),又稱再勵學習或評價學習,它是重要的機器學習方法之一,在機器人控制、制造過程控制、任務調配及游戲中有著廣泛的應用。
1.1 定義
所謂強化學習就是智能Agent從環境狀態到行為映射的學習,并通過不斷試錯的方法選擇最優行為策略,以使動作從環境中獲得的累積獎賞值最大。
強化學習狀態值函數有三個基本表達式,如下:
這三個狀態的值函數或狀態—動作對函數的值函數是用來表達目標函數,該目標函數是從長期的觀點確定什么是最優的動作。其中[γ]為折扣因子,[rt]是agent從環境狀態[st]到[st+1]轉移后所接受到的獎賞值,其值可以為正,負或零。其中式(1)為無限折扣模型,即agent需要考慮未來h([h∞])步的獎賞,且在值函數以某種形式進行累積;式(2)為有限模型,也就是說agent只考慮未來h步的獎賞和。式(3)為平均獎賞模型,agent考慮其長期平均的獎賞值。最優策略可以由(4)式確定
1.2 基本原理與一般結構
強化學習就是能夠和環境進行交互的智能Agent,通過怎樣的學習選擇能夠達到其目標的最優動作。通俗的說,在Agent與環境進行交互的過程中,每個行為動作都會獲得特定的獎賞值。如果Agent的某個行為策略導致環境正的獎賞值(強化信號),那么Agent以后產生這個行為策略的趨勢就會加強。Agent的目標就是對每個離散的狀態發現最優策略以期望的折扣獎賞和最大。
在上述定義中描述了強化學習的三個狀態值或函數動作對函數來表達目標函數,可以求得最優策略(根據(4)式)。但是由于環境具有不確定性[5],因此在策略[π]的作用下,狀態[st]的值也可以寫為
強化學習把學習看作試探評價過程,可用圖1描述。強化學習選擇一個動作作用于環境,環境受到作用后其狀態會發生變化,從一個狀態轉換到另一個狀態,同時產生一個強化信號反饋給Agent,即獎懲值。Agent接受到獎懲值和環境狀態變化,進行學習更新,并根據獎懲值和環境當前狀態選擇下一個動作,選擇的原則是使受到正強化(獎)的概率增大。選擇的動作不僅影響立即強化值,而且影響環境下一時刻的狀態及最終的強化值。
2 神經網絡
2.1 神經網絡概述
神經網絡是指模擬人類大腦的神經系統的結構與功能,運用大量的處理部件,采用人工方式構造的一種網絡系統。神經網絡是一種非線性動力學系統,并且具有以分布式存儲和并行協同處理的特點,其理論突破了傳統的、串行處理的數字計算機的局限。盡管單個神經元的結構和功能比較簡單,但是千千萬萬個神經元構成的神經網絡系統所能表現的行為卻是豐富多彩的。
單個神經元的模型如圖2所示。
人工神經元模型由一組連接,一個加法器,一個激活函數組成。連接強度可由各連接上的值表示,權值為正表示激活,權值為負表示抑制;加法器用于求輸入信號對神經元的相應突觸加權之和。激活函數用于限制神經元輸出振幅。
神經元還可以用如下公式表示
激活函數主要有閾值函數、分段線性函數、非線性轉移函數三種主要形式。
一般來說,神經網絡在系統中的工作方式是:接受外界環境的完全或者不完全的狀態輸入,并通過神經網絡進行計算,輸出強化系統所需的Q值或V值。人工神經網絡是對人腦若干基本特性通過教學方法進行的抽象和模擬,是一種模仿人腦結構及功能的非線性信息處理系統。
2.2 強化學習與神經網絡的融合
經過研究發現,神經網絡的眾多優點,可以滿足強化學習研究的需要。首先,由于神經網絡模仿人的大腦,采用自適應算法,使得Agent智能系統更能適應環境的變化。此外,神經網絡具有較強的容錯能力,這樣可以根據對象的主要特征來進行較為精確的模式識別。最后,神經網絡又有自學習,自組織能力和歸納能力的特點,不僅增強了Agent對不確定環境的處理能力,而且保證了強化學習算法的收斂性。神經網絡也有無導師學習機制,正好適用于強化學習。
強化學習和神經網絡的融合重點在于如何運用神經網絡多重特性,能夠快速高效地促進Agent智能系統經歷強化學習后,選擇一條最優行為策略來滿足目標需求。強化學習的環境是不確定的,無法通過正例、反例告知采取何種行為。Agent必須通過不斷試錯才能找到最優行為策略。但是在此過程中,會遇到許多問題,比如輸出連續的動作空間問題,但可利用神經網絡的泛化特征,實現了輸出在一定范圍內的連續動作空間值[2]。所以,簡單的講,將神經網絡和強化學習相融合,主要是利用神經網絡強大的存儲能力和函數估計能力。目前,在函數估計強化學習研究上,神經網絡是研究熱點之一。
3 馬爾科夫決策過程
本文主要論述馬爾科夫型環境下的強化學習,可以通過馬爾科夫決策過程進行建模。下面給出其形式定義:
基本的POMDP由四個元組成:。S是指一個環境狀態集,可以是有限的,可列的或者任意非空集;A為Agent行為集合,用A(s)表示在狀態s處可用的決策集;獎賞函數R(s,a):[A×S]->Real;T:[A×S]->PD(S);T(s,a,s')為Agent在狀態s采用a動作使環境狀態轉移到s'的概率。
一個有限的馬爾科夫決策過程有5元組成:;前四個元與上述是一致的,V為準則函數或者目標函數[3],常用準則函數有期望折扣總報酬、期望總報酬和平均報酬等并且可以是狀態值函數或狀態-動作對值函數。
馬爾科夫決策過程的本質是:當前的狀態轉變為另一個狀態的概率和獎賞值只取決于當前的狀態和選擇的動作,與過去的動作和狀態無關。所以,在馬爾科夫環境下,已知狀態轉移概率函數T和獎賞函數R,可以借助于動態規劃技術求解最優行為策略。
4 改進的強化學習算法
到目前為止,強化學習領域提出的強化學習算法層出不窮,如Sutton提出的TD算法[6],Watkins提出的Q-Learning算法[7],Rummery和Niranjan于1994提出的Sarsa算法[8],以及Dyna-Q學習算法[9]等。致力于這方面研究的研究人員,都在極力尋找一種既能保證收斂性,又能提高收斂速度的新型學習算法。本文主要在基于神經網絡的特性,研究并提出改進的強化學習算法。
4.1 基于模糊神經網絡的Q([λ])學習算法
Q學習算法是強化學習領域重要的學習算法之一[7,10],它利用函數Q(x,a)來表達與狀態相對應的各個動作的評估。Q學習算法的基本內容為:
(1)任意初始化一個Q(x,a)
(2)初始化 s
(3)從決策集中隨即選擇一個動作a
(4)采取動作策略a,觀察[r,][s]'的值
(5)計算 [Qs,aQs,a+αr+γmaxa'Qs',a'-Qs,a], (11)
(7)重復(2)-(6)步,直到s終結。
式(11)使用下一狀態的估計來更新Q函數,稱為一步Q學習。將TD([λ])的思想引入Q學習過程,形成一種增量式多步Q學習,簡稱Q([λ])學習[11]。步驟與Q算法類似,其計算公式如下:
如果 [s=st,a=at],則[Qst,at=Qst,at+αtγt+γtetst+at]; (12)
4.2 基于BP神經網絡的Sarsa算法
描述如下:(1)H是用于保存最近訪問的Q值,當滿的時候送至神經網絡訓練。
如果表H已滿,則利用H中的樣本對網絡進行訓練,版本號自動增加1
若網絡隊列q也已滿,則隊尾元素出隊,把新訓練的神經網絡入隊q;
清空訓練集;
該算法的主要貢獻是引入神經網絡隊列保存大量的Q值表,從來降低了保存大量Q值所要花費大量的內存空間,更重要的是解決了單個神經網絡“增量式”學習所帶來的“遺忘”問題。
5 強化學習應用
由于強化學習在算法和理論方面的研究越來越深入,在大空間、復雜非線性控制,機器人控制、組合優化和調度等領域呈現出良好的學習性能,使得強化學習在人工智能,控制系統,游戲以及優化調度等領域取得了若干的成功應用,而本文主要介紹基于神經網絡的強化學習算法在某些領域的應用。
在非線性控制系統方面,張濤等人[2]將BP網絡運用于 Q-Learning算法中,成功解決了連續狀態空間的倒立擺平衡控制問題和連續狀態空間輸入、連續動作空間輸出的問題,從而提高了強化學習算法的實際應用價值;在機器人控制方面,應用更為廣泛,Nelson[13]等人考慮了基于模糊邏輯和強化學習的智能機器人導航問題,并且段勇等人[4]基于該理論,成功地將模糊神經網絡和強化學習結合起來,采用殘差算法保證函數逼近的快速性和收斂性,有效地解決了復雜環境下機器人導航的問題。在游戲方面,Tesauro采用三層BP神經網絡把棋盤上的棋子位置和棋手的獲勝概率聯系起來,通過訓練取得了40盤比賽中只輸一盤的好戰績[14]。在優化調度方面,主要包括車間作業調度,電梯調度以及網絡路由選擇等,Robert Crites等[15]將強化學習和前饋神經網絡融合利用,以最終實驗結果表明為依據,證明了該算法是目前高層建筑電梯調度算法中最優算法之一。
6 結束語
本文將強化學習和神經網絡相融合,介紹利用神經網絡強大的存儲能力、泛化能力及函數估計能力,可以解決強化學習領域遇到的連續狀態和動作輸入、輸出的問題,學習狀態空間過大的問題以及不確定環境處理的問題等。基于此,主要論述了三種神經網絡和強化學習的改進算法,它們都綜合了神經網絡的特性。最后,簡單介紹了目前基于神經網絡的強化學習應用的成功實例。目前,利用神經網絡進行強化學習依然是研究熱點課題之一。
參考文獻:
[1] 高陽,陳世福,陸鑫. 強化學習研究綜述[J].自動化學報,2004,30(1):86-100.
[2] 張濤,吳漢生.基于神經網絡的強化學習算法實現倒立擺控制[J].計算機仿真,2006,23(4):298-300.
[3] 林聯明,王浩,王一雄.基于神經網絡的Sarsa強化學習算法[J].計算機技術與發展,2006,16(1):30-32.
[4] 段勇,徐心如.基于模糊神經網絡的強化學習及其在機器人導航中的應用[J].控制與決策,2007,22(5):525-529.
[5] 劉忠,李海紅,劉全.強化學習算法研究[J].計算機工程與設計,2008,29(22):5805-5809.
[6] Sutton R S.Learning to predict by the methods of temporal differences.Machine Learning,1988,3:9-44.
[7] Watkins P.Dayan.Q-Learning.Machine Learning,1992,8(3):279-292.
[8] Rummery G,Niranjan M. On-line Q-Learning using connectionist systems. Technical Report CUED/F-INFENG/TR 166,Cambridge University Engineering Department,1994.
[9] Sutton R S,Barto A G, Williams R. Reinforcement Learning is direct adaptive optional control.IEEE Control Systems Manazine,1991,12(2):19-22.
[10] Sutton R S, Barto A G. Reinforcement Learning: An introduction[M].Cambridge:MIT Press ,1998.
[11] Peng J , Dayan P. Q-learning [J]. Machine Learning,1992,8(3):279-292.
[12] Kelley H J , Cliff E M, Lutze F H. Pursuit/evasion in orbit[J]. J of the Astronautical Sciences, 1981, 29(3):277-288.
[13] NELSON H C, YUNG. An intelligent mobile vehicle navigator based on fuzzy logic and reinforcement learning [J].IEEE Trans on Systems, Man and Cybernetics, Part B: Cybernetics,1999,29(2):314-321.
篇8
>> 網絡交易信用風險的防范分析 我國網絡購物的信用風險研究 基于復雜網絡的信用風險傳染模型研究 基于神經網絡的信用風險預警研究 信用風險分析方法的發展 網上交易信用風險評價研究:基于網上拍賣的賣方視角 銀行間市場交易系統的信用風險模塊設計研究 網絡銀行個人客戶信用風險評價研究 網絡借貸信用風險管理體系研究綜述 信用風險研究分析 基于BP神經網絡的農戶小額信貸信用風險評估研究 基于模糊神經網絡的企業信用風險評估模型研究 基于BP神經網絡的商業銀行信用風險評估模型研究 網絡借貸平臺信用風險的測度和控制研究 基于P2P網絡借貸的信用風險管控研究 商業銀行信用風險評價方法研究 基于信用風險與ABC分類方法分析的應收賬款研究 基于 Fisher判別方法的信用風險評估實證研究 信用風險評估中的財務分析方法 信用風險的變革 常見問題解答 當前所在位置:.
[2]倪翠云.我國網絡購物的信用風險研究[J].中國集體經濟,2011(6):61-62.
[3]于鳴燕.人工神經網絡在金融領域信用風險評估中的應用[D].南京理工大學,碩士論文,2007-06.
[4]馮煒.消費者網絡購物信任影響因素的實證研究[D].浙江大學,博士論文,2010-06.
[5]洪瓊.C2C交易模式下誠信問題的研究[D].安徽理工大學,碩士論文,2009-06.
[6]周艷美,李偉華.改進模糊層次分析法及其對任務方案的評價[J].計算機工程與應用,2008(5):212-214.
[7]劉巧玲,張金城.在線拍賣信用行為的博弈分析[J].商業研究,2007(8):211-214.
篇9
關鍵詞:神經網絡;預測;剩余油氣;模式識別;訓練
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2015)09-0200-02
Abstract: The paper is aimed at the problem of traditional exploration methods can not predict the remaining oil and gas accurately, the methods of fuzzy theory and self-organizing map are approached. It takes the advantage of Fuzzy neural network system converging faster and higher prediction accuracy, as well as the unsupervised competitive learning mechanism of self-organizing map, it achieves the goal of predicting the remaining oil and gas. The method of neural network improve the precision of remaining oil and gas, it obtains better effect of prediction.
Key words: neural network; predict; remaining oil and gas; pattern recognition; train
石油是國家經濟發展的命脈,油氣勘探開發則是石油工業的基礎,在國民經濟的地位舉足輕重。隨著地震勘探理論方法日趨成熟,我國各大油氣田勘探程度相繼提高,油氣田已經被大幅度開采。然而我國的石油平均采收率并不高,約為30%多一點,還有近70%的油氣并未采收,傳統的油氣勘探方法已經不能滿足增加石油的采收率。當前我國各大油田的地質勘探工作已經進入中后期,迫切需要一些新的方法研究方法和技術,對油氣田剩余油氣的分布和變化趨勢做出預測,以便在尋找新的勘探開發領域,同時也能繼續對老油氣田進行挖掘,從而提高油氣產量。
近些年來,隨著神經網絡技術[1]的日趨成熟,基于模式識別的各類方法技術,如統計模式識別、神經網絡、模糊判別等技術和理論在剩余油氣預測方面都得到了較多的應用,也取得了較好的結果。其中模糊理論具有很強的表達能力并且容易被人理解,神經網絡的自適應學習能力很強。由于模糊理論和人工神經網絡各自的優點,常常被單獨或者是組合起來運用到實踐中,本文主要介紹神經網絡的方法運用于預測剩余油氣的工作中。
1 模糊理論
1.1 發展歷程
1965年美國加州大學伯里克分校的扎德教授首先創立了模糊集合的數學理論,隨后P.N.Marions也開始從事相關研究,于1966年發表了一份關于模糊邏輯的研究報告。1974年扎德教授作了模糊推理的研究報告,同年英國的E.H.Mamdanl運用模糊邏輯和模糊推理首次實現了蒸汽機的實驗性控制,從此模糊理論的雛形形成了,隨后模糊理論[2]掀起了一波熱潮。
1.2 在剩余油氣預測中的應用
在預測剩余油氣[3]的實踐中,首先對地震資料做初步的特征提取,然后將提取的樣本用模糊理論的聚類方法進行訓練,對訓練樣本進行幾類。每類都有各自對應的神經網絡,用專屬于每類的樣本依次訓練各自對應的神經網絡。具體步驟如下:
1)流體屬性的提取
流體屬性數據是三維數據,屬性的提取方法依賴于具體的物理問題與數據網格的劃分。三維數據場屬性邊界的提取所采用的方法是求出網格點的梯度,特征區域一般是梯度模值較大的區域。對于均勻的三維網格,估計其梯度的方法可采用三維差分。為得到網格點上的梯度值,簡單的方法是利用前、后、左、右、上、下六個鄰近點的場值進行簡單的差分估計。在計算流體力學問題中,采用的網格大都是結構化網格,為計算網格點上的梯度,需將網格變換為均勻規則正交網格。設三維網格交換為[x=T1(ξ,η,?)],[y=T2(ξ,η,?)],[z=T3(ξ,η,?)],在點(m,n,p),其場值梯度在兩種網格上的關系式為:
[?f?ξ?f?η?f??=?f?x?f?y?f?z?x?ξ?x?η?x???y?ξ?y?η?y???z?ξ?z?η?z??]
2)模糊系統處理流體屬性
確定輸入輸出的學習樣本[(αK,βK,γk)],k為樣本個數。利用模糊聚類的方法將輸入樣本分成N類,N類樣本對應N條神經網絡。利用各自的樣本訓練各自的神經網絡,選擇合適的學習樣本,系統經過多次樣本訓練和樣本學習之后,優化出一部分識別精度高的樣本,優選的樣本到達能辨別精度后,將該樣本輸出,這樣就可以被識別了。
2 自組織神經網絡
2.1 結構與工作過程
自組織神經網絡是上世紀80年代芬蘭Helsink大學的Kohonen在Willshaw與Von der Malsberg在的工作上,結合對自然界中的生物神經系統的理解,創建Kohonen模型,又稱Kohonen網絡。自組織神經網絡[4]的特征映射是基于生物的大腦神經系統,模擬它的自組織特征映射機制,在樣本訓練中有很強大學習能力,在組織學習中不需要監控,是一種無監督競爭式學習的前饋網絡。自組織神經網絡通過學習,從而提取某組數據中的某種重要特征或內在規律,按離散時間的方式進行分類。網絡可以把任意高維的輸入作為輸入神經元,映射到低維空間得到輸出神經元,并且使得輸入神經元內部的某些相似性質表現為幾何上鄰近的特征映射,這就是人們常說的降維處理。這樣輸出神經元會聚集成一個輸出層,輸出層就可以繪制成一維或二維離散幾何圖形,并且其拓撲結構保持不變。此分類反映了樣本集之間的本質區別,大幅度降低了一致性準則中的人為因素。
如圖1所示,SOM網絡是一種比較簡單的雙層網絡, 由若干輸入神經元和輸出神經元組成。輸入層與輸出層各神經元之間實現了全部互相直接或間接的連接方式,每個輸出神經元可通過可變連接權與所有輸入神經元相連, 且輸出神經元間存在局部相互連接。每個連接都具有對應的連接權值,用于表示該連接的強度。各個神經元的連接權值均具有一定的分布,每個輸入神經元與輸出神經元之間的聯系通過連接權來傳達。輸出層的神經元之間實行側向連接,相鄰的神經元相互激勵,距離較遠的神經元則相互抑制,然而超過了一定的距離的神經元又具有較弱的激勵作用,最后剩下的一個神經元或一組神經元,則反映該類樣本的屬性。
2.2 預測剩余油氣的步驟
1)根據勘探數據體提取流體屬性[5],并對其進行預處理。
2)優選出所要了解的流體屬性,對其進行降維壓縮,將壓縮集作為模式識別的輸入,以統計的油氣儲層參數作為輸出來訓練組組織神經網絡。
3)利用模式識別[6]參數和降維壓縮集對儲層的油氣進行預測,從而得到如今的剩余油氣的分布。
3 結束語
本文針對傳統油氣勘探的方法難以滿足預測油氣田剩余油的難題,著重介紹了模糊理論和自組織神經網絡的方法,這兩種神經網絡的方法各有優勢。其中模糊神經網絡的系統訓練和學習速度快,收斂較快,預測的精度高。自組織神經網絡的競爭模式起到了快速優選的作用,神經元之間的協作模式在某種意義上則縮短了整個流程的工作時間。總而言之,神經網絡的技術與方法在預測油氣田的剩余油氣的實踐中取得了不錯的成果。
參考文獻:
[1] 汪鐳,周國興,吳啟迪.人工神經網絡理論在控制領域中的應用綜述[J].同濟大學學報:自然科學版,2001,03:357-361.
[2] 王曉軍,楊海峰,邱志平,等.基于測量數據的不確定性結構分析的模糊理論[J].北京航空航天大學學報,2010,08:887-891.
[3] 熊艷,包吉山,肖慈.模糊神經網絡預測儲層及油氣[J].石油地球物理勘探,2000,02:222-227.
[4] 易榮慶,李文輝,王鐸.基于自組織神經網絡的特征識別[J].吉林大學學報:工學版,2009,01:148-153.
篇10
關鍵詞:油;水分;爆裂法;小波變換;神經網絡
中圖分類號:TE622.1 文獻標識碼:A
0 前言
在機械設備的油管理中,水分含量是一個非常重要的指標,且機械設備在運行時,由于水封的失效或損壞,熱交換器的腐蝕或損壞,潮濕空氣的原因,水侵入油系統是不可避免的[1]。油含水超標將會導致油膜失效、油系統部件的腐蝕和銹蝕、油乳化、添加劑失效等嚴重后果[2]。目前,常見的油水分測量方法有卡爾―費休法、蒸餾法、重量法、介電常數法、微波衰減法、華特斯摩試紙法和爆裂法等,其中卡爾―費休法、蒸餾法和重量法屬于實驗室分析方法,介電常數法和微波衰減法可用于現場測量,但影響因素較多,不能有效地進行油水分含量的判斷,而華特斯摩試紙法和爆裂法屬于定性的判斷方法。本文以爆裂法為基礎,對其進行半定量研究,著重研究了如何判斷油中的水分含量是否超標的方法。
BP神經網絡是自20世紀80年展起來的一種新的模式識別方法,它以其良好的非線性映射特性和自適應、自學習能力在模式識別、函數逼近和分類、數據壓縮等領域得以應用,并取得了一定的研究成果。文中基于油水分定性實驗的爆裂聲信號,構造了相應的BP網絡目標識別模型,仿真實驗結果表明,該方法對于半定量的確定油中水分含量是可行的,為現場測量油中水分含量提供了新的思路和方法,具有一定的理論價值和實際意義。
1 基本原理
1.1 油水分定性實驗法
將盛有試樣的試管垂直地插入熱油浴中,仔細觀察試管及試樣若干分鐘,直至試樣溫度達到150 ℃為止。如試樣中有水分時,即發生泡沫,可以聽到噼啪的爆裂響聲,甚至試管會發生震動或顫動,高出浴面的油層會變成渾濁[3]。
1.2 小波變換及能量分布特征提取
若ψ(t)∈L2(R)且滿足容許性條件
1.3 BP神經網絡模型及算法
BP神經網絡(Back propagation Neural Network,簡稱BP網絡)也稱誤差反向傳播神經網絡,它是由[HJ]非線性變換單元組成的前饋網絡。BP神經網絡是人工神經網絡中應用最廣的一種神經網絡。BP神經網絡的拓撲結構如圖1所示。這種網絡的特點是:①一般由輸入層、輸出層和隱層3部分組成,隱層可以為一層或多層。根據Kolmogorov定理,1個3層的BP網絡足以完成任意的n維到m維的映射,即一般只需1個隱層就夠了;②輸入信號從輸入層節點,依次傳過各隱層節點,最后傳到輸出層節點,每一層節點的輸出僅影響下一層節點的輸出。在確定了BP網絡的結構后,利用輸入輸出樣本集對其進行訓練,也即對網絡的權值和偏差進行學習和調整,以使網絡實現對給定輸入輸出關系的映射,并使其具有泛化(Generalization )功能。對于樣本集合:輸入xi(Rm)和輸出yi(Rn),可以認為存在某一映射g,使g(xi)=yi,i=1, 2,…,P。現要求出一映射f,使得在某種意義下(通常是最小二乘意義下),f是g的最佳逼近[5]。
BP算法包括信息的正向傳播和誤差的反向傳播,不斷修正權值和誤差,使網絡輸出層實際輸出與期望輸出的誤差平方和達到最小。由于這種算法采用非線性規劃中的最速下降法,按誤差函數的負梯度方向修改權系數,因此存在學習效率低,收斂速度慢;易陷于局部極小狀態;網絡的泛化及適應能力較差等缺點。為了解決這些問題,出現了很多BP改進算法,文中采用附加動量項的方法。
2 油水分測量研究
2.1 爆裂實驗
2.1.1 儀器和材料
儀器:聲傳感器,PULSE系統,PC機,電爐和50 mL燒杯。
材料:CD 40油。
2.1.2 實驗內容
該實驗采用丹麥PULSE系統和Microphone 4189A21型傳感器采集含水油爆裂實驗中的聲信號。在實驗過程中,每次取5 mL試樣置于燒杯中,用電爐加熱。PULSE系統分析帶寬設為0~25.6 kHz,頻譜線數設為1600。根據GB/T 7607-1995柴油機油換油指標,當油中水分含量大于0.2%時需要對油進行更換。因此,在實驗中,分別選取4組濃度小于0.2%的含水油(濃度分別為0.068%、0.093%、0.13%和0.17%)和3組濃度大于0.2%的含水油(濃度分別為0.25%、0.30%和0.50%)作為實驗對象。
2.2 油水分測量研究
含微量水分的油是典型的油包水型分子基團,油是連續相,水是分散相,由于油的沸點比水高,受熱后水總是先達到沸點而蒸發或沸騰。當油滴中的壓力超過油的表面張力及環境壓力之和時,水蒸氣將沖破油膜的阻力使油滴發生爆炸,發出爆裂聲,同時形成更細小的油滴,這就是微爆效應[6]。另外,微爆發生的強弱與油的品種及含水量有關[7]。因此,文中利用二進小波變換來提取尺度空間上的能量分布作為BP神經網絡的輸入特征向量。基于小波變換和BP神經網絡的油水分測量研究過程如圖2。
2.2.1 能量分布特征提取
首先,對每個濃度的試樣采集10組數據,共70組數據,選40組作為訓練樣本,其中濃度0.068%、0.093%、0.13%和0.17%的各5組,濃度0.25%和0.30%的各7組,濃度0.50%的6組,其余30組作為測試樣本,其中0.068%、0.093%、0.13%和0.17%的各5組,濃度0.25%和0.30%的各3組,濃度0.50%的4組。對這70組數據進行6層小波分解,采用db4小波,計算各個高頻分量的能量,這樣每個能量特征向量的維數就是6,總共有40組訓練樣本和30組測試樣本。圖3~圖5分別為濃度為0.069%的含水油(合格)加熱時發生微爆效應所采集到的原始信號以及6層小波分解后得到的近似信號和細節信號。
2.2.2 BP神經網絡分類器的實現
根據Kolmogorov定理,采用一個N×2N+1×M的3層BP網絡作為狀態分類器。其中,N表示輸入特征向量的分量數,M表示輸出狀態類別總數。由此可得,該BP網絡結構為:輸入層有6個神經元,中間層有13個神經元,輸出層有2個神經元,用(0,0)表示合格,(1,0)表示不合格,中間層神經元的傳遞函數為S型正切函數,輸出層神經元的傳遞函數為S型對數函數。然后,利用訓練樣本對該BP神經網絡進行訓練,經過2432次訓練后,網絡的均方誤差落在所設定的0.00001以內。訓練曲線如圖6。
最后,利用訓練好的BP神經網絡,把30個測試樣本輸入到神經網絡,根據BP神經網絡的實際輸出對油含水量是否合格進行判斷,結果如表1。
觀察BP神經網絡輸出結果可以發現,根據BP神經網絡輸出結果判斷的油含水量與實際結果完全一致,表明該BP神經網絡分類器可以準確的判斷油中含水量是否合格。
3 結論
文中基于小波變換和BP神經網絡理論,構造了一個BP神經網絡分類器,并成功地應用于油中水分含量的判斷。實驗結果表明:該方法能有效地進行油含水量合格與否的判斷,從而為研究油水分含量的測量提供了新的思路和方法。
另外,文中在實驗時只選取了7種濃度的溶液,且溶液的濃度差別相對較大。因此,溶液的濃度相差較小時是否可以用該方法進行有效的判斷以及是否可以對分類結果進行更具體的分類將是下一步研究的重點。
參考文獻:
[1] 李廷朝,程素萍.油聚結脫水技術[J].液壓與氣動,2003(1):41-42.
[2] 郭洪波,張志強,于達仁,等.透平油微水含量在線檢測方法研究綜述[J].汽輪機技術,2001,43(2):65-67.
[3] SH/T 0257-92 油水分定性實驗法[S].
[4] 鄭海波,陳心昭,李志遠,等.小波神經網絡故障診斷系統的設計與應用[J].農業機械學報,2002,33(1):73-76.
[5] 焦李成.神經網絡系統理論[M].西安:西安電子科技大學出版社,1996.
[6] Wang C H,Law C K. Micro-Explosion of Fuel Droplets UnderHigh Pressure[J]. Combust Flame,1985(59):53-62.