神經網絡方法范文

時間:2024-03-29 18:17:26

導語:如何才能寫好一篇神經網絡方法,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

神經網絡方法

篇1

為了改善小波神經網絡(WNN)在處理復雜非線性問題的性能,針對量子粒子群優化(QPSO)算法易早熟、后期多樣性差、搜索精度不高的缺點,提出一種同時引入加權系數、引入Cauchy隨機數、改進收縮擴張系數和引入自然選擇的改進量子粒子群優化算法,將其代替梯度下降法,訓練小波基系數和網絡權值,再將優化后的參數組合輸入小波神經網絡,以實現算法的耦合。通過對3個UCI標準數據集的仿真實驗表明,與WNN、PSOWNN、QPSOWNN算法相比,改進的量子粒子群小波神經網絡(MQPSOWNN)算法的運行時間減少了11%~43%,而計算相對誤差較之降低了8%~57%。因此,改進的量子粒子群小波神經網絡模型能夠更迅速、更精確地逼近最優值。

關鍵詞:

小波神經網絡;改進的量子粒子群;參數組合優化

0引言

小波神經網絡(Wavelet Neural Network, WNN)自提出以來得到了廣泛應用,然而,傳統WNN模型存在精度差、不穩定、易早熟等缺點。與此同時,量子粒子群優化(Quantumbehaved Particle Swarm Optimization, QPSO)算法雖然對傳統粒子群優化(Particle Swarm Optimization, PSO)算法進行一定的改進,但仍然沒有完全擺脫PSO容易陷入局部最優的缺點,并存在著易早熟、后期多樣性差、搜索精度不高等缺陷。

基于此,本文將在前人的研究基礎上,提出一套QPSO算法的改進方案,并用改進后的QPSO算法代替梯度下降法,以均方差(Mean Squared Error, MSE)誤差為目標函數,優化WNN的小波基系數和網絡權值,再將優化后的參數組合輸入WNN模型進一步精確優化,從而實現兩種算法的耦合。通過實驗分析可以證明,改進后的WNN具備更高的收斂精度和更快的收斂速度,對于解決復雜非線性問題擁有更好的泛化能力、容錯能力以及學習能力。

1量子粒子群算法及其改進

1.1量子粒子群算法

為了克服傳統PSO算法的缺陷,Sun等[1]提出QPSO算法,提高了粒子群的全局收斂能力。由于算法在迭代過程中,僅存在粒子位置的變化,因此計算大大簡化,主要迭代方程歸納為:

其中:i=1,2,…,M;n=1,2,…,N;M為粒子的種群規模;N為粒子的維數;t為當前迭代次數;r1、r2和u均為[0,1]的隨機數;pi(t)為粒子的個體最優位置;pg(t)為粒子的全局最優位置;p(t)為pi(t)和pg(t)之間的隨機點。 β為收縮擴張這個說法是標準表達嗎?請明確 。是否應該為收縮-擴張系數?系數,是量子粒子群算法唯一的初始參數,通常情況下, β的值隨著迭代次數增加而線性減小[2],即:

β=0.5+(1-0.5)(T-t)/T(2)

其中T為最大迭代次數。當u≤0.5時, β取正號;當u>0.5時, β取負號。與其他智能算法不同,量子粒子群只有收縮擴張系數β作為唯一的初始參數,因此它具有易控制、收斂快以及全局搜索能力強等特點,但也存在以下幾點問題:

1)量子粒子群算法沒有在根本上改變標準粒子群在后期容易陷入早熟的問題,相關研究[3]表明,隨著迭代次數的增加,種群的多樣性逐步減弱,粒子的全局搜索能力也會隨之降低。

2)在量子空間里,單個粒子沒有速度向量的指引,后期搜索能力較弱,并且隨著β參數的遞減,粒子的搜索空間也逐步壓縮,容易陷入早熟,導致搜索精度不高。

1.2改進的量子粒子群算法

為了改善QPSO算法性能,Sun等做了許多工作,比如提出了概率分布機制,維持種群的多樣性[4];與模擬退火算法相結合,提高全局搜索能力[5];利用免疫記憶來提高粒子的收斂速度[6]等。此外,Coelho[7]提出了基于Gaussian分布的QPSO算法,通過引入變異算子改善后期搜索能力;林星等[8]提出混沌QPSO優化算法,具有較好的搜索精度和較強的克服早熟的能力;許少華等[9]引入量子Hadamard門操作和全局自適應因子,改善了QPSO算法的搜索能力等。

上述改進方法都能在一定程度上改善了QPSO算法的性能,但算法的改進應是一個系統工作,僅靠一兩個方面的改善,效果非常有限,甚至可能會帶來一些負面效果,比如提高粒子搜索精度可能降低收斂速度,加快搜索可能陷入早熟,所以,本文針對QPSO算法固有缺陷,提出從收斂精度、搜索速度以及克服早熟能力的三個方面綜合考慮,全面系統地設計改進方案,主要包括以下4點。

1)加權系數。

式(1)中平均最優位置mbest僅僅是由處于每個維度上最優粒子的簡單求和平均得出,這就等同于假定了每個粒子在空間搜索中所做貢獻是一樣的,而在實際情況中這顯然是不合理的。雖然在多數情況下,傳統的處理方式是可行的,但是為了降低算法的隨機性,提高粒子搜索精度,本文引入加權系數[10]對原算法進行改進。

在每次迭代時,通過計算出適應值pi(t),篩選出每一個維度處于最優位置的粒子。若是求最大值問題,則pi(t)越大,粒子越重要;反之,若是求最小值問題,則pi(t)越小,粒子越重要。因此,根據適應值的大小,首先將粒子按降序排列,然后為每個粒子確定其加權系數αi,n,離預期的最優結果越近,αi,n的值越大,所以,將mbest改進為:

2)Cauchy隨機數。

一般情況下,QPSO算法的隨機因子都是使用均勻分布產生,但隨著迭代次數的增加,量子空間逐漸被壓縮,一旦陷入局部最優,大多數粒子會不斷趨同,整個粒子群就會失去多樣性,如此便很難避免早熟的產生。對此,有文獻提出使用Gaussian分布代替均勻分布,增加粒子后期的活力,但由于Cauchy分布具有較高的兩翼概率,更易得到一個離原點較遠的隨機數,比Gaussian分布的區域范圍更廣,因此,本文采用Cauchy分布[11]代替均勻分布生成隨機因子。

本文采用標準的Cauchy分布C(0,1)分布,首先將隨機因子u由原來的u~U(0,1)改為u服從u~C(0,1),其次,將隨機因子r1和r2也改為服從Cauchy分布,即r1,r2~C(0,1),則式(1)改進為:

3)隨機收縮擴張系數。

收縮擴張系數β是QPSO算法中唯一重要的初始參數,較大的β有利于粒子的快速收斂,提高算法的全局搜索能力;而較小的β有利于對當前的搜索區域進行精確局部搜索,增強算法的局部搜索能力。文獻[2]中詳細驗證了當β為線性遞減或者非線性遞減時,對于多數情況下能取得較好的結果,但這種參數處理方法需要反復的實驗才能確定最優值,并且,若在搜索的開始階段未能接近最優值,則隨著β的減小和粒子多樣性的減弱,算法易陷入局部最優。

對此,本文在白俊強等[12]的啟發下,將收縮擴張系數β服從某種隨機分布,如果在搜索的開始階段未能接近最優值,則β的隨機生成能使部分粒子跳出局部最優,重新在可行域中搜索,進而盡量避免β線性或非線性遞減所引起的早熟,因此將式(2)改進為:

其中:εmax為隨機系數的最大值;εmin為隨機系數的最小值;σ為隨機系數的方差;N(0,1)為標準正態分布的隨機數;rand(0,1)為0到1之間的隨機數。

4)自然選擇。

為了在不影響收斂精度的前提下,盡可能提高粒子在可行域空間的搜索速度,本文在前人研究[13]的基礎上,將自然選擇的思想引入到QPSO算法的改進方案中,通過保留優等粒子,加快淘汰迭代過程中偏離最優解的劣等粒子來實現對算法的改進。

具體的做法是在每次迭代過程中將每一個種群的粒子按適應值pi(t)排序,通過比較,用粒子群中最優的20%部分的粒子替換最差20%部分的粒子,同時保留每次迭代過程中產生的全局最優值,以提高粒子群中優等粒子的比重,以保證QPSO算法的收斂速度加快,并持續保持良好的性能。

綜上所述,本文提出了旨在提高QPSO算法收斂精度、搜索速度和克服早熟能力的3種性能,以引入加權系數、Cauchy隨機數、隨機收縮擴張系數和自然選擇的4種改進方法為基礎的一套改進方案,以此提升QPSO算法的綜合性能,如圖1所示。其中:引入加權系數是為了提高收斂精度,引入自然選擇是為了提高搜索速度,引入Cauchy隨機數和隨機收縮擴張系數是為了防止早熟的產生。

2基于改進的QPSO的小波神經網絡模型

2.1小波神經網絡

WNN與傳統BP神經網絡的主要區別在于將神經元中的Sigmoid激勵函數換成小波基函數,使其具備小波變換的局部化特點和神經網絡的自學習性質,具備較強的非線性逼近能力。

隱含層函數ψa,b(x)采用國內外較多使用的Morlet小波基函數[14],即:

網絡輸出的誤差函數采用均方差計算,即:

MSE=1M∑Mm=1∑Jj=1(yjm-Rjm)2(8)均方差的定義應該為開方形式,為何沒有?即應與式(12)類似,請明確或解釋一下。

根據預測誤差值,采用梯度下降法調整連接層權重和小波基系數,即:

2.2改進的量子粒子群小波神經網絡的實現

使用基于改進的量子粒子群算法訓練小波神經網絡(Modified Quantum Particle Swarm OptimizationWavelet Neural Network, MQPSOWNN)實際上就是將每個維度的粒子向量分別代表WNN模型的初始連接層權重(wik,wkj)和小波基系數(ak,bk),并以均方差誤差函數,即式(8)作為MQPSO優化的目標函數,通過反復迭代計算,一直到適應值趨于穩定為止。在此基礎上,將優化后的參數組合應用到預先設置好的WNN模型中進一步訓練,直至搜索到最優網絡參數。由于在MQPSOWNN的初始階段,MQPSO算法代替了梯度下降法調整WNN模型參數,使得整個網絡能夠更穩定地在更接近最優解位置進行參數尋優,從而有效提高了WNN尋優速度和精度。

MQPSOWNN算法的步驟如圖2所示。

2.3改進的量子粒子群小波神經網絡的分析

與BP神經網絡相比,WNN采用小波基函數取代Sigmoid函數作為激勵函數,并引入伸縮、平移因子,因此具備了更強的容錯、識別和預測能力,但在實際應用中WNN存在著初始參數的選取不合適可能導致整個學習過程不收斂的缺點。而MQPSO算法擁有精度高、收斂快等良好性能,因此,嘗試將二者相互耦合,采用MQPSO算法對網絡參數進行優化,得到更適應WNN模型的參數組合,再通過WNN進一步精確優化,能夠提高WNN模型的穩定性、容錯能力及學習能力,增強其對于實際問題的解決能力。

3仿真實驗

3.1實驗條件

為了驗證MQPSOWNN算法的有效性及優越性,本實驗在CPU主頻2.20GHz、內存2.0GB的運行環境下,使用Matlab 7.0軟件,選取UCI機器學習數據庫中的3個標準數據集作為原始數據集(都是典型的復雜非線性預測問題),分別采用WNN、PSOWNN、QPSOWNN和MQPSOWNN算法進行預測仿真實驗,進而對比研究。

篇2

關鍵詞:GPS高程轉換 神經網絡 標準BP算法 LMBP

中圖分類號:TN711 文獻標識碼:A 文章編號:

0. 引言

GPS定位技術自問世以來,以其精度高,速度快,操作簡便等諸多優點受到測繪界的廣泛關注。國內外大量的實踐表明,利用GPS進行平面相對定位的精度能夠達到±(0.1~1)mm×106D甚至更高,這一點常規測量技術難以比擬。但是,GPS測量經過平差處理,所得到的高程是相對于WGS―84橢球的大地高h,在實際工程應用中使用的是水準高(正常高)H,因此,在工程應用中應將大地高h轉換為水準高程H,兩者之間的差值稱為高程異常ξ。其關系如下:H=h-ξ,用圖形表示則如圖1所示:

圖1 大地高與正常高的關系

GPS測量經過平差、轉換,如能獲得高精度的水準高程值H,則可部分地節約工作量及其繁重的水準測量,其經濟效益是非常可觀的。目前轉換GPS高程的方法有很多種,常用的比較傳統的有以下幾種數學模型:

(1)多項式曲面擬合模型 這種模型是在擬合區域內的水準重合點之間,按削高補低的原則平滑出1個多項式曲面來代表擬合區域的似大地水準面,供內插使用。擬合范圍越大,高程異常的變化越復雜,所得結果的誤差也越大。同時,由于二階多項式函數幾何表示為一“拋物單曲面”,所以如果高程異常圖像鞍部、水波浪形等存在多個凸凹面時,用1個二階多項式函數就無法以數學形式表示。并且該模型對于高程異常變化較大的測區來說很難適應,因此適用范圍受到限制。

(2)多面函數擬合模型 多面函數擬合是一種純數學曲面逼近方法,它的出發點是在每個數據點上同各個已知數據點分別建立函數關系。

(3)加權平均值模型 加權平均模型是根據重合點上的高程異常值的加權均值推算插值點上的高程異常。采用此類模型時若以內插點到已知平面距離的函數作為權,則只顧及了已知點距內插點遠近的影響,未反映出重合點分布及周圍地形起伏的影響,插值點上的高程異常向最近的已知值靠近。若以向徑的函數作權,對精度有一定的改善。對于不同測區要根據點位分布密度和面積選擇適當的權函數和擬合半徑。該模型一般適用于大面積、點位分布均勻的區域。

以上幾種方法都是人為的構造一個數學模型,再根據一定數量的已知點信息結算數學模型中待定參數,從而達到求解該未知量的目的。但這樣做一般不可避免地會存在數學模型誤差。

本文所討論的神經網絡法是一種自適應的映射方法,它不用作假設,理論上也比較合理,能避免未知因素的影響,減少模型誤差。本文將最新的神經網絡的相關理論與GPS高程相關理論相結合,給出一種新的算法,來有效地改進GPS高程擬合。這種方法對有效地減少水準測量的外業及解決GPS高程擬合,有很高的應用價值。

1.BP神經網絡模型

1.1神經網絡的概述

神經網絡,是由大量的神經元廣泛互聯而成的網絡,是對人腦的抽象、簡化和模擬,反映人腦的基本特性。人工神經網絡非常適合于模擬非線性映射,并且不需要建立數學模型。它能夠通過自學習功能來獲得非線性映射能力,并把這種能力分布地存儲在網絡的連接權值和閾值中。

多層前饋型人工神經網絡是最常用、最流行的網絡模型,它的逼近能力和訓練算法是其應用的關鍵。BP網絡是一種多層前饋神經網絡,其神經元的變換函數一般為線性函數,如S型函數或雙曲線正切函數,因此輸出量為0到1之間的連續量,它可以實現從輸入到輸出的任意的非線性映射。由于權值的調整采用反饋傳播(Back Propagation)的學習算法,因此被稱為BP網絡。在確定了BP網絡的結構后,利用輸入輸出樣本集對其進行訓練,也即對網絡的權值和閥值進行學習和調整,以使網絡實現給定的輸入輸出映射關系。經過訓練的BP網絡,對于不是樣本集中的輸入也能給出合適的輸出,這種性質稱為泛化(generalation)功能,從函數擬合的角度看,這說明BP網絡具有插值功能。

典型的BP網絡是三層網絡,包括輸入層、隱含層和輸出層,各層之間實行全連接,如圖2所示。

1.2 BP算法的學習過程

BP網絡的學習由四個過程組成,即

(1)輸入模式由輸入層經中間層向輸出層的“模式順傳播”過程;

(2)網絡的希望輸出與網絡實際輸出之差的誤差信號由輸出層經中間層向輸入層逐層修正連接權的“誤差逆傳播”過程;

(3)由“模式順傳播”與“模式逆傳播”的反復交替進行的網絡“記憶訓練”過程;

(4)網絡趨向收斂即網絡的全局誤差趨向極小值的“學習收斂”過程。

簡而言之,就是由“模式順傳播”“誤差逆傳播”“記憶訓練”“學習收斂”的過程。

2. GPS高程的神經網絡轉換方法

進行GPS高程的轉換,實質是為了實現GPS高程與正常高之間的非線性映射。所以采用反向傳播網絡(Back Propagation,BP網絡)。

用已知點的坐標(,)和高程異常值建立神經網絡的已知樣本集

={}

=(,,)i=1,2,…,n

對樣本集P進行學習,建立映射關系

=f(x,y)

其中,x,y為平面坐標; 為高程異常。

通過計算比較,結點激活函數選用Sigmoid函數()。

2.1 標準BP學習算法

標準的BP算法是基于梯度下降法,通過計算目標函數對網絡權值和閾值的梯度進行修正。標準梯度下降法權值和閾值修正的迭代過程可以表示為

x(k+1)=x(k)-ηΔF(x(k))

式中,x(k)為由網絡所有權值和閾值所形成的向量;η為學習速率;F(x(k))為目標函數;ΔF(x(k))為目標函數的梯度;k為迭代次數。

BP神經網絡的算法流程如下:

(1)初始化網絡。

(2)選取模式對提供給網絡。

(3)用輸入模式,連接權計算隱含層各單元的輸入然后用通過S函數計算隱含層各單元輸出

j=1,2,…p (1)

(2)

(4)用隱含層的輸出、連接權值計算輸出層各單元的輸入然后用通過S函數計算輸出層各單元的響應

(3)

(4)

(5)用希望輸出模式、網絡實際輸出計算輸出層的各單元的一般化誤差

(5)

(6)用連接權、輸出層的一般化誤差、隱含層的輸出計算隱含層各單元的一般化誤差

(6)

(7)用輸出層各單元的一般化誤差、隱含層各單元的輸出修正連接權

(7)

(8)用隱含層各單元的一般化誤差、輸入層各單元的輸入修正連接權

(8)

,,

(9)選取下一個學習模式對提供給網絡,返回到步驟(3)直到全部m個模式對訓練完畢。

(10)重新從m個學習模式對中隨機選取一個模式對,返回步驟(3)直到網絡達到預設的訓練次數或網絡全局誤差函數E小于預先設定的一個極小值。

(11)結束學習。

神經網絡訓練規則中反向傳播訓練算法雖已經得到了廣泛的應用,但是仍然存在著一些缺點:(1)從數學上看,反向傳播算法歸結為非線性梯度優化問題,因此不可避免存在局部極小問題;(2)學習算法的收斂速度慢;(3)存在過學習問題.

2.2 BP網絡的改進學習算法―LMBP算法

L-M算法是一種利用標準數值優化技術的快速算法,具有二階收斂速度.其不需要計算Hessian(赫森)矩陣,利用進行估算,梯度計算采用,式中J為Jacobian(雅可比)矩陣,包含網絡誤差相對權重和閾值的一階微分.雅可比矩陣可利用標準反向傳播算法得到,比直接計算赫森矩陣簡單很多.L-M算法迭代式為:

(9)

比例系數μ=0時即為牛頓法,μ取值很大則接近梯度下降法,每迭代成功一步,μ值減小,在接近誤差目標時逐漸與牛頓法相似.牛頓法在接近誤差最小值時,計算速度更快,精度更高.

3.應用實例仿真

應用上述人工神經網絡模型,對某一測區具有15個水準重合點的GPS控制網的數據進行了實際計算。圖3是兩種學習算法的誤差下降曲線圖。

(a)標準BP算法誤差下降曲線圖

(b)LMBP算法誤差下降曲線圖

圖3 兩種學習算法誤差曲線的比較

4. 結論

從上述的實例資料計算可以得出:

(1)神經網絡方法對GPS水準聯測點數目要求較少,能解決已知點較少的測區GPS高程轉換問題,且效果較好。這對于充分利用GPS高程信息減少水準測量外業,有著一定的現實意義,并對局部GPS問題即解決GPS高程擬合和精化局部大地水準面模型也有十分實用的參考價值。

(2)改進的學習算法和標準BP算法在GPS高程轉換中,誤差相當的情況下,改進的學習算法LMBP收斂速度比標準BP算法快很多。因此改進的BP網絡學習算法與標準算法相比,在GPS高程的實時解算方面是一種很好的方式。

(3)由于神經網絡本身還有很多的問題需要研究目前的算法對于不同的問題均存在陷入局部極小的可能性,因此對于神經網絡轉換GPS高程而言,還需要在算法的優選等方面作進一步的研究。

參考文獻:

【1】Martin T.Hagan, Howard B.Demuth, Mark H. Beale.戴葵,等譯.神經網絡設計[M].機械工業出版社,北京:2002.

【2】韓碩.神經網絡在GPS高程擬合中的應用.測繪通報[J].2006,4:48-50.

【3】魯鐵定,鐘小威.基于改進BP學習算法的GPS高程轉換.測繪通報[J].2005,12:13-15.

【4】韓敏,田雪.基于神經網絡的GPS坐標轉換方法研究.大連理工大學學報[J],2005,45(4):603-606.

【5】云學英,謝靈斌.GPS高程擬合模型及優選.城市勘測[J].2005,4:21-24.

【6】吳良才,胡振琪.GPS高程轉換方法和正常高計算.測繪學院學報[J].2004,21(4):256-258.

篇3

【關鍵詞】介損值;BP算法;人工神經網絡

1.引言

當前的電容型電氣設備絕緣在線監測與診斷還停留在一個簡單處理數據的層次上,如果能夠結合先進的數學工具進行分析,將有助于提高監測與診斷的應用水平。模糊數學、專家系統、神經網絡、灰關聯分析等理論在電氣設備的絕緣監測與診斷方面已經有了廣泛的應用,并提供較完備的知識與信息,提高了絕緣監測與診斷的準確性。

大量停電試驗和專門試驗的介損值結果統計分析表明,介損值會對溫度的變化較為敏感,環境的濕度對介損值也會有影響。在分析了各種因素影響介損值的基礎上,文獻[6]提出了基于人工神經網絡的電容型電氣設備的絕緣狀況的預測方法。人工神經網絡方法能夠根據大量的故障機理研究以及經驗性的直覺知識歸納出典型樣本,通過對神經網絡內部的競爭達到問題的求解,從本質上模擬專家的直覺。在此基礎上本文提出了基于人工神經網絡的電容型電氣設備的介損值的預測方法,以BP神經網絡作為主要的研究方法。BP網絡的預測結果的準確與否取決于學習樣本的優劣,本文根據實際情況選取了神經網絡的學習樣本并進行了仿真,結果表明該預測方法的誤差滿足工程誤差的要求,基于人工神經網絡的介質損耗值的預測方法是可行的、正確的和有效的。

2.基于BP神經網絡預測方法的確定

人工神經網絡的模型有數十種,可分為三大類:前向網絡、反饋網絡和自適應網絡。但在人工神經網絡的實際應用中,絕大部分的神經網絡模型都采用BP網絡及其變化形式。BP(Back Propagation)網絡是一種多層前饋型神經網絡,其神經元的傳遞函數是S型函數,輸出量為0到1之間的連續量,它可以實現從輸入到輸出的任意非線性映射。BP神經網絡的主要優點:

(1)BP神經網絡具有分布式信息存儲能力;

(2)BP神經網絡的容錯性和大規模并行處理能力;

(3)BP神經網絡具有自學習、自組織和自適應能力;

(4)BP神經網絡是大量神經元的集體行為,表現出一般復雜非線性系統的特性;

(5)BP神經網絡可以處理一些環境信息十分復雜、知識背景不清楚和推理規則不明確的問題。

基于以上優點,本文選用BP神經網絡作為主要研究方法。

3.BP算法基本思想和網絡的基本結構

BP神經網絡是一個多層前饋神經網絡,包括了輸入層、隱層和輸出層。這種網絡在輸入層和輸出層之間至少有一個隱含層,每一個神經元結點都與其后一層的結點相連接,但是沒有后層結點向前層結點的反饋連接。BP網絡具有結構簡單、可靠性強的優點,能夠滿足工業應用的需要,而且有關網絡的機理和算法的研究都很豐富,是眾多網絡中最為成熟,應用最為廣泛的一種,是復雜系統建模的優秀工具。

BP算法的基本思想:當一對學習樣本提供給網絡后,神經元的激活值從輸入層經隱層向輸出層傳播,在輸出層的各神經元獲得網絡的輸入響應。接下來,按照減少目標輸出與實際誤差的方向,從輸出層經過各隱層逐層修正各連接權值,最后回到輸出層,這種算法為“誤差逆傳播算法”。隨著這種誤差逆的傳播修正不斷進行,網絡對輸入模式響應的正確率也不斷升高。

三層前饋網絡中,輸入向量為X=(x1,x2, ……,xi,……,xn)T;隱層輸出向量為Y=(y1,y2,……,yj,……,ym);輸出層輸出向量為O=(o1,o2,……,ok,……,ol)T;期望輸出向量為d=(d1,d2,……,dk,……,dl)T。輸入層到隱層之間的權值矩陣用V表示,V=(v1,v2,……,vj,vm),其中列向量Vj為隱層第j個神經元對應的權向量;隱層到輸出層之間的權值矩陣用W表示,W=(W1,W2,……,Wk,……,Wl),其中列向量Wk為輸出層第k個神經元對應的權向量。如圖3-1所示。

對輸出層,有

Ok=f(netk) k=1,2,…,l (1)

netk= k=1,2,…,l (2)

對于隱層,有

yj=f(netj) j=1,2,…,m (3)

netj= j=1,2,…,m (4)

以上兩式中,轉移函數f(x)均為單極性(或雙極性)sigmoid函數,f(x)具有連續、可導的特點。式(3.1)到式(3.4)共同構成了三層前饋網的數學模型。

圖1 三層BP網絡

三層前饋網絡的BP學習算法權值調整計算公式為:

(5)

(6)

其中:

(7)

對于一般多層前饋網,設共有h個隱層,按前向順序各隱層節點數分別記為m1,m2,…,mh,各隱層輸出分別記為y1,y2,…,yh,各層權值矩陣分別記為W1,W2,…,Wh,Wh+1,則各層權值調整計算公式為:

輸出層:

j=0,1,…,mh;k=1,2,… (8)

第h隱層:

i=0,1,…,mh-1;j=1,2,…,mh (9)

按以上規律逐層類推.則第一隱層權值調整計算公式:

p=0,1,…,n;j=1,2,…,m1 (10)

容易看出,BP學習算法中,各層權值調整公式形式上都是一樣的,均由3個因素決定,即:學習率η、本層輸出的誤差信號δ以及本層輸入信號Y(或X)。

4.基于MATLAB的BP神經網絡的實現

4.1 網絡的輸入層和輸出層設計

大量停電試驗和專門試驗的介損結果統計分析表明,電容型設備的介質損耗值的大小與環境等外界因素之間有著密切的關系。基于此,本文提出了基于環境等外界因素影響分析電容型設備絕緣狀況的BP神經網絡模型,其示意圖如圖2所示。

圖2 神經網絡模型示意圖

為了更好的體現輸入和輸出變量的相應關系,輸入層神經元應盡可能多采集與輸出量相關性大的信息。本文以某一時刻設備的電壓、電流、電容、環境溫度、濕度和介質損耗值所為網絡的輸入參數,所以網絡輸入層的神經元有6個。輸出層只有一個即預測時刻的介質損耗值,則輸出層只有一個神經元。

為了統一量綱和防止因凈輸入的絕對值過大而使神經元輸出飽和,繼而使權值調整進入誤差曲面的平坦區。BP神經網絡的訓練樣本在輸入網絡之前要進行必要的歸一化,也就是通過變換處理將網絡的輸入、輸出數據限制在[0,1]或[-l,1]區間內。歸一化方法有很多種形式,本文采用如下公式來進行樣本數據的歸一化:

令P為網絡的輸入向量,t為網絡的目標向量,p_test、t_test為網絡的測試樣本向量,利用MATLAB歸一化的代碼為:

歸一化后的輸入向量P

for i=1:6

P(i,:)=(p(i,:)-min(p(i,:)))/(max (p(i,:))-min(p(i,:)));

end

歸一化后的輸入向量A

for i=1

T(i,:)=(t(i,:)-min(t(i,:)))/(max(t(i,:))-min(t(i,:)));

end

測試樣本向量p_test和t-test的歸一化同輸入向量p和目標向量t的歸一化,歸一化后的向量為P_test和T_test。

4.2 隱層神經元數的選擇

在設計多層前饋網時,一般先考慮設一個隱層.當一個隱層的隱節點數很多仍不能改善網絡性能時,才考慮再增加一個隱層。由于本系統是一個比較小型的網絡,且各結點采用S型函數進行處理,故采用單隱層。

隱層的神經元數目選擇是一個非常復雜的問題,往往需要根據設計者的經驗和多次試驗來確定。隱單元的數目與問題的要求、輸入/輸出單元的數目都有直接的聯系。隱單元數目太多和會導致學習的時間過長、誤差不一定最佳,也會導致容錯性差、不能識別以前沒有看到的樣本。選擇最佳隱單元數的參考公式:

(1)

其中,k為樣本數,n1為隱單元數,n為輸入單元數。

(2)

其中,m為輸出神經元數,n為輸入神經元數,a為[1,10]之間的常數。

(3)

其中,n為輸入單元數。

由于單隱層BP網絡的非線性映射能力比較強,本文采用了單隱層的神經網絡,而中間層神經元個數需通過實驗來確定,輸入層神經元個數有6個,中間層神經元的個數選擇3個值,分別為13、15和20,并分別檢查網絡性能。通過實際的迭代訓練,設置多種不同的隱節點情況,用同一樣本集進行訓練,比較迭代訓練實驗的結果,從中確定網絡誤差最小時對應的神經元個數。

MATLAB代碼為:

隱層單元個數向量

a=[13 15 20];

for i=1:3

net=newff(threshold,[a(i),1],{‘tansig’, ‘logsig’},‘traindx’);

net.trainparam.epochs=1000;

net.trainparam.goal=0.01;

init函數用于將網絡初始化

net=init(net);

net=train(net,P,T);

Y(i,:)=sim(net,P_test);

end

figure;

繪制誤差曲線

中間神經元個數為13

polt(1:6,Y(1,:)-T_test);

hold on;

中間神經元個數為15

polt(1:6,Y(2,:)-T_test);

hold on;

中間神經元個數為20

polt(1:6,Y(3,:)-T_test);

hold off;

通過3種情況下的誤差比較發現,中間層神經元個數為13、20時網絡的誤差比較大,當隱層節點數為15時,網絡誤差較小,收斂速度較快能得到最理想的輸出,網絡的預測性能最好。

通過上述分析,可以確定本文設計的神經網絡結構為6-15-1,網絡中間層的神經元傳遞函數,采用S型正切函數tansig,輸出層神經元傳遞函數采用S型對數函數logsig。這是因為函數的輸出位于區間[0,1]中,正好滿足網絡輸出的要求。

圖3 預測誤差對比曲線

本文所要解決的問題是根據環境等外界因素對設備的絕緣狀況進行預測,對網絡的訓練速度和穩定性有較高的要求,因此選擇traingdx函數作為訓練函數,該函數結合了動量梯度下降算法和自適應學習速率梯度下降算法。

該算法的基本過程為:首先計算出網絡的輸出誤差,然后在每次訓練結束之后,利用此時的學習率計算出網絡的權值和閾值,并且計算出網絡此時的輸出誤差。如果此時的輸出誤差與前一時刻的輸出誤差的比值大于預先定義的參數max_perf_inc,那么就減小學習率(通過乘以系數lr_dec來實現),反之,就增加學習率(通過乘以系數lr_inc來實現)。再重新計算網絡的權值和閾值以及輸出誤差,直到前后輸出誤差的比值小于參數max_perf_inc為止。

4.3 網絡學習速率和動量系數的選擇

學習速率大小的選擇,直接影響訓練時間,當學習速率的選擇不當,特別在嚴重時,將導致網絡完全不能訓練,這是因為1986年Rumelhart等人在證明BP訓練算法收斂中,假設了無限小的權重調節速率。實際上這是不可能的,因為這表示需要無限的訓練時間,所以,實際上必須選一個有限的學習速率大小,即η的值取0.01到1。一般來說要根據實驗或經驗來確定,還沒有一個理論指導。若η選得太小,收斂可能很慢:若η選得太大,可能出現麻痹現象。為了避免這種現象,通常會選擇減少η,但又會增加網絡的訓練時間。動量項可以加快BP算法的學習速度,但選項的時候應當注意避免學習時產生振蕩。

因此,本文在確定網絡的學習速率和動量系數的時候,采用不同的值的組合,利用55組訓練數據進行了若干次網絡的迭代訓練。本文根據比較結果確定學習速率為0.1,動量系數為0.7作為網絡訓練時的參數。

5.基于BP神經網絡介損值的預測應用

本文所建立的BP網絡是基于MATLAB中的GUI建立。圖形用戶界面GUI (Graphical User Interfaces)是神經網絡的工具箱提供的人機交互界面,它引導工程人員一步步的建立和訓練網絡,避免了代碼的編寫過程。借助圖形用戶界面GUI,可比直接利用工具箱函數更快捷和方便的完成神經網絡的設計與分析。

利用BP神經網絡理論和經過以上訓練得到的網絡參數,利用Matlab軟件提供的GUI構造出了基于環境等外界因素影響分析設備絕緣狀況的BP神經網絡模型。表1列出了本文研究中建立的BP網絡的各個參數和函數。

網絡所用的訓練數據和測試數據均出自于某110KV變電站主變套管的在線監測的數據],本文采用其中的55組典型數據,其中50組數據用于網絡訓練(訓練次數為1000次,訓練目標為0.01),5組數據用于仿真預測,利用仿真函數獲得網絡的輸出,網絡的預測結果及誤差見表2,可見預測值與實際監測值之間的誤差非常小,能滿足實際要求。

表1 基于BP神經網絡的電容型設備絕緣診斷模型參數

名稱 參數

輸入層節點數 6

隱含層節點數 15

輸出層節點數 1

訓練函數 traingdx

學習函數 learngdm

學習速率 0.1

動量系數 0.7

表2 外界環境相同時介損值的實際值與預測值的對比

序號 電壓 電流 電容 溫度 濕度 實 際

介損值 預 測

介損值 誤差

1 119 7.047 326.479 18 50 0.003906 0.004025 0.000119

2 119 7.057 327.545 17 52 0.000440 0.004386 0.000014

3 118 7.022 328.078 17 55 0.003946 0.004108 0.000162

4 119 7.059 327.035 16 55 0.004471 0.004512 0.000041

5 119 7.069 327.406 17 59 0.003249 0.003178 0.000071

6.結束語

本章通過對BP網絡模型和學習算法的研究,深入分析了BP網絡在函數預測方面的優點,確定了用BP網絡來實現對容性設備介質損耗值的預測,得到的結論如下:

(1)通過對BP網絡結構的研究,將三層前向神經網絡結構進行了改進,適應了本文對介質損耗值的預測要求。

(2)BP網絡的預測結果的準確與否取決于學習樣本的優劣,本文根據實際情況選取了神經網絡的學習樣本并進行了仿真,結果表明該預測方法的誤差滿足工程誤差的要求,及基于人工神經網絡的介質損耗值的預測方法是可行的、正確的和有效的。

(3)數據預測具有一定的精度,但是還存在誤差,需選擇相關大的、較合理的輸入向量,還可以對網絡的結構和算法選擇方面進行改進,選擇更合適的訓練函數使其收斂速度更快,誤差更小。

參考文獻

[1]張寒,文習山,丁輝.用人工神經網絡預測基于泄漏電流、氣象因素的絕緣子等值附鹽密度預測[J].高壓電器,2003,39(6):31-35.

[2]韓力群.人工神經網絡理論、設計及應用[M].北京:化學工業出版社,2002.

[3]閆志忠.BP神經網絡模型的改進及其應用研究[D].長春:吉林大學,2003.

[4]聞新.MATLAB神經網絡仿真與應用[M].北京:科學出版社,2000.

[5]許東,吳崢.基于MATLAB6.X的系統分析與設計-神經網絡(第二版)[M].西安:西安電子科技大學出版社,2002.

[6]叢爽.面向MATLAB工具箱的神經網絡理論與應用[M].合肥:中國科技大學出版社,1998

篇4

關鍵詞:人工神經網絡;神經元;可視化

中圖分類號:TP183文獻標識碼:A文章編號:1009-3044(2008)36-2882-03

Analysis and Comparison Between ANN and Viewdata

ZHAO Chun, LI Dong

(Department of Computer Science, Xinxiang University, Xinxiang 453000, China)

Abstract: ANN and viewdata two calculating methods of obtaing new data by the dig and learrangement of the original data. This paper intends to make a general analysis of the featurcs of the two methods and a friof comparison between the two, and summed up the two algorithms and the similarity of common ground.

Key words:ANN; nerve cell; viewdata

1 引言

人工神經網絡和可視化方法是數據挖掘中的兩個重要的算法模型,兩者都是根據模擬人腦和人的視覺神經與傳統的數字計算機相比較而抽象出來的數據挖掘算法??梢暬椒ㄊ侨四X神經網絡的一部分,它們之間存在著必然的聯系,而算法又各有所異。隨著數據挖掘技術的快速發展,存儲在數據庫中的數據量也迅速增長,這證明傳統的關系數據庫和存儲圖像、CAD(計算機輔助設計)圖紙、地理信息和分子生物結構的復雜2D和3D多媒體數據庫是合理的。許多應用都要用到大型的數據庫,這些數據庫有幾百萬種數據對象,這些數據對象的緯度達到幾十甚至幾百。面對如此復雜的數據時,我們常常面臨著一些棘手的問題:應該從哪里開始著手?哪些是有用的數據?還有一些其他可用的數據嗎?能得出答案的其他方法是什么?人們在尋求突破的同時反復地思考并詢問復雜數據的專門問題。我們從人工神經網絡和可視化方法的算法、特有屬性進行橫向和縱向的比較來找出他們的共同點和相似點。

2 人工神經網絡算法與可視化方法性能比較

2.1 人工神經網絡提供特有的屬性和能力

1) 人工神經網絡有超強的運算功能――人腦大約有1011個微處理神經元,這些神經元之間相互連接,連接的數目大約達到1015數量級[1]。每個神經元都相當一個微型計算機,把每個微型計算機鏈接起來就形成了一個超級計算機網絡。

2) 由于人工神經網絡相當于一個超級因特網,每個神經元都相當于一個微型計算機,對所有的任務都可并行,并且是分布式處理,其處理能力也是超強的――每個神經元節點都可以看作一個微型計算機,這樣就形成了一個龐大的神經元網絡。

3) 人工神經網絡有歸納總結和分類的能力。――歸納總結和分類是人工神經網絡對輸入而產生合理的輸出。

4) 人工神經網絡有離散性。

5) 人工神經網絡通過典型的實例中進行歸納總結。

6) 對整個網絡有很強的適應性和快速的驗證的能力。

7) 對整個人工神經網絡的包容性。

8 對整個人工神經網絡統籌能力。

2.2 可視化方法特有的屬性和能力

1) 在正常情況下人對圖像的信息比較敏感。而對數據的反映比較遲鈍。

2) 人從圖像視覺接受到的信息比從文本或表格上接受更快、更有效。比如“百聞不如一見”。

3) 人從圖像視覺接受到的信息總是有選擇的接受

4) 人的視覺選擇的特征為形狀、顏色、亮度、運動、向量、質地等。

這些篩選仍然是通過人龐大的神經網絡中的部分神經元來處理的。其中進行的樣本的學習能里以及自適應性得到了充分的體現。

2.3 人工神經網絡和可視化方法的共同點

1) 對接受到的信息進行歸納處理。

2) 對接受到的信息進行轉化,只是轉化的方式不同。

3) 對接受到的信息進行篩選,并對接受到的信息產生合理的輸出。

4) 容錯性。

5) 從接受到的信息進行學習的能力。

2.4 人工神經網絡和可視化方法的不同點

1) 人工神經網絡是好比因特網,而可視化方法的計算網絡好比計算機網絡。可視化網絡的計算能力只是人工神經網絡很小的一部分。

2) 可視化方法雖然也是并行分布式處理的結構,但是它也只是人工神經網絡分布式處理的很小部分。其速度要遠遠低于人工神經網絡

3) 人的視覺和人工神經網絡對信息的篩選的方式各有不同。

3 算法比較

3.1 人工神經網絡

人工神經元是一個抽象的自然神經元模型,將其數據模型符號化為:

netk=x1wk1+x2wk2+ … … +xm wkm +bk

在ANN中輸入和相應權重乘機的累加為xiwki(其中,i=1, ……m),一些輸入xi,i=1, ……m,其中k是ANN中給定的神經元的索引,權重模擬了自然神經元中的生物突出強度[2]。

一個神經元就是一個微型計算機,它是一個ANN運轉的最小單位,就像是整個因特網中的一臺計算機。下例圖1是人工神經元的模型。

從這個模型可以看出人工神經元是有三個基本元素組成:

第一、一組連接線。X1 、X2 、…、Xm,每個連接線上的Wki為權重。權重在一定范圍類可能是正值,也可能是負值。

第二、累加器。將Xi與對應的權重值相乘的積累加。

第三、篩選函數。通過每個神經元經過函數篩選后輸出數值。

同樣,還可以用矢量符號來將其表示成兩個m維向量的無向乘積:

netk= X?W

其中

X={x0, x1, x3,… , xm}

W={w0, w1, w3,… , wkm}

3.2 可視化方法

可視化技術在字典中的意思為“心理圖像”,在計算機圖形學領域。可視化將自身行為聯系起來,特別是和人眼可以理解的復雜行為聯系起來。計算機可視化就是用計算機圖形和其他技術來考慮更多的樣本、變量和關系。

可視化技術其目的是清晰地、恰當地、有見解地思考,以及有著堅定信念的行動。

基于計算機的可視化技術不僅僅把計算機作為一種工具,也是一種交流媒介,可視化對開發人類認知方面提出了挑戰,也創造了機遇。挑戰是要避免觀察不出不正確的模式,以免錯誤地做出決策和行動。機遇是在設計可視化時運用關于人類認知的知識。

安得魯曲線技術把每個n維樣本繪制成一條直線。

f(t)=x1/1.41+x2sin(t)+x3cos(t)+ x4sin(2t) +x3cos(2t)+ …

其中t為時間域,函數f(t)把n維點X=(x1, x2, x3, x4, …,xn)

將f(t)進行部分變換:

f(t)= X?W

其中

X={x0, x1, x3,… , xm}

W={w0, w1, w3,… , wkm} (w0= sin(t),w1= cos (t))

這種可視化的一個好處是它可以表示很多維,缺點是要花很多的時間計算,才可以展示每個維點。這種幾何投影技術也包括探測性統計學,如主成分分析、因子分析和緯度縮放。平行坐標可視化技術和放射可視化技術也屬于這類可視化[3]。

3.3 人工神經元模型與可視化化方法中的安得魯曲線技術分析與比較

人工神經元是一個抽象的自然神經元模型,將其數據模型符號化為:

netk=x1wk1+x2wk2+ … … +xmwkm+bk

netk= X?W

安得魯曲線技術把每個n維樣本繪制成一條曲線。這種方法與數據點的傅立葉轉換相似。它用時間域T的函數f(t)來把n維點X=(x1,x2,x3,x4, …,xn)轉換為一個連續的點。這個函數常被劃分在-∏≤t≤∏區間。

f(t)=x1/1.41+x2sin(t)+x3cos(t)+ x4sin(2t) +x3cos(2t)+ …

f(t)= X?W

人工神經網絡和可視化方法部分算法比較可以近似的計算認為:

netk= f(t) =X?W

通過對人工神經網絡和可視化方法公式的整理可以得出它們有著很多的共同性和相似性[4],在容錯允許的情況下其算法為:

F(t)= X?W

其中F(t)可表示為人工神經網絡

F(t)= netk

或可視化方法

F(t)= f(t)

4 kohonen神經網絡

Kohonen神經網絡也是基于n維可視化的聚類技術,聚類是一個非常難的問題,由于在n維的樣本空間數據可以以不同的形狀和大小來表示類,n維空間上的n個樣本。

Mk=(1/n)

其中k=1,2,…,k。每個樣本就是一個類,因此∑nk=N。[5]

Kohonen神經網絡可以看作是一種非線性的數據投影這種技術和聚類中的k-平均算法有些相似。

可見,Kohonen神經網絡屬于可視化方法也屬于神經網絡算法。

5 結束語

現代世界是一個知識大爆炸的世界。我們被大量的數據所包圍著,這些數據或是整型的、或是數值型或其他類型,它們都必須經過各種方法的分析和處理,把它轉換成對我們有用的或可以輔助我們決策和理解的信息。數據挖掘是計算機行業中發展最快的領域之一,原始數據在爆炸式的增長,從原始數據中發現新知識的方法也在爆炸性地增長。人工神經網絡和可視化方法是兩種對海量數據進行數據挖掘整理的不同算法,通過以上縱向和橫向的對比,我們可以發現它們的相似性和共同點:對接受到的信息進行歸納處理、轉化、篩選、容錯性、并對接受到的信息產生合理的輸出。在應用中可以根據它們不同的屬性和能力選擇不同的算法。

參考文獻:

[1] Tang,Z H.數據挖掘原理與應用[M].北京.清華大學出版社,2007:74.

[2] Kantardzic M.數據挖掘[M].北京.清華大學出版社,2002:89.

[3] 李守巨,王吉.基于概率神經網絡的巖土邊坡穩定性預測方法[J].巖土力學,2000(2).

[4] Tam C M, Tong T K L.Diagnosis of Prestressed Concrete Pile Defects Using probabilistic Neural Networks[J].Engineering Structures,2004,26(8):1155.

篇5

[關鍵詞]模糊系統 神經網絡 模糊推理神經網絡 威脅 評估

一、引言

威脅評估就是根據戰場敵我雙方的態勢推斷敵方對我方的威脅程度,是防空指揮自動化系統的一個重要組成部分,是火力分配和戰術決策的前提,對指揮員準確地判斷敵情、正確部署、調整和使用兵力有著舉足輕重的作用。目前常用的威脅評估方法主要有:層次分析法、多屬性決策法、專家系統方法、模糊理論、神經網絡方法等。

本文將模糊理論和神經網絡融合,取長補短,提出了基于模糊推理網絡的目標威脅評估方法。該方法利用神經網絡來實現模糊邏輯推理,使神經網絡沒有明確物理含義的權值被賦予了模糊邏輯中推理參數的含義,并且系統具有自學習能力。實驗表明,新方法保留了模糊理論和神經網絡各自的優勢,較好地解決了各自存在的問題,能有效地評估目標的威脅程度。

二、影響目標威脅程度的因素

在防空作戰中,往往需要用多個因素刻畫空襲目標的本質與特征。對地空導彈武器系統而言,影響目標威脅程度的主要因素有:

(1)目標的航路捷徑P。指對武器部署點或保衛要地的航路捷徑。

(2)目標類型C??找u兵器的類型不同,其飛行速度和攻擊能力也不同,對要地或地域的威脅程度也不同。

(3)機動特性M。主要考慮高度上的機動。當發現目標機動,說明其攻擊意圖明確,威脅程度大。

(4)到達發射區近界的時間T。

(5)電子干擾E。

三、模糊推理神經網絡

一個多輸入多輸出的模糊推理網絡系統(FNNS),它由五層組成,可直接完成模糊化、模糊推理、模糊運算、去模糊化等操作。

1.網絡結構

FNNS各層的內部結構如下:

2.學習算法

FNNS的自組織學習過程和監督學習過程如下:

四、實驗與分析

在一次保衛要地的防空作戰中,某地空導彈營的探測雷達發現空中有4批敵對目標對我保衛要地構成了威脅。已識別出4批目標的類型C分別為戰術彈道導彈、巡航導彈、殲擊轟炸機、武裝直升機,且已測得各批目標當前時刻的航路捷徑P、到達發射區近界的時間T、電子干擾能力E(已歸一化)。各個目標的數據如表1所示。

表1 4批目標的數據

根據上述數據,分別構建一個含4個輸入節點、1個輸出節點的神經網絡(3層BP網)和模糊推理網絡(5層),并進行訓練。將得到目標威脅程度W的評估結果如下:

(1)模糊推理網絡:W3=0.92 > W1=0.63 > W2=0.59 > W4=0.57。即,目標3的威脅程度是最大的,目標4的威脅程度是最小的。

(2)神經網絡:W3=0.89 > W1=0.64 > W2=0.59 > W4=0.58。

可見,評估結果與模糊推理網絡的相同,只是具體數據有所差異。

五、結論

本文將模糊理論與神經網絡相結合,使用模糊推理神經網絡評估目標的威脅程度。該方法利用神經網絡來實現模糊邏輯推理,使神經網絡沒有明確物理含義的權值被賦予了模糊邏輯中推理參數的含義,使得規則容易抽取出來,并且系統具有自學習能力。仿真結果表明新方法能有效地評估目標的威脅程度。

參考文獻:

[1]王衛平,田志學,陳選社.威脅判斷的層次――效用模型在防空雷達中的運用[J].現代雷達, 2005, 27(2): 8-14.

[2]曲長文,何友,馬強.應用多屬性決策的威脅評估方法[J].系統工程與電子技術, 2000, 22(5): 26-29.

[3]劉玉全,李為民,王君.基于排列法的目標威脅評估模型[J].現代防御技術, 2004, 32(1): 20-23.

[4]余舟毅,陳宗基,周銳.基于貝葉斯網絡的威脅等級評估算法研究[J].系統仿真學報, 2005, 17(3): 555-558.

[5]鄧文運,尼喜.地面防空威脅估計模糊優化計算方法及使用[J].現代防御技術, 2001, 29(4): 9-11.

[6]潘紅華,王建明,朱森等.目標威脅判斷的模糊模式識別模型[J].兵工學報, 2004, 25(5): 576-580.

[7]王向華,覃征,劉宇等.徑向基神經網絡解決威脅排序問題[J].系統仿真學報, 2004, 16(7): 1576-1579.

[8]黎洪生,卓禎雨. ANFIS模糊神經推理機在故障診斷中的應用[J].控制工程, 2003, 10(2): 153-155.

篇6

關鍵詞:自組織特征映射神經網絡;概率神經網絡;巖性識別;預測

中圖分類號:TP183

0 引 言

巖性識別是儲層評價的重要工作之一,是求解儲層參數的基礎。測井在勘探中的作用和地位正在日益提高,測井參數值是地下巖石的礦物成分、結構和孔隙度等的綜合反映,是巖性分析的基礎資料。對于一組特定的測井參數值,它就必然對應著地層中的某一種或某幾種巖性。在分析巖心和測井參數對應特征的基礎上,劃分巖心的巖石類型,并從各類巖石中讀取能夠代表巖樣的測井參數值,確定巖性與測井參數對應關系。

由于井下地質構造的復雜性和測井參數分布的模糊性,傳統的數理統計等方法難以準確地反映測井資料與地層巖性的非線性映射關系,識別精度有限,采用具有聚類功能的人工神經網絡――自組織特征映射網絡(SOM)和概率神經網絡(PNN)完成測井資料的巖性識別。采用神經網絡對測井數據進行巖性識別,具有較強的自組織和自適應性,有較高的容錯能力。

1 概率神經網絡(PNN)

概率神經網絡(Probabilistic Neural Network,PNN)是基于貝葉斯最小風險準則和Parzen窗的概率密度函數方法發展而來的一種并行算法,是徑向基函數模型的發展[3]。它直接考慮樣本空間的概率特性,以樣本空間的典型樣本作為隱含層的節點,其網絡權值是模式樣本的分布。

概率神經網絡由四個結構層組成:輸入層、樣本層、累加層和輸出層。輸入層的節點數是樣本向量的維數,將所有樣本不變地傳給樣本層后,樣本層將輸入向量的各個分向量進行加權求和,然后再用一個非線性算子進行運算,非線性算子取高斯函數:

式中:[WTHX]X為輸入向量;W[WTBX]為權值向量;1/R2為平滑因子。オ

然后將計算結果傳遞到累加層[5],累加層各個節點只與相應類別的樣本節點相連,計算同類樣本輸出值的和,權值都為1。網絡的輸出層,即競爭層采用勝者為王的學習規則,使具有最大概率的向量的輸出為1,其他類別的向量輸出為0。這樣網絡就按Bayes決策[6]將輸入的向量分配到具有最大后驗概率的類別中去。

2 自組織特征映射神經網絡(SOM)

自組織特征映射網絡(Self[CD*2]Organizing feature Map,SOM),接受外界輸入模式時,將會分為不同的對應區域,各區域對輸入模式具有不同的響應特征。自組織映射學習算法包含:競爭、合作和更新三個過程[7]。

(1) 在競爭過程中,確定輸出最大的神經元為獲勝神經元。由于神經元的激勵函數為線性函數,神經元的最大輸出取決于其輸入ui=∑Nj=1wijxj,即輸入向量[WTHX]X[WTBX]=[x1,x2,…xN]T和權值向量[WTHX]W[WTBX]i=[wi1,wi2,…wiN]T,i=1,2,…,M的內積。而該內積在輸入向量和權值向量均為歸一化向量時,等價于輸入向量和權值向量的歐氏距離最小。所謂歐氏距離就是n維歐氏空間中向量[WTHX]Y[WTBX]=[y1,y2,…,yN]和向量[WTHX]Z[WTBX]=[z1,z2,…,zN]的距離,其值為∑ni=1(yi-zi)2。所以當輸入向量為[WTHX]X[WTBX]且第c個神經元獲勝,滿足條件:[WTHX]X[WTBX]-[WTHX]W[WTBX]c=┆min[WTHX]X[WTBX]-[WTHX]W[WTBX]i(i=1,2,…,M) 。И

(2) 在合作過程中,確定獲勝神經元的加強中心。拓撲鄰域的中心就是在競爭過程中得到的獲勝神經元,在鄰域范圍內的神經元為興奮神經元,即加強中心。

(3) 在更新過程中,采用Hebb學習規則[8]的改變形式,對網絡上獲勝神經元拓撲鄰域內的神經元進行權值向量的更新。

自組織特征映射神經網絡是一種競爭式學習網絡,共有兩層,輸入層各神經元通過權向量將外界信息匯集到輸出層的各神經元。采用Kohonen算法,獲勝神經元對其鄰近神經元的影響是由近及遠,由興奮逐漸轉變為抑制,其學習算法中不僅獲勝神經元本身要調整權向量,它周圍的神經元在其影響下也要程度不同地調整權向量,調整力度依鄰域內各神經元距獲勝神經元的遠近而逐漸衰減。最后使輸出層各神經元成為對特定模式類敏感的神經細胞,對應的內星權向量成為各輸入模式類的中心向量。并且當兩個模式類的特征接近時,代表這兩類的神經元在位置上也接近,從而在輸出層形成能夠反映樣本模式類分布情況的有序特征圖[9]。

3 基于神經網絡的巖性識別

通過對已知井段測井數據進行學習,來預測同一地區其他井段的巖性。

3.1 巖性樣本

為了探討神經網絡在巖性識別中的具體應用,選擇一批測井巖性數據用于巖性識別建模工作。選擇某地區的資料進行研究,該地區屬于碳酸鹽地層,選取的樣本巖性有3種,即泥巖、砂巖和石灰巖。影響巖性的重要因子有5個,補償中子空隙度CNL、補償密度曲線DEN、聲波時差DTC、自然伽瑪GR和微電阻率RT。通過對歷史資料的分析,獲得了6組樣本數據。

在各種測井工作中,由于不同的測井響應具有各自的測量量綱,數值大小不一,差異較大,無法直接進行定量比較,因而必須對測井數據進行處理,對其歸一化,將非地質因素校正到同一水平上。在歸一化處理后的測井響應值是沒有量綱的,而且其數值在[0,1]范圍內變化,消除了不同測井響應在量綱和數量級上的差異。原始數據歸一化后的結果數據列出如表1所示。

3.2 PNN網絡巖性識別仿真

建立PNN網絡,其輸入層有5個神經元,分別對應5個影響因子,選取的樣本有三種不同的巖性,利用二進制格式描述這三種巖性,作為目標向量。利用下面函數創建PNN網絡用于巖性識別。

net=newpnn([WTHX]P[WTBZ],[WTHX]T[WTBZ],SPREAD);其中:[WTHX]P[WTBZ]為輸入向量;[WTHX]T[WTBZ]為目標向量;SPREAD為分布密度。

運用建立的模型對學習樣本仿真,輸出結果如表1最后一列所示。

由表1的仿真結果可知,網絡成功地將巖性樣本分為三類,這與實際情況一致,并且可知第1類為泥巖,┑2類為砂巖,第3類為石灰巖。接下來用一組測試樣本,檢驗模型的未知巖性的識別能力。測試樣本數據如表2所示。

運用建立的模型對上表的巖性影響因子測試樣本進行仿真,輸出結果如表2最后一列所示。仿真結果顯示該組測試樣本屬于第3類,即為石灰巖,與期望輸出一致??梢?PNN網絡能夠正確識別未知巖性樣本。

3.3 SOM網絡巖性識別仿真

SOM神經元數的選取與樣本有多少模式有關。如果神經元數較少,對輸入樣本類別進行“粗分”,如果神經元數較多,可將輸入樣本類別“細化”。

選取競爭層神經元為2×3的組織結構,通過距離函數linkdist來計算距離,利用下面函數創建SOM網絡,用于巖性類別的“粗分”。

由于網絡的初始權值相同,權向量是重合的。利用表1的學習樣本對網絡訓練,訓練步數的大小影響網絡的聚類功能。不斷調整訓練步數,訓練100次后,神經元就可以自組織分布。網絡訓練結束后權值也就固定了,以后每輸入一組新的樣本,競爭層的神經元開始競爭,激活與之最為接近的神經元,從而實現巖性自動識別。運用建立的SOM網絡對學習樣本和測試樣本進行仿真,聚類結果如表3所示。樣本序號類別激發神經元索引

聚類結果表明學習樣本分為三類,序號為1,2的樣本為第1類,激活第5個神經元;序號為3,5的樣本為第2類,激活第4個神經元;序號為4,6的樣本為┑3類,激活第1個神經元。而測試樣本激活第1個神經元,屬于第3類,由學習樣本可知,為石灰巖。可見,SOM網絡能夠準確地劃分巖性類別。

將上述巖性樣本類別“細化”,或者增加更多不同類型的巖性樣本,那么應該增加競爭層神經元的數量。選取競爭層神經元為3×4的組織結構,創建SOM網絡,隨著神經元個數的增加,增加訓練次數,當訓練1 000次時,神經元就可以自組織分布。運用建立的SOM網絡對學習樣本和測試樣本進行仿真,聚類結果如表4所示。[JP]

參照樣本實際分布曲線,分析聚類結果,當競爭層的神經元數目較多時,幾乎每一個樣本都被劃分為┮煥唷*從圖1可以看出,序號1和2樣本、序號3和5樣本分別在高維空間相近,而聚類后激活的相應神經元的位置也接近,序號4和6樣本相仿程度更高,聚類后激發了同一個神經元1,這和實際情況是吻合的。測試樣[LL]本與序號4和6樣本極為接近,聚類后激發了同一個神經元,即網絡的第1個神經元,所以樣本屬于第4類。增加競爭層神經元的數量,可以使巖性類別劃分更加詳細,巖性識別準確。

4 結 語

采用概率神經網絡和自組織特征映射神經網絡對巖性進行自動識別是準確的。PNN網絡不需要訓練,具有結構簡單、追加樣本容易的特點,是一種具有較強容錯能力和機構自適應調整的網絡,但需要預設目標向量。SOM網絡具有效率高,無需監督,能自動對輸入模式進行聚類的優勢,但輸出層的神經元數目多,網絡規模較大。仿真結果表明這兩種網絡用于巖性分類和識別是準確和可靠的,對用于油層、煤層及其勘探等領域,具有重要的參考價值。

參 考 文 獻

[1]于代國,孫建孟,王煥增,等.測井識別巖性新方法[CD2]支持向量機方法\[J\].大慶石油地質與開發,2005,24(2):93[CD*2]95.

[2]Gao T H,Cao J Y,Zhang M L,Qi J B.Lithology Recognition during Oil Well Drilling Based on Fuzzy[CD*2]adaptive Hamming Network [A].Proceedings of the Sixth International Conference on Intelligent Systems Design and Applications[C].2006:574[CD*2]578.

[3]Specht D F.Probabilistic Neural Network and General Regression Neural Network [M].McGraw-Hill,1996.

[4]Tao Song,Mo Jamshidi,Roland R Lee,et al.A Novel Weighted Probabilistic Neural Network for MR Image Segmentation[A].IEEE International Conference on System,Man and Cybernetics\[C\].2005,3:2 501[CD*2]2 506.

[5]Han J,Kanmber M.Data Mining:Concepts and Techniques[M].San Francisco:Academic Press,2001.

[6]Chuhee Lee,Euisun Choi.Bayes Error Evaluation of the Gaussian ML Classifier[J].IEEE Trans.on Geoscience and Remote Sensing,2000,38 (3):1 471[CD*2]1 475.

[7]楊建剛.人工神經網絡實用教程[M].杭州:浙江大學出版社,2001.

[JP2][8]Parag C,Pendharkar A.Data Envelopment Analysis[CD*2]based Approach for Data Preprocessing[J].IEEE Trans.on Knowledge and Data Engineering,2005,17(10):1 379[CD*2]1 388.[JP]

[9]韓力群.人工神經網絡教程[M].北京:北京郵電大學出版社,2006.

篇7

WANG E (School of Traffic and Transportation, Lanzhou Jiaotong University, Lanzhou 730070, China)

摘 要:文章借鑒物流聯盟風險評價問題已有成果,總結了影響物流聯盟風險的主要因素,并在此基礎上建立了兩級4種類型的物流聯盟風險評估指標體系,該指標體系包括市場風險、合作關系風險、能力風險、信息與管理風險4個方面共11個評價指標。建立了基于BP神經網絡分析法對物流聯盟合作伙伴選擇模型,利用MATLAB進行了樣本訓練和實例分析,結果顯示利潤分配、信息共享、信任程度是影響物流聯盟風險最重要的二級指標。

關鍵詞:物流聯盟;風險評價;BP神經網絡;物流聯盟風險

中圖分類號:F272 文獻標識碼:A

Abstract: This paper questioned the risk of assessment results for logistics alliance, summarized the main factors which influencing the risk of logistics alliance, and based on the two levels of four types of logistics alliance risk assessment index system, the index systems including four aspects such as market risk, cooperation risk, ability risk, information and management risk, these risks contained eleven evaluation indexes. We build a logistics alliance partner selection model which is based on the BP neural network analysis method, and sample training and case analysis, are studied by using the MATLAB software and results show that the degree of profit distribution, information sharing, trust are the most important secondary indexes affecting logistics alliance risk.

Key words: logistics alliance; risk assessment; the BP neural network; logistics alliance risk

0 引 言

隨著經濟的發展,物流業已經成為我國眾多發展迅猛的行業之一。由于市場競爭程度的加劇,單個物流企業已無法應對市場中的各種風險,建立物流聯盟成為物流企業調整戰略格局的重要措施。我國的一些大中型物流企業不斷卷起聯盟的狂潮,目的是使企業獲得較新的技術設備及能力資源、降低企業成本、提高企業核心競爭力、增加企業收入水平。理論上,如果物流聯盟能夠有效執行,其發展前景是不可估量的,但是也存在一些風險。本文研究目的是為物流聯盟的構建以及風險因素的評估進行理論分析,并且借鑒這些因素對物流聯盟的風險程度做出相應的定量分析和評價,以增加物流聯盟的長期性、提高物流聯盟的穩定性,使得雙方或者多方企業通過物流聯盟的方式降低物流成本,獲得最大收益。

Ashino和Rangan[1]提出兩個或者多個物流企業組成的聯盟必須能夠擁有共同的目標,在建立聯盟時共同分享獲得的利潤,并且將這些資源運用到聯盟企業的運營當中去,只有這樣聯盟才能持久且穩定,否則存在諸多聯盟風險;Shapiro[2]將聯盟風險中的信任風險分為4種:基于達成共識的信任風險、基于認知能力的信任風險、基于威懾的信任風險以及敏捷信任風險;Ming-Chih Tsai[3]等人分析了政治風險對物流企業發展的作用,指出微觀企業因素和宏觀政治因素所引起的風險不容忽略;Hallikas[4]提出了如何在網絡環境中處理物流聯盟風險的方法,介紹了風險管理的過程;鄭紹鐮[5]計算了層次分析法評估指標的權重,優化了聯盟利益分配的機制;馮蔚東[6]利用模糊綜合分析法(Fuzzy-AHP)建立了一種基于風險與投資比例的求解辦法,通過實際的計算證明了其有效性和正確性;徐志祿[7]J為聯盟合作伙伴的適合性、匹配性、資產專用性、競爭和合作的平衡、企業成員之間相互信任等因素會直接影響到物流聯盟穩定性;劉明菲[8]依據物流市場運營風險的內涵,對市場運營風險進行分類識別,分析了各類風險可能產生的后果,并提出風險管理對策;袁旭和孫希剛[9]結合時間價值理論和層次分析法建立了一個虛擬物流企業受益混合模型;DASTK和TENGBS[10]等人針對物流聯盟提出了基于風險理論,認為影響物流聯盟的風險有績效和關系兩大類。

國外學者起初研究供應商選擇方法,后來研究合作伙伴選擇條件,但都未深入進行物流聯盟合作伙伴的研究。國內對物流聯盟研究起步較遲,且缺少實踐經驗,只描述概念方法和模型介紹,并未證明模型的適用性。本文根據物流聯盟風險的分類,結合BP神經網絡分析法對物流聯盟的風險進行綜合評價,并且運用MATLAB對物流聯盟的風險評價結果進行驗證。

1 物流聯盟風險分類

根據風險的劃分方式不同,物流聯盟風險的種類也不盡相同。唐萌春[10]認為物流聯盟中存在兩類風險:內部風險和外部風險。聯盟外部風險主要包括市場風險、金融環境風險以及自然環境風險等;聯盟內部風險主要有合作關系風險、能力風險和信息與管理風險等。物流聯盟風險的分類示意圖如圖1所示:

物流聯盟內部風險占主導因素,物流聯盟的外部風險也起一定作用,一般是由外部環境的不確定性和不穩定性導致的。本文主要分析以下4種風險(1種聯盟外部風險和3種聯盟內部風險):

(1)市場風險

市場風險主要是指在一些市場中由于市場價格、利率等的不穩定從而使得市場遭受無法預料的隱含損失風險,包含物品風險、利率風險、權益風險以及匯率風險等,其中利率風險是主要風險。

(2)合作關系風險

合作關系風險是指由于聯盟的企業之間的某種交易行為從而造成聯盟關系的不穩定性。一般來說,影響物流聯盟的合作關系有很多因素,例如:企業文化、價值觀念、激勵機制、道德風險、信任程度以及戰略目標。第一,信任是合作的首要保證,當然也是物流聯盟合作的基礎。如果企業聯盟之間互不相信,那么企業聯盟也將無法進行下去。第二,物流聯盟的有效保障是適當地激勵和合理公平的利益分配,如果信息不對稱,那么物流聯盟將可能會出現停滯現象,同樣,利潤分配不公平、激勵不合理、聯盟成員的機會主義等都有可能造成物流聯盟的失敗。第三,企業和成員的價值觀念以及行為方式的不同,還有企業文化的沖突等都會對聯盟的關系產生威脅,甚至破裂。

(3)能力風險

能力風險主要是指由于聯盟組織的實踐經驗、知識積累以及協調管理等能力的缺乏引起的。同樣,物流服務成本、物流技術、物流服務質量以及物流響應時間等方面因素都可能會對物流聯盟組織的穩定性造成一定的影響。物流聯盟的基礎是對客戶提供優質的服務,當物流聯盟企業各方面的能力有限、技術上沒有辦法滿足客戶要求或服務質量低下時,都有可能使得物流聯盟的關系解體。

(4)信息與管理風險

信息與管理風險主要是指信息的傳遞、核心能力的集成、信息資源的集成和物流聯盟的組織與管理等方面的風險。物流與信息流密切相關,信息共享和信息高效、準確的傳遞是有效物流聯盟建立的最基本要求,然而由于每個物流聯盟企業互不相同的信息系統、通信協議以及數據庫標準,往往使得企業之間物流信息的傳遞出現延遲,或者集成時出現銜接困難,因而造成物流聯盟效率低下、運行資料缺少,增加物流聯盟的運行風險。

2 BP神經網絡模型建立

設輸入變量為X=x■,x■,…,x■;隱含層輸出向量為y■=y■,y■,…,y■;輸出層輸出向量為h■=h■,h■,…,h■;期望輸出向量為d■=d■,d■,…,d■。輸入層和隱含層間的連接權值為W■,隱含層與輸出層間的連接權值為W■;隱含癰魃窬元的閥值為

z■,輸出層各神經元的閥值為z■;樣本數據個數為K,K=1,2,…,m,輸出層的誤差函數為:

E=■■d■k-y■k■ (1)

隱含層與輸入層之間的連接修正權值為:

ΔW■k=-u■=δ■kX■k (2)

W■=W■■+ηδ■kX■k (3)

則全局誤差為:

E=■■■d■k-y■k■ (4)

接下來看誤差是不是適合特定的條件,如果網絡誤差降到了一定的程度或者最初的最大次數小于訓練次數時,就可以讓訓練停止。

MATLAB軟件中Nntool工具箱對BP神經網絡訓練過程:

(1)創建網絡;

(2)輸入訓練樣本;

(3)計輸出值和誤差值;

(4)修正各層權值和閾值;

(5)誤差滿足條件,訓練結束(如果誤差不滿足終止條件則繼續第三步,直到誤差達到所設置的誤差為止)。

3 基于BP神經網絡分析的風險評估實例分析

文章結合以下實例運用BP神經網絡方法對物流聯盟風險進行評估:例如某企業在組建物流聯盟之前邀請5位專家對聯盟伙伴的匹配性和合作者風險進行評估,這兩種風險發生的概率和該風險對物流聯盟所產生的影響度分別用p■和f■來表示。評語集合U=極高,高,中等,低,極低。邀請5位專家對風險因素X■進行評估,第j個專家的重要程度為W■,評價結果如表1所示:

風險影響程度數值表示,如表2所示:

第i種風險因素的風險度為:

X■=1-1-■w■f■1-■w■p■ (5)

其中:n表示專家個數(這里n=5),代入相應的數值計算可得:

X■=1-1-0.2×0.8+0.2×0.8+0.3×0.6+0.1×0+0.2×0.61-0.2×0.4+0.2×0.6+0.3×0.5+0.1×0.85+0.2×0.65=0.835

同理可得:X■=0.865,X■=0.888,X■=0.963,X■=0.800,X■=0.953,X■=0.779,X■=0.769,X■=0.774,X■=0.941,X■

=0.933。

具體數據如表3所示:

從以上的數據我們可以看出,在這11種風險當中,信任程度的風險度是最高的,其值為0.963,其次是利潤分配和信息共享,風險度的值分別為0.953和0.941。在一定的條件下,技術能力和文化沖突等對聯盟風險的風險度就比較小。風險等級的區間表示:區間0,0.2表示低風險,區間0.2,0.4表示較低風險,區間0.4,0.6表示中等風險,區間0.6,0.8表示較高風險,區間0.8,1表示高風險。由于等級區間表示范圍在0,1之間,故隱含層采用Logsig函數(隱含層節點數為4),輸出層采用Purelin轉換函數(輸出層的節點數為1),建立BP神經網絡,對網絡進行訓練。假設輸入層節點數為10,以專家評價法求出的11種風險因素的風險度作為BP神經網絡的期望輸出值。5位專家打分的風險發生的概率和重要度作為樣本的輸入,輸出7組數據作為訓練樣本,再用4組數據作為預測輸出值,輸出值的大小用以上的5個等級來反映風險的大小。

首先是創建神經網絡,然后對網絡環境初始化,主要是閾值和權值的設定(包括連接權重、隱含層、輸出層閾值等),最后輸入樣本訓練值對網絡進行訓練。當訓練到第100步時,訓練誤差的藍線達到期望水平并保持穩定,即BP神經網絡收斂,訓練結束。如圖2所示:

經過訓練,得到樣本輸出結果為:0.92315,0.92071,0.93959,0.79772,0.80573,0.79717,0.91989;訓練輸出結果為:0.82125,0.85374,0.92061,0.89466。

結果分析:從以上的訓練結果可以得到該物流聯盟的風險范圍,因而能夠判斷物流聯盟風險的高低。從輸出結果可以看出,在誤差允許范圍內,第10種風險是信息共享風險,專家評價計算得出的風險度(期望輸出值)為0.941,風險等級為極高;而網絡訓練結果為0.92061,風險等級也為極高。由此說明BP神經網絡的分析結果和期望結果基本一致,證明了本文所建立的BP神經網絡的可靠性。

4 結 論

對物流鷴粵盟風險進行評估,不僅可以有效地規避物流聯盟在建立過程中的風險,而且可以讓聯盟企業有針對性地選擇對應措施。如果在物流聯盟組建之前對其風險進行評估,就可以未雨綢繆,采取有效措施將風險降低。BP神經網絡能夠兼顧多種影響因素,利用人工智能學習的方法達到解決問題的實時性、敏捷性等特點。文章分析了物流聯盟風險產生的原因和風險特點,結合BP神經網絡分析法對風險指標進行評估,并且對聯盟的風險評估方法進行選擇,最后使用MATLAB軟件中的Nntool工具箱對實例進行分析,驗證了文章提出方法的合理性和適用性。但是,該方法的使用有其不足之處:在使用BP神經網絡進行訓練所需的大量樣本不易獲得。

參考文獻:

[1] Charles W. L. Hill, Gareth R. Jones. Strategic management[M]. Houghton Mifflin Co, 1995:32-37.

[2] Shapiro D. L. International Trust: A Comparison of Attitudinal and Situational Factors[J]. Human Relations, 1980,33(11):113-132.

[3] Ming-Chih Tsai, Ying-So Su. Political risk assessment on air logistics hub developments in Taiwan[J]. Journal of Air Transport Management, 2002,11(6):373-380.

[4] Jukka Hallikas, Iris Karvonen, Urho Pulkkinen, et al. Risk management processes in supplier networks[J]. International Journal of Production Economics, 2004,6(8):47-58.

[5] 鄭紹濂,等. 分層次與相對績效評價機制及其效率研究[J]. 管理科學學報,1998(1):27-29.

[6] 馮蔚東. 虛擬企業中的風險分析與監控[J]. 中國管理科學,2001(10):24-31.

[7] 徐志祿. 第三方物流企業戰略聯盟的穩定性研究[D]. 廣州:暨南大學(碩士學位論文),2007.

[8] 劉明菲,羅顯敏. 物流園區市場運營風險管理[J]. 武漢理工大學學報,2006(3):389-399.

[9] 袁旭,孫希剛. 基于貢獻的虛擬物流企業收益分配[J]. 桂林電子工業學院學報,2004(3):72-74.

[10] DASTK, TENGBS. Resource and management in strategic alliance making process[J]. Journal of Management, 1998(24):21-54.

篇8

論文關鍵詞:微鈣化點良惡性分類,腫瘤模式識別,學習矢量量化神經網絡,敏感度,特異度

1 引言

隨著早期檢測的重視,近年來乳腺癌的死亡率有降低的趨勢,但僅是在歐美國家,比如美國癌癥協會ACS建議40-50歲之間的婦女每隔一年就做一次X光片的早期檢查,而對50歲以上的則要求一年一次[1]。在過去的十年里中國的乳腺癌診斷病例以每年3%的比例在增長,這個比例已高于西方國家[2],并且呈年輕化的趨勢,這可能歸結于環境的變化、飲食結構等改變。

本文的主要工作是提出將微鈣化簇分類為良性或惡性的分類算法。分類算法包括4個步驟:(1)從DDSM數據庫中獲取研究對象,并修改圖像格式和尺寸;(2)從數據庫相關說明文件中提取病灶區域;(3)提取有效的特征向量;(4)對CC和MLO兩種視圖的圖像使用LVQ神經網絡分別訓練和測試獲得最佳的分類率;(5)使用邏輯或操作計算最后的分類結果,即如果認為任何一個視圖下的圖像是惡性的,那該病人的病灶性質就是惡性的。

2 圖像預處理及特征提取

2.1 圖像數據庫和預處理

篇9

關鍵詞:壓鑄機;RBFNN;故障診斷;模糊K均值聚類算法

中圖分類號:TP212文獻標識碼:A

文章編號:1004-373X(2009)12-179-04

Method of Control System Sensor Fault Dignosis Based on RBF Neural Network

PENG Jishen,DONG Jing

(Faculty of Electrical and Engineering Control,Liaoning Technical University,Huludao,125105,China)

Abstract:For the problems of related sensor common fault in the die casting machine real-time detection and control system,through the study of artificial neural network′s theory and methods,sensor fault diagnosis observer model of control system based on a radial basis function neural network control system RBFNN is established.The model is trained by the measured parameters of die-casting machine,adopting fuzzy K means clustering algorithm to select clustering centre,using the observer to forecast the residuals between the sensor output value and the sensor actual output value to diagnose sensor fault.The simulated results show that RBFNN observer has strong capacity of non-linear process and arbitrary function approximation,and has many advantages such as high-precision,learning time short,rapid network computing and stable performance to meet the requirements of sensor fault diagnosis.

Keywords:die casting machine;RBFNN;fault dignosis;fuzzy K means clustering algorithm

0 引 言

傳感器是現行研究的壓鑄機實時檢測與控制系統[1]的關鍵部件,系統利用傳感器對壓鑄機的各重要電控參數(如:合型力、油壓、壓射速度、模具溫度等)進行檢測,并進行準確控制。這一過程中,各傳感器輸出信號的質量尤為重要,其優劣程度直接影響壓鑄機控制系統分析、處理數據的準確性,最終影響壓鑄件產品質量的優劣。由于大型壓鑄機生產環境較為惡劣,長期的高溫、高壓、高粉塵及來自周邊器械的電磁干擾等因素的存在,不可避免地會造成傳感器軟硬故障的發生,有故障的傳感器所發出的錯誤信號,會使整個壓鑄機控制系統分析、處理和控制功能紊亂,造成系統無法正常運行,帶來無法估計的生產安全隱患及嚴重的后果。因此,對壓鑄機控制系統中傳感器故障診斷方法的研究具有重要的意義。

人工神經網絡[2](神經網絡)是傳感器故障診斷的方法之一。神經網絡是有大量人工神經元相互連接而構成的網絡。它以分布的方式存儲信息,利用網絡拓撲結構和權值分布實現非線性的映射,并利用全局并行處理實現從輸入空間到輸出空間的非線性信息變換。對于特定問題適當建立神經網絡診斷系統,可以從其輸入數據(代表故障癥狀)直接推出輸出數據(代表故障原因),從而實現非線性信息變換。層狀結構的神經網絡輸入層、輸出層及介于二者之間的隱含層構成。依據用于輸入層到輸出層之間計算的傳遞函數不同,提出一種基于徑向基函數RBF神經網絡的傳感器故障診斷策略[3-5]。

1 RBF神經網絡的模型

徑向基函數神經網絡[6,7](RBFNN)是一種新型神經網絡,屬于多層前饋網絡,即前后相連的兩層之間神經元相互連接,在各神經元之間沒有反饋。RBFNN的三層結構與傳統的BP網絡結構相同,由輸入層、隱含層和輸出層構成,其結構見圖1。其中,用隱含層和輸出層的節點計算的功能節點稱計算單元。

圖1 RBF神經網絡結構圖

RBF神經網絡輸入層、隱含層、輸出層的節點數分別為n,m,p;設輸入層的輸入為X=(x1,x2,…,xj,…,xn),實際輸出為Y=(y1,y2,…,yk,…,yp)。輸入層節點不對輸入向量做任何操作,直接傳遞到隱含層,實現從XFi(x)的非線性映射。隱含層節點由非負非線性高斯徑向基函數構成,如式(1)所示。

Fi(x)=exp(-x-ci/2σ2i), i=1,2,…,m(1)

式中:Fi(x)為第i個隱含層節點的輸出;x為n維輸入向量;ci為第i個基函數的中心,與x具有相同維數的向量;σi為第i個感知的變量,它決定了該基函數圍繞中心點的寬度;m為感知單元的個數(隱含層節點數)。x-ci為向量x-ci的范數,通常表示x與ci之間的距離;Fi(x)在ci處有一個惟一的最大值,隨著x-ci的增大,Fi(x)迅速衰減到零。對于給定的輸入,只有一小部分靠近x的中心被激活。隱含層到輸出層采用從Fi(x)yk的線性映射,輸出層第k個神經元網絡輸出見式(2):

k=∑mi=1ωikFi(x), k=1,2,…,p(2)

式中:k為輸出層第k個神經元的輸出;m為隱層節點數;p為輸出層節點數;ωik為隱層第i個神經元與輸出層第k個神經元的連接權值。

RBF網絡的權值算法是單層進行的。它的工作原理采用聚類功能,由訓練得到輸入數據的聚類中心,通過σ值調節基函數的靈敏度,也就是 RBF曲線的寬度。雖然網絡結構看上去是全連接的,實際工作時網絡是局部工作的,即對輸入的一組數據,網絡只有一個神經元被激活,其他神經元被激活的程度可忽略。所以 RBF網絡是一個局部逼近網絡,這使得它的訓練速度要比 BP網絡快 2~3 個數量級。當確定了RBF網絡的聚類中心ci、權值ωik以后,就可求出給定某一輸入時,網絡對應的輸出值。

2 算法學習

在此采用模糊K均值聚類算法[8]來確定各基函數的中心及相應的方差,而網絡權值的確用局部梯度下降法來修正,算法如下:

2.1 利用模糊K均值聚類算法確定基函數中心ci

(1) 隨即選擇h個樣本作為ci(i=1,2,…,h)的初值,其他樣本與中心ci歐氏距離遠近歸入沒一類,從而形成h個子類ai(i=1,2,…,h);

(2) 重新計算各子類中心ci的值,ci=1si∑sik=1xk。其中,xk∈ai;si為子集ai的樣本數,同時計算每個樣本屬于每個中心的隸屬度為:

uij=min∑sij=1xj-cixk-ci, xj,xk∈ai(3)

U={uij∈[0,1]|i=1,2,…,h;j=1,2,…,s}

(3) 確定ci是否在容許的誤差范圍內,若是則結束,不是則根據樣本的隸屬度調整子類個數,轉到(2)繼續。

2.2 確定基函數的寬度(誤差σ)

σ2=(∑sj=1uijxj-ci)∑sj=1uij(4)

式中:ai是以ci為中心的樣本子集。

基函數中心和寬度參數確定后,隱含層執行的是一種固定不變的非線性變換,第i個隱節點輸出定義為:

Fi(x)=exp(-x-ci2/2σ2i)∑mi=1exp(-x-ci2/2σ2i)(5)

2.3 調節隱層單元到輸出單元間的連接權

網絡的目標函數為:

E=12N∑NK=1[y(xk)-(xk)]2(6)

也就是總的誤差函數。式中:y(xk)是相對于輸入xk的實際輸出;(xk)是相對于xk的期望輸出;N為訓練樣本集中的總樣本數。對于RBFNN,參數的確定應能是網絡在最小二乘意義下逼近所對應的映射關系,也就是使E達到最小。因此,這里利用梯度下降法修正網絡隱含層到輸出層的權值ω,使目標函數達到最小。

Δωi=-ηE(xk)•(xk)鄲i(7)

式中:η為學習率,取值為0~1之間的小數。根據上面式(6),式(7)最終可以確定權值ω的每步調整量:

Δωi=-ηN∑[y(xk)-(xk)]bi(xk)(8)

權值ω的修正公式為:

ωiωi+Δωi,i=1,2,…,m(9)

利用上述學習方法得到ci=8.1,σ=0.01。

3 控制系統傳感器故障診斷與仿真研究

3.1 觀測器模型與故障診斷

壓鑄機檢測與控制系統中傳感器主要檢測的參數有合型力、油壓、模具溫度、壓射速度,各參數隨時間變化輸入與輸出之間存在明顯的非線性關系。RBF神經網絡模型具有較強的非線性處理和任意函數逼近的能力。圖2為基于RBF神經網絡的傳感器故障診斷原理。

圖2 基于RBFNN的傳感器故障診斷原理圖

圖2中虛線框所示部分即為RBFNN觀測器原理。基本思想:通過正常情況下非線性系統的實際輸入和傳感器的輸出學習系統的特性,用已經訓練好的觀測器的輸出于實際系統的輸出做比較,將兩者之差做殘差,再對殘差進行分析、處理,得到故障信息,并利用殘差信號對傳感器故障原因進行診斷[9]。

非線性系統:

y(k)=f[u(k-d),y(k-1)](10)

u(k-d)=[u(k-d),u(k-d-1),…,u(k-d-l)](11)

y(k-d)=[y(k-1),u(k-2),…,y(k-n)](12)

式中:y(k)是傳感器實際輸出;u(k)是系統實際輸入;f(•)代表某個未知的動態系統(壓鑄機)的非線性關系;n,l,d分別代表系統結構的階次和時間延遲,并且假設u(k),y(k)是可測的。

利用RBF神經網絡模型的徑向基函數來逼近f(•)。將函數:

X(k)=y(k)=[u(k-d),u(k-d-1),…,

u(k-d-l),y(k-1),y(k-2),…,y(k-n)](13)

作為RBF神經網絡訓練模型輸入層的輸入,通過上述隱含層高斯徑向基函數進行非線性變換,再利用上述模糊K均值聚類算法來選取聚類中心和訓練權值,最后得到整個網絡的輸出:

(k)=∑mi=1ωiFi(k)+θ(14)

式中:(k)為輸出層的輸出;ωi為修正后的權值;Fi(k)為第i個隱層節點的輸出;θ為輸出層節點的閥值,并將(k)與當前系統的實際輸出y(k)進行比較,得到殘差δ(k)。若δ(k)小于預定閥值θ,表示傳感器正常工作,此時采用系統實際輸出的數據;若δ(k)大于預定閥值θ,說明傳感器發生故障,此時采用RBFNN觀測器的觀測數據作為系統的真實輸出,實現信號的恢復功能。

3.2 仿真實驗

在壓鑄機系統各傳感器正常工作時連續采集52組相關數據,將其分成2組,前40組用于對RBF神經網絡進行離線訓練,以構建RBF神經網絡觀測器;后12組用于對訓練好的網絡進行測試。表1為訓練樣本庫中的部分數據。

表1 用于RBF神經網絡訓練的部分數據

序號合型力 /MPa油壓 /MPa壓射速度 /m/s模具溫度 /℃

111.258.962.50353.21

211.408.902.52353.30

311.409.002.46354.20

411.259.002.42354.50

511.009.102.42353.61

611.709.102.56353.14

712.009.122.60352.90

812.109.212.60352.95

912.109.232.52353.76

1011.709.122.68353.21

1111.258.902.68356.12

1211.258.892.62355.32

1311.328.982.48354.46

1411.329.112.48353.62

1511.459.102.50355.00

1612.109.112.42356.18

由于表1中的4個參數的物理意義、量級各不相同,必須經過歸一化處理后才能用于神經網絡的訓練,用Matlab[10]的Simulink仿真工具箱提供的函數對數據進行歸一化處理使數據位于[-1,1]之間。訓練結束后切斷學習過程使網絡處于回想狀態,將系統實際輸出與網絡模型的輸出相減就可以獲得殘差。以合型力傳感器為例,采樣時間為0.5 s,利用上面的學習樣本在時間T∈[1 s,1 000 s]內對RBF神經網絡進行訓練,結果經過約50步訓練誤差就達到10-7并急劇減少,如圖3所示。

圖4為用后12組數據對RBF神經網絡進行測試時,跟蹤正常合型力傳感器測量值y的情況,其最大誤差不超過1.5 MPa,所以訓練好的RBF神經網絡具有一定的泛化能力,可以較好的觀測、跟蹤合型機構現狀。

現針對傳感器經常發生的卡死故障、漂移故障和恒增益故障進行模擬仿真實驗。當合型力傳感器正常工作時,RBFNN觀測器輸出與合型力傳感器測量值y之間的殘差δ=-y近似為高斯白噪聲序列,其均值近似為零;當傳感器發生故障時,由于y不能準確反應合型力數據,導致δ突變,不再滿足白噪聲特性。根據上面所述的傳感器故障診斷原理,設定閥值θ=2.7 MPa,圖5表示合型力傳感器在T∈[400 s,600 s]內發生卡死故障時的輸出殘差曲線;圖6表示傳感器在T∈[600 s,1 000 s]內發生漂移故障;圖7表示傳感器在T∈[800 s,1 000 s]內發生恒增益故障時的輸出殘差曲線。

圖3 RBFNN訓練過程誤差收斂情況

圖4 合型力傳感器正常工作時的殘差曲線

圖5 合型力傳感器發生卡死故障時的殘差曲線

圖6 合型力傳感器出現漂移故障時的殘差曲線

通過對各類典型故障的仿真實驗,能夠準確檢測到合型力傳感的各類故障。

圖7 合型力傳感器出現恒增益故障時的殘差曲線

4 結 語

在此依據徑向基(RBF)神經網絡原理,以壓鑄機控制系統各傳感器的輸出參數作為RBF神經網絡的輸入,采用模糊K均值聚類算法選取聚類中心,建立傳感器RBF神經網絡觀測器模型對控制系統傳感器進行故障診斷,仿真實驗表明徑向基神經網絡具有較強的非線性處理和逼近能力,泛化能力強,網絡運算速度快,能夠準確發現和處理故障信號,性能穩定。因此,RBF神經網絡故障診斷是壓鑄機控制系統一個必不可少的新管理工具。

參考文獻

[1]彭繼慎.壓鑄機控制技術[M].北京:機械工業出版社,2006.

[2]韓力群.人工神經網絡教程[M].北京:北京郵電大學出版社,2006.

[3]王軍,呂震中,曹荃,等.基于神經網絡的傳感器的故障診斷方法與應用[J].自動化儀表,2003,24(10):21-24.

[4]翁桂榮,葉萍.基于RBF的傳感器在線故障診斷和信號恢復[J].傳感器技術,2003,22(10):50-53.

[5]胡香玲,馮浩,華亮.基于RBF神經網絡的變壓器保護[J].電氣應用,2005,24(10):59-62.

[6]趙望達,劉勇求,賀毅.基于RBF神經網絡提高壓力傳感器精度的新方法[J].傳感技術學報,2004,23(4):640-642.

[7]張秀玲,李海濱.一種基于RBF神經網絡的數字模式識別方法[J].儀器儀表學報,2002(6):265-267.

[8]張小軍,馮宏偉.基于徑向基函數神經網絡的車型識別技術[J].西北大學學報:自然科學版,2006(2):21-24.

篇10

Columbia, Canada

Machine Learning Methods

in the Environmental

Sciences

2009, 349pp.

Hardcover

ISBN: 9780521791922

William W. Hsieh著

機器學習是計算機智能(也叫人工智能)的一個主要的子領域。它的主要目標就是利用計算的方法從數據中提取信息。神經網絡方法,一般被認為是機器學習研究中的第一次突破,它自上世紀80年代以來開始流行,而核方法是在上世紀90年代后半期作為機器學習研究的第二波而到來的。本書對于機器學習方法和它在環境科學中的應用給出了統一的處理。

機器學習方法進入環境科學是在上世紀90年代。已經大量地應用于衛星數據的處理、大氣環流模型、天氣和氣象預報、空氣質量預報、環境數據的分析和建模、海洋和水文預報、生態建模、以及雪災冰川和森林監測等領域。

書中第1-3章主要是為學生們而寫的背景性資料,包括在環境科學中應用的標準統計方法。1.主要介紹了概率分布的基本意義、隨機變量的平均值與方差、分析兩變量關系的相關與回歸分析方法等基本統計概念;2.回顧了主成份分析的方法和它的一些變化,以及經典相關分析方法;3.引入了基于時間序列數據的分析方法,如奇異譜分析(SSA)、主振蕩型分析(POP)等。

第4-12章為那些標準的線性統計方法提供了有力的非線性轉化。4.關于前饋神經網絡模型及其最普遍的代表――多層感知哭模型(MLP模型),介紹了MLP模型的一些歷史發展知識;5.為MLP神經網絡模型所需要的非線性優化的內容;6.探索了幾種能夠使神經網絡模型正確的學習并泛化的方法;7.是關于核方法內容。主要討論了核方法的數據基礎、主要思想以及它的一些缺點,并介紹了從神經網絡到核方法的過渡;8.介紹了處理離散型數據的方法――非線性分類;9.介紹了兩種核方法(支撐微量回歸、SVR 和高斯過程、GP)和一種樹方法(分類和回歸樹方法CART);10.關于非線性主成份分析的方法及相關的一些研究方法;11.系統地闡述了MLP和非線性經典相關分析(NLCCA)方法,并以熱帶太平洋氣候變異性數據及它同中緯度氣候變異的相關性為例加以說明;12.給出了大量機器學習方法在環境科學眾多研究領域中的應用實例如遙感、海洋學、大氣科學、水文學及生態學等。

作者William W. Hsieh是英屬哥倫比亞大學地球與海洋科學系及物理與天文學系的教授,主持大氣科學項目。作者在環境科學中發展和應用機器學習方法中所做的先驅性工作在國際上享有很高的知名度。已在天氣變化、機器學習、海洋學、大氣科學和水文學等領域80多篇。

本書主要適用于研究生初期階段或者高年級的本科生,而且對于那些致力于在各自的研究領域應用這些新方法的研究者和參與者們也是十分有價值的。

朱立峰,

博士后

(中國科學院動物學研究所)