人工神經網絡的意義范文
時間:2024-03-28 16:38:39
導語:如何才能寫好一篇人工神經網絡的意義,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
【關鍵詞】 人工神經網絡;中醫證候;非線性建模
建模就是建立一個數學模型,使之能最好地擬合通過系統的輸入輸出數據體現出的實際系統的動態或靜態特性。證候學研究的目的就是通過對四診信息的綜合分析,找出證候的特征,做出證型的分類診斷。因此,可以通過數理分析方法總結證型與指標之間的規律,建立證候診斷數學模型。常用的證候建模方法分為線性建模法和非線性建模法兩種。
1 線性證候建模方法及其存在的問題
目前,常用的線性證候建模方法有多元線性回歸分析、因子分析、判別分析等多元統計方法。多元線性回歸分析可以根據各指標的常數項和偏回歸系數建立證候的多元線性回歸方程;因子分析可以通過將公因子表示為指標的線性組合,從指標的觀測值估計各個公因子的值,從而建立證候的因子得分模型;判別分析可以對證候診斷明確的一組資料建立證候的判別函數。上述3種方法均可以建立證候的線性模型,并可實現對證候的診斷和預測。
多元統計方法很多都是對復雜問題的線性簡化。如判別分析和回歸分析都是不加區別地、均衡地看待每個癥狀變量對線性關系的影響,同時還基于各變量的作用與其他變量的值無關,且各變量的作用可以疊加這一不甚合理的假定而建立的癥狀和證候關系的一種簡單的線性描述[1];因子分析也是建立每一個公因子(證候)和變量之間的線性函數。然而,中醫證候系統具有非線性復雜性特征,且癥狀之間存在大量的多重共線性關系和協同關系,線性建模方法雖然有利于對復雜問題的數學描述,但卻很難準確地模擬癥狀和證候之間的復雜關系,更難以逼近中醫證候的真實面貌。
2 非線性證候建模方法
非線性建模法又稱黑箱建模法,即在不了解黑箱內部機理和結構的情況下,通過提取隱含在系統的輸入輸出數據中的特性,建立一個能充分逼近系統實際結構的等價模型。目前,人工神經網絡技術具有強大的非線性映射能力,能夠任意精度逼近非線性函數,成為非線性系統辨識的主要建模方法。
中醫證候的診斷過程,實質上是由收集到的各種癥狀,通過分析獲得證型診斷的過程,可以把這個過程看作是一個非線性映射過程,因此,我們將改進的BP神經網絡用于中醫證候的非線性建模研究,探討了基于人工神經網絡模型的非線性證候建模方法。
3 基于人工神經網絡的證候非線性建模方法
3.1 人工神經網絡簡介
人工神經網絡(artificial neural network,ANN)是在對人腦神經網絡結構認識理解的基礎上,人工構造的新型信息處理系統。ANN具有大規模的并行處理方式、良好的魯棒容錯性、獨特的信息存儲方式以及強大的自學習、自組織和自適應能力,這使得它在模式識別、控制優化、信息處理、故障診斷以及預測等方面應用廣泛,其理論與技術方法在工程、醫療衛生、農業、交通、財經、軍事、環境、氣象等領域顯示出巨大的吸引力,并具有廣闊的應用前景[2]。
ANN的一個顯著特征是它通過自動學習來解決問題,對樣本的學習過程,即為對網絡中的神經元間的聯系強度(即權重系數)逐步確定的過程,通過對樣本的學習,可以學會識別自變量與應變量間的復雜的非線性關系。經過充分學習后的ANN獲取了樣本的特征規則,并將這些規則以數字的形式分布存貯在網絡的連接權中,從而構成了系統的非線性映射模型。這樣的ANN模型不僅能夠對其學習過的樣本準確識別,而且對未經學習的樣本也可以準確識別,它甚至可以充分逼近任意復雜的非線性映射關系。可見,ANN不需要精確的數學模型,而是通過模擬人的聯想推理和抽象思維能力,來解決傳統自動化技術無法解決的許多復雜的、不確定性的、非線性的自動化問題。
BP神經網絡[3]是指基于誤差反向傳播算法(back propagation,簡稱BP算法)的多層前向神經網絡。BP網絡的神經元通常采用Sigmoid型可微函數,可以實現輸入到輸出間的任意非線性映射,這使得它在函數逼近、模式識別、數據壓縮等領域有著廣泛的應用,也使得它能夠應用于中醫證候的非線性建模。
3.2 非線性建模方法
證候具有典型的非線性特征,證候的診斷過程可以看作是一個從診斷指標到證候的非線性映射過程,這個過程用非線性數學模型可以充分模擬,而ANN是典型的非線性數學模型,其中的BP網絡更具有強大的非線性擬合能力。因此,我們選擇ANN中最常用的BP神經網絡技術,并進行適當的改進后,建立中醫證候的非線性模型,然后對建立的證候模型的診斷性能進行測試。具體步驟如下。
3.2.1 數據預處理
在建模之前,首先對試驗數據進行預處理。包括對輸入數據的歸一化處理和對數據的主成分分析以及資料的分組處理等。
先對所有數據進行歸一化處理,使變換后的輸入輸出信息在(0,1)區間,以防止小數值信息被大數值信息所淹沒;然后對歸一化處理后的數據進行主成分分析,主成分的選擇標準定為95%。數據經過主成分分析,可對大量的輸入信息進行降維處理;最后根據驗證方法進行病例分組,我們采用3倍交叉驗證法,因此,將樣本隨機分為3組。
3.2.2 確定BP網絡的結構
在MATLAB7.0環境下,采用改進的共軛梯度學習算法(trainscg學習算法),建立證候的三層前向BP網絡模型。該網絡包括輸入層、隱層和輸出層,其中輸入層包含的輸入神經元數即是證候的診斷指標數;隱層的層數及每層包含的神經元數根據具體情況而定;輸出層包含的輸出神經元數即研究資料包含的基本證型數。兩個隱層之間通過雙曲線正切S型傳遞函數(tansig)連接,隱層與輸出層之間用對數S型傳遞函數(logsig)連接。設定網絡的系統誤差為小于0.01,最大迭代次數為500次,最小下降梯度為10-10。
其中,網絡的輸出節點用來表示共幾種證型,表示方法是一個輸出節點對應一種證型。我們將包含n個證型的輸出采用(0,1,…,0)的方式,括號內共有n個數值,每一個數值代表一種證型,其中0表示診斷不成立,1表示診斷成立,這樣可以診斷兼夾證的情況。另外,預測輸出值分原始輸出值和整合輸出值兩組,原始輸出值為0到1之間的連續值;整合輸出值既可整理成(0,1)的形式(規定≥0.5為1),又可整理成0-1之間的分段數值,比如(0,0.2,0.4,0.6,0.8,1)等6個數值,這樣根據數值大小既可診斷兼夾證,又可判斷證型的主、次情況。
3.2.3 證候網絡模型的訓練
先取樣本的兩組作為訓練集,另一組作為測試集,再交換其中的一組,如此循環,分別共做3次訓練與測試,從中得出平均預測效果值。
網絡參數的初始值取為[-0.5,+0.5]上均勻分布的隨機數。經重置幾次網絡權值的學習率和動態訓練集后,不斷改善權值。到權值趨穩,即認為網絡訓練完成。
3.2.4 證候網絡模型的測試
神經網絡訓練的期望目標是以盡可能簡單的網絡結構達到盡可能高的學習精度和盡可能好的泛化能力,因此考察神經網絡的性能就要看網絡的泛化能力。所謂泛化,就是網絡對尚未學習過的數據的正確識別能力,是否具有良好的泛化能力是網絡能否投入實際使用及使用效果如何的重要因素。它可以通過測試樣本集網絡診斷結果的特異性和準確率來衡量。
證候網絡模型的權值趨穩,訓練結束后,即可以采用三倍交叉驗證的方法,分3次分別對1/3測試樣本做檢驗。此時只有輸入矢量(即只有癥狀得分),無輸出期望值(即沒有相應證型的判斷)。經網絡運算后,得出預測輸出值,與期望輸出進行比較,分別統計各種證型預測值的特異性和準確率,以判斷該證候神經網絡模型的診斷性能。
4 實現基于人工神經網絡的非線性證候建模研究
我們采用上述非線性證候建模方法,在MATLAB7.0環境下,對一組765例類風濕性關節炎(rheumatoid arthritis,RA)臨床證候資料和一組449例糖尿病腎病(diabetic nephropathy,DN)臨床證候資料,分別建立了RA證候BP網絡模型和DN證候BP網絡模型,并均采用三倍交叉驗證的方法,檢驗了證候神經網絡模型的診斷性能(具體內容另文詳述)。測試結果顯示:兩種模型的平均單證特異性分別為81.31%、81.32%;平均單證準確率分別為95.70%、96.25%;平均診斷準確率分別為90.72%、92.21%。說明基于改進的BP神經網絡的證候模型具有較高的診斷、預測能力。
5 討論
“線性”和“非線性”是區別事物復雜性程度的標尺,在數學中,當兩個變量(自變量和應變量)的關系成正比時就稱為線性關系,否則就是非線性關系[4]。在生命科學中,由上述概念推廣而來的線性和非線性邏輯則更具實用意義,非線性邏輯表征事物各組分之間是相互作用的,而不是相互獨立的、正則的、無限可微的和平滑的,即總體不等于部分之和,它是復雜系統的典型特征之一。證候是機體各層級結構的整體涌現現象,中醫四診信息所表達的就是人體各層級結構的功能失調逐級涌現的結果[5]。顯然,證候具有非線性特征。
對非線性證候系統建模應當用非線性建模法更能反映證候的實質?;诤谙浣Y構的ANN具有強大的非線性建模能力。因此,我們將其用于證候的非線性建模。
我們在基于共軛梯度下降算法的BP神經網絡的基礎上,對RA臨床證候資料和DN臨床證候資料均建立了非線性神經網絡證候模型,經過三倍交叉驗證,兩種證候神經網絡模型均有良好的診斷、預測能力。可以得出結論,ANN在不必知道內部結構的情況下能夠充分模擬癥狀與證候的非線性映射關系。神經網絡利用網絡的自動學習能力,在充分辨識證候表征信息的基礎上,可以自動抽提出這些信息蘊含的內在規律,并將其分布在網絡的聯接權中,從而建立了癥狀與證候的非線性映射函數。
在這里,樣本(證候)被概括為一對輸入與輸出的抽象的數學映射關系,各種物理表征信息為輸入單元,證型診斷為最終的輸出結果。證候診斷的過程被看作了一個映射問題,通過癥狀找出對應的證型診斷,神經網絡把癥狀與證型的對應關系通過輸入與輸出的映射轉化成了一個非線性優化問題。雖然不清楚網絡模型的內部結構,但我們的研究證實這種模型卻能夠充分逼近癥狀與證型診斷的非線性映射關系,近似真實地反映證候的全貌,這是在不打開黑箱的前提下,建立非線性證候模型、反映證候的內在規律和特征的有效方法。
BP神經網絡雖然是一個標準的非線性數學模型,但它的收斂速度非常慢,為此,我們采用trainscg函數改進train函數,trainscg函數是共軛梯度算法的一種變形,具有采用尺度化共軛梯度反向傳播算法對網絡進行訓練的功能。該算法結合了Levenberg-Marquardt算法中的模型置信區間方法和共軛梯度算法,避免了耗時巨大的線搜索過程,從而大大提高了網絡的訓練速度。我們建立的兩種證候網絡最后一次訓練的迭代次數分別為58、33,說明建立的證候網絡模型有很好的收斂性能。
總之,中醫證候的診斷規律蘊含在足夠多的樣本集合中,利用神經網絡的自主學習能力從大量的樣本中進行證候特征的規則提取,能夠抽提出比較全面的內在規律;同時,網絡的自組織、自適應能力又能加強對邊緣相似病例的辨識能力,這樣的證候診斷模型更能充分逼近證候真實面貌?;诟倪M的BP神經網絡的證候非線性數學模型具有良好的診斷、預測能力,能夠充分逼近證候的真實面貌,是證候非線性建模的可行性方法。
當然,用ANN建立的證候模型是否有強大的推廣能力,取決于樣本的含量以及樣本所含信息的全面程度。因此,必須保證樣本的含量足夠大、樣本所蘊含的證候診斷信息足夠全面,這樣才能盡量真實地展示證候全貌。同時,ANN的知識處理能力還需進一步提高,還需圍繞如何提高神經網絡的學習能力、收斂速度、可塑性以及普化能力等方面展開深入研究。但目前采用神經網絡技術建立證候數學模型,從而實現對證候的非線性建模,對中醫證候的規范化研究不啻是一種可行的方法。
【參考文獻】
[1] 袁世宏,王天芳.多元統計方法在建立證候診斷模型研究中存在問題的思考[J].北京中醫藥大學學報,2004,27(4):9-11.
[2] 白云靜,申洪波,孟慶剛,等.中醫證候研究的人工神經網絡方法探析[J].中醫藥學刊,2004,22(12):2221-2223.
[3] 許 東,吳 錚.基于MATLAB6.X的系統分析與設計——神經網絡[M].第2版.西安:西安電子科技大學出版社,2002.19-24.
[4] 包含飛.初議中醫學是復雜性科學[J].上海中醫藥大學學報,2003,17 (2):3-6.
篇2
Abstract: Perturbation model by building privacy preserving data clustering using hidden logarithmic spiral perturbations of the original data, maintaining stable raw data neighborhood relationship, the effective maintenance of data availability clustering; further mention BP neural networkthe convergence speed. Data privacy, while maintaining the availability of the output results and can be effectively avoided.
關鍵詞: BP神經網絡;對數螺旋線;數據擾動;收斂速度
Key words: BP neural network;logarithmic spiral;data perturbation;convergence rate
中圖分類號:TP392 文獻標識碼:A 文章編號:1006-4311(2013)02-0181-02
0 引言
人工神經網絡的輸入數據若能預先進行有效的數據處理,那么對隱藏層的數據處理可提供高效的數據,使得網絡收斂速度得到較快改進,數據擾動不僅是解決了該問題,而且可以對原始數據中的隱私信息得到有效的保護。
1 對數螺線方程
對數螺旋線上的動點的與極坐標的極徑始終保持定角β的軌跡,稱為對數螺旋線(如圖1所示),它的極坐標方程為:r=r0ekθ。
期中:r0、k為常數,k=ctgβ,r0為起始極徑,θ為極角,r為極徑。
在直角坐標系中其方程為:
x=r0ekθcosθ y=r0ekθsinθ
2 對數螺線特性
對數螺旋線具有良好的幾何特性,主要表現在以下幾方面:①在一條對數螺旋線上,每個點的螺旋角每處都相等,運動點的運動方向與極徑之間的夾角β始終固定值,稱該角度為對數螺旋線的螺旋角,即螺旋線上每點的螺旋角都相等。②螺旋線與它的等距曲線全等始終保持螺旋線的螺旋角都不會不變,改變它的起始極徑r0,那么就會形成一系列的等距螺旋線族,它們是全等的螺旋線。③針對多維數據,若進行對數螺線擾動,始終不會改變數據集的數據附近之間的關系。④對數據集進行多重對數螺線擾動,不會改變數據集的數據鄰域關系。⑤多重對數螺線擾動可以增強隱私保護的安全性。
綜上所述,通過對數螺旋線對數據進行擾動,不會改變原始數據的基本特性。
3 對數螺旋線數據擾動方法
考慮將對數螺線的幾何性質應用于微數據隱藏,借助對數螺線對數據點進行擾動,隱藏原始數據。具體思路如下:通過對數螺線的旋轉和縮放使數據點落于對數螺線上,再使數據點沿螺線方向在螺線上移動,從而對原數據進行擾動保護,將這種擾動方法稱之為對數螺線擾動。
設原始數據點為A,對數螺線擾動函數為F,擾動后數據點為A′,F×A表示運用函數F對數據點A進行擾動,則對數螺線擾動可以表示為F×AA′。
在二維平面上,給定一條對數螺線,對于平面上任意一點,若該點落在對數螺線上,則使該點順著螺線的方向在螺線上移動;若該點不在螺線上,則使螺線繞其螺心旋轉直至使該點落于螺線上,再使該點在螺線上沿螺線方向移動,將這種擾動方法稱之為二維對數螺線擾動,如圖2所示。
設點A(Ai,Aj)為二維平面上的任意一點,設對數螺心為O(x,y),對數螺線方程為r=aekθ,旋轉擾動角度為Δθ,如圖2所示,二維對數螺旋線擾動可分解為旋轉和縮放兩部分,點A先縮放至點A″,再圍繞螺心旋轉至點A′。
設θA為點A相對于對數螺線的極角,縮放參數k為擾動后的點A′與螺心的距離|A′|與擾動前的點A與螺心的距離|OA|的比,則
k=■=■=■=e■
其中r■、r■分別為點A、A′的極徑。則擾動后點A′(A■■,A■■)的坐標為
A■■=k·rA·cosθ■+Δθ+x A■■=k·r■·cosθ■+Δθ+y
根據給定的參數,設二維螺旋線擾動函數為F(k,Δθ,O(x,y)),則二維對數螺旋線擾動可以表示為:
F(k,Δθ,O(x,y))×A(Ai,Aj)A′(A■■,A■■)
將多維數據集D中的多維屬性隨機劃分成一組不相交的二維、三維投影子集,給定縮放參數k。對于二維投影子集,給定螺心O(x,y)和擾動角度Δθ,進行二維對數螺線擾動;對于三維投影子集,給定螺心O(x,y,z)、螺軸向量V(a,b,c)和擾動角度Δθ,進行三維對數螺線擾動,最后將原數據集替換為擾動后的數據集D′。對數據集D進行t次這樣的對數螺線擾動,最終得到t重對數螺線擾動后的數據集D(T)。
4 人工神經網絡樣本質量對網絡的影響
BP神經網絡能夠較好地解決I/O之間的映射關系的不明確問題,大部分的人工神經模式在模式識別問題中,其I/O的映射關系難于用解析的方法來求解,故神經網絡很難適用來解決模式識別中的有關問題。BP神經網絡的樣本主要分為訓練樣本及測試樣本,神經網絡中樣本的本身質量,在一定程度上影響著預網絡的預測結果。首先,輸入的訓練樣本及待預測樣本平均值存在較大差異,神經網絡的預測誤差值,就會隨著增長預測時間的訓練不斷增大。再次,如果訓練誤差會隨訓練樣本及待預測樣本均值的差異增大而逐漸增大。
所以把用于BP神經網絡的訓練樣本和待預測樣本先進行數據擾動,可以保證數據的安全性和可用性,先用對數螺旋線進行t重擾動,再進行BP神經網絡的訓練,最后用輸入樣本數據進行預測,實驗證明使用擾動后的數據進行訓練的網絡比用原始數據歸一化處理后訓練的網絡收斂速度快,且輸出結果更加可靠。
5 實驗與分析
BP人工神經網絡的主要功能是能以任意精度逼近任意連續函數,幾乎所有的模式識別及分類問題基本能看作從模式空間到類別空間的一個映射,故BP神經網絡模式分類方法能用于解決任意復雜度的模式分類問題。BP神經網絡泛化能力較強,若用少量的訓練樣本對網絡進行訓練后,那么BP神經網絡對訓練階段,也能對沒有遇到的新樣本給出正確分類。神經網絡的這種泛化性,是其它模式分類方法無法的。
使用傳統的神經網絡方法,可以較好的解決模式分類問題,但因為訓練樣本數量和分布不可能是理想的,若使用樣本集訓練分類器所得到的分類面始終與最優分類是存在差異,這就導致了人工神經網絡的泛化能力。為了提高人工神經網絡的泛化能力及收斂速度,有許多專家做了大量的工作,但由于這些研究主要是集中分析人工神經網絡的參數和訓練樣本等對泛化能力的影響,對用新的方法提高網絡的泛化能力及泛化能力的穩定性很少涉及[2]。
采用文獻[1]中的例子,在MATLAB下用誤差投影和局部投影算法,對RBF網絡進行仿真實驗,優化BP網絡參數,預測某種水泥在凝固時放出的熱量y(卡/克)與水泥中下列四種化學成分之間的關系,實驗樣本數據為表1中的數據。
其中,x1,x2,x3,x4的含意如下:x1:3CaO·Al2O3的成分(%);x2:3CaO·SiO2的成分(%);x3:4CaO·Al2O3·Fe2O3的成分(%);x4:2CaO·SiO2的成分(%)。
用對數螺旋線進行t重擾動(取整),對表1的擾動后的輸入如表2所示。
對BP網絡訓練后,對表2中的實際值進行預測,實驗結果如表3。
6 結論
采用對數螺旋線對輸入樣本數據進行擾動,保持了數據的原始特性不變的情況下,加快了BP人工神經網絡的收斂速度,精度得到了較大的提高,而且對數據中的隱私得到了有效的保護。經過MATLAB仿真實驗,仿真結果見表3,從該表可以看出,與文獻[2]的結果比較仿真精度得到了較大的提高,平均誤差為-0.27,標準方差為0.7732。
參考文獻:
[1]Kadirkamanathan V, Niranjan M. A function estimation approach to sequential learning with neural networks. Neural Computation,1993,5(4):954-975.
[2]宋紹云等.人工神經網絡中的樣本對輸出精度影響分析[J].河北:價值工程,2010-5-3.
[3]李江紅等.RBF神經網絡的一種新的學習算法[J].長沙:長沙電力學院學報(自然科學版),2000,15(1):39-42.
篇3
關鍵詞:神經網絡 網絡方法 環境色譜法 多個節點 信息模型
中圖分類號:X83 文獻標識碼:A 文章編號:1674-098X(2017)05(a)-0126-02
從近幾年在國內神經網絡的使用來看,在環境監測中也有著非常良好的效果。無論是從色譜法、光譜法還是整個環境的評價都帶來了很多新的成果。該文主要是通過對神經網絡相關分類的闡述,結合神經網絡在環境監測中的應用效果,希望能給神經網絡對環境監測中做一些回顧和總結[1]。
1 網絡方法類別
由于著重的角度關系,網絡法會有多種不同的類別,由于神經網絡是多個節點的連接,有相當多復雜的算法,基于神經網絡,可以總共闡述兩大類的情況,包括有管理和無管理的網絡方法。關于這兩種的不同點就在于它們是否需要對現有的樣本進行訓練。有管理的網絡方法是需要訓練,而無管理的網絡方法是無需進行訓練,它需要與其他的化合物相結合使用,里面會涉及到網絡與遺傳法、偏最小二乘法等分析方法來進行分析比較。另外根據網絡的結構不同,也可以把網絡方法給分成前向和后向的網絡方法,而如果是從網絡活動方式的差別,也可以將其分為隨機和確定兩種網絡方法。
2 關于環境監測的化學方面的應用
在化學方面,國內與有很多用于化合物的一些研究,比如一些有機結構分析,還有化學反應、蛋白質結構等等的分析。在進行定量的構效關系分析中,可以把釀酒的酵母菌來作為一種模型的指示物,建立相關網絡模型,然后對生物的毒性進行進一步預測,當然,在分析過程中還存在著很多的問題,通過比較一些網絡模型,然后計算它們之間的權值,再篩選相出相應的參數,學者們在分析的時候也會對多層前傳網絡進行探討分析,盡量減低誤差,通過多方向的非線性校準,并且進行數據解析,然后表明引射能力,通過建立神經網絡來不斷接近規律的程度,擬定相關的指標數[2]。
3 分光光度的方法應用
在化學分析進程中,通過多元校正和分辨是相對來說較好的一種方法。隨著相關方法的不斷普及,目前大多數是使網絡和現有的紫外光譜法相互關聯,利用線性網絡、BP網絡等來用于多個分組的報道[3]。鄧勃等[4]學者在分析的時候,認為除了人工神經網絡,迭代目標轉換因子的分析法相比較起來也是一種不錯的選擇,兩種方法各有優勢,并且產生的網絡法的誤差一般都不會很大。孫益民等專家在分析時,利用現有的人工神經網絡先后側出的光度法,并且可以測定比如銅、鎳,并且這個分析方式非常的簡單和方便[5]。
4 神經網絡對X射線中的熒光光譜法的應用
研究人員通過神經網絡建立與X射線熒光譜譜法的關系,通過多個不同的神經網絡來應用,可以通過他們之間的連接來測定酸溶鋁,通過神經網絡的設置,可以測定里面的最低的鋁值,通過神經網絡與BP的網絡模型的設立,可以直接輸入測出來的鋁含量情況,然后通過鋁含量來側出酸溶出來的鋁的數值。BP模型可以結合現有的神經網絡系統,充分的在現有的信息模型上應用,通過利用網絡神經的結構,不僅可以做一些化學分析,還可以通過神經網絡來檢測環境監測中涉及到的紅外譜圖等的分析,這為環境分析提供了非常有意義的方向,并且給環境監測提供了新的檢測方法[6]。
5 環境監測中的色譜法的研究
在關于色譜法的研究中,人工神經網絡也有可以應用的方向[7]。色譜法中的小波分析,與人工神經網絡的結合,小波分析的主要目的是為了得到重疊的色譜峰的信息,運用神經網絡分析之后,可以在其中建立相關的模型,通過兩者的結合來分開重疊的色譜峰信息,眾所周知,把重疊色譜分開是一個非常復雜的工程,它們之間需要運用大量的元素來分開,效率極低,極其浪費時間。因為其內里復雜的重疊組織,而現在,人工神經網絡為其分離提供了一種新的嘗試[8],不僅如此,通過人工神經網絡的方法不僅可以分離,而且可以在分離之后得到更加精確的色譜信息。研究工作者在模擬退火神經網絡的時候,會運用藥物來優化整個分離的條件,這對于提高色譜精確度也非常有效。
6 環境監測中的評價
通過之前提到的BP網絡,通過介紹與人工神經網絡模型的結合,來闡述了整個模型應用的原理,通過綜合相關的分析方法可以對環境監測中的適用性進行分析評價,這樣表現出來的結果會更加客觀。研究者可以從有預測模型中表現的結果,在水庫里進行抽樣,提取水庫中的相關元素進行預測,確認是否與實際結果一致,可以通過建立人工神經網絡來對水質中的污染指數進行評價,然后得出相應的成果。
7 結語
人工神經網絡在整個環境監測中有著非常重要的作用,它擁有一些比較有意義特性,總共可以總結為以下3個方面:第一,人工神經網絡具有自學習的特性??梢酝ㄟ^大量的圖像來設計,進行相關的圖像識別,把不同的幾個圖像進行整合分析,并且把與之相互對應的結果嵌入到神經網絡系統中,系統會根據自己特有的自學功能,對以后相關的圖像進行識別操作,它可以給人們提供一些預測結果,甚至在未來的無論是經濟還是政治等方面提供一些預測,預測經濟和市場,給未來的發展提供引導。第二,系統具有可存儲的特性。人工神經網絡里面包含了一種反饋的功能,而通過輸入信息和模型整合,聯系不同元素之間的關系,得出一些可能的聯想信息。最后,神經網絡還有一項功能便是優化得出答案的能力。
一般問題的因果關系都會涉及到多個方面,那么如何在多個元素中抽絲剝繭,不斷地優化整個系統,是神經網絡的一個主要的功能,它可以通過計算來得到最優化的解,即便其中的運算量牽連的比較多,但是結合神經網絡中反饋聯想的功能,再包括計算機強大的運算效率,那么得到答案有時候也是比較容易的。
人工神經網絡在環境監測中表現的效果比較好,但是除此之外,在其他領域,運用神經系統也可以得到一些相關的數據,比如經濟領域,它可以通過建立信息模型,來進行市場預測和風險評估,這些都是很好的應用方式。在未來的實踐中,隨著經驗的積累,神經網絡的應用在環境監測中會不斷地深入,通過在色譜、光度等領域的剖析,為未來的環境監測效果提供了更多的可能性。
參考文獻
[1] 黃勝林.遺傳優化神經網絡在大壩變形監測中的應用[D].遼寧工程技術大學,2012.
[2] 熊勛.人工神經網絡在環境質量評價和預測中的應用研究[D].華中科技大學,2009.
[3] 王學.無線傳感器網絡在遠程環境監測中的應用[D].山東師范大學,2011.
[4] 武藝.人工神經網絡在土壤質量監測中的應用[D].浙江海洋學院,2015.
[5] 黃湘君.基于主成分分析的BP神經網絡在電力系統負荷預測中的應用[J].科技信息:科學?教研,2008(16):313-314.
[6] 李春梅,周驥平,顏景平.人工神經網絡在機器人視覺中的應用[J].制造業自動化,2000(9):33-36,49.
[7] 涂曄,車文剛.BP神經網絡在福利彩票預測中的應用[A].中國智能計算大會[C].2009.
[8] 李巖,韓秋,鄭萬仁.BP神經網絡在電力需求決策中的應用[J].現代經濟信息,2009(22):325-326.
篇4
【摘要】 目的:應用bp人工神經網絡原理,設計一種類風濕關節炎疾病診斷的方法。方法:選用對類風濕關節炎敏感的8個指標,作為bp人工神經網絡的輸入數據,對樣本進行訓練和預測。結果:bp人工神經網絡經通過對150例樣本的運算,訓練集的113例樣本,訓練正確率為97.4%;預測集的37例樣本,預測正確率為91.9%。結論:bp人工神經網絡能為類風濕關節炎作出較準確的診斷,能提高診斷的客觀性。
【關鍵詞】 人工神經網絡; 類風濕關節炎; 預測
類風濕關節炎(rheumatoid arthritis ,ra)是一種以關節滑膜發生慢性炎性病變的自身免疫性疾病,其病程多呈進行性進展,致殘率高,治愈率低下[1],早期臨床表現不典型,單項自身抗體檢測的靈敏度和特異性均有不足,類風濕因子的檢出率也偏低,容易造成誤診[2,3]。因此醫務人員主要是通過敏感性互補的幾個檢驗指標和臨床表現對類風濕關節炎作出診斷[4],但在疾病的診斷中往往帶有很多的主觀因素。近年來發展起來的人工神經網絡是種理論化的數學模型,是模仿人腦神經的網絡結構及其功能而建立起來的一種信息處理系統,具有自行學習、聯想記憶、錯誤容納和強大的非線性處理能力[5]。因此人工神經網絡常常被應用到臨床醫學疾病的診斷上。本研究結合類風濕關節炎診斷的8個主要指標,設計一種基于人工神經網絡類風濕關節炎的診斷方法,通過對150例樣本的網絡運算,探討了人工神經網絡對類風濕關節炎診斷的可行性。
1 人工神經網絡基本原理
人工神經網絡可以通過對外界信息的學習,以特定的方式對這些信息進行處理和概括,從而具備了對這些信息的識別功能,并產生了一個相對應的結論。因此,再次給人工神經網絡這樣一個相似的條件時,神經網絡就會根據已學到的知識,自行推理判斷,得到一個我們需要的結果。
1.1 人工神經元
人工神經元是組成人工神經網絡的基本處理單元,簡稱為神經元。如圖1顯示了一個具有r個輸入分量的人工神經元模型[6]。
圖1中p(r=1,2,…,r) 為該神經元的輸入數據;wr 為該神經元分別與各輸入數據間的連接強度,稱為連接權重,權重值的大小代表上一級神經元對下一級神經元的影響程度。b為該神經元的閾值,f(x)為作用于神經元的激勵函數,通常采用的是s 型函數,其數學表達式見式(1)[7]:
f(x)=(1+e-qx)-1(1)
a為神經元的輸出數據。神經元將接收信息pi與連接權重wi 的點乘積求和構成其總輸入, 在神經元閾值b的作用下經函數f(x)的作用,產生信號輸出a。
圖1 人工神經元模型
1.2 人工神經網絡
人工神經網絡是由多個不同的神經元連接而成,一般含有多個層次,每個層次又包含了多個神經元,上一層次的神經元只能對下一層的神經元產生作用,同層神經元間無相互作用[7]。根據神經元的不同連接方式,就形成了不同功能的連接網絡模型。比如bp神經網絡,kohonen神經網絡,hopfield神經網絡等等,多達數十種。在醫學中應用比較廣泛的是bp神經(back propagation),也就是誤差逆向傳遞網絡[8],本研究中采用的也是bp神經網絡。bp神經網絡一般由輸入層,隱含層和輸出層構成,其結構模型如圖2所示。
神經網絡輸入層的神經元是接受外界信息的端口,不包括數據運算功能,他將外界的輸入數據通過一個連接權重傳遞給下一隱含層的神經元。隱含層是神經網絡的核心部分,數量上可以有一個或多個層次,隨著層次的增多,網絡結構變得更復雜,網絡數據處理功能也增強。網絡的最后一層是輸出層,輸出層接收到隱含層的各項信息,然后經過轉換把信息傳給外界。
輸入層 隱含層 輸出層
圖2 bp人工神經網絡模型
1.3 人工神經網絡工作原理
為了解決臨床上對疾病的預測或識別等問題,神經網絡主要是通過學習來獲取"知識"或"經驗"的,這一過程總體上可分為訓練和預測兩個階段。所謂訓練就是形成一種病因與疾病之間的函數映射關系,即給定一個實際輸出與期望輸出的目標誤差值,將病人的各種病因、實驗室檢查、影像超聲檢查、臨床表現等作為網絡的輸入信息加到其輸入端,輸入信息經過隱含層神經元的處理后,傳遞給輸出層。如果輸出層得到的結果大于預先給定的誤差目標值時,神經網絡將這種誤差信號沿原來的傳遞路線逐層返回,并調節各個層次間神經元連接的權重值,這種過程不斷交替進行,直到誤差達到目標值時,訓練過程結束。經過訓練可使疾病的各種情況分布到連接權上, 使學習后的網絡權重值存儲了臨床癥狀和疾病類型等相關的知識,此時可以認為神經網絡建立起了病人的各種因素與該病人是否患有某種疾病的映射關系,這種映射關系就是一個預測疾病的判別函數。預測就是檢驗判別函數的可靠程度,利用一些未包括在訓練集中的樣本構成預測集,將預測集中與疾病相關的數據輸入到訓練好的網絡中去,在訓練階段所得到的判別函數的作用下,就可以得到一個測試結果,從網絡的輸出端就可以診斷病人是否為疾病患者。
2 人工神經網絡診斷類風濕關節炎實例
2.1 病例選取及變量確定
實驗數據來源于哈爾濱醫科大學附屬醫院,總共有150例。其中類風濕關節炎患者83例,女71例,占85.5%;男12例,占14.5%。年齡范圍為20~79歲,平均年齡為48.92歲。所有患者均符合1987年美國風濕病協會修訂的類風濕關節炎診斷標準。用來作正常對照的有67例,其中女62例,占92.5%;男5例,占%7.5,年齡范圍為18~79歲,平均年齡為43.63歲。病人資料主要包括臨床癥狀與體征,相關實驗室檢查,相應影像學檢查。
根據中華醫學會風濕病學分會制定的類風濕關節炎診斷指南,典型的類風濕關節炎按照1987年美國風濕病協會修訂的類風濕關節炎診斷標準來診斷并不困難,但某些不典型、早期類風濕關節炎,常常被誤診或漏診。2008年,胡勇等[9]通過研究發現,抗ccp抗體對類風濕關節炎的敏感性和特異性分別為80.0%和93.7 %,聯合抗ccp抗體和rf可以提高診斷的準確性,對類風濕關節炎的早期診斷有重要意義。因此為了提高神經網絡診斷各種類型類風濕關節炎的準確率,我們選取了x1(關節晨僵)、x2(對稱性關節炎)、x3(腕、掌指或者近端指間關節至少有一個關節腫)、x4(3個或者3個以上關節部位腫)、x5(關節x線改變)、x6(皮下結節)、x7(rf )和x8(抗ccp抗體)這8個指標來作為神經網絡運算的輸入數據。其中x1、x2、x3、x4、x5、x6和x7這幾個輸入數據是1987年美國風濕病協會修訂的類風濕關節炎診斷標準所包含的內容,x8是為了提高對不典型、早期類風濕關節炎的診斷所采用的輸入數據。上述x1、x2、x3、x4、x5、x6是定性變量(離散變量),臨床上常用陽性和陰性來描述,實驗中用1和0對這些變量進行賦值,當變量值為1時表示陽性,為0時表示陰性;而變量x7、x8是定量變量(連續變量),用原始數據來描述。
2.2 確定訓練樣本及預測樣本
在以上150例樣本中(83例類風濕關節炎和67例正常對照)中分別選取63例類風濕關節炎和50例正常對照的樣本,用來組成訓練集,并用1~113的數字對其進行順序編號,1~63號代表是類風濕關節炎,64~113號代表的是正常對照組的樣本。剩余的樣本用來組成預測集,集中樣本總數為37例,其中類風濕關節炎患者有20例,正常對照組有17例,也用同樣的方法進行編號。訓練集與預測集樣本比例大約為4:1。
2.3 網絡參數的設定及算法程序
首先對神經網絡參數設定如下:輸入神經元個數為8,輸出神經元個數為1,期望目標輸出值用0表示正常,用1表示類風濕關節炎,隱含層采用tansig函數。訓練次數為6000次,訓練目標為0.06,學習速度為0.05,網絡連接權重初始值是[-1,1]之間的隨機數,其次網絡進行運算所采用的是批動量梯度下降算法,應用matlab6.5來編寫該程序算法。
2.4 訓練及預測結果
將訓練集樣本的8個指標輸入到bp網絡的算法程序中,網絡經過500次的訓練后,達到了訓練目標的要求,訓練結果如圖3所示,預測輸出以0.5為閾值,>0.5者為類風濕關節炎患者,<0.5者為正常對照樣本。
圖3 113例樣本訓練結果從訓練得到的圖形可以看出,63例類風濕關節炎患者中有54例訓練結果都在目標輸出值1附近,而且非??拷?。只有9例稍微偏離了目標輸出值1,由于輸出結果均在0.5~1.5的范圍內,可以認為訓練結果與實際相吻合。類似的在50例正常對照組中,有47例輸出結果都在目標值0的附近,輸出值都在0~0.5之間,訓練結果與實際也相吻合。而編號為64、75、92的3例樣本,其輸出值大于0.5,明顯大于目標輸出值0,樣本訓練結果有錯誤。綜上所述,訓練集中113例樣本有110訓練正確,訓練正確率達到97.4%。
經過訓練可以得到一個能反映類風濕關節炎疾病情況的神經網絡模型。把預測集樣本的數據導入到訓練好的神經網絡中去,進行預測,預測的結果如圖4。
圖4 37例樣本預測結果從上圖的輸出結果可以看出,在20例類風濕關節炎樣本的預測中,19例樣本的輸出結果主要集中在目標輸出值1附近,沒有超出0.5~1.5的范圍,可以視為預測結果與實際相符合,而編號為1的樣本,其輸出值小于0.5,偏離了目標輸出值1,預測結果錯誤。另外17例正常對照組中,15例預測結果與實際相符合,而編號為27、33號的樣本其輸出值大于0.5,明顯偏離目標輸出值0,預測不正確。所以對于預測的總體樣本來說,34例預測正確,準確率為91.9%,靈敏度為94.7%,特異度為86.7%。
訓練集和預測集的樣本,經bp神經網絡運算,其結果如表1所示。表1 bp神經網絡測試樣本的計算結果
3 討論
由表1可知,2例預測有誤的樣本,它們來源于預測集的正常對照組中。同樣在訓練階段,運算有誤的3例樣本也全都來源于訓練集的正常對照組中。由此可見,運算有誤的樣本在訓練集和預測集之間存在一種對應關系,即神經網絡對樣本訓練的錯誤率越高,其預測的準確率就越低。同時,一些樣本的訓練和預測結果也出現了較大范圍的波動,沒有集中在目標值為1和0的這兩條直線上。出現這種結果的原因可能是:有些樣本數據偏倚,訓練樣本總數又不是很多,從而導致這些數據偏倚的樣本所占的比例較大,在總體中表現出來的作用也就較強。因此加大訓練樣本的數量,選擇數據偏倚較少或者更有代表性的樣本來學習訓練,神經網絡就能更準確的反映疾病自身情況,同時網絡所包含的病因與疾病間相映射的函數關系也就更具有普遍性。
對疾病診斷過程而言,人工神經網絡能夠模擬專家級醫師診斷疾病的思維過程和獲得診斷疾病的相關知識。此后對疾病進行預測時就可以避免醫師對疾病診斷的主觀性及思維定勢,因此能提高疾病診斷的客觀性。盡管臨床上也存在一些疾病患者,往往因為診斷數據的缺失,給醫師診斷帶來了很多的困難或是誤診,然而神經網絡具有的容錯性質以及能根據訓練得來的知識和處理問題的經驗,對上述缺失的數據等這種復雜的問題,做出合理的判斷與推理,從而為病人做出較正確的診斷。
在疾病診斷方面, 按照1987年美國風濕病協會修訂的類風濕關節炎診斷標準,對一些不典型,早期的類風濕關節炎常常不能作出正確的診斷,特異性也低,往往造成誤診。然而基于人工神經網絡類風濕關節炎的診斷方法,通過對37例樣本的預測,預測結果表明:本方法對類風濕關節炎的診斷,其準確率為91.9%,靈敏度為94.7%,特異度為86.7%,可作為疾病診斷的一種新方法。當然,實驗中也存在一些問題有待于進一步研究,如輸入變量的選擇及其數據處理,網絡初始權重的計算,網絡訓練的最佳原則,隱含層數的設計等等。隨著研究的進一步深入,人工神經網絡必將得到臨床工作者的認同并為疾病研究帶來諸多的便利。
【參考文獻】
1 顧福榮,張義東,施錦杰.抗ccp抗體、抗ra33抗體、抗sa 抗體和rf聯合檢測對類風濕性關節炎診斷的意義.江西醫學檢驗,2007,25(1):24~25.
2 matsuo k,xiang y,nakamura h,et al.identification of novel eitrullinated autoantigens of synovium in rheumatoid arthritis using a proteomie approach.arthritis res ther,2006,8(6):1~3.
3 harrison mj,paget sa. anti2ccp antibody testing as a diagnostic and prognostic tool in rheumatoid arthritis.qjm,2007,100(4):193~201.
4 王青青.類風濕性關節炎的診斷與治療.全科醫學臨床與教育.2008,6(2):92~94.
5 孫文恒,王煒,周文策.人工神經網絡技術在胰腺癌診斷中的應用.蘭州大學學報,2008,44(7):224~227.
6 宋燁,楊本付,人工神經網絡及其在疾病診斷中的應用,中華醫學實踐雜志,2006,5(3):275~277.
7 王俊杰,陳景武.bp神經網絡在疾病預測中的應用.理理醫藥學雜志,2005,21(3):259~262.
篇5
【關鍵詞】神經網絡 手寫 識別系統 應用
隨著計算機技術的快速發展,其在人們的辦公學習和日常生活成了不可替代的工具。鍵盤已經幾乎完全替代了筆在人們生活中的地位,隨之而來的后果就是人們越來越少的區書寫漢字,導致越來越多的中國人甚至都忘記了漢字該如何書寫,這種現象在很多研究和報道中都有體現。計算機和鍵盤是由西方國家發明的,其符合西方國家的語言習慣,對于中國人來說,用字母、符號去完成方塊漢字的輸入就需要使用者非常熟悉漢語拼音或者五筆編碼,對于文化程度較低的使用者來說,這些都限制著他們使用計算機。鑒于計算機鍵盤的這些缺陷,聯機手寫輸入法應運而生,這為計算機的輸入帶來了新的發展機遇和挑戰。
1 聯機漢字手寫識別的意義及難點
聯機漢字識別是用書寫板代替傳統紙張,筆尖通過數字化書寫板的軌跡通過采樣系統按時間先后發送到計算機中,計算機則自動的完成漢字的識別和顯示。
1.1 聯機漢字手寫識別的意義
聯機手寫漢字識別的誕生具有非常重要的意義。首先這種輸入方法延續了幾千年中華文明的寫字習慣,實現用戶的手寫輸入,對于長時間不提筆寫字的用戶來說能夠加強其對漢字書寫方面的認識,防止“提筆忘字”現象的繼續惡化。其次,手寫漢字輸入不需要學習和記憶計算機的漢字編碼規則,其完全符合中國人的寫字習慣,使人機之間的交流更人性化,更方便快捷。另外,隨著移動智能終端的不斷普及,聯機漢字手寫識別的應用范圍將進一步擴大,以適用于不同層次人群對信息輸入的需要,具有較大的市場發展前景。
1.2 聯機手寫漢字識別問題的難點
手寫漢字識別是光學字符讀出器中最難的部分,也是其最終的目標,手寫漢字識別的應用主要依賴于其正確識別率和識別速度[1]。手寫漢字識別系統的問題具有其特殊性:
(1)中國漢字量大。我國目前的常用漢字大概在4000個左右,在實際應用中的漢字識別系統應該能夠完全識別這些常用的字才能夠滿足需要,由于超大的漢字量,使得手寫識別的正確率和識別速度一直不高。
(2)字體多,結構復雜。漢字的手寫字體豐富多彩,且漢字的筆畫繁多,以及復雜的結構,再加上漢字中的形近字頗多,這些都為漢字識別系統的發展造成了很大的困難。
(3)書寫變化大。不同用戶在進行手寫輸入時其字體的變化是很大的,這種變化因人而異,對漢字識別造成了很大的干擾,增加了漢字匹配的難度。
2 人工神經網絡概述
人工神經網絡是一種應用類似于大腦神經突觸聯接的結構進行信息處理的數學模型,通常簡稱為神經網絡,是一種仿生物神經的信號處理模型。在二十世紀四十年代初人們開始進行神經網絡的研究,經過幾十年的發展,神經網絡也產生了一系列的突破,目前應用最多的是Hopfield模型和BP算法。
神經網絡的一般模型一般包括十個方面:環境、處理單元、傳播規則、神經網絡的狀態、互聯模式、穩定狀態、操作模式、活躍規則、活化函數和學習算法。其中,神經元、互聯模式、學習算法是神經網絡模型中的三個關鍵因素。神經網絡的一個重要內容就是學習,其學習方式可以分為監督學習和無監督學習,其學習過程一般遵循Hebb規則,誤差修正學習算法以及勝者為王的學習規則,其中Hebb規則是神經網絡學習中最基本的規則。
人工神經網絡具有獨特的優越性。首先其具有主動學習的功能,在漢字識別過程中,先將漢字模板及可能的識別結果輸入到神經網絡中,神經網絡能夠通過其自身的學習過程來實現對漢字的識別,自學功能對于神經網絡的預測功能具有非常重要的意義。其次,神經網絡系統具有聯想存儲功能,其反饋功能能夠實現這種聯想。另外,通過計算機的高速運算能力,神經網絡具有高速尋找優化解的能力。
3 人工神經網絡在聯機手寫識別系統中的應用
漢字識別屬于大類別模式識別,人工神經網絡可以通過函數逼近、數據分類、數據聚類三種作用方式以及“聯想”的特殊模式對漢字進行識別。Hopfield神經網絡作為反饋網絡的一種,其自聯想記憶網絡可以使系統不需要通過大量的訓練即可對漢字進行識別,因此Hopfield神經網絡對于漢字識別來說具有獨特的優勢。其中的離散型Hopfield神經網絡能夠通過串行異步和并行同步的工作方式,使其反饋過程具有非常好的穩定性,而網絡只有通過不斷的演變穩定在某一吸引子狀態時,才能夠實現正確的聯想。
聯機手寫識別可以分為訓練階段和識別階段。訓練階段流程依次為:標準書寫字符圖像預處理,提取特征并建立特征庫,建立Hopfield網絡模型,訓練網絡,保存權值。識別階段的流程為:坐標序列轉化為bmp圖像,預處理測試樣本,提取特征,送入網絡運行,運行網絡到平衡狀態,分析結果值。根據聯機手寫識別的工作流程以及Hopfield網絡模型的理論,基于Hopfield神經網絡的聯機手寫識別系統在Matlab環境下得到了仿真模擬,效果非常理想。
4 總結
手寫識別系統能夠彌補普通鍵盤的不足,在提高漢字書寫頻率的同時,能夠滿足不同層次人群對計算機應用的技術需要?;贖opfield神經網絡的聯機手寫識別系統一起自身獨特的性能,不僅能夠滿足手寫漢字識別的正確率,而且其識別過程速度非常快。因此它對于實現聯機手寫識別以及圖像識別具有非常重要的意義。
參考文獻
[1]俞慶英.聯機手寫漢字識別系統的研究與實現[D].安徽大學,2005(5).
[2]郭力賓.交叉點的神經網絡識別及聯機手寫字符的概率神經網絡識別初探[D].大連理工大學,2003(03).
[3]趙蓉.基于神經網絡的聯機手寫識別系統研究與實現[D].西安電子科技大學,2011(01).
篇6
關鍵詞:類風濕關節炎;自身抗體;人工神經網絡;ROC;循證醫學
美國風濕病學學會(ACR)和歐洲抗風濕病聯盟(EULAR)2009年關于類風濕關節炎(RA)分類標準將類風濕因子(RF)和抗環瓜氨酸肽抗體(CCP-AB)作為重要的血清學指標。近年的研究表明,CCP-AB等抗體具有早期診斷的意義,在類風濕關節炎典型癥狀出現之前干預治療至關重要。然而對于這些血清學指標的認識僅僅從串聯或并聯分析是不夠的, 不同的醫師給出的診斷意見差異很大。有些自身抗體滴度的高低與疾病具有很強的相關性,因此弄清楚血清學指標與RA的數量關系非常必要。
1 資料與方法
1.1一般資料 回顧分析瀘州醫學院附屬醫院和瀘州市第二人民醫院2012年9月~2014年9月所有CCP-AB、RF、ANA和ENA自身抗體譜檢驗數據,共計24694例,其中住院病例13241例,門診 11453 例。CCP-AB檢測573 例,ENA抗體譜9575例,RF檢測14536例。通過電子病歷查閱個病例的最后診斷。
1.2類風濕關節炎診斷標準 ACR/EULAR2009年的類風濕關節炎診斷標準。
1.3方法 檢測方法 CCP-AB為酶聯免疫吸附試驗(ELISA),RF為免疫比濁法,ANA為免疫熒光法,ENA為免疫印跡法。
1.4人工神經網絡模型 輸入節點:CCP-AB(S/co值)、RF(IU/ML)、ANA(0/陰性,0.5/±,1/+,2/++,3/+++)。輸出節點:1/類風濕關節炎、0/非類風濕關節炎。仿真預測值:-1~2。
1.5統計學處理 SPSS19.0統計軟件,ROC分析,輸出ROC數據集,并擴展計算出陽性預測值、漏診率和誤診率。
2 結果
2.1血清學實驗的ROC分析 各項指標的ROC曲線和AUC見圖1,表1。
2.2診斷閾值 對診斷類風濕關節炎有統計學意義的CCP-ab、RF和ANA三項血清學指標確定了漏診率和誤診率最小的診斷閾值(CUT OFF)、靈敏度、特異性、陽性預測值見表2。
2.3人工神經網絡模型 CCP-AB 、RF 和ANA三項指標聯合建立人工神經網絡診斷類風濕關節炎模型的ROC曲線見圖2,AUC=0.993,標準誤=0.007,漸進 Sig.b=0。漸近 95% 置信區間為0.98~1.00。ROC擴展數據集見表3。
2.4ANN模型驗證 應用雙盲法驗證:將120個驗證病例的CCP-AB、RF和ANA檢測結果輸入ANN模型運算輸出ANN預測值,將預測值CUT OFF設置為0.35(≥0.35為陽性),與臨床診斷的符合率為99.60%。診斷靈敏度99.10%,診斷特異性98.7%。
3 討論
類風濕關節炎是一種自身免疫性疾病,自身抗體檢測是最重要的診斷依據。回顧分析說明,其中CCP-AB、RF和ANA三項檢測是很好的診斷指標,其AUC在0.75以上。所以對于類風濕關節炎的實驗診斷這三項已經具有很好的診斷意義。CCP-AB的AUC達到0.9以上,而且出現在早期病例中。
關于多項實驗室指標的聯合分析報道很多[1],然而都采用了簡單的串聯分析或并聯分析,只關注其單項指標的定性結果,忽略了檢測物質量與疾病的關系。將CCP-AB、RF和ANA三項指標檢測結果聯合建立人工神經網絡診斷模型,不僅提高了診斷的準確度,從AUC比任意單項指標高很多。控制誤診和漏診有據可循。對于同一個醫療組的統一判斷檢驗結果提供了參考。人工神經網絡模型利用OFFICE插件,容易調用,計算方便,容易保存。
篇7
關鍵詞:農村電力;BP算法;人工神經網絡;回歸分析
中圖分類號:TM855文獻標識碼:A
文章編號:1009-2374 (2010)22-0138-03
0引言
農村用電具有很大的不確定性,農村電力短期負荷預測研究對農村電力系統的安全及農業安全生產有十分重要的意義。基于短期負荷預測研究理論和方法已做了大量預測研究,提出了很多方法,大致可以分為兩類:一類是以時間序列法為代表的傳統方法,如時間序列法等,這些方法算法簡單,速度快,應用廣泛,但由于其本質上都是線性模型方法,因此存在著很多缺點和局限性,無法真實地反映農村電力系統不同負荷模型的非線性特性;另一類是以人工神經網絡為代表的新型人工智能方法,神經網絡具有并行分布信息和自學習及任意逼近連續函數的能力,能夠捕獲農村電力短期負荷的各種變化趨勢。BP網絡需要大量歷史數據進行訓練,且學習及處理不確定性和人工信息的能力較差。人工邏輯系統適用于處理不確定性、不精確性及噪聲引起的問題。實踐證明,將BP算法和神經網絡融合的人工神經網絡能發揮各自的優勢,克服各自的不足是一種有效的方法。
1農村電力短期負荷預測研究算法
基于負荷預測方法主要有回歸分析法、時間序列法、指數平滑法、灰色模型法、專家系統法、人工神經網絡法、小波分析預測技術和數據挖掘理論等。
1.1回歸分析法
回歸分析法是研究變量與變量之間的一種數學方法。在回歸分析中,自變量是隨機變量,因變量是非隨機變量,由給定的多組自變量和因變量資料,研究各自變量和因變量之間的關系,形成回歸方程,求解回歸方程后,給定各自變量數值,即可求出因變量值?;貧w分析法根據歷史數據和一些影響負荷變化的因素變量來推斷將來時刻的負荷值。回歸分析法的特點是:原理、結構簡單,預測速度快,外推特性好,對于歷史上未出現過的情況有較好的預測值。
1.2灰色模型法
灰色系統理論將一切隨機變化量看作是在一定范圍內變化的灰色量。常用累加生成(AGO)和累減生成(IAGO)的方法將雜亂無章的原始數據整理成規律性較強的生成數據列。用灰色模型(GM)的微分方程作為農村電力系統單一指標(如負荷)的預測時,求解微分方程的時間響應函數表達式即為所求的灰色預測模型,對模型的精度和可信度進行校驗并修正后即可據此模型預測未來的負荷。
1.3專家系統法
專家系統是依據專門從事短期負荷預測的技術人員提供的經驗,總結出一系列的規則,并建立相應的歷史負荷和天氣的數據庫,利用if-then規則對待預測日的負荷進行估計。由于專家系統將天氣條件作為一個重要因素引入預測模型,因而預測的結果更為令人滿意。專家系統預測的優點在于較好的解決了天氣等因素對負荷的影響,有力的克服了時間序列法不能處理數據序列中出現大擾動的情況。但是這種方法過分依賴規則,如果沒有一系列成熟的規則負荷預測就無法進行,而規則本身不具有普遍適應性,預測模型不能推廣到所有的系統,這正是專家系統存在的弱點。
1.4人工神經網絡法
人工神經網絡方法是90年代以來發展起來的新方法,用人工神經網絡進行負荷預測是農村電力系統負荷預測的一個新發展方向。人工神經網絡法利用人工神經網絡(ANN),選取過去一段時間的負荷作為訓練樣本,然后構造適宜的網絡結構,用某種訓練算法對網絡進行訓練,使其滿足精度要求之后,用ANN作負荷預測。一般而言,ANN應用于短期負荷預測要比應用于中長期負荷預測更為適宜,因為短期負荷變化可以認為是一個平穩隨機過程,而長期負荷預測與國家或地區的政治、經濟政策等因素密切相關,通常會有些大的波動,而并非是一個平穩隨機過程。目前用人工神經網絡進行負荷預測還存在一些問題,比如模型結構的確定,輸入變量的選取,人工神經網絡的學習時間較長等問題。但它仍具有許多其他方法所不能比擬的優點,例如:良好的函數逼近能力,通過對樣本的學習,能夠很好的反映對象的輸入/輸出之間復雜的非線性關系。因此人工神經網絡受到許多學者的高度評價。
1.5小波分析預測技術
小波分析是Fourie分析深入發展過程中的一個新的里程碑,是本世紀數學研究成果中最杰出的代表,已成為眾多學科共同關注的熱點。一方面,小波分析發揚了Foufie分析的優點,克服了Fourie分析的某些缺點;另一方面,小波分析現在已經被廣泛應用于信號處理、圖像處理、量子場論、語言識別與合成、地震預報、機器視覺、機械故障診斷與監控、數字通信與傳輸等眾多領域。原則上講,凡是傳統方法中采用Fourier分析的地方,基本上都可以用小波分析來取代,而且其應用結果會得到深化和發展,因此小波分析作為一種多方面運用的數學工具,具有巨大的潛力和廣泛的應用前景。
農村電力系統中曰負荷曲線具有特殊的周期性,負荷以天、周、年為周期發生波動,大周期中嵌套小周期。而小波分析是一種時域或頻域分析方法,它在時域和頻域上同時具有良好的局部化性質,并且能根據信號頻率高低自動調節采樣的疏密,容易捕捉和分析微弱信號以及信號、圖像精細的采樣步長,從而可以聚焦到信號的任意細節,尤其是對奇異信號很敏感,能很好的處理微弱或突變的信號,其目標是將一個信號的信息轉化成小波系數,可以方便的處理、存儲、傳遞、分析或被用于重建原始信號,這些優點決定了小波分析可以有效地應用于負荷預測問題的研究。
1.6模糊預測法(FUZZY)
FUZZY預測,是近幾年來在農村電力系統負荷預測中不斷出現的一種預測方法,將FUZZY方法引入的原因是,農村電力系統中存在著大量的模糊信息,如負荷預測中的關鍵因素氣象狀況的評判、負荷的日期類型的劃分等信息,都是模糊的。常規方法就是采用統計和經驗相結合的方法予以處理,這給負荷預測引入了不科學因素,并且與自動化要求相矛盾,而FUZZY方法正是破解這些模糊信息的鑰匙。從實際應用來看,單純的FUZZY方法對于負荷預測的精度往往是不盡人意的,主要因為FUZZY預測沒有學習能力,這一點對于不斷變化的農村電力系統而言,是極為不利的。
2農村電力短期負荷預測研究與實現
2.1人工神經網絡原理
人工神經網絡是一種“采用物理可實現的系統來模仿人腦神經細胞的結構和功能的系統。”人工神經網絡是最近發展起來的十分熱門的交叉學科,它涉及生物、電子、計算機、數學和物理學科,有著非常廣泛的應用背景,這門學科的發展對日前和末來的科學技術的發展有重要的影響。二維的簡單人工神經網絡按網絡拓撲結構可分為兩類:前饋型網絡和反饋型網絡。反饋型網絡模型是一種反饋動力學系統,它具有極復雜的動力學特性。反饋神經網絡模型可以用完備的無向圖表示,代表性的模型包括;Hopfield網絡模型和Hamming網絡模型。反饋神經網絡模型有很強的計算能力。前饋神經網絡模型是指那些在網絡中各處理單元之間的連接都是單向的,而且總是指向網絡輸出方向的網絡模型。
2.2BP人工神經網絡算法
基于BP網絡學習規則的指導思想:對網絡權值和閾值的修正要沿著表現函數下降最快的方向――負梯度方向。
xk+1=xk-akgk (1)
其中xk是當前的權值和閾值矩陣,gk是當前表現函數的梯度,ak是學習速度。假設三層BP網絡,輸入節點,隱層節點,輸出節點。輸入節點與隱層節點間的網絡權值為,隱層節點與輸出節點間的網絡權值為。當輸出節點的期望值為時,模型的計算公式如下:
隱層節點的輸出:
yj=f(wjixi-θj )=f (netj) (2)
其中netj=wjixi-θj (3)
輸出節點的計算輸出:
zl=f(vljyj-θl)=f (netl) (4)
其中netl=vlj yj-θl (5)
輸出節點的誤差:
E=(tl-zl)2=(tl-f(vljyj-θl))2
=(tl-f(vljf(wjixi-θj)-θl))2 (6)
E=(tI-zi)2=(tI-zi)
2.3誤差函數對輸出節點求導
=?=? (7)
E是多個zk的函數。但有一個zk與vlj有關,各zk間相互獨立,其中:
=[-2(tk-zk)?]=-(tl-zl) (8)
=?=f '(netl)?yj (9)
則=-(tl-zl)?f '(netl)?yj (10)
設輸入節點誤差為δl=(tl-zl)?f '(netl) (11)
則=-δl?yj (12)
2.4誤差函數對隱層節點求導
=?? (13)
E是多個zl的函數,針對某一個wji,對應一個yj,它與所有zl有關,其中:
=[-2(tk-zk)?]=-(tl-zl) (14)
=?=f '(netl)?(-1)=f '(netl)?vlj (15)
=?=f '(netl)?xi (16)
則=-(tl-zl)?f '(netl)?vlj?f '(netj)?xi=δlvlj?f '(netj)?xi(17)
設隱層節點誤差為δj'=f '(netj)?δlvlj (18)
則:=-δj'xi (19)
由于權值的修正Δvlj,Δwji正比于誤差函數沿梯度下降,則有:
Δwji=-η'=η'δj'xi (20)
vlj(k+1)=vlj(k)+Δvlj=vlj(k)+ηδlyj (21)
δl=-(tl-zl)?f '(netl) (22)
Δθl=η=ηδl (23)
wji(k+1)=wji(k)+Δwji=wji(k)+η'δj'xi (24)
δj′=f '(netj)?δlvlj (25)
其中隱層節點誤差δj′中的δlvlj表示輸出節點的zl的誤差δl通過權值vlj向節點yj反向傳播成為隱層節點的誤差。
2.5 閾值θ也是變化值,在修正權值的同時也需要修正,原理同權值修正一樣誤差函數對輸出節點閾值求導
=? (26)
其中=-(tl-zl) (27)
=?=f '(netl)?(-1)=-f '(netl) (28)
則=(tl-zl)?f '(netl)=δl (29)
閾值修正Δθl=η=ηδl (30)
θl(k+1)=θl(k)+ηδl (31)
誤差函數對隱層節點閾值求導=??(32)
其中=-(tl-zl) (33)
=f '(netl)?vlj (34)
=?=f '(netj)?(-1)=-f '(netj) (35)
則=(tl-zl)?f '(netl)?vlj?f '(netj)=δlvlj?f '(netj)=δj' (36)
閾值修正Δθj=η' =η'δj' (37)
θj(k+1)=θj(k)+η'δ'j (38)
2.6傳遞函數f(x)的導數S型函數
f (x)=,則f ' (x)=f (x)?(1-f (x)) (39)
f ' (netk)=f (netk)?(1-f (netk)) (40)
對輸出節點zl=f (netj) (41)
f ' (netj)=zl?(1-zl) (42)
對輸出節點yj= f (netj) (43)
f ' (netj)=yj?(1-yj) (44)
3結語
基于一種新的基于人工神經網絡在農村電力短期負荷預測研究。針對BP算法中存在的收斂速度慢、易陷入局部最小值的問題,可采用附加動量法和自適應學習速率法在一定程度上解決這些問題。附加動量法是在BP算法的基礎上,在每個權值變化上加上一項正比于上一次權值變化量的值,并根據BP算法來產生新的權值變化,利用附加動量法可能會避開某些局部最小值。自適應學習速率法是在學習過程中不斷修正學習速率,有利于提高學習效率,縮短學習時間。
參考文獻
[1] 劉光中,顏科琦.組合神經網絡模型對電力需求的預測[J].數量經濟技術經濟研究,2003,(1)
篇8
摘要:旅游需求的預測預報研究一直是旅游學研究的一個重要課題。本文在對到訪澳門地區中國內地游客量分析的基礎上,運用人工神經網絡(ANN)的理論和方法,構建了ANN模型分析中的3層BP模型,以澳門近10年(1996-20__)入境來訪的中國內地旅游人數為例進行模型驗證,模擬結果表明,BP神經網絡預測的結果能夠高程度的吻合原始數據,在旅游市場預測中,BP神經網絡預測是一種有效的預測方法。一.問題的提出與分析近年來,對澳門地區的旅游業來說,中國內地旅客是旅游收入的主要來源。目前旅游業已成為澳門地區經濟發展特別是第二產業發展的支柱。建立科學的可操作的旅游預測模型是實現澳門地區旅游業持續健康穩定發展的理論基石和前提。由于影響某地旅游人數的因素各異,還不存在普遍適用的神經網絡模型。基于此,本文擬用3層BP神經網絡模型來仿真模擬分析和預測澳門地區旅游需求,以此為旅游需求預測提供一種新的方法。二.模型的假設與符號說明1.基本假設1)交通在旅游中通常不是重要的,為了研究的方便(主要是無法獲得交通數據),把交通這個影響忽略。2)假設澳門的接待能力都滿足需求。3)在本例旅游需求預測模型中,我們考慮的主要因素有:客源地的人口,客源地的總收入,客源地的消費水平,旅游目的地的生活水平。4)為了研究的方便,假定以上四因子之間相互獨立,本例旅游需求即為上述四因子的函數,即y=f(GDI,POP,GDE,M-GP)。就用這四個因素作為人工神經網絡模型輸入層的神經元。2.符號說明T澳門內地游客量GDI中國內地國民總收入POP中國內地人口總數GDE中國內地國民消費水平M-GP澳門生產總值三.模型的建立與求解1.人工神經網絡模型理論原理
人工神經網絡(ArtificialNeuralNetwork)是由大量的、簡單元件(神經元)廣泛相互聯結而成的非線性的、動態的復雜網絡信息處理系統,它是在現代神經學研究成果基礎上提出的,能模擬人腦的若干基本功能[1]。它具有并行分布的信息處理結構,可以通過“自學習”或“訓練”的方式完成某一特定的工作。它可以從積累的工作案例中學習知識,盡可能多地把各種定性或定量的因素作為變量加以輸入,從而建立各種影響因素與結論之間的高度非線性映射,采用自適應模式識別方法來完成預測工作[2]。人工神經網絡模型尤其是對處理內部規律不甚了解、不能用一組規則或方程進行描述的復雜的、開放的非線性系統顯得較為優越。人工神經網絡模型一般由處理單元、激活狀態、單元輸出、連接模式、激活規則、學習規則等6個部分組成。一個多層神經網絡中包含有很多個信息處理單元,分布于不同的層次中。根據每項輸入和相應的權重獲取一個綜合信號,當信號超過閾值則激活神經元而產生輸出。各類影響因素和最終輸出結果之間可以假定存在一種映射,即輸出結果=F(影響因素)。為了尋求最佳的映射關系F,將訓練樣本集合和輸入、輸出轉化為一種非線性關系,通過對簡單非線性函數的復合,從而建立一個高度的非線性映射關系F,最終實現輸出值的最優逼近[3]。在人工神經網絡的實際應用中,80~90的人工神經網絡是采用前饋反向傳播網絡(back-propagation-network,簡稱BP網絡)或它的變化形式。BP神經網絡(如圖一)是一種單項傳播的多層前向神經網絡,分為輸入層、隱含層和輸出層,層與層之間采用全連接方式,同一層單元之間不存在相互連接。它是前向網絡的核心部分,體現了人工神經網絡最精華的部分[4]。標準的BP網絡是根據W-H學習規則,采用梯度下降算法,對非線性可微函數進行權值訓練的多層網絡。圖一:BP神經網絡的每一層的權值通過學習來調節,其基本處理單元為非線性輸入-輸出關系,選用S型作用函數:其中:xj為該神經元第i個輸入;wij為前一層第i個神經元至該神經元j的連接權值,i=0時的權值為閾值。其計算步驟如下:(1)給定一組隨機的權值和閾值初始值及步長系數η與勢態因子α;(2)取學習樣本數據,根據學習樣本、權值及閥值計算輸出,并與學習期望輸出比較,當誤差滿足要求時結束訓練,否則將誤差向后逐層傳播,并修正各層連接權值,調整公式為:其中:k取j結點所在層的前一層所有結點。5)澳門內地旅客人數神經網絡模型的建立(一)BP網絡設計網絡設計是一個綜合性問題,它應滿足多種不同要求,例如,希望所涉及的網絡有較好的推理能力,易于硬件實現,訓練速度快等,其中有較好的推理能力是最主要的。一般來說,推廣能力決定于3個主要因素,即問題本身的復雜程度、網絡結構以及樣本量大小。在一般情況下,旅游需求預測研究中樣本的數量是一定的,因此可歸結為在樣本量一定的情況下,如何選擇網絡規模的問題。在進行BP網絡預測模型設計中,我們主要考慮以下因素:網絡的層數、每層中的神經元個數、初始值的選擇、學習速率和期望誤差。i)網絡的層數已證明:具有偏差和至少一個S型隱含層加上一個線性輸出層的網絡,能夠逼近任何有理函數。所以,本文選擇一個3層的BP網絡。ii)每層中神經元的個數輸入層和輸出層神經元的個數根據解決具體問題的復雜程度而定。為了提高網絡訓練的精度,可以通過采用一個隱含層,再加上1到2個神經元以加快誤差的下降速度即可。因此,本文輸入層神經元個數選擇為4個,隱含層神經元個數分別選擇了9、12、15個,輸出層神經元個數選擇為1個。iii)初始值的選擇由于人工神經網絡是一個非線性系統,初始值的選擇對于網絡學習是否達到局部最小、是否能夠收斂以及訓練時間的長短都有較大影響。在初始值的選擇上一般是使經過初始值加權后的每個神經元的輸出值都接近零,這樣可以保證每一個神經元的連接權值都能夠在它們的S型激活函數變化最大處進行調解。所以,初始值一般選擇在(-1,1)之間的隨機數。本文的初始值為默認值。iv)學習速率對于任何一個網絡都對應一個合適的學習速率。學習速率決定每一次循環訓練中所產生的權值的變化量。大的學習速率可以導致網絡的不穩定,但是小的學習速率又會導致訓練時間延長,收斂速度較慢,不能保證網絡的誤差能最終趨于最小。綜合上述考慮,在學習速率的選擇上傾向于選擇較小的學習速率以保證網絡的穩定性,本文選擇的學習速率為0.01。v)期望誤差值期望誤差值的確定也是通過網絡對不同誤差值分別進行訓練比較后確定的最適合值。所謂的最適合值是相對于所需要的隱含層的節點數來確定的,一個較小的誤差值的獲得需要增加隱含層的節點以及訓練時間。本文經過不斷測試,選擇0.0001為期望誤差值。(二)1.網絡訓練模式的選擇訓練網絡有兩類模式:逐變模式和批變模式。在逐變模式中,每一個輸入被作用于網絡后,權重和偏置量被更新一次。在批變模式中,所有的輸入被應用于網絡后,權重和偏置量才被更新 一次。使用批變模式不需要為每一層的權重和偏置量設定訓練函數,而只需為整個網絡制定一個訓練函數,使用起來相對方便,因此,本文在進行網絡訓練時采用批變模式。表格一:年度
澳門的內地游客量(T)(千人)中國內地國民總收入(GDI)(億元)中國內地人口數(POP)(萬人)中國內地居民消費水平(GDE)(元)澳門生產總值(M-GP)(億美元)1996604.270142.5122389278966.31997529.877653.1123626300266.71998816.883024.3124761315961.919991645.288189.0125786334659.220__2274.798000.5126743363261.020__3005.7108068.2127627386961.920__4240.4119095.7128453410668.220__5742.0135174.0129227441179.220__9529.7159586.71299884925103.320__10463183956.11307565439115.62.數據和模型的建立神經網絡模型要求數據具有:A、易獲得性B、可靠性C、可測度性。本項研究采用很可靠的官方發表的數據作為分析的數據源(見表1),主要來自于中國統計局網。用3層BP網絡模型對本例旅游需求進行模擬,根據BP網絡的映射原理,對于樣本集合X和輸出Y,可以假設存在一映射F。為了尋求F的最佳映射值,BP網絡模型將樣本集合的輸入、輸出轉化為非線性優化,通過對簡單的非線性函數的復合,建立一個高度的非線性映射關系,實現F值的最優逼近。對于本例旅游需求模型的模擬:其輸入層結點數(4個神經元):中國內地國民總收入(GDI)、中國內地人口總數(POP)、中國內地國民消費水平(GDE)、澳門生產總值(M-GP)。把澳門內地游客量(T)作為輸出結點。從而得出3層前饋反向傳播神經網絡模型。四.模型結果及分析1網絡訓練性能的檢查。不同個數的隱層單元組成的BP網絡訓練曲線如圖1,2,3所示。通過比較發現,中間層神經元個數為9和12時,網絡的收斂速度比較快。2網絡預測性能的考查。在數據列表中選取1996年到20__年的數據作為網絡的測試數據。20__、20__年的(文秘站:)游客量檢驗誤差曲線如圖4。其仿真結果令人滿意,達到預期的效果。圖1圖2圖3圖4五.模型的應用與評價(優缺點與改進)從上面的分析可以看出,3層BP神經網絡模型的仿真模擬效果是鄰人滿意的??梢钥闯觯斯ど窠浘W絡的擬合精度比較高,主要是基于人工神經網絡抗干擾能力強,穩定性好,能自動準確地找出各種輸入和輸出之間的線性或非線性關系,具有較強的模擬適應能力等特點。在本例對于澳門的內地游客量的旅游預測中BP神經網絡模型是一種有效的預測方法。這一研究方法為旅游學的定量預測研究提供了一種新的思路,也為工程實踐問題中的一些研究工作提供了一種非常好的指導方法。雖然BP網絡得到了廣泛應用,但其自身也存在一些缺陷和不足,主要包括幾個方面的問題。首先,由于學習速率是固定的,因此,網絡的收斂速度慢,需要較強的訓練時間。再次,網絡隱含層的層數和單元數的選擇尚無理論上的指導,一般是根據應驗或者通過反復試驗確定的。因此,網絡往往存在很大的冗余性,在一定上也增加了網絡學習的負擔。六.原題附帶問題簡析通過對本例旅游需求模型的分析,我們認為在利用數學建模的方法對旅游需求進行預測預報時,對于數據的采集和整理工作需要認真做好。對于數據的分析有助于我們尋求變量間的關系,以形成初步的想法。如何獲得數據以及如何獲得準確的數據對于我們研究實際問題具有相當重大的意義。收集數據并非多多益善,而是要弄清究竟需要哪些數據,剔除不必要的數據,從而減少冗余的工作。同時,需要什么形式的數據也是我們應該思考的一個問題,這與建立模型的目的和所選擇的模型的特點有關。[參考文獻][1]王士同,等.問題求解的人工智能:神經網絡方法[M].北京:氣象出版社,1995.[2]HillT,MarquezO’connorM,RemusW.ArtificialNeuralNetworkMedelsfor
ForecastingandDecisionMaking[J].InternationalJournalofForecasting,1993,
篇9
關鍵詞:BP神經網絡;農用地定級;評價
0 引言
農用地定級作為農用地分等與估價的中間環節,是在分等對農用地質量區域性差異評價的基礎上,考慮影響土地質量的自然因素和社會經濟因素,根據土地管理,尤其是耕地保護管理的需要,在一定行政區內進行的農用地質量綜合評定[1]。根據《農用地定級規程》(TD/T1005-2003),農用地定級推薦采用因素法、修正法或樣地法,在加權求和模型、幾何平均模型或復合模型求取土地評價單元總分值的基礎上,通過等間距法、數軸法或總分頻率曲線法進行土地級別的劃分。
傳統的定級方法容易受人為主觀因素影響,導致評價結果的不準確性,而人工神經網絡的評價方法具有自學習、自組織、自適應性的特點,正好可以解決此問題。人工神經網絡(Artifical Neural Network,ANN)的評價與優化功能在近幾年的地學研究中得到充分體現[2],其中BP(Back Propagatin)人工神經網絡是目前應用最廣泛的一類,該網絡在具有人工神經網絡各特點的同時,還具有構建簡單、訓練算法豐富、映射能力強等優點。本文嘗試運用 BP人工神經網絡進行農用地定級,利用這種非線性定量分析的方法不僅可以減少人為確定權重的主觀性和模糊性,同時還可以精簡評價過程。
1 研究區概況
嘉魚縣位于湖北東南部,長江中游南岸。地跨東經113°39′-114°22′,北緯29°48′-30°19′,縣境地形狹長,全境長85km,寬5.7-17.9km。地屬長江沖積平原,地面高程都在18-26m之間。屬亞熱帶濕潤型季風氣候,具有四季分明、氣候溫和、濕度較大、日照充足、雨熱同季、無霜期長等特點。境內平原與丘崗氣候亦無明顯區別。
嘉魚縣國土面積為101842.36hm2。其構成是:農用地面積74,885hm2,占總面積73.53%,其中耕地面積為32,944.26hm2,占總面積32.35%;建設用地面積10,462.7hm2,占總面積的10.27%,其中居民點及工礦用地5,254.72hm2,占總面積5.16%,未利用地16,494.66hm2,占總面積16.20%。
2 研究方法與模型
2.1 BP人工神經網絡
BP(Back Propagatin)人工神經網絡是目前世界上研究最深入、應用最廣泛的人工神經網絡模型。該網絡一般由輸入層、隱含層(或稱中間層)和輸出層三層構成;層內的單元不發生聯系,層間的單元間通過輸入數據及其對應的權重值相互連接。信息由輸入層進入網絡后,傳到隱含層單元,經過響應傳遞函數(一般取Sigmoid 函數),再傳到輸出層并計算輸出值。之后網絡將應有的輸出與實際輸出進行比較,通過反向傳播誤差,修正與基本單元相連接的各輸入量的權重,并重新計算輸出、進行比較。通過信息傳遞、輸出、比較、反饋的連續反復訓練,使模擬誤差逐步降低直至低于規定要求[4]。
2.2 建立定級模型
根據對BP人工神經網絡的分析,農用地定級評價的BP神經網絡模型結構如圖1所示:
由模型結構圖可以看出,模型由三層神經元組成:輸入層、隱含層和輸出層。其中輸入層神經元是經過標準化處理后的農用地定級評價基礎指標;輸出層神經元是農用地定級評價的結果,即農用地定級級別;而隱含層的神經元數目的多少則是對整個網絡能否正常工作具有重要意義,所以科學地、自動地確定隱含層節點數目是極其重要的。
2.2.1 確定隱含層節點數
從原理上說, 一個在輸入層上具有m個神經元,隱含層具有(2m+1)個神經元,輸出層具有n個神經元的三層網絡,可以精確地實現任意給定的連續的映射。因此,每當創建一個新的人工神經網絡模型時,可以從這(2m+1)個隱層節點入手進行篩選,根據前人經驗[6~9]可以依據以下公式進行設計:
(1)
(2)
式中:m為隱層節點數;n為輸入層節點數;w為輸出層節點數;R(10)為1~10之間的常數。
2.2.2 模型建立步驟
根據圖1所示BP網絡,可按以下步驟建立模型:
(1)確定影響因素因子并進行數據量化處理,作為網絡輸入。收集研究區內樣點資料,并進行必要的分析與檢驗,剔除不合格的樣點數據,確保樣本數據可靠。
(2)確定網絡結構,即根據評估對象特性確定隱含層節點數及各層的節點數。
(3)初始化網絡及學習參數,即將隱含層和輸出層各節點的連接權值、神經元閾值賦予某一區間的一個隨機數。
(4)提供訓練樣本。即從樣本數據中,選取一部分樣本,作為網絡學習樣本。
(5)訓練樣本經過隱含層、依權值和激活函數的作用在輸出節點算得網絡輸出值,并計算網絡輸出與樣點期望輸出間的均方差,如果均方差大于給定限差,則執行下一步(6);如小于,則返回本步,進行下一個訓練樣本訓練,直到訓練樣本集合中的每個樣本滿足輸出要求為止,即BP網絡學習完畢。
(6)從輸出層反向計算到第一隱含層,首先計算同一層節點的的誤差δ,然后按梯度法修正權值,再用修正后的各節點連接權值轉到第(5)步重新計算。
3 嘉魚縣農用地定級評價
3.1 嘉魚縣農用地定級指標體系構建
3.1.1 農用地定級影響因素分析
影響農用地定級的因素主要指對農用地質量差異有顯著影響的自然因素、區位因素和社會經濟因素[3]。
(1)自然因素:指對農用地質量有顯著影響的局部氣候差異、地形、土壤條件、水資源狀況等,主要包括溫度、降水量、蒸發量、地形部位、坡度坡向、土壤質地、土壤pH值、土壤污染狀況、地下水埋深、水源水質等。
(2)區位因素:指土地利用狀況、耕作便利條件和基礎設施條件等,主要包括灌溉保證率、排水條件、田間道路、耕作距離、田塊平整度、利用集約度、人均耕地、利用現狀等。
(3)社會經濟因素:指對農用地質量有影響的區位條件和交通條件,主要包括中心城市影響度、農貿市場影響度、道路通達度等。
不同地區,影響農用地質量的因素存在差異,在具體評估過程中,選擇定級因素應遵循以主導因素為主的原則,選擇那些對農用地質量有顯著影響的、有較大變化范圍的主要因素,盡可能舍棄那些影響弱、或與主導因素存在相關關系的因素。為了便于應用數學模型對農用地定級評價,還必須根據各因素對農用地質量的影響程度大小進行量化及相應的處理。
3.1.2 嘉魚縣農用地定級指標體系
根據以上分析,結合《農用地定級規程》(TD/T 1005-2003)中提供的農用地定級備選因素因子、統計資料與影響因素的相關性和資料收集的難易性、以及以往土地評估經驗和專家的建議,利用特爾菲法,最終確定選擇了自然因素、社會經濟因素和區位因素3個方面共10個因子指標,建立了嘉魚縣農用地定級評價指標體系,如表1:
3.2 屬性數據的標準化處理
為了統一數據量綱、提高數據可比性,并滿足BP模型對數據的要求,需要對所有因子指標進行量化,并根據需要對數據進行極差標準化處理,從而把所有數據轉化到0~1范圍內[5]。經極差標準化后的數據如表2:
3.3 定級評價過程BP網絡模擬
在嘉魚縣農用地定級評價過程中,采集的樣本數總數為163,其中訓練集樣本63個,占總數的38.7%,測試集樣本100個。利用MATLAB軟件將經過標準化處理后的10個定級因子作為樣本的輸入值,利用63個訓練樣本進行網絡學習訓練,并進行網絡隱含層神經元數的調整,最終確定隱含層神經元數為6,即網絡結構為10-6-1,程序代碼如下:
%p為樣本輸入數據;%t為目標數據
net=newff([0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1],[6 1],{'tansig' 'purelin'},'traingdx');
net.trainParam.goal=0.001;
net.trainParam.epochs=10000;
net=init(net);net=train(net,p,t);save net10 net;
網絡訓練成功,并保存網絡。將測試樣本輸入訓練好的網絡中,輸出定級結果。神經網絡輸出的結果是定級評估的量化值,而不僅是級別,級別內部差別也可得到體現。如表3:
3.4 試驗結果與分析
根據神經網絡計算出的評價值,可將嘉魚縣農用地分為5級。一、二級地分別占總面積的16%和15%,分布在全縣的東南部地勢較平緩的平原地區;三級和四級地分別占總面積的31%、35%,主要分布在全縣的西北崗地區;五級地占總面積的3%,主要為自然條件和灌溉條件差、利用率低的地區。評價結果與嘉魚縣實際情況基本相符,該結果反映出嘉魚縣農用地低等級別地較多,占農用地總面積的六成以上。也間接反映出近年來,耕地質量下降的問題。
4 結論
盡管BP神經網絡有其自身的弱點,還有待進一步的完善。但由于神經網絡具有自身適應能力,排除了很多人為的干擾因素,從而能對農用地定級給出一個客觀的評價。并且,人工神經網絡還可以精簡評價過程,為評價工作減少不必要的冗余。通過BP網絡在嘉魚縣農用地定級評價中的應用,與嘉魚縣實際情況是基本相符合的,證明了該方法還是具有很強的實際應用價值的。
參考文獻:
[1] 金曉斌,張鴻輝.基于模糊ISODATA聚類方法的農用地定級研究[J].農業工程學報,2008,24(7):82-85.
[2] 朱紅梅,周子英.BP人工神經網絡在城市土地集約利用評價中的應用――以長沙市為例[J].經濟地理,2009,29(5):836-839.
[3] TD/T1005-2003.農用地定級規程[S].
[4] 張蓬濤,楊紅.基于神經網絡的基準地價預測模型研究--以河北省主要城市為例[J].中國土地科學,2000,14(5):32-35.
[5] 劉耀林,焦利民.土地評價理論、方法與系統開發[M].北京: 科學出版社,2008:213-223.
[6] 趙霈生,陳百明.在土地評價中應用人工神經網絡專家系統的理論與實踐[J].中國土地科學,1998,12(2):28-34.
[7] 周開利,康耀紅.神經網絡模型及其MATLAB仿真程序設計[M].北京:清華大學出版社,2005:89-100.
篇10
關鍵詞:戒備率評估;數據庫技術;人工神經網絡;混合編程
中圖分類號:TP311文獻標識碼:B
文章編號:1004-373X(2010)04-141-04
Design and Implementation of Readiness Rate Evaluation System for Missile Weapon System
LU He,WANG Hongli,YIN Dejin
(The Second Artillery Engineering College,Xi′an,710025,China)
Abstract:The readiness rate is an important index to tactics and technology of missile weapon system,evaluation and analysis can provide an important decision-making criterion to research and operation of missile weapon system.To get the readiness rate quickly and accurately,the readiness rate evaluation system for missile weapon system is developed based on C#.NET,database technique which has high security and efficiency is used to manage the information that is needed in evaluation,evaluation method of artificial neural network is used in this system,the technology of combination programming is used to do the evaluation of readiness rate.This system realizes the rapid evaluation of readiness rate of missile weapon system and it can also analye the effect of different factor on readiness rate quantitatively,it has important practical significance to the study of evaluation technology of readiness rate.
Keywords:evaluation of readiness rate;database;artificial neural network;combination programming
0 引 言
導彈武器系統的戒備率指處于戒備狀態下導彈數與該導彈總數的比值[1]。通過分析評估導彈武器系統的戒備率,能夠完整地掌握武器系統戒備作戰的能力,從而為導彈武器系統的研制和作戰使用提供重要決策和依據。
導彈武器系統作為一個復雜系統,其戒備率受到可靠性、維修性、保障性、戰場環境、人為因素、生存能力等因素的綜合影響,所以導彈武器系統戒備率的評估難度大,時間長?,F代戰爭的各種因素的變化很快,如何快速準確地得到導彈武器系統的戒備率,為導彈武器系統的作戰使用提供決策依據,是戒備率評估發展研究的方向。在此,利用發展成熟的數據庫技術,結合人工神經網絡的評估方法,開發出了導彈武器戒備率評估系統,降低了評估的難度,縮短了評估的時間,能夠根據戰場形勢的變化快速準確地完成戒備率的評估,對戒備率評估技術的研究有十分重要的現實意義。
1 系統的總體設計
1.1 任務需求
根據影響導彈武器系統戒備率各項要素的物理特性以及它們之間的關系,以作戰想定、任務剖面和評估條件為基礎,快速準確地得到導彈武器系統技術陣地、待機陣地、發射陣地、導彈和導彈武器系統的戒備率評估值;進行導彈武器系統全壽命周期內不同任務剖面下的戒備率評估;通過數據庫實現數據的規范化管理,方便地進行信息查詢。
1.2 系統結構
導彈武器戒備率評估系統的設計目的是完成導彈武器系統戒備率評估任務及其評估數據的管理,整個系統的框架采用模塊化設計,主要分為系統管理模塊、戒備率評估模塊、數據庫模塊、接口模塊、幫助模塊。系統結構如圖1所示。
圖1 系統結構框圖
1.3 系統功能
系統中五個模塊的具體功能如下:
系統管理模塊 完成用戶登陸的身份驗證。將操作人員分為管理員,評估人員,查詢人員。管理員可以完成添加刪除用戶、設定用戶權限、查詢和修改導彈數據庫等操作;評估人員能夠查詢相關型號數據庫,進行戒備率的評估,將數據寫入數據庫;查詢人員可以查詢相關的導彈參數。
戒備率評估模塊 它是系統的主要組成部分。完成評估參數的輸入;對不同量綱的指標采用歸一化的方法將其標準化,將評估參數處理為神經網絡的訓練樣本;調節神經網絡的參數使之達到評估目標;對評估結果進行分析、存貯、打印等。
數據庫管理模塊 主要完成數據的管理?!皩椢淦髻Y料”用于管理所要評估導彈系統的各項指標數據,允許管理員用戶建立新的導彈型號數據庫;“評估結果”用于管理評估結果,可以將本次的評估數據寫入導彈武器資料庫作為訓練樣本,并可以記錄達到評估目標所采用的神經網絡參數,作為以后評估的參考。
接口模塊 完成不同模塊之間的數據交換?!皵祿旖涌凇蓖瓿蓪祿斓牟僮?“Matlab接口”完成對Matlab引擎的調用。
幫助模塊 為用戶提供系統幫助及使用說明。
2 關鍵技術
導彈武器戒備率評估系統涉及多種型號的導彈武器系統評估,在準確性、安全性、快速性、可操作性上有較高的要求。因此在開發的過程中涉及的關鍵技術主要有:人工神經網絡評估方法、數據庫技術、混合編程技術。
2.1 人工神經網絡評估方法
導彈武器的戒備率評估涉及到大量不確定的因素,為了進行評估,從系統分析著手,采用層次分析法分析了影響導彈武器系統進入戒備狀態的主要因素,并廣泛征求專家意見,得到戒備率評估的指標體系,即戒備率的評估模型。
評估的模型與方法之間呈現相互支持、相互依賴的關系[2]。一方面,評估中得到的數據要由評估模型來處理;另一方面,評估模型的評估方法在運用中得到體現。常用的評估方法主要有[3]:層次分析法(AHP)、模糊綜合評判法、ADC法、SEA 法、指數法、人工神經網絡評估法等。
依據導彈武器系統的復雜性,要求評估方法必須具備強大的處理非線性運算的能力;指標體系中某些參數獲取的困難性,要求評估方法能夠并行地處理模糊數據和精確數據;執行任務的條件具有多變性,要求評估方法有自適應性。由于戒備率評估的如上特點,系統選用了人工神經網絡的評估方法。因為人工神經網絡是一個非線性自適應系統,從理論上講,能夠以任意精度逼近任意復雜的非線性函數[4],自身具有一定的“學習”和“進化”能力,可以克服系統環境和各項指標的不斷變化,使戒備率評估的知識庫不斷的完備更新,獲得最佳的評估效果。
人工神經網絡評估的原理如下:首先將評估的指標進行歸一化處理,將其處理成可供神經網絡訓練的輸入樣本,在部隊進行戰備等級轉換時得到相應條件下導彈武器系統實際戒備率作為神經網絡的輸出,用足夠多的樣本訓練網絡,使網絡獲取各項指標對戒備率的影響程度以及專家的知識經驗。訓練好的神經網絡可以根據評估對象的各項指標屬性值,再現出專家的知識經驗及不同指標對戒備率的影響程度,實現定性與定量的有效結合。
訓練樣本的獲取是人工神經網絡評估方法實現的關鍵,在戒備率的底層評價指標中,有的可以用確定的表達式描述(如可靠性),通過數值計算得到精確的數值結果;而有些指標只能通過定性的評估(如人員反應能力),這些數據采用德爾菲法獲得。對于定量指標,其性質和量綱也不相同,可以將定量指標分為三種類型[5],即越大越好型、越小越好型和具有最佳值型。由于各種指標的量綱和性質不同,造成各指標的不可共度性,指標需進行合理的歸一化處理,首先必須建立諸因素與戒備率的隸屬函數,以不同因素的隸屬作為神經網絡的輸入值,將各輸入單元歸一化到(0,1)的區間內[6] 。
2.2 數據庫技術
導彈武器系統是一個復雜系統,對其進行戒備率評估所需要的訓練樣本數據以及在評估過程中產生的中間數據量較大,并且要求數據處理的安全性很高。為了提高數據處理的效率,保證數據的安全,選用了數據庫技術。數據庫技術是針對數據組織和管理的技術,數據庫方式數據處理的整體化、信息化、隱藏化、安全化等特點使數據的分析和評估簡單易行。
應用程序對數據庫的訪問采用接口??梢杂行У貜臄祿斓牟僮髦袑祿脑L問分解為多個單獨使用或串聯使用的連續組件[7],通過可以方便地完成對數據庫的復雜操作。
由于部隊實際條件的限制,系統可能無法遠程訪問數據庫,所以在數據庫的訪問上采用兩種方案。
第一種方案是客戶端可以遠程訪問服務器,其連接字符串為:
"Provider=SQLOLEDB;Persist Security Info=True;Data Source=SQLName;Initial Catalog=DbaseName;User Id=ID;Password =PWD;"
第二種方案是客戶端不能遠程訪問服務器,其連接字符串為:
"Data Source=.\\SQLName;AttachDbFilename =|DataDirectory|\\DbaseName.mdf;Integrated Security=True;User Instance=True"
其中:Data Source為SQL服務器名稱;Initial Catalog為數據庫名稱;AttachDbFilename為數據庫的相對路徑。當客戶端不能遠程訪問服務器時,需要在安裝文件中添加數據庫。
2.3 混合編程技術
系統的用戶界面是采用.NET平臺下C#開發的,.NET平臺是微軟公司推出的一種面向網絡,支持各種終端的開發環境平臺。利用該平臺開發的系統具有界面友好,執行速度快,易于維護等特點,可以生成可執行文件,保護算法和數據,具有較好的安全性。但是它對數學計算的支持不夠,文中所采用的人工神經網絡的算法用其實現較為復雜,而Matlab是一套高性能的數值計算和可視化軟件,具有專門的神經網絡工具箱,內含大量可以設計神經網絡模型[8],通過C#.NET設計用戶界面,Matlab實現后臺算法,提高了編程的效率。C#.NET與Matlab的接口主要有以下幾種[9],即利用Matlab自身的編譯器Matlab Complier,利用COM或NET技術,利用C-MEX、利用Mideva的平臺、利用Matlab的引擎技術。其中,只有Matlab引擎技術支持調用神經網絡工具箱,所謂Matlab引擎技術指Matlab提供的接口函數。通過這些接口函數,C#.NET可以完成對Matlab通過引擎方式的調用。戒備率評估系統會打開一個新的Matlab進程,可以控制它調用神經網絡工具箱,完成戒備率的評估。C#.NET調用Matlab引擎技術實現神經網絡的過程如圖2所示[10]。
在C#.NET編程環境中,使用Matlab引擎,首先需要安裝Matlab軟件;然后添加COM,引用“Matlab Application Type Library”;之后就可以實例化引擎對象。因為.NET語言與Matlab語言的數據類型不同,為了完成兩種數據的自動交換,還需要添加對MWArray類庫的引用。數據的交換主要采用Matlab引擎提供的三個接口:Execute,PutFullMatrix,GetFullMatrix;分別實現運行腳本,向Matlab Server中添加矩陣,從Matlab Server中讀取矩陣的功能,通過上述三個接口函數就可以完成.NET對Matlab引擎的調用。
圖2 C#.NET調用Matlab引擎技術實現神經網絡
由于神經網絡的初始參數是由經驗推斷的,很難滿足精度的要求,需要根據訓練的效果進一步調整。為了能夠輔助評估人員快速找到最佳參數,系統采用如下的解決方案:在諸多參數調解中,隱層神經元個數和學習步長這兩個參數對評估的效果影響最大,首先由評估人員根據經驗給定兩個參數的區間,以及迭代的步長,由系統逐次迭代選擇相對最優值,而后在其附近減小迭代的步長,進行進一步優化,如果誤差較大,調整參數直至達到評估要求。
2.4 系統實現
為了實現這些功能,系統編程語言選用C#.NET,數據庫采用Microsoft SQL Sever 2005,利用對數據庫進行訪問,通過Matlab引擎技術完成對神經網絡工具箱的調用,程序流程如圖3所示。
圖3 程序流程圖
達到神經網絡的評估目標后,將網絡結構參數保存到數據庫,得到不同時間節點戒備率的評估值。為了更直觀地顯示戒備率的變化情況,系統采用圖形設備接口(GDI+)繪制出戒備率的實時變化圖,系統運行效果如圖4所示。
圖4 運行效果圖
3 結 語
戒備率評估系統的開發主要考慮幾個方面的問題,易用性、快速性與準確性。該系統采用C#.NET開發的用戶交互界面,界面友好,操作簡單方便;采用數據庫技術保證了數據管理的效率和安全性;利用人工神經網絡的評估方法,可以最大程度地適應評估環境的變化,得到準確的評估值;調用Matlab神經網絡工具箱,提高了編程的效率,簡化了評估的程序,縮短了評估的時間。該系統不僅可以為指揮員的作戰決策,導彈的作戰使用提供參考依據,還可以作為新型導彈研制的輔助工具。
參考文獻
[1]朱坤嶺,汪維勛.導彈百科辭典[M].北京:宇航出版社,2001.
[2]李志猛.基于SEA的效能評價方法研究[D].長沙:國防科學技術大學,2003.
[3]牛作成,偉,雷磊.軍事裝備的評估方法探究[J].電光與控制,2006,13(5):98-101.
[4]朱大奇,史慧.人工神經網絡原理及應用[M].北京:科學出版社,2006.
[5]高彬,郭慶豐.BP神經網絡在電子戰效能評估中的應用[J].電光與控制,2007,14(1):69-71.
[6]王杰貴,崔宗國.雷達干擾決策的模糊綜合評估[J].電子對抗,1997(1):22-28.
[7]繆勇,李新峰,付志濤.Visual C#學習筆記[M].北京:電子工業出版社,2008.
[8]董長虹.Matlab神經網絡工具箱與應用[M].北京:國防工業出版社,2005.