神經網絡基本原理范文
時間:2023-06-01 10:42:32
導語:如何才能寫好一篇神經網絡基本原理,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
【關鍵詞】BP神經網絡;預測;誤差
1.引言
許多金融學家和計量學家對發達國家成熟市場的波動性進行了廣泛的研究,但是在對股市的預測上,由于人們在知識、能力、經驗上存在著較大的差異,加之問題本身又具有很大的隨機性和高度的非線性,即使是一些金融專家、炒股高手對出現的同一復雜行情進行分析,往往也會得出不同的結論。此外,傳統方法還要事先知道各種參數,以及這些參數在什么情況下應作怎樣的修正。這都給預測股市帶來一定的困難。
基于以上股市預測的困難性,本文提出了人工神經網絡的預測方法。隨著計算機、人工智能尤其是專家系統的發展,人工神經網絡技術逐漸成熟并開始應用于各個領域。人工神經網絡(ANN,簡稱神經網絡)作為一種由大量簡單神經元廣泛相互聯接而成的非線性映射或自適應動力系統,恰好能有效解決股市預測處理中常見的困難,因此它很快在股市預測分析與處理領域得到了廣泛的應用。
2.BP神經網絡介紹
2.1 BP 網絡算法的基本原理
2.1.1 標準的BP 網絡算法的基本原理
BP(Back Propagation)網絡是反向傳播的多層前饋式網絡,是目前使用最為廣泛的一種人工神經網絡。它的核心是BP算法,一種對于多基本子系統構成的大系統進行微商計算的嚴格而有效的方法,采用最小均方差學習方式。BP 神經網絡的原理說到底就是給它一些輸入變量,然后就有一個輸出,輸出值的情況與實際的情況進行比較,差多少,然后再進行網絡的內部調整,屬于有導師的學習規則,使得網絡輸出與實際逼近。
神經網絡能學習和存貯大量的輸入―輸出模式映射關系,而無需事前揭示描述這種映射關系的數學方程。人工神經網絡由非線性函數組成,而由一系列不同權重的線性過濾器組合而成:
2.1.2 BP網絡算法的優化
由于常用的BP算法主要缺點為收斂速度慢,局部極值,難以確定隱含層和隱含層的個數,使得在實際應用中BP算法很難應用,因此,出現了許多改進算法。BP算法的改進主要有兩種途徑,一種是采用啟發式學習方法;另一種則是采用更有效的優化算法,本文采用了動量法和學習率自適應調整的策略,從而提高了學習速度并增加了算法的可靠性。動量法降低了網絡對于誤差曲面局部極值的敏感性,有效地抑制了網絡陷于局部極小。
2.2 BP神經網絡的模型識別及步驟
模式通常指對事物的一種定量描述或結構描述,“識別”是指對客觀事物按其物理特征進行分類。模式識別的基本原理就是從待識別對象和理想標本之間若干特征的相似性推斷它們之間總體的相似性。BP神經網絡模式識別過程分為訓練階段和模式分類階段,分為初始化、數據與處理、網絡訓練以及模式分類四個步驟。以下利用實證分析來進行著四個步驟。
3.實例分析
下面以上證的某股600個交易日的股票價格收盤指數作為原始樣本數據,對上述神經網絡模型進行求解,預測20天的收盤價,與實際收盤價進行比較,并求出其誤差:
式中,表示第日的實際收盤指數,表示第日的預測值,表示誤差。主要按照如下幾部分來處理:(1)準備600個數據的時間序列,進行歸一化。BP神經網絡中每個神經元的輸出值由傳遞函數Sigmoid函數來計算,其輸出值的范圍是(0,1);(2)留出最后20個數據,作為預測檢驗使用;(3)繪制圖像,包括實際值和預測值,能量函數;(4)分析實際和預測兩曲線的趨勢。
采用I-J-K學習模型,該模型是輸入層I個神經元,隱層J 個神經元,輸出層K個神經元。利用BP神經網絡模型訓練500次、800次、1000次的輸出值和期望值以及能量函數(或者叫誤差函數)E,結果見圖1到圖3。
通過上面的圖示,可以看到用BP神經網絡預測的效果比較明顯,這說明該模型適用于短期預測嗎,股市的波動在很多地區都是非常劇烈的,各種因素的綜合作用也使得長期股指的變動具有極大的不確定性,使得預測變得很困難。而BP網絡的算法原理和自學習的特點使其能夠充分挖掘出隱含在樣本數據中的規律性,實現從輸入空間到輸出空間的非線性映射,對樣本數據進行精確的擬合。從而BP神經網絡的方法對于股市上的一些很難看出規律的數據列的預測而言,無疑是一個比較精確的預測方法。
4.結論
本文介紹了股市的特點以及股市預測的困難性,提出了利用BP神經網絡的方法來解決股市預測問題。文章介紹了BP神經網絡算法的基本原理,BP神經網絡算法的優化,BP神經網絡模型識別及步驟,最后后以上海證券交易所每日股票價格收盤指數為分析對象,把原理應用于實際,利用BP神經網絡對股票價格收盤指數進行了短期預測,并計算出預測值和實際值的誤差。通過實驗發現該模型收斂速度快,預測精度非常高,對預測短周期內股指波動具有較強的適用性。
參考文獻
[1]高琴.人工神經網絡在股市預測模型中的應用[J].微電子學與計算機,2007年第24卷第11期.
[2]周翠紅,路邁西.線性回歸與人工神經網絡預測煤炭發熱量[J].煤炭科學技術,第37卷第12期.
[3]尹慶雙,奉瑩.人工神經網絡在第三產業就業分析中的應用[J].人口與經濟,2009年第6期.
[4]鄒文安,劉寶,姜波,楊春生.基于Excel 技術平臺人工神經網絡BP模型及應用[J].水文,第30卷第1期.
[5]康進,劉敬偉.非參數回歸估計與人工神經網絡方法的預測效果比較[J].統計與決策,2009年第23 期.
[6]楊本昭,田耕.基于人工神經網絡的客戶價值分類研究[J].科技管理研究,2007年第12期.
篇2
【關鍵詞】故障診斷;基本原理;神經網絡;實際應用
引言
電梯在實際生活中出現不正常運行、停運等故障是在所難免的,而作為高層建筑中主要的垂直交通工具如果不能及時準確的查明故障原因并維修往往會給乘客帶來巨大的生命威脅。只有保證電梯的安全運行,及時的發現故障并解決故障,才能夠為乘坐電梯的乘客提供合格的安全保證。目前,國內在用的電梯缺乏完善的故障診斷系統,僅僅依靠維修技術人員的經驗以及簡單的診斷儀器已經不能夠及時的解決復雜的電梯故障問題。神經網絡技術可以應用于復雜多模式的故障診斷并且既可以用于實時監測也可以進行離線診斷,在系統模式非常復雜或者根本不知道系統模式的情況都可以應用,這些特點恰恰解決了傳統方法中最最難以解決的問題。因此必須加快神經網絡技術應用于診斷電梯故障的步伐,形成完善的故障診斷系統,才能更及時準確的查明故障原因進一步及時的解決問題,保證乘客的人身安全。
一、電梯的運行原理和電梯故障的特點
只有清楚地了解電梯控制系統的運行原理才能夠及時準確的診斷出電梯故障原因,因此清楚的了解電梯運行原理,每一個電梯維修人員必須要做到。電梯運行過程總體上可分為以下幾個階段:第一、登記層外召喚信號和登記內選指令階段;第二、電梯門關閉或者電梯按照系統指令停運階段;第三、啟動階段;第四、在到達信號記錄的樓層前進行減速制動;第五、平層開門階段。在整個過程中電梯需要從外界接收信號并處理,然后完成相應的指令或者輸出信號,由此可以將電梯看作是一個完整的獨立的系統,只需要外界給予相應的信號就可以自動的做出動作。電梯系統內部復雜的構件緊密的結合在一起,正是如此才使得電梯系統故障具有了復雜性、層次性、相關性以及不確定性的特點。
二、神經網絡技術基本原理
生物學上的神經是由一個個簡單的神經元相互連接進而形成了復雜的龐大的神經系統,同理,神經網絡就是由大量簡單的處理單元相互連接形成的復雜的智能系統。單獨的處理單元類似于一個神經元,是一個可以接受不同信息但是只輸出一種信息的結構單位。神經網絡系統與生物學神經系統相似的是具有自我修改能力,它可以同時接收大量的數據并進行統一的分析處理,進而輸出相應的處理結果。這就使得神經網絡系統具有了高度容錯性、高度并行性、自我修改性、學習性以及高度復雜性,也正是由于這些特性才使的利用神經網絡技術能夠及時準確的查明電梯故障原因并得出故障解決方案。電梯故障診斷中應用的神經網絡模型分為三個層次:輸入層、接收外部信號或者是電梯自我檢測信息(如載重信息);隱含層、對接收到了大量數據進行相應的分析處理;輸出層、將記錄著動作命令的數據傳送出來。在電梯出現故障時,首先可以通過神經網絡模型快速確定故障發生在哪一層達到節約時間的目的。但是神經網絡也會因為收斂速度過于慢、訓練強度太大或者是選擇的網絡模型不好等問題導致診斷結果受到影響。
三、神經網絡模型在電梯故障診斷中的應用分類
神經網絡模型已經成為了如今電梯故障診斷中應用最廣泛的技術模型,相比于傳統方式它具有診斷速度快、故障原因命中率高的優點,因此引起了各方面專業人士的強烈關注,并在他們的不懈努力下得到了發展與創新。它跨越多個專業領域、通過對各種復雜的高難度工作的不斷的發展與改進出現了越來越多的應用模型,下面主要介紹了當前應用最普遍的BP網絡模型,并且簡單的引入并介紹了近年來新興的模糊神經網絡模型和遺傳小波神經網絡模型。
(一)BP網絡模型
BP神經網絡作為神經網絡應用最廣泛的一種,它多應用的誤差反向傳播算法使其在模式識別、診斷故障、圖像識別以及管理系統方面具有相對先進性。基于BP網絡的電梯故障診斷技術就是通過學習故障信息、診斷經驗并不斷訓練,并將所學到的知識利用各層次之間節點上的權值從而表達出來。BP網絡系統的主要診斷步驟主要可以分為三步。第一步:對輸入輸出的數據進行歸一化處理,將數據映射到特定的區間。第二步:建立BP網絡模型,訓練BP網絡模型。第三:通過已經訓練好的網絡模型對原來的樣本進行全面的檢測。算法步驟:a、在一定的取值范圍內對數據進行初始化;b、確定輸入值數值大小,計算出預期輸出量;c、用實際輸出的值減去上一步得到的數值;d、將上一步得到的誤差分配到隱含層,從而計算出隱含層的誤差;e、修正輸出層的權值和閾值,修正隱含層的權值;f、修正隱含層的閾值,修正隱含層和輸入層的權值。
(二)遺傳小波神經網絡模型
遺傳算法運用了生物界的優勝劣汰、適者生存的思想對復雜問題進行優化,適用于復雜的故障,起到了優化簡化問題的作用。對局部數據進行詳細的分析是小波法最大的特點,所以它被譽為“數字顯微鏡”。遺傳算法小波神經網絡就是運用小波進行分解的方法分解模擬故障信號,將得到的數據進行歸一化,將歸一化后的數值輸入到神經網絡模型中。它融合了神經網絡、小波分析和遺傳算法三者所有的優點。基于遺傳小波神經網絡的電梯故障診斷的一般步驟為:測試節點信號采樣、小波分解、故障特征量提取、歸一化得到訓練樣本集、遺傳算法優化、得到故障類型。遺傳小波神經網絡模型在故障原因復雜、數據信息量巨大的電梯系統的應用中能夠發揮更大的作用。
(三)模糊神經網絡模型
模糊神經網絡模型就是創新性的將神經網絡與模糊理論結合到一起。它采用了廣義的方向推理和廣義的前向推理兩種推理方式。與其它兩種模型不同的是,它的語言邏輯、判斷依據和結論都是模糊的。但是它的數據處理能力還有自我學習能力并沒有因此而變差,反而更加豐富了它的定性知識的內容。在處理實際問題的過程中,首先要建立所有可能發生的故障的完整集合,其次將所有的故障發生原因歸入到同一個集合中去,最后就是建立故障和原因的關系矩陣。分別叫做模糊故障集、模糊原因集、模糊關系矩陣。相較于BP網絡模型,這種模型更加的簡單易行,充分發揮了神經網絡和模糊邏輯的優點,不會因為故障原因過于復雜而失去診斷的準確性,在原本豐富定性知識和強大數據處理能力的基礎上具有了很大的自我訓練能力。
結語
綜上所述,神經網絡技術可以應用于復雜多模式的故障診斷并且既可以用于實時監測也可以進行離線診斷,在系統模式非常復雜或者根本不知道系統模式的情況都可以應用,這些特點恰恰解決了傳統方法中最最難以解決的問題,它的應用提高了電梯故障的診斷速度和準確度,保證了電梯運行的安全性。雖然神經網絡技術的優點很多,但是在實際生活中的應用還很少,因此還需要不斷的進行改進完善。同時還要注意將集中診斷方法融合到一起,例如穩重提到的模糊神經網絡模型和遺傳小波神經網絡模型都是集成應用的典型代表。
篇3
關鍵詞:城區土壤;重金屬污染;遺傳算法;BP神經網絡
中圖分類號:X53 文獻標識碼:A 文章編號:0439-8114(2013)03-0685-03
重金屬污染是全球環境污染的突出問題,隨著社會和經濟的發展,重金屬污染危害日益加重。研究重金屬污染的分布,并根據分布情況實現對污染源的定位對于有關部門進行及時的環境預防與整治具有重要意義[1]。
近年來興起的人工神經網絡能通過學習實例集自動提取“合理的”求解規則,且具有容錯和容差能力以及一定的推廣能力。本研究建立基于并行遺傳算法的BP神經網絡系統,該模型可以實現對污染源位置的定位,從而為相關部門及時進行環境整治提供了理論依據。
1 構建基于遺傳算法的BP神經網絡模型
1.1 BP神經網絡基本原理
BP神經網絡是在對復雜的生物BP神經網絡研究和理解的基礎上發展起來的,因此具有較強的信息處理能力,對復雜的問題具有適應和自學的能力,可以很好地協調多種輸入信息的關系[2]。BP神經網絡通常由輸入層、若干隱含層和輸出層組成,每層都包含若干神經元,通過神經元之間的相互作用來完成整個網絡的信息處理。其網絡拓撲結構如圖1。同一層各神經元相互沒有連接,相鄰層的神經元通過權實現全連接。
1.2 BPANN算法改進
普通的BP神經網絡有自身的缺陷,包括易陷入局部最小點、收斂速度慢、學習過程容易出現震蕩等。為了改進普通的BP神經網絡,引入遺傳算法(Genetic algorithm,GA)。遺傳算法是一種基于自然選擇和基因遺傳學原理的優化搜索算法,它將“優勝劣汰,適者生存”的生物進化原理引入待優化參數形成的編碼串群體中,按照一定的適配值函數及一系列的遺傳操作對個體進行了篩選,從而使適配值高的個體被保留下來,組成新的群體,新群體中包含上一代的大量信息,并且引入新的優于上一代的個體。這樣的周而復始,群體中的適應度不斷提高,直到滿足一定的條件為止,其基本原理如圖2[3]。
遺傳算法與神經網絡算法的結合就是利用GA優化網絡的拓撲結構,如網絡層數和每層的節點數,以及各層節點間的連接關系。根據某些性能評價準則(如學習速度、泛化能力或結構復雜程度等)搜索結構空間中滿足問題要求的最佳BP神經網絡。基于遺傳算法的神經網絡流程如圖3。
2 模型應用實例——以青島市城區土壤重金屬污染源的定位為例
青島是中國重要的經濟中心城市和港口城市,是中國重要的外貿口岸之一、國家歷史文化名城和風景旅游勝地,作為體現青島面貌的首要因素——環境,已成為青島、中國乃至世界大眾關注的問題。因此,對青島的城市環境地球化學研究勢在必行。
現以青島市城區為例,根據從城區采樣得到的土壤重金屬含量數據建立神經網絡模型,對污染源進行定位。對青島市南區、市北區、四方區、李滄區、嶗山區5個城區進行了廣泛的土壤地質調查,將所考察的城區按照每平方公里1個采樣點對表層土進行取樣,共得到319個采樣點,并分別檢測每個采樣點的8種重金屬Cd、Cr、Cu、Hg、Ni、Pb、Zn和As的含量[4]。
對每種金屬元素進行多次基于遺傳算法的BP神經網絡模擬后,在所得的數據矩陣中隨機選取200個點對應的坐標進行繪圖,繪圖結果如圖4。從圖4中可以看出,每種重金屬元素在城區中的空間分布,對數據中每種金屬元素的空間坐標進行K-means聚類,所得的聚類中心即為污染源預測位置。
3 小結
通過建立基于遺傳算法的BP神經網絡模型,并將該模型運用于青島市城區內各種重金屬污染源的定位。使得環境管理部門可以在目標地區的土壤進行采樣分析的基礎上,利用該算法得出目標地區內重金屬元素的分布圖,根據極大值點可以定位污染源,并由此采取相應的管理措施。該算法的優越性在于可利用部分測量數據估計整體地區的分布情況,但同時也存在不足之處,一是數據獲取困難,一般需要依靠衛星測量獲取樣本數據,二是算法雖然有較高的收斂速度,但缺少動態性,無法進行金屬元素的動態分析和分布變化預測。
參考文獻:
[1] 馬旺海,曹 斌,楊進峰,等.城市重金屬污染特征[J]. 中央民族大學學報(自然科學版),2008,17(1):66-73.
[2] 盧文喜,楊忠平,李 平,等.基于改進BP算法的地下水動態預測模型[J].水資源保護,2007,23(3):5-8,59.
篇4
關鍵詞:變壓器;故障診斷;蟻群算法;神經網絡
作者簡介:彭宇(1979-),女,北京人,華北電力大學經濟與管理學院碩士研究生,北京市電力公司順義供電公司,工程師。(北京
102206)
中圖分類號:TM407 文獻標識碼:A 文章編號:1007-0079(2013)23-0225-02
電力變壓器作為電力系統中最重要和最貴重的設備,其運行的安全性與電網供電可靠性有直接關系。所以,電力變壓器的故障診斷技術一直都是研究的焦點,傳統的故障診斷方法主要是根據變壓器油中溶解氣體的組成、含量與故障類型和故障嚴重程度之間有密切關系的原理而得出的,俗稱油中溶解氣體分析法(DGA法)。基于DGA法得出的實用性算法中應用最為廣泛的是三比值法。該方法通過計算C2H2/C2H4,CH4/H2,C2H4/C2H6三種比值,根據已知的編碼規則和故障類別,查表確定故障類別。但此方法存在“編碼盲區”問題,即有時會出現“無編碼”問題的情況。由于上述缺陷,有學者在此方法基礎上發展出了專家系統、模糊數學、人工神經網絡等方法來判別變壓器故障,取得了一些成效,但都有或多或少的不足之處。專家系統在辨別變壓器故障時往往具有復雜性、不完全性、模糊性;模糊數學在處理故障診斷時隸屬函數確定困難,容易過多引入人的主觀臆斷;人工神經網絡在學習過程中收斂慢,對初始設置較敏感且容易陷入局部最優。
本文基于DGA法知識,提出蟻群神經網絡作為診斷變壓器故障的新方法。該方法利用了人工神經網絡映射非線性能力和泛化能力強等優點,同時利用蟻群優化(ACO)算法來改善其存在的缺點,使變壓器的故障診斷準確率和快速性都得到了提高,通過算例仿真驗證了方法的高效性和正確性。
一、蟻群優化(ACO)算法基本原理
ACO算法是一種模擬螞蟻群體在尋找食物時能找到距食物最短路徑的仿生隨機搜索算法。蟻群中每個螞蟻個體間不直接通信,而是通過在其經過的路徑上留下一種叫“信息素”的分泌物來引導其他個體的行為,某條路徑上經過的螞蟻越多,留下的信息素也越多,后來的螞蟻被吸引到該條路徑上的概率也就越大。這樣,通過先行者的先驗知識傳遞給后來者,將最終導致最優路徑選擇成功。
二、神經網絡中ACO算法的模型
本文針對BP神經網絡在訓練中存在的對初值設置較敏感、收斂速度慢和容易陷入局部最優等缺點,利用ACO算法的全局優化和啟發式尋優特征來尋找BP神經網絡的最優權值,使得神經網絡能夠具有更加優越的智能尋優能力。
1.基本原理
神經網絡的訓練過程可以看作是一個找到一組最優的權值組合的優化問題。這組最優的權值組合可使得BP神經網絡的輸出結果與期望結果間的誤差最小。
因為TSP問題是蟻群算法成功解決了的經典問題,所以此處采用神經網絡權值的尋優問題與TSP問題同比對照來說明權值組合的尋優過程。
假設網絡中有n個參數,包括所有權值和閾值。首先,按一定順序對這些參數進行排列,記為h1,h2,…hn,對于參數hi(1≤i≤n),將其設置為N個隨機非零值,形成集合Shi(1≤i≤n)。此時,讓蟻群從蟻巢出發去尋找食物,也就是每只螞蟻在集合Shi中選擇一個權值,在全部集合中選擇一組神經網絡權值。這里的一個權值就相當于TSP問題中的一座城市(下文稱其為“虛擬城市”)。當螞蟻對所有虛擬城市完成了一次拜訪,就是在全部集合中選擇了一組權值,就算找到了食物。由各只螞蟻找到的這組權值作為神經網絡的計算用權值得到的結果與真實值相比較,得出計算誤差,這個誤差值就相當于TSP問題中路徑的路程。路徑的選擇目標是要求得的路徑路程為所有路徑之中的最小值,神經網絡權值的選擇目標也就是要求得到的誤差值是所有神經網絡權值組合中使計算誤差為最小的一組。用得到的誤差值對螞蟻在選擇虛擬城市(權值)時的信息素進行反饋調整。將這個過程反復進行,直至全部螞蟻收斂到同一組權值,或達到給定的迭代數上限時停止搜索。
2.算法基本步驟
對于一個有n個參數的神經網絡訓練問題,設定螞蟻數量為m。基本步驟如下:
(1)初始化。
確定備選權值:將神經網絡所有權值的取值區間 [Wmin,Wmax]均勻地劃分為μ個子區域,將每個子區域邊界上的點作為一個備選權值。
令時間t=0、循環次數NC=0,設每個點都具有相同的信息素量τ0和信息素揮發系數ρ,設置最大循環次數NCmax。
(2)啟動所有m只螞蟻,讓每只螞蟻從集合Shi(1≤i≤n)中選擇一個元素,按下式計算螞蟻選擇其他虛擬城市(權值)的概率:
(1)
式中: pj(k)為螞蟻k選擇權值j的概率;τj(t)為t時刻權值j上的信息素濃度;ηj(t)為t時刻權值j的啟發信息;α和β為常數。T(k)為第k只螞蟻的禁忌表,用于存放螞蟻k所選擇候選權值的集合。螞蟻k從概率最大的權值中隨機選擇一個權值i存入T(k)。當螞蟻為所有的權值參數選擇了值之后,就完成了一次遍歷,它選擇的所有值構成該神經網絡的參數。
啟發信息ηj(t)的計算公式。啟發信息是ACO中一個與問題相關的用來引導螞蟻搜索的量,它與信息素一起確定優化選擇。基于啟發信息是使螞蟻在選擇城市時,盡量選取當前候選集中路程短路徑的基本思想,這里采用如下公式來計算啟發信息:
(2)
式中:Aj(t)表示前面所有迭代中第k只螞蟻選擇備選集中權值j的次數和;Bj(t)表示前面所有迭代中所有螞蟻選擇備選集中權值j的次數和。
(3)重復步驟(2),直至螞蟻全部完成一次遍歷,即全部到達食物源為止。
(4)令t=t+n;NC=NC+1;利用各只螞蟻選擇的權值參數組計算出神經網絡的計算輸出結果,并以此獲取誤差E。記錄誤差較小的ω組權值和最優解Emin,比較Emin與給定的誤差最小E0的大小,若Emin≤E0則轉到步驟(8),否則進行步驟(5)。
(5)調節信息素。為防止信息素的聚集,要對先前留下的信息素隨時間進行揮發處理。信息素揮發系數ρ表示信息素的持久性。經過時間n,螞蟻從蟻巢到達食物源,各個路徑上的信息素要按下式進行揮發調整:
(3)
(4)
式中:Δτjk(Shi)表示第k只螞蟻在本次循環中留在集合Shi第j個元素上的信息素,可用下式計算:
(5)
式中:Q為常數,表示螞蟻完成一次遍歷后所釋放的信息素總量,用于調節信息素的調整速度;ek是用第k只螞蟻選出的一組權值作為神經網絡計算權值的輸出誤差,定義為ek=|os-oq|。其中os和oq分別是神經網絡的實際輸出和期望輸出。顯然,誤差越小相應的信息素的增量就越大。這即是蟻群算法正反饋機制的體現。
(6)重復步驟(2)到步驟(4),直至滿足最大迭代次數。
(7)采用BP算法進一步訓練神經網絡。
(8)采用驗證樣本對訓練好的神經網絡進行泛化能力檢驗,若驗證誤差滿足要求就退出程序;否則轉到步驟(1)重新開始訓練。
三、基于蟻群算法的故障診斷
由于人工神經網絡具有強大的自適應功能、聯想記憶和分布式存儲功能和復雜的非線性映射能力等優點,已廣泛應用于自動控制、組合優化、模式識別和圖像處理等領域。BP網絡是目前應用最廣泛的神經網絡模型之一,已在電力變壓器的故障診斷中成功得到應用。但由于BP網絡采用的是誤差反向傳播算法,是按誤差函數梯度下降的方向進行收斂,所以就不可避免地出現了學習收斂速度慢和容易陷入局部最優點的問題。利用蟻群算法具有全局優化和啟發式尋優的特點,將其運用到BP網絡的權值和閾值組合尋優上,進行變壓器的故障診斷,可大大提高診斷特性。
1.BP網絡建立
由于油浸式電力變壓器內部發生潛伏性絕緣故障后,反映故障信息的特征很多,因此,選取具有代表性的特征就成為故障識別的關鍵。大量相關文獻顯示,采用H2、CH4、C2H6、C2H4、C2H2這五種特征氣體的體積含量作為變壓器絕緣故障的診斷特征量效果良好。
(1)輸入特征量的歸一化處理。經過歸一化處理的數據對于神經網絡的訓練和學習會更容易,所以這里對五種氣體的體積含量在進入網絡訓練前進行計算體積含量相對比例的歸一化處理,使其變換到0~1之間。設故障特征量為A,A的元素ai(i=1,2,…,5)分別表示H2、CH4、C2H6、C2H4、C2H2五種特征氣體占氣體總體積含量的相對比例,計算式如下:
(6)
式中:
(2)網絡結構設計。理論分析證明,具有單隱含層的前饋網可以映射所有的連續函數。增加隱含層數目可以提高BP網絡的非線性映射能力,但隱含層的數目超過了一定值,反而會使網絡性能下降。本文采用含一個隱含層的三層BP網絡。隱含層節點數使用經驗公式:
(7)
式中:m為隱含層節點數,n為輸入層節點數,l為輸出節點數,α為1~10之間的整數。本實驗中輸入節點數為5,輸出節點數為4,故隱含層節點數應在4~13之間。用MATLAB軟件設計了隱含層數目可變的BP網絡,通過對比確定最佳隱含層數目為7。
最終設計出的BP網絡結構為三層:輸入層節點數為5,分別對應五種特征氣體占氣體總體積含量的相對比例;隱含層節點數為7;輸出層節點數為4,分別對應變壓器絕緣故障的4種故障類型。
2.算例仿真比較
為了對該網絡模型進行驗證,收集290條經過剔除、篩選的變壓器油中氣體濃度數據,選取其中150條為訓練樣本,另外的140條為測試樣本。這兩類數據中都包含了正常狀況和4類不同絕緣故障運行工況下的量。設置最大迭代次數NCmax為1000次,誤差收斂因子為0.0001,隱含層和輸出層的激勵函數采用非線性Sigmoid函數;權值區間取[-2,2],將區間分成50份,即μ=50,螞蟻群數目m=40,螞蟻選擇概率中啟發信息的α=0.7、β=2.3。殘余信息量ρ=0.6,信息素總量Q=100。
由表1實驗結果可知,本文給出的基于ACO算法的三層BP網絡與單純的BP網絡相比具有更快的收斂速度,能夠達到更小的均方差值。因此,此算法收斂過程具有明顯的優勢。
由表2中的診斷結果表明,本文提出的基于ACO-BP神經網絡算法在變壓器絕緣故障診斷上具有比單純的BP網絡更高的診斷準確度。
四、結論
本文利用ACO算法在解決離散問題時優良的啟發式學習和全局尋優能力,試圖將其運用到BP神經網絡的訓練中來彌補BP神經網絡學習、收斂慢的缺點,充分發揮了兩種方法的優點。實驗結果表明,將該方法運用到電力變壓器絕緣故障診斷中,與單純的BP神經網絡法相比,其在提高收斂速度和降低誤判率方面有更優良的特性。
參考文獻:
[1]楊海馬,劉瑾,等.BP神經網絡在變壓器故障診斷中的應用[J].變壓器,2009,46(1):67-70.
[2]丁曉群,林鐘云.神經網絡應用于電力變壓器故障診斷[J].電力系統自動化,1996,20(2):32-35.
[3]基于蟻群算法的最短路徑問題的研究和應用[J].計算機工程與應用,2007,43(13):233-235.
篇5
(天津理工大學管理學院,天津 300384)
(School of Management,Tianjin University of Technology,Tianjin 300384,China)
摘要: 本文采用了一種將證據理論與BP神經網絡相結合的信息融合算法,該方法集中了兩種算法的優勢使得計算結果更加準確,為眾多商業銀行帶來切實的利益。
Abstract: This paper uses the information fusion algorithm by the combination of evidence theory and BP neural network, this approach focuses the advantages of the two algorithms to make the results more accurate and bring tangible benefits for many commercial banks.
關鍵詞 : 物流金融;信用風險;BP網絡;證據理論
Key words: logistic finance;credit risk;BP network;evidence theory
中圖分類號:F252 文獻標識碼:A
文章編號:1006-4311(2015)06-0016-02
0 引言
中小企業作為中國經濟快速發展的生力軍,貸款難一直是制約其快速進步的最主要的因素。近年來物流業大發展也使得以運輸、倉儲為主的傳統經營不再能滿足其對利益的追逐。另外,物流金融作為商業銀行的重要創新,成為其在激烈的同行業競爭中取勝的必然選擇。綜上,物流金融勢必成為中小企業、物流企業、商業銀行多方關注,謀求共贏的一種發展趨勢。
最早的物流金融概念是由浙江大學的鄒小芃和唐元琦于2004年提出。他們認為物流金融就是面向物流運營的全過程,應用各種金融產品,實施物流、資金流、信息流的有效整合,有效地組織和調劑供應鏈運作過程中的貨幣資金的運動[1]。作為一種委托關系,信用是其健康運作的基礎,信用風險則成為商業銀行所面臨的首要風險。由于物流金融業務的特殊性,其表現出與傳統信貸相比更為復雜的信用風險,傳統意義的信用風險評價指標體系和評價模型將會失靈,建立一整套科學進步、基于物流金融融資模式的信用風險評價體系就顯得尤為重要。
本文通過將信用風險的輸入數據按物流金融業務特征進行重新開發分類,建立BP網絡組。根據網絡組的輸出,得出對于各類信用度的基本概率分配函數,最后利用DS證據理論融合。將其應用于商業銀行對物流金融的信用評估中,從而實現風險的最終決策,提高了風險度量的準確度,使得商業銀行在新興的物流金融業務下的操作風險有效監控得到提升。
1 商業銀行物流金融信用風險體系指標
根據物流金融的運作特點,可將其風險來源歸納為來自融資企業、抵押物以及第三方物流企業三大方面。借鑒Altman,Haldeman和Narayanan(1977)提出的第二代“ZETA計分模型”中企業信用評價指標體系[3],將來自融資企業的風險細化為中小企業營運能力w1、盈利能力w2、償債能力w3、及信用記錄w4四大方面的十個具體指標,分別為w11持續經營、w12資產回報率、w13存貨周轉率、w21連續盈利、w22稅后利潤率、w23銷售利潤率、w31穩定存貨、w32資產負債率、w33速凍比率、w41履約率。我國現階段的物流金融業務主要集中于基于權利質押以及基于存貨質押兩種,因此質押物本身的質量也直接關系其風險大小。指標包括:所有權w51、市場性質w61、保險率w71三方面。作為重要參與方的物流企業為實現其對質押物的有效監管,企業規模w81及企業信譽w91也即成為影響物流金融風險的重要指標。
2 基于BP神經網絡和證據理論的評價方法
2.1 BP 神經網絡的基本原理
BP神經網絡,是由Rumelhart 和 McCelland 等人(1986)提出的。其基本思想是,學習過程由信號的正向傳播與誤差的反向傳播兩個過程組成。正向傳播時,輸入樣本從輸入層通過隱含層傳向輸出層。若輸出層的實際輸出與期望輸出不符,則轉入誤差的反向傳播階段,并將誤差分攤給各層的所有單元。正向傳播與誤差反向傳播周而復始,一直到網絡輸出的誤差減少到可接受的程度,或預先設定的次數為止。
2.2 證據理論的基本原理
2.3 信用風險評估算法
為了保證神經網絡的收斂和穩定性,本論文中將15個指標分為四組,建立4個神經網絡NN1,NN2,NN3和NN4。神經網絡的輸出設計為(0.1,0.1,0.9)T、(0.1,0.9,0.1)T、(0.9,0.1,0.1)T,表示的信用風險級別分別為高風險、中度風險、低風險,記為A1,A2,A3。將輸出歸一化,得到向量(a′i1,a′i2,a′i3)T,記作V′i。令mi(Ai)=a′il,i∈{1,2,3,4},l∈{1,2,3},表示由NNi 得到的對信用風險級別Ai的基本信任度,即針對事件Ai的證據。之后,再將4個證據利用DS證據理論融合。就可以對信用風險進行評估,最初最終決策。
3 應用實例
本次數據采集共發出問卷200份,收回135份,有效問卷92份。將前91組數據分別訓練神經網絡。再將余下1個樣本輸入訓練好的神經網絡,歸一化處理輸出結果即得該證據對該命題的基本概率分配,而后利用DS證據理論將其融合得到最終優化結果。
由表2可知,中度風險類型O2的概率隨著融合次數增多逐漸趨向于1,而其余兩種風險類型則趨近于0,與表1中結果相比大大地提高了結果的準確性。
4 結論
本文所提出的基于神經網絡和DS證據理論的物流金融信用風險評價模型,其優勢表現為:此兩種算法的結合,不僅克服了單一神經網絡達到高精度需要迭代次數過多而造成實時性差的缺點,而且通過大量標準樣本對神經網絡的訓練,使得DS證據理論對系統的決策更加準確。
參考文獻:
[1]鄒小芃,唐元琦.物流金融淺析[J].浙江金融,2004(5):80-83.
篇6
關鍵詞:BP神經網絡;Adaboost算法;遺傳算法
中圖分類號:F832.332文獻標識碼:A文章編號:1008-2670(2012)02-0012-08
收稿日期:2011-12-11
基金項目:國家社科基金資助項目“企業金融衍生業務風險測度及管控研究”(10BGJ054)。
作者簡介:宿玉海(1964-),男,山東濰坊人,經濟學博士,山東財經大學金融學院教授,研究方向:國際金融;彭雷(1986-),男,山東濰坊人,山東財經大學金融學院碩士研究生,研究方向:國際金融;郭勝川(1990-),男,山東安丘人,山東大學數學學院學生。
一、引言
商業銀行的信用風險管理一直是人們關注的焦點,在引入工程方法進行信用風險的度量后,BP神經網絡信用風險模型以其較強的逼近非線性函數的優勢從眾多方法中脫穎而出,其對于歷史數據的模擬仿真和預測能力也顯示出了獨特的優勢。但是,BP神經網絡信用模型在處理較為復雜的財務數據時,對于數據指標在模型中獲得的權值沒有一個明確的標準,而是特別依賴于對于歷史數據指標的選擇,使得模型對于新樣本的考察缺乏一個有效的動態權值變動,這就造成了模型在使用過程中的困難。
隨著BP神經網絡信用風險管理模型應用的增多,許多學者逐漸認識到BP神經網絡信用風險模型在處理財務數據時存在的問題,采取一系列的措施對BP神經網絡信用風險模型進行了改進,特別是對于權值設定的改進做了大量的工作。Back等[1]建議將遺傳算法與神經網絡結合起來協同工作,但沒有實際討論引入遺傳算法后帶來的實際效果;Piramuthu等[2]采用符號特征樣本的技術處理輸入數據取得了較為明顯的效果,但是符號特征樣本技術則存在較為主觀的人為因素影響。國內學者在引進神經網絡以后,也為神經網絡模型的優化進行了卓有成效的努力。如許佳娜、西寶[3]采用層次分析法對神經網絡模型的改進,以及郭英見、吳沖[4]采用DS證據理論將神經網絡和SVM的輸出結果進行的融合,都在一定程度上增強了神經網絡模型的判別準確率,但他們在神經網絡的權值修改上仍然沒有找到很好的設定規則。
可以看出,許多學者在神經網絡良好的泛化能力和模式識別能力上達成了共識,但對于神經網絡中占有重要地位的連接權值的修正,沒有給出一個較為恰當的標準。本文在探討改進這一問題時,將遺傳算法與Adaboost算法分別引入到BP神經網絡信用風險模型中,通過兩種模型對于相同的訓練樣本和預測樣本的考察分析,比較兩種方法的優劣,從而為BP神經網絡信用風險模型的改進提供一定的參考。
本文結構安排如下:第一部分為引言;第二部分介紹BP神經網絡信用風險模型并評價其缺陷;第三部分使用Adaboost算法以及遺傳算法對BP神經網絡信用風險模型進行算法尋優;第四部分則通過Matlab的模擬進行實證分析并比較實證結果;第五部分根據實證分析的結果得出相應的結論并探討商業銀行在應用過程中應注意的問題。
二、現有BP神經網絡信用風險模型介紹
篇7
引言
分子蒸餾是一種新型的在高真空條件下進行的液-液分離技術,具有蒸餾溫度低(低于物質沸點溫度)真空度高,物料受熱時間短,分離程度高等特點;且分離過程不可逆,沒有沸騰鼓泡現象[1]。特別適用于分離高沸點、熱敏性、高粘度和易被氧化的物質。但是分子蒸餾過程是一個極其復雜的過程,實際生產中除了發揮其優點外,還要要兼顧生產效率及產品質量,因此,分子蒸餾生產工程的工藝參數優化是一個多目標組合優化問題[2]。生產中根據生產目標選擇相應的工藝指標,這就需要進行反復實驗來獲取目標下的最佳工藝參數值。由于分子蒸餾過程的復雜性,導致其工藝參數比較多,難以用數學方法來解決。而人工神經網絡具有人體腦神經系統的信息處理機制,可以映射任何較為復雜的非線性關系,具有自學習能力。本文采用應用較為廣泛的BP神經網絡和遺傳算法相結合,將其運用到分子蒸餾過程中的工業參數優化中,通過給定分子蒸餾的工藝參數及生產指標,經過大量樣本的學習訓練使網絡達到允許的誤差范圍,映射工藝參數與生產指標之間的復雜非線性關系[3-4]。以該模型的預測性能輸出作為目標函數,對工藝參數進一步優化,從而實現預定的工藝指標下的分子蒸餾工藝參數的優化。
1分子蒸餾參數測試實驗
1.1分子蒸餾過程模型氣體分子從液體表面溢出,由于其自由程的不同,與其他分子碰撞前的飛行距離各不相同。分子蒸餾技術就是利用不同種類分子逸出液面后平均自由程不同的性質實現分離的。Langmuir[5]根據理想氣體的動力學理論提出了分子自由程的數學模型:式中,p為分子所處環境壓強;λm為分子運動平均自由程;d為分子有效直徑;T為分子所處環境溫度;k為玻爾茲曼常數。由式(1)分子平均自由程公式可知,氣體分子平均自由程與溫度成正比,與壓強反比。當加熱板上的物料達到一定溫度時,分子平均自由程大于板間距離的輕組分脫離加熱板飛向冷凝板,在冷凝板上捕獲,而平均自由程小于板間距的重組分到達不了冷凝板,從而實現了物質的分離。其分離過程如圖1所示。
1.2實驗設備本文在DCH-300三級分子蒸餾裝置的基礎上進行參數測試實驗研究。實驗裝置的刮膜式短程蒸發器分子蒸餾過程為:液料放入原料罐被計量泵抽取。泵用穩定流量輸送物料,經過管道被送入降膜器內的旋轉分配器,在離心力的作用下,被甩向夾套加熱室內壁,這時物料液體受重力的作用,沿著內壁向下流動,與此同時裝在轉軸上的刮板,把料液刮成簿膜,這樣料液受加熱而蒸發,由于在重力及離心力的作用下,不斷地更新液膜。根據分子運動理論知道,液體混合物的分子受熱后運動會加劇,當接受到足夠的能量時,輕組分首先就會從液面溢出而成為氣體分子,當氣體分子逸出碰到內冷凝列管時,瞬即從氣體變為液體并被柱下氣相罐收集,重組分因達不到逸出溫度,而仍然以液體狀態流出蒸餾柱,由液相罐收集。圖2為蒸餾裝置的工藝原理圖,其中,H1、H2、H3為三級的蒸發器,蒸發器面積分別為0.02m2,0.26m2,1.1m2。L1、L2、L3為三級的冷凝器,并且每一級的蒸發器都配有各自的刮膜電機,可以控制刮膜轉速,提高蒸發速率,每一級的冷凝系統都與冷機相連,保證具有合適的冷凝溫度。第二級包括一個水環真空泵、2個羅茨真空泵,1個增壓真空泵構成的泵組,第三級包括旋片真空泵和增壓泵,三級真空度越來越高,蒸餾的溫度就可以逐級降低,達到負壓低溫蒸發的降低能耗的目的。
1.3實驗方案及結果本實驗采用了3次蒸餾,第一級蒸餾為預脫氣、脫水處理階段,即薄膜蒸發階段,為確保后續蒸餾時具有足夠高的真空,而除去物料的空氣和溶劑等組份。物料進蒸餾器之前,經一級除氣裝置進行脫氣處理,然后以一定的速率進入二級、三級分子蒸餾刮膜器中,在高真空和適宜的蒸餾溫度下進行,分離出殘余物和餾出物。實驗安排采用在改變一個因素的單因素實驗設計下,固定其他參數,對得到的實驗結果進行比較,以便對這一因素的影響作出結論。實驗水平如表1所示。本次實驗共采用9組進行試驗,通過改變蒸餾溫度、進料速率和真空度等參數,對實驗所得精油含量與得率的影響。實驗結果如表2所示通過上述試驗結果可以看出,并不是工藝參數(即蒸餾溫度、進料速率和真空度的值)越大越好,且沒有規律可循。也有采用正交試驗進行工藝參數優化的方法,但對于分子蒸餾采取該種方法不可行,因為正交實驗法是當真空度不變時,通過多次實驗得到最佳溫度,在此溫度下再通過多次蒸餾實驗摸索最佳真空度,而分子蒸餾的蒸發器的溫度與真空度是具有耦合關系的量,當真空度改變,物質的沸點發生改變,即真空度變化,最佳蒸餾溫度隨之改變,因此為了提高生產效率及產品指標,進行高效、高質地分離提取,本文采用了基于BP網絡和遺傳算法的分子蒸餾工藝參數優化方法。
2BP神經網絡及遺傳算法優化模型的建立
2.1基本原理人工神經網絡信息處理、魯棒性、自學習及非映射能力較強,遺傳算法具有并行、隨機和自適應搜索等優點[6]。本文采用神經網絡與遺傳算法相結合的優化設計方法,充分利用二者優點。基本原理是:首先通過試驗獲得目標函數與工藝參數之間的離散試驗數據關系。將試驗數據作為網絡的樣本,對網絡進行訓練,當網絡達到誤差要求時,存儲權值閾值,利用網絡的記憶功能,建立起工藝參數與指標之間的非線性映射關系。再利用遺傳算法對這一黑匣型的函數求解。上述優化問題的數學表達形式為:其中,xi表示神經網絡的輸入,yi表示神經網絡的輸出,f是評價函數。算法的實現過程為:運用試驗獲得的大量樣本對網絡進行訓練,建立穩定的BP網絡預測模型,對訓練好的模型在一定范圍內隨機產生多組輸入向量,通過BP預測出相應的輸出量,再通過評價函數,計算個體適應度值,再利用遺傳算子通過適應度值調整輸入向量,產生具有更好適應性的新的種群。通過遺傳算子的計算得到優化目標,相應輸入即為目標的優化結果。
2.2BP神經網絡預測模型BP神經網絡是目前應用最廣、最為成熟的1種采用誤差反向傳播的前饋型多層神經網絡。包括輸入層、中間層和輸出層。選取1組訓練樣本提供給神經網絡,經過隱含層激活函數后向輸出層傳播,隱含層的輸出作為輸出層的輸入,最后獲得網絡的輸入響應。接下來進行的誤差的反向傳播階段,即按照網絡輸出與目標值之間的誤差減小方向傳播,從輸出層到隱含層再到輸入層,逐層修正各層之間的連接權值[7-8]。含有一個隱層的3層BP神經網絡可以任意精度逼近任何有理函數。本文采用單隱含層的BP神經網絡作為預測模型,其模型結構如圖3所示。大量學習樣本對BP神經網絡進行訓練后,分子蒸餾工藝參數與產品指標之間就會通過神經網絡建立起1種能映射二者之間內在關系的連接關系,即獲得產品指標預測的BP神經網絡模型。本文在Matlab7.0神經網絡工具箱的基礎上[8-9],安排了18組試驗樣本,選擇9組作為訓練樣本,其余9組作為測試樣本,網絡結構為3×6×2,輸入層節點為3,分別為蒸餾溫度,真空度及進料速率;隱層節點為6,輸出層為2,分別為產品的含量和得率。數據歸一化處理,訓練時,不同的訓練函數的訓練速度和精度不同,這里采用梯度下降法,訓練誤差曲線如圖4所示。經過42次的網絡訓練,網絡的訓練誤差值就收斂到預定的目標誤差0.001。訓練后的神經網絡用于產品指標預測,由預測結果與試驗結果進行比較可知,訓練后的神經網絡具有較高的預測精度。
2.3優化模型的建立遺傳算法是1種通過模擬自然進化過程,根據自然選擇和遺傳算法,進行隨機、自適應搜索最優解的方法。遺傳算法將自然界適者生存、劣者淘汰的生物進化原理引入到待優化參數問題中,將待優化變量進行編碼,組成初始種群,將其按一定的適應度函數及遺傳算子的操作,即選擇、交叉和變異,選擇適應度值較大的個體,形成高適應值的新群體,經過反復進行,最終找到適應度最大的個體[10],此時的個體即為優化結果。本文以遺傳算法作為蒸餾工藝參數的優化方法。式中,W1和W2分別為工藝權值,T1,T2分別為含量與得率的目標值。可見目標函數越小預測值越接近目標值,當目標函數最小時對應的工藝參數值為最優值。遺傳算法在進化搜索中基本不利用外部信息,僅以適應度函數為依據,個體的適應度越大,表明其適應能力越強[12-15]。建立的目標函數需符合適應度函數要求,本文采用的適應度函數就是目標函數的倒數。工藝參數優化流程如圖5所示。經過遺傳算子作用后的工藝參數作為神經網絡的輸入,通過訓練好的神經網絡模型輸出目標函數值,再計算個體適應度函數值,再進行選擇,交叉概率為0.8,變異概率為0.01等遺傳操作獲得新一代種群。通過反復進化計算,直至適應度函數值趨于穩定,此時的輸入值為最優解,優化結果如圖6所示。此時W1=W2=0.5,達到穩定后的適應度值為38.97。此時蒸餾溫度為120℃,進料速率295r/min,進料速率60L/h。
篇8
【關鍵詞】攔渣壩; BP神經網絡;小波神經網絡
0 前言
為了確保各種大型工程在施工和生產運行中會產生大量的棄土、棄石等廢棄固體物質的安全放置,必須建立合適的攔渣壩。但是,隨著攔渣壩運行時間的推移,攔渣壩運行的各種條件(如結構、基礎、環境等)逐漸發生變化,使得壩體材料老化變質、壩體結構性能衰減甚至惡化等影響其安全運行,這樣有可能嚴重的威脅著周邊人民的生命和財產安全,這在在國內外均有著深刻教訓。因此,必須對攔渣壩進行安全監測,建立正確有效的變形預測模型,科學地分析和預測攔渣壩的變形,及時發現存在的安全隱患,制定合理的防治措施,以確保攔渣壩的安全運行。
由于各種條件和環境的復雜性,使得攔渣壩變形的影響因素存在多樣性,利用單一的理論方法來對工程變形進行預測,其變形的大小是難以準確預測的。將多種理論和方法進行有機結合,建立一種方法預測工程變形的大小是一種有效的途徑。本文基于這樣的思想,將小波分析與神經網絡有機結合的小波神經網絡應用于攔渣壩工程實例,對其變形分析研究。
1 小波神經網絡
小波神經網絡是將小波分析與人工神經網絡有機結合的產物。其基本思想是用小波元代替神經元,用已定位的小波函數代替Sigmoid函數作為激活函數,然后通過仿射變換建立起小波變換與神經網絡系數之間的連接,形成的新模型具有較強的網絡逼近能力和容錯能力。
目前,將小波分析與人工神經網絡的結合主要有下面兩種方式:松散性結合,即將小波分析與人工神經網絡進行輔助式結合;緊致性結合,即將小波和神經網絡直接融合的一種方式, 它主要是把小波元代替神經元,將相應的輸入層到隱層的權值及隱層閾值分別由小波函數的尺度與平移參數所代替。其中緊致性結合方式也是當前研究小波神經網絡模型最主要的結構形式。
小波神經網絡是在小波分析的基礎上提出的前饋型神經網絡。小波神經網絡激活函數是具有良好時頻局域化性質的小波基函數。設小波神經網絡有m(m=1,2,…,m)個輸入節點、N(N=1,2,…,N)個輸出層、n(n=1,2,…,n)個隱含層節點。并設xk為輸入層的第k個輸入樣本,yi為輸入層的第i個輸出值,wij為連接輸出層節點i和隱含層節點j的權值,wjk為連接隱含層節點j和輸入層節點k的權值。約定wi0是第j個輸出層節點閾值,wj0是第j個隱含層節點閾值,aj和bj分別為第j個隱含層節點的伸縮和平移因子,則小波神經網絡模型可以表示為:
2 工程實例應用
國家某重點高速公路第B4合同段內某攔渣壩,其壩體為混凝土重力壩,長約122米,高約30米,攔渣壩上面(上游)是巨大的高速路高填方路基,這在國內是比較罕見的,而下游是梅西河。本攔渣壩主要是為了防止高速路隧道挖方土回填的高填方路基滑動和垮塌發生危險,從而對高速路的運行和梅溪河的通航造成不必要的影響。通過對攔渣壩體上S5號點上的沉降監測數據分析,建立變形預測的小波神經網絡模型。將從2008年9月28日到2009年11月5日共11期數據作為學習樣本對攔渣壩小波神經網絡進行訓練和學習。對S5號從2010年2月1日到2010年12月29日共5期數據進行預測。
通過對混凝土壩的研究和本攔渣壩功能作用的分析,可知影響本攔渣壩沉降變化的因素主要有:溫度、土壓力、時效。其中取4個溫度因子,分別為C、C5、C15、C30(Ci為自觀測日起前i天的平均氣溫);土壓力因子1個(為S5號點附近土壓力盒的每期平均計算壓力);時效因子2個,分別為T、InT(T為觀測日到起算日的累計天數除以100)。故輸入層節點數為7個。而輸出層節點數為1個,即為觀測點S5每次垂直方向的累計沉降量。先用經驗公式確定一個初始節點數,然后進行試驗訓練,當隱含層節點數為13時網絡訓練最為合適,所以采用7-13-1的結構形式的小波神經網絡模型。通過對不同小波函數的試驗訓練,多次計算表明,當選用Morlet小波函數時網絡的總體性能較好。利用Matlab7.1語言編制相應的網絡模型程序進行計算。
為了充分的分析小波神經網絡的訓練效果,本文中也采用相同結構的BP神經網絡對攔渣壩監測數據進行訓練、預測。在本實例中,設兩種模型的收斂誤差都取0.0001。訓練結果表明,兩種模型的收斂速度都比較快,BP神經網絡訓練了25次就低于誤差限差;而小波神經網絡只訓練了5次就低于誤差限差0.0001,總體上小波神經網絡比BP網絡精度高。小波神經網絡訓練與BP神經網絡訓練擬合殘差系統比較結果如表1。
從預測結果對比分析表可以看出,小波神經網絡和BP神經網絡對攔渣壩變形預測的預測殘差絕對值在一個數量級上,但是WNN網絡的預測殘差值總體上明顯小于BP神經網絡。小波神經網絡的預測值與BP神經網絡的預測值相比較更加接近于實際值,WNN預測結果好于BP神經網絡預測結果,其預測優越性是顯而易見的。
3 小結
本文通過對小波神經網絡模型的研究,建立了攔渣壩變形預測的小波神經網絡模型。通過對WNN網絡模型和BP神經網絡模型訓練擬合結果與預測結果的對比分析,可以看出小波神經網絡模型在攔渣壩變形預測中的收斂性和精度比BP神經網絡好,對攔渣壩的變形預測研究有一定的參考應用價值。
【參考文獻】
篇9
關鍵詞:模式識別;BP神經網絡;手寫體字符識別;圖像分析
引言
在當前MATLAB神經網絡字符識別研究中,一般都是基于單個字符庫樣本進行學習機訓練而且很少進行手寫字符的識別,例如應用最多的車牌字符識別,其送人的訓練樣本一般很有限,因此學習樣本有限,很難適用于具有廣泛特性的手寫字符識別,因此,對于多種不同手寫樣本的訓練和識別有一定的研究意義。具體實現功能描述如下,首先利用不同筆跡書寫的字母訓練BP神經網絡學習機,然后用手寫的樣本測試BP學習機的識別正確率,要求輸入各個字母的訓練樣本庫和測試用的手寫字母庫,程序給出最終的識別結果和識別正確率。
1基于Matlab的手寫字符識別系統
基于Matlab的手寫字符識別系統由以下模塊構成,包括圖像預處理、字符有效區域檢測、圖像分割、樣本庫訓練和測試字符識別,如圖1。
其中,原始圖像:由數碼相機或其它掃描裝置拍攝到的圖像;
圖像預處理:對動態采集到的圖像進行濾波、邊界增強等處理以克服圖像干擾;
字符分割、歸一化:利用梯度檢測的字符定位、分割方法得到單個的字符,并將所有字符歸一化為固定大小;
樣本數據庫:利用前期采集的每個字母80個的手寫字符為第5步的字符識別建立字符模板數據庫;
BP學習機:根據樣本數量和訓練分類結果構建BP學習機:
字符識別:基于人工神經網絡的OCR算法,通過特征對比或訓練識別出相關的字符,得到最后的英文字符識別結果。
2BP神經網絡的字母識別
2.1圖像預處理
圖像在形成、傳輸或變換過程中,受多種因素的影響,如:光學系統失真、系統噪聲、曝光不足或過量、相對運動等,往往會與原始景物之間或圖像與原始圖像之間產生了某種差異,這種差異稱為降質或退化。因此在圖像處理之前必須進行預處理,包括去除噪音、邊界增強、增加亮度等等。
以字母q的樣本庫圖2為例,實驗素材是數碼相機拍攝的手寫字母q的各種不同形式,但由于手寫體比較自由的特點,因此有了許多形態不盡相同的字母q的類,通過觀察發現,不同類型字母q由于手寫速度不同造成部分字母出現部分線條斷裂,另外由于字母灰度圖存在部分干擾,為了消除以上缺陷,先將圖像進行灰度二值化并濾除一些孤立背景噪聲,其次再對圖像做膨脹和腐蝕運算使得圖像中斷裂的線條重連使用的樣本庫均類似圖3。
經過預處理的圖像含有很少的噪聲,并且圖像特征得到增強,后面將會對預處理過的圖像進行分割操作。
2.2字母定位
經過預處理,可以更加清晰的發現字母圖像基本是按照水平和垂直的行和列分布,因此先將圖像分隔成包含每8個字母的分行圖像。按照以下方法來進行行分割。通過和列像素點統計相類似的辦法可以得到行的像素點統計分布。統計完成繪制的像素點統計分布圖如圖4其中圖像橫坐標是圖像的行列的絕對像素位置。
根據所得的結果很容易確定每行字母的其實行(列)和終止行(列),通過檢測梯度剛開始上升的位置則為行開始位置,梯度下降末的位置則為圖像的行(列)終止的位置。通過該算法進行行(列)位置的確定。
2.3字母分割
根據上面提供的算法已分別將上升沿、下降沿位置信息存儲到了hang up和hang down數組中,下面將整個圖像分隔成單行,算法思想是新建圖像空間,分別搜素圖像自像素行hang up(1)到hang-down(1)位置的所有行,將其復制到新的圖像空間。這樣便完成了圖像的行分割,如圖5。同理我們可采取同樣的思想將分割后的行圖像進行統計,然后記錄上升沿和下降沿的位置信息,再掃描上升沿到下降沿的所有列并存儲到新的圖像空間,這樣就完成了圖像的列分割,從而完成字母單獨分割。同樣原理實現列分割的效果如圖6。
2.4字母圖像歸一化
考慮到為避免后期進行目標識別時由于大小而引起的誤差,因此應將單個字符圖像進行歸一化,此外為方便起見,前期分配臨時存儲空間時,采用了固定的圖像空間大小,因此由于分配的圖像的存儲空間一般大于字母,所以會造成空間的浪費,所以我們還要對圖像進行去空白區域操作,思想是由頂行逐行向底行搜索,統計當前行的黑色像素點,將少于一定數量黑絲點的像素所在的行刪除。同樣,列也逐列搜索,去掉小于一定列數的圖像列。歸一化圖像見圖7。
Y方向的緊縮策略和x方向相同,前面做膨脹和腐蝕的原因是進一步連接字母圖像中斷裂的像素點。
2.5建立字符模版圖像數據庫
根據我們獲得的圖像建立了9個字母的圖像數據庫空間,每個字母的模版空間有80個,分別是a,d,m,n,p,q,r,u,w,統一將所有的圖像進行歸一化整理,共得到720個庫模版,分為9個類。如圖7為其中的一組庫,這樣的庫總共有80個。操作過程中不一定需要存儲所得的模版庫,我存儲的目的是使文檔更加全面,事實上也可只用一組模板庫進行手寫字母識別,但正確率較低,約為60%。
得到模版庫后由于在前面處理中已進行歸一化,且因為之后的字符識別使用神經網絡算法進行字符識別,所以再將上面歸一化后的模板圖像的樣本轉化為一個模版對應一個列向量。
其次為了使主程序Recognize中程序簡潔明了,設計了某個字母圖像對應的80個獨立的樣本的產生函數,給出的結果是產生行為2500,列為80的向量P。
2.6字符識別
字符識別目前較常用的方法是基于模版匹配的OCR算法以及基于人工神經網絡的OCR算法。基于模板匹配的OCR的基本過程是:首先對待識別字符進行二值化并將其尺寸大小縮放為字符數據庫中模板的大小,然后與所有的模板進行匹配,最后選最佳匹配作為結果。用人工神經網絡進行字符識別主要有兩種方法:一種方法是先對待識別字符進行特征提取,然后用所獲得的特征來訓練神經網絡分類器。識別效果與字符特征的提取有關,而字符特征提取往往比較耗時。因此,字符特征的提取就成為研究的關鍵。另一種方法則充分利用神經網絡的特點,直接把待處理圖像輸入網絡,由網絡自動實現特征提取直至識別。本設計則是基于BP人工神經網絡的字符識別,不提取特征直接送入BP神經網絡學習機進行分類訓練。
BP網絡是前向網絡的核心部分,它是一種單向傳播的具有三層或三層以上的前向神經網絡,包括輸入層、隱層和輸出層,上下層之間實現全連接,而每層神經元之間無連接。一個三層的BP網絡理論上可逼近任意的非線性映射,因此在實際應用中,一般采用三層的BP網絡就可以滿足需要。如圖8所示的就是一個三層的BP網絡結構圖。
BP網絡由正向傳播和反向傳播組成,在正向傳播階段,每一層神經元的狀態只影響下一層神經元的狀態,若在輸出層得不到期望的輸出值,則進行誤差的反向傳播階段,BP網絡學習規則又稱8學習規則。
BP網絡主要的訓練函數包括BFGS準牛頓BP算法函數trainbfg、梯度下降BP算法函數traingd、梯度下降動量BP算法函數traingdm、成比例的變梯度算法SCG trainscg等等。一般的對于上百個權值的函數逼近,LM算法收斂速度最快,并且在許多情況下LM算法可以獲得比其他任何一種算法更小的均方誤差,但當網絡的權值數量增加時trainlm優點將不再明顯,其次trainlm算法對于模式識別問題處理功能較弱,而RPROPA的訓練函數trainrp應用于模式識別,其速度最快。但對于函數逼近問題卻不是最好。而SCG算法在網絡規模較大的場合其性能都很好,該算法基本原理利用LM算法和變梯度算法相結合,SCG算法應用于函數逼近問題時幾乎和LM算法一樣快,而在應用于模式識別幾乎和RPROPA一樣快,而且其性能不會隨目標誤差減小而下降那么快。
程序流程圖如圖9。
3手寫字母識別結果
測試圖像如圖10,最終得到結果如圖11,可以發現神經網絡在經過訓練后識別結果已經達到了92.06%,可以說實驗到此已經有比較完美的結果了,畢竟實驗測試項目有限,但為了測試不同函數對于神經網絡識別的正確率的影響,故有進行了不同訓練函數的測試。
在訓練參數里net-newff(minmax(P),{'logsig','logsig','logsig'},'trainrp')將訓練函數trainrp替換為SCG算法的訓練函數trainscg,效果有一定提升,識別表現出了極好的識別性,總體識別正確率達到95%以上,63個測試字母僅未識別3個,三個分別是第3行第6列,第8行第1列,第8行第2列,至于未識別的原因,目前仍不清楚。SCG算法的識別結果如圖12。
觀察發現,SCG訓練函數識別正確率對于原識別正確率有3%左右的提升,可以說實驗已經取得了較大的成功。這表面SCG算法在網絡規模較大的場合性能較好,該算法基本原理是將LM算法和變梯度算法相結合,SCG算法應用于函數逼近問題時幾乎和LM算法一樣快,而在應用于模式識別幾乎和RPROPA一樣快,而且其性能不會隨目標誤差減小而下降那么快。
4總結
在手寫體字符識別的整個過程中,查找了很多資料,綜合了各方面的信息。字符識別實現的每一步都有許多的方法,各種方法都有其優劣,但是對于具體的圖像處理,并不是每一種理論在實踐中都可以實現,即使實現了也很難說哪一種方法最合適,還得在具體的實驗中比較選擇。測試結果表明,本設計有以下優點:
(1)實現了單類多個樣本的整體訓練,有一定實用價值。
篇10
Abstract: Neural network is widely applied for character recognition. Through the analysis of the problems, this paper recognizes character by the application of improved BP neural network, so as to improve recognition rate. This method has high recognition rate, fast speed, strong practicability, and can be applied to various high noise environment.
關鍵詞: 神經網絡;圖像預處理;特征提取;字符識別
Key words: neural network;image preprocessing;feature extraction;character recognition
中圖分類號:TP301.6 文獻標識碼:A 文章編號:1006-4311(2014)10-0206-02
0 引言
字符識別是指采用掃描儀、數碼相機等輸入設備,把英文字母、數字、條形碼等特殊字符的圖形文件輸入計算機,由識別軟件對圖片信息上的字符信息進行識別并變換成可編輯文檔的識別技術。主要有光學字符識別(Optical
Character Recognition,OCR)、圖像字符識別(Image Character Recognition,ICR)和智能字符識別(Intelligent Character Recognition,ICR),實際上這三種自動識別技術的基本原理大致相同。
1 常用字符識別方法
字符識別方法基本上都是為了區分結構識別、統計識別以及兩者相結合的三大類方法,這三大類方法都包含具體的識別方法。
1.1 結構識別 結構識別是早期字符識別的研究的主要方法,我們也可以稱之為句法結構識別。其思想是提取含有一定規律的結構信息,作為識別的依據。識別過程類似一個邏輯推理過程。結構識別的優點在于對字符變化的適應性強,區分相似字符能力強。但是在實際獲取字符圖像的過程中,由于存在著很多扭曲、傾斜等因素,就導致不能夠準確地提取結構特征,后面的識別過程就成了無源之水。此外,結構識別的算法描述也較為復雜,匹配過程的復雜度也很高,因此,我們原有的句法識別就受到新的挑戰。
1.2 統計識別 統計決策論的發展相對較早而且成熟,是為了提取待識別字符的一組統計特征,然后按照一定的準則進行決策函數的分類判決的。而統計識別是將字符點陣看作是一個能夠經過大量統計數據得到的整體,是以后所用的特征都需要經過的。統計特征主要是以抗干擾能力強為主要特點,以實現匹配與分類的算法簡單,且容易實現的。不足之處在于細分能力較弱,區分相似字的能力差一些。
1.3 結構識別與統計識別相結合 上述方法各有優缺點,而隨著研究的深入,這些方法逐漸得到融合。網格化特征就是結合的產物。特征的統計以網格為單位,即使個別點的統計有誤差也不會造成大的影響,增強了特征的抗干擾性。這種方法正得到日益廣泛的應用。
字符的結構特征直接反映了字符的特有屬性,而用字符的統計特征進行字符識別則是利用了計算機軟件善于處理數字的特點。雖然近幾年流行的神經網絡方法主要采用的是局部特征,但其分類機理也與傳統的統計識別方法相類似,優點是靈活性強。
2 字符識別流程
字符識別技術在當今社會的許多領域都有著廣泛的商業應用前景。常見應用有條碼識別、車牌識別、盲人的輔助閱讀設備和郵包自動分檢等。本文以車牌識別為例說明字符識別的應用以及識別流程。車牌識別系統的工作流程如圖1所示。
經過字符分割后,得到可以進行字符識別的圖像。本文采用神經網絡方法進行字符識別,識別的具體過程如圖2所示。
3 基于改進型BP神經網絡的字符識別算法
3.1 BP神經網絡簡介 神經網絡最早的研究是20世紀40年代,由心理學家Mcculloch和數學家Pitts合作提出的,由此拉開了神經網絡研究的序幕。人工神經網絡是通過對人腦生物神經機理進行簡化,抽象和模擬之后建立起來的一種計算模型,屬于機器學習的重要研究領域。人工神經網絡可以應用于字符識別、人臉識別等領域。
隨著神經網絡的威力逐漸顯現以及付諸應用的現實性,大量的學者對此進行了深入研究,出現了多種神經網絡,如徑向基神經網絡和Hopfield網絡等。1986年科學家Rumelhart和McCelland提出了BP(Back Propagation)神經網絡,是一種按誤差逆傳播算法訓練的多層前饋網絡,是目前在字符識別中應用最廣泛的神經網絡模型之一。BP網絡能學習和存儲大量的輸入輸出模式映射關系,而無需事前揭示描述這種映射關系的數學方程。它的學習規則是使用最速下降法,通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差平方和最小。
BP神經網絡的結構如圖3所示。從左至右分別是輸入層、隱含層和輸出層。
從圖3可以看出,某一層的輸出就是下一層的輸入,即:am+1=fm+1(Wm+1am+bm+1),m=0,1,…M-1……
這里,M為神經網絡的層數。第一層的神經元的輸入為a0=p,最后一層神經元的輸出是a=aM,即為整個神經網絡的輸出。BP神經網絡雖然在字符識別領域有著重要的應用價值,但其存在如下問題:①進行字符識別時存在局部極小值問題;②算法通常需要迭代幾千步甚至更多,收斂速度慢;③隱含層和隱含層節點的數量難以確定。要解決上述問題,就需對BP神經網絡算法進行改進。
3.2 基于改進型BP神經網絡的字符識別
3.2.1 圖像預處理 在字符圖像采集、輸入的過程中由于受到多種噪聲的干擾,會使圖像質量下降,為字符識別工作帶來困難,因此需要對初始圖像進行必要的預處理。圖像預處理的具體步驟如下:①選取合適的閾值進行圖像二值化;②灰度變換增強對比度,改善視覺效果;③選取合適的方法去除噪聲,常用的有中值濾波、均值濾波、高通濾波等方法;④圖像分割,即將圖像中的字符獨立的分割出來。
3.2.2 字符特征值的提取 如果直接采用分割后的字符進行對比,那么需要對比的信息量很大,程序運行的時間也會大大增加。所以需要對分割后的字符進行特征提取,本文使用了類似九宮格的方法進行特征提取,即在字符圖像的水平方向上將圖像均勻分成三部分,在每一部分用一條水平方向的掃描線從左至右穿過字符,進行查找;垂直方向上原理相同,掃描線從上到下穿過字符,進行查找。取這六條線上的特征作為字符圖像的特征,這樣就得到了每個字符的六個特征值。
3.2.3 改進型BP神經網絡 針對BP神經網絡的局限性,為了避免落入局部極小值點,提高網絡訓練的精度和速度,對其算法進行了改進,常用的方法有:①優化初始權重。由于BP網絡的誤差曲面存在多個局部最小點和算法采用誤差梯度下降的方法調整網絡權重,因此導致了網絡的訓練結果極容易落入局部極小點。所以,網絡的初始權重對網絡的最終訓練結果影響非常大,它是影響網絡最終能否達到需求精度的重要因素之一。②調整自適應學習率。學習率η也稱步長,在標準的算法中為常數。BP算法的收斂特性和收斂速度很大程度上取決于學習率,對于不同的問題,其取值范圍也會不同。η取值過大可以加快學習速度,但會導致學習過程不收斂;η取值過小,則迭代次數明顯增加,導致學習速度過慢。為了加速收斂的過程,可以自適應改變學習速率。③附加動量法。動量法是指在反向傳播的基礎上,在每個權值調整值上加上一項正比于前次權值變化的值,并根據反向傳播法來產生新的權值變化。
本文為了簡單起見,采用附加動量法只對數字和英文字母進行字符識別,利用梯度下降法,使權值沿函數的負梯度方向改變。提高了學習速度,增加了算法的可靠性。
帶有附加動量項的權值調節公式為:
Wij(k+1)=Wij(k)+η[(1-α)D(k)+αD(k-1)]
其中,α是附加的動量項,取值范圍為0
3.2.4 設計改進型BP神經網絡進行字符識別 本系統采用了兩個BP網絡來進行數字和字母的識別。BP神經網絡的建立主要是三個層的神經元數目的確定。①輸入層節點數。此節點個數即為圖像預處理后所輸出的特征的維數。本系統輸入層節點數為24×48。②隱含層節點數。確定隱含層節點數的基本原則是:在滿足精度要求的前提下取盡可能緊湊的結構,即取盡可能少的隱含層節點數。本系統的兩個神經網絡,可以根據輸出層神經元的多少來確定其個數,即輸出層神經元越多,其隱含層神經元個數也越多。③輸出層節點數。用于識別數字的BP網絡,由于只有10個數字,所以采用了8421碼進行編碼,輸出層的神經元數目為4。而識別26個字母的BP網絡,其輸出層的神經元數目為5。待識別的字符圖像和訓練好網絡后識別的結果分別如圖4和圖5所示。
4 結束語
在字符識別的過程中,每一步都會有不同程度的誤差,本文神經網絡經驗證后識別率可達95.1%,平均識別時間為0.6s。影響識別成功率的主要因素是訓練樣本的數量和訓練次數,要保證一定數量以上的訓練樣本和訓練次數,以保證識別率。另外,神經網絡的層數和各層神經元的個數,對神經網絡算法的運行速度和識別率也有著直接的影響,其數量越多,識別率越高,但也制約著識別速度,因此,如何處理好兩者關系很重要。
參考文獻:
[1]關學忠,劉勇智.基于數字圖像處理的車牌定位及字符分割方法[J].裝備制造,2010(01).
[2]武桐.基于圖像匹配的漢字識別系統研究與實現[D].上海:上海交通大學,2010.