神經網絡的運用范文
時間:2024-03-28 18:14:37
導語:如何才能寫好一篇神經網絡的運用,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
關鍵詞:瓷磚表面缺陷;布爾神經網絡;瓷磚檢測
中圖分類號:TP274 文獻標識碼:A 文章編號:1009-2374(2013)30-0031-02
過去的神經網絡沒有解釋能力,其不能很好地觀測物體內部機理構造,而本文所論述的布爾神經網絡是在過去神經網絡上的一種升級,它將原始數據按照某種規則進行了編碼,然后利用編碼后得到的數據信息來重新驅動網絡,其各個節點具備有效的物理意義。當前瓷磚表面的缺陷依據瓷磚不規則性及顏色可分為幾種,按照缺陷所對應的類型可選擇使用不同的濾波器來進行檢測,因為缺陷瓷磚表面通常存在不規則形,所以濾波器在使用過程中有著極大的局限性,針對缺陷本身來說,雖然不同的瓷磚產品有著一定的差異,但是同種瓷磚又基本保持不變。而布爾神經網絡其可在大范圍內有效控制檢測的精度及速度,并具有智能型,因此對它的研究將具備極為重要的現實意義。
1 布爾神經網絡應用背景
隨著社會經濟的不斷發展,客戶對各類型產品表面的質量要求越來越苛刻,表面質量已經成為了直接決定產品價格及各個企業之間競爭的重要指標,另外,過去的人工目視檢測方法存在很多的缺陷及不足,如無法適應高速機組,對細小表面缺陷的檢測效率極低,并且如果長期進行檢測,檢測人員易出現視覺疲勞而無法長時間有效地進行整個材料表面的檢測。總之,傳統的檢測已經無法滿足現代化生產的需要。在這種背景下,新的檢測方法必然出現,而其中布爾神經網絡的應用就是其中的一種有效的檢測手段。
2 廣義的布爾神經網絡
過去的BP網絡在分類上屬于一種分層網絡,其各個節點域下一層節點在連接時通常是完全均勻的,而這種均勻直接連接在圖像感知時通常會致使網絡感知能力受到限制,但是廣義的布爾神經網絡是通過研究過去的前向神經網絡的優點及缺陷之后升級而來。如果單獨從數據驅動方面來講,布爾神經網絡也可叫做前向傳播網絡。在該網絡中其各個權重和神經網絡只能取值兩個,分別為{-1,1}、{0,1},其閾值也被限定為整數。
但是在具體進行運算階段通常是使用二進乘法、整數加法、比較操作法等幾種方法,因此與傳統的方法相比較其運算速度得到了提高,另外,這種網絡在訓練階段因為不存在反向傳播過程,所以其不需要反復迭代,這使得其運算速度又得到了進一步提高。
設總數是K的訓練樣本為ak,當,根據樣本ak,可計算對應的權值wk=2ak-1,由于ak的取值范圍在[0、1],因此,其第k節點的閾值表達式為:
在該式中rk表示神經網絡第k節點的吸引域,在該吸引域中心是該神經網絡的權重矢量中心wk,而在對樣本進行具體檢測時通常應用的方法為漢明距離測量法,如果測試樣本在進入某節點吸引域,那么對應的節點則被激活,其值顯示為1。
2.1 布爾神經網絡檢測流程
布爾神經網絡是一種三層網絡,如圖1所示,其第一層通常設置為輸入層,在進行檢測過程中在該層輸入標本模式數據,在分類過程則輸入采樣樣本數據信息,其第二層通常是以C個節點所組成,其各個節點都與輸入點相互連接,各個節點均有三個相同的參數,即權重、閾值及吸引域,這些參數必須要由訓練算法來求算,第三層包括兩個節點,分別是接受節點與拒絕節點,接受節點的閾值為1,和各個種類的節點相互連接的閾值也是1,拒絕的節點的閾值則為θ,其和第二層的連接權重則為-1,當種類層中出現多個節點是1的時候,那么接收點將被激活,與之相反當所有的種類節點顯示為0時,那么拒絕節點將被激活,說明該次輸入為奇異點,也叫做缺陷點,進而完成對缺陷的檢測。
2.2 布爾神經網絡的連續特征值
以上所述的布爾神經網絡需要輸入的驅動數據是二進制數,但在實際運用過程通常是連續值,因此必須要對該網絡所對應的連續特征值進行研究,首先要對連續值做好編碼,將這些數據信息轉化為和其完全對應的二進制數,而其具體的網絡結構圖如圖2所示,該處通常利用溫度計進行編碼,在實際操作過程中使用一連串的1來對連續值進行對應表示。因為其存在對應關系,因此該串1的長度和連續量的值一般為正比關系,在具體進行編碼過程中,由于要對一些特征值進行歸一化數,導致同類型的特征值在差異方面出現了更大的變化。
2.2.1 編碼算法。(1)對所有的特征值進行歸一化,讓其值的分布區間在[0,1],即以其最大值除去其所有的同種特征值。(2)選定一個有效的正整數,稱編碼為階次,使用該階次與所得歸一化特征值相乘,再加上0.5,并和其最為靠近的整數相互替換,最后將特征值變為正整數,使其分布區間為[1,階次+1]。(3)將相互替換得到的整數變為二進制數,如果所得二進制數的階次為5,則第4的編碼為111100。
2.2.2 訓練計算。首先將訓練獲取的數據及信息逐一離散化、歸一化,其次構建好網絡,依據一定的規律在訓練過程中有序的增減種類節點,接著對特征節點所對應的閾值依據二進制布爾神經網絡的訓練方式來求算,通常情況下訓練節點的權重是1,而其閾值和所對應連接特征數其對應的權重及閾值均是1。
2.2.3 分類計算。(1)對輸入的樣本信息進行歸一化并進行編碼轉換。(2)假設拒絕節點顯示為1,那么根據第四步進行。(3)種類節點的閾值必須加1。(4)如果拒絕節點顯示為1,則根據第五步或者根據第三步進行。(5)種類層其節點在進行計算時必須要減1,另外需要讀取的種類節點也是1,并且在進行檢測時確定其所屬的種類。(6)將各種類層所對應節點的閾值減去2,并進行再次分類。
3 分層進行檢測
在具體利用布爾神經網絡檢測瓷磚表面缺陷過程中,除了必要的將網絡分類中權重及閾值除去外,還要求對神經節點的各個吸引域做好對應的控制,但是其對一些較大的吸引域做出的結果往往很是粗糙,這致使虛警出現的概率大大地增加,另外也會導致漏警出現的概率增加。在進行分層檢測時,對于存在差異的分辨率要求適應不同的吸引域,對一些較低分辨率要求采用較大的吸引域,隨著進行逐層檢驗還需要緩慢減小吸引域,最終使得檢驗精度得到有效提高,因為對下層的檢驗是在上層檢驗結果出現之后才進行的,所以排除了吸引域,因此使得檢驗精度得到不斷提高。從圖像顯示來說,圖像結構包含K個層次,其中不同的層次在組合過程中其分辨率存在差異,最底層是由最初的輸入圖像,而在塔形k+1層則是下層元素在該基礎的一種簡單變換,另外第k層的元素比k+1層要多,這就呈現了一種塔形結構,因此對輸入客體來講,其敘述的準確性相對K層來說較為粗糙,最后頂層所具有的的元素應該
最少。
4 布爾神經網絡方法的運用方向
一般來說瓷磚表面出現的缺陷主要為刮痕、裂紋、斑點及針孔,其中針孔缺陷在進行檢測時通常是根據其的反射性質,并通過線型CCD來完成檢測的,而本文所述的檢測手段僅對瓷磚表面的刮痕、裂紋及斑點進行檢測,由于瓷磚本身的大小及形狀有著極大的不確定性,所以使用本文所述的方法進行瓷磚的缺陷檢測比傳統濾波器檢測效果
更好。
5 結語
本文主要闡述了對瓷磚表面缺陷檢測過程中布爾神經網絡技術的一些簡單運用,其具體分為兩個階段,即訓練階段與檢測階段,為了測試檢測的正確性,通常是將同一塊磚的無缺陷部位來作為檢測的訓練樣本,而將其中的缺陷部分進行檢測,工作時充分利用以下三個參數:方差、能量、均值,在數字化過程中要求取階次N=10,這樣可直接獲取[1,11]位所對應的二進表達,因為使用了溫度進行編碼,所以整個過程一定要以值的大小來做基礎參考,從實驗結果來看,利用本文所述的方法來檢測,對缺陷的檢出率得到了有效提高。
參考文獻
[1] 戴哲敏,許增樸,于德敏,王永強.計算機視覺在
瓷磚表面顏色勻度分析中的應用[J].中國陶瓷工業,
2002,(4).
[2] 吳平川,路同浚,王炎.機器視覺與鋼板表面缺陷的
無損檢測[J].無損檢測,2000,(1).
[3] 趙海洋,馮心海,薛鈞義,江顯異.基于機器視覺的
瓷磚表面質量分析與檢測[J].西安建筑科技大學學報
(自然科學版),2000,(1).
[4] 羅瑋,彭復員,柳健.彩色瓷磚的自動分類系統[J].
篇2
一般而言,計算機網路安全管理指的是計算機在連接網絡后進行信息的交換、瀏覽以及下載的過程中,對信息安全進行有效的管理,防止信息被他人竊取或者破壞。隨著信息時代的到來,越來越多的人對計算機產生了很強的依賴,從兒童到老年人,計算機的影響無處不在,隨著計算機的普及,人們在使用計算機的過程中對其安全性就有了顧忌。對于計算機網絡,只要連接互聯網,隨時都存在被攻擊的可能,相對而言,沒有任何計算機是絕對的安全或者是不受到任何的攻擊。運用計算機網絡技術進行攻擊或者盜取個人信息或者是企業信息的事件凡乎每年都會發生,計算機網絡存在嚴重的安全隱患。所以,要及時的認識以及了解計算機網絡面臨的安全隱患,積極的采取相應的措施加強對計算機網絡安全的管理
2神經網絡在計算機網絡安全管理應用的現狀
2.1對神經網絡在計算機安全管理運用中的重視程度不夠。計算機網絡安全是因特網發展的最基礎的目的,但與此同時近乎所有的計算機網絡在開創以及不斷的發展過程中都趨向于實用以及便利,相反卻在一定程度卜沒有重視對計算機的安全管理,更沒有將神經網絡技術運用到計算機的安全管理中,進而對計算機網絡的安全管理留下了嚴重的隱患。另外,神經網絡在計算機網絡安全管理中主要是對計算機的網絡安全進行評估,然而由于不重視對神經網絡在計算機網絡安全管理中的運用,使得沒有建立良好的計算機網絡安全評價標準體系。
2.2對神經網絡在計算機網絡安全評價模型的設計和實際運用不夠合理。一般來說,神經網絡在計算機網絡安全管理中主要是對計算機網絡安全進行一定的評估,在對其進行評估的過程中,就需要設計一定的計算機網絡安全評價模型,主要包含刊浦俞入層、輸出層以及隱含層的設計;但是,目前神經網絡在計算機網絡安全管理中對于評價模型的設計還沒有將這三方面有效的聯系起來、除此之外,對神經網絡在計算機網絡安全管理的實際運用中,不能科學、合理的實現計算機網絡安全管理評價模型運用,不注重對評價模型的學習以及不關注對評價模型進行有效的驗證。
3加強神經網絡在計算機網絡安全管理中的應用采取的措施
3.1神經網絡在計算機網絡安全管理中要科學、合理的設計網絡安全評價模型。神經網絡在計算機網絡安全管理中要科學。合理的設計網絡安全評價模型,以便更好的實現計算機網絡安全、高效的運行。為此,計算機網絡安全評價模型需要進行一下設計:首先是對輸入層的設計,一般來說,神經網絡在計算機網絡安全管理運用中,對于輸入層考慮的是神經元的節點數以及評價指標的數量,盡可能的使這兩者數量保持一致。其次是對隱含層的設計,對于隱含層的設計需要注意的是若某個連續函數在任意的閉區間中,可以通過在隱含層里的神經網絡來靠近,大多數情況下,神經網絡通常運用的是單隱含層。最后是輸出層的設計,神經網絡的輸出層設計主要是獲得計算機網絡安全管理評價的最終結果,例如可以設置計算機網絡安全管理評價的輸出層節點數為2,那么相應的輸出結果(l,)l指的是非常安全、(o,)l指的是較不安全、(,l山指的是基本安全以及(,0切指的是非常的不安全。
3.2神經網絡在計算機網絡安全管理運用中要對評價模型進行有效的驗證。需要注意的是,神經網絡在計算機網絡安全管理運用中要對評價模型進行有效的驗證,一般體現在一下幾方面:首先是要關注評價模型的實現,為了實現神經網絡在計算機網絡安全管理中的良好運用,就要依據客戶滿意的評價模型,運用計算機網絡技術創建設置含有輸入層、隱含層以及輸出層的神經網絡模型,然后再對網絡安全進行檢驗。其次是要注意對評價模型的學習,在對計算機網絡安全進行評價之前,需要對神經網絡進行標準化的處理,才能盡可能的減少對計算機網絡安全管理評價中的誤差。最后要注意對評價模型進行驗證,當神經網絡經過標準化處理以及在計l章機網絡安全評價之后,就需要刊輸出的結果進行一定的驗證,以便確定神經網絡對計算機網絡安全的評價輸出結果是否與期望的評價結果相一致,進一步驗證神經網絡在計算機網絡安全管理中安全評價模型的準確與否。
3.3重視神經網絡在計算機網絡安全管理運用以及建立健全安全評價標準體系。神經網絡在計算機網絡安全管理運用中主要的任務是對計算機網絡的安全進行一定的評價,并且將評價的結果準確、及時的反饋給用戶,所以就應該對其在計算機網絡安全管理中的應用引起高度的重視,為此就應該建立健全計算機網絡安全管理的評價標準體系。一方面是評價指標的建立,計算機網絡安全管理是復雜的過程,同時影響計算機網絡安全的因素比較多。因此,建立科學、合理以及有效的計算機網絡安全管理評價標準,對于神經網絡高效的開展評價工作有很大的關聯。另一方面是刊評價標準的準確化,影響計算機網絡安全管理的因素非常的多,就應該對各種評價標準進行細化,以達到評價的準確。
4結束語
篇3
關鍵詞 人工神經網路 林分材種出材率 BP算法
引言
林分材種出材率是林分調查工作的重要指標,它可以進一步評價森林木材資源的經濟價值,而研究森林木材,又可以合理正確的經營森林資源,達到人與自然和諧相處的目的。林分林種出材率就是原木材積于立木材積之比,我國現行的森林采伐限額制度、查處亂砍濫伐林木案件、制訂林業發展規劃、計劃和編制森林經營方案、預測和計算、開展森林資源資產評估等等,都需掌握積蓄量和材種的出材率的指標。我國已經不斷學習借鑒前蘇聯的先進技術編制自己的材種出材率表了,隨著我國天然林保護工程的全面實施和林業分類經營的逐步推行,人工商品林比例的不斷提高,我國森林結構和性質也有所變化,所以傳統的統計學以難以解決很多問題,運用人工神經網絡在林業生成與運用則是一個不二之選的方法,對林業的發展也有很大的理論價值和推廣意義。
人工神經網絡(Artificial Neural Network-ANN),簡稱“神經網絡”,是由大量處理單元過極其豐富和完善的互聯組成的非線性、自適應信息處理系統。它的提出是基于現代神經科學研究成果上,以模擬大腦神經網絡處理、記憶信息的方式進行信息處理。涉及學科較多,較為廣泛。
1 研究內容和方法
平均樹高,平均胸徑,林種年齡,立地質量,積蓄量,保留密度等等因素都會影響林分材種出材率,而林分林種出材率具有非線性和非確定性的因素,一般采用統計分析方法進行預測采樣,需要大量的林木樣本元素,模型涉及的許多參數無法或很難有較高的精確度。
人工神經網絡(Artificial Neural Network)具有非線性,非局限性,自適應,自組織,自學習的特征,相較于傳統的統計學方法,不同之處在于它的容錯性和儲存量,通過單元之間的相互作用,相互連接能模擬大腦的局限性。ANN的獨到之處,也使得人們注意了ANN,并且廣泛的應用于各種學科之中,如心理學,邏輯學,數學模型,遺傳算法,語音識別,智能控制等等。當然,運用人工神經網絡對林分林種出材率進行預測也同樣具有很好的效果與實現。
研究主要完成,通過對數據的采樣和分析處理,對神經網路預測模型的結構,參數進行優化,再應用到林分材種出材率的預測中。以c++程序設計為設計平臺,運用人工神經網絡中的BP算法,分析各隱含層神經元的數量,訓練的次數,隱含層函數,樣本數量,進行優化建立林分材種出材率的預測模型。
1.1BP人工神經網絡
BP(Back-Propagation Network)神經網絡是一種以誤差逆傳播算法(BP)訓練的多層前饋網絡,目前應用較為廣泛的神經網絡模型之一。BP神經網絡能學習和存貯多個輸入-輸出模式映射關系,而且無需事前對這種映射關系的數學方程進行描述。它通過不斷反向傳播來調整神經網絡的權值和閾值,使神經網絡的誤差平方和最小。BP神經網絡模型拓撲結構由三層組成分別是輸入層(input)、隱層(hidelaver)和輸出層(output layer)。
BP人工神經網絡主要以標準BP算法為主,而標準BP算法有存在許多問題,由于是非線性梯度優化算法,就會存在局部極小值問題,使得精確度受限;算法迭代系數過多,使得學習率降低,收斂速度降低;網絡對初始化的值存在發散和麻痹;隱節點不確定性的選取。所以引進了幾種BP算法:動量BP算法、學習速率可變的BP算法和LM算法(Levenberg-Marquardt)。動量BP算法以上一次修正結果來影響本次的修正,動量因子越大,梯度的動量就越大。學習效率可變的BP算法怎是力求算法的穩定,減小誤差。為了在近似二階訓練速率進行修正時避免計算HeSSian矩陣,選擇LM算法。所以為了神經網絡計算的速度與精確度,所以運用不同的優化算法來改善BP網絡中的局部極小值問題,提高收斂速度和避免了抖動性。
2 基于BP人工神經網絡和林分材種出材率預測模型的建立
分析了大量的材種出材率的相關資料后,均有非線性的特征,對于模型的建立和預測,傳統的識別系統在研究和實踐中有很大的問題,而采用人工神經網絡,不僅其特征是非線性,而且人工神經網絡具有較為穩定的優越性,所以,對于林分材種出材率的預測和建立采用BP人工神經網絡。
2.1建模工具
研究采用c++程序設計對數值的計算和預測,對模型進行編譯和實現。c++語言是受到非常廣泛應用的計算機編程語言,它支持過程化程序設計,面向對象程序設計等等程序設計風格。c++是一門獨立的語言,在學習時,可以結合c語言的知識來學習,而c++又不依賴于c語言,所以我們可以不學c語言而直接學習C++。
用c++來模擬BP網絡是相對較好的程序設計語言,以面向對象程序設計來設計和實現林分材種出材率的BP算法,直觀而簡潔。
2.2BP神經網絡結構的確定
對于使用BP算法,關鍵在于隱含層層數和各層節點數。而神經元的輸入輸出又影響著隱含層層數,而對于BP萬羅中的輸入輸出層是確定的,重點就在于隱含層層數,增加隱含層數可以提高網絡的處理能力,是的訓練復雜化,樣本數目增加,收斂速度變慢等,而隱含層的節點數越多,可以提到其精確度。
研究過程中,多層隱含層會將訓練復雜化,所以我們往往選擇三層就夠了,即一個輸入層,一個隱含層,一個輸出層的基本單層BP網絡結構。最后確定以下四個神經元:平均樹高、平均胸徑、林種年齡、每公頃積蓄量作為輸入單元。輸出單元為林分材種出材率。
結論
以BP神經網絡建立林分材種出材率的網絡模型,使得出材率的精確度提高。根據樣本的選取和整理,算法的優化,避免了異常數據和算法的不安全性對神經網絡的學習影響,提高了網絡的繁華能力,利用數據歸一化節約了網絡資源,學習負擔減輕,避免了訓練過程中的抖動與麻痹狀態。歲模型的總體分析,減少神經元個數的輸入,權值減少,極大的提高了網絡訓練中的收斂速度,也使得網絡的穩定性和容錯性提高。
篇4
關鍵詞:回歸神經網絡;時間序列;數據預測;歸一化方法
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)07-1508-03
在工業、氣象、金融、地理、醫藥、交通、環境等領域,都存在大量需要進行分析與處理的數據信息,在對這些數據信息進行挖掘分析的過程中,為了能提高分析效能與提高分析性能,在進行數據分析初期階段需要對原始數據進行預處理,將原始數據值通過某種算法轉化為所需分布范圍數據,即數據標準化處理。
利用神經網絡模型來進時間序列數據趨勢預測是一個已經開展了很長時間研究的熱門話題,這方面也有了許多研究成果。Connor[1]等運用非線性自回歸平均移動預測模型來進行時間序列問題魯棒預測,cheung[2]等運用神經網絡模型對未來的金融數據進行預測,Wang[3]等設計出一種基于回歸神經網絡的多維并行預測模型,文獻[4] 采用基于自回歸神經網絡進行多維動態預測。在運用神經網絡預測模型進行趨勢預測時,需要對時間序列數據進行缺失值及數據標準化處理,下文運用多維動態預測模型對幾種常見的數據歸一化方法進行分析。
1 回歸神經網絡預測模型
圖一為基于回歸神經網絡的多維動態預測模型[5]。網絡模型分為輸入層、分配層、隱層與輸出層四層;隱層為具有延遲一步功能的反饋單元,作用函數為Sigmoid函數,輸出層作用函數為線性累加函數。
2 數據歸一化方法
數據歸一化方法很多,用的較多的有線性歸一化與非線性歸一化兩種方法。線性歸一化方法主要運用極值或則均值通過線性運算公式對原始數據進行運算,將數據轉換為[-1,1]區間內的數值;非線性歸一化方法主要運用一些非線性行數對原始數據進行運算,將數據轉換為一定分布范圍數據。
從實驗結果來看,初始數據的歸一化處理方法對自回歸神經網絡預測模型的預測性能有明顯的影響,線性歸一化方法中最大值運算法要優于最大最小值法;非線性歸一化方法中,對數運算法優于反正切運算法,總體來看,運用最大值運算法對初始數據進行歸一化標準化處理適合于自回歸神經網絡預測模型。
4 結論
通過運用基于自回歸神經網絡的動態預測模型來分析幾種常見數據歸一化方法對模型預測性能的影響,結果表明,數據歸一化方法的選擇會對自回歸神經網絡預測模型性能有明顯影響;對于自回歸神經網絡預測模型,運用最大值運算法來進行數據歸一化處理要優于其它幾種常見方法。
參考文獻:
[1] Connor J T,Martin R. D,Atlas L E.Recurrent neural networks and robust time series prediction[J].In IEEE Trans. on neural networks,1994(5):240–254.
[2] Cheung Y M,Leung W M,Xu L.A RPCL-CLP architeeture for finaneial time series forecasting[C].Proceedings of IEEE International Conference on Neural Network,1995,2:829-832.
篇5
本文作者:仇阿根、熊利榮、趙陽陽 單位:中國測繪科學研究院、武漢大學資源與環境科學學院、華中農業大學工學院
花生仁的外衣完整性檢測是一種模式識別。根據影響花生仁外衣完整性的顏色特征參數,對花生仁外衣完整性進行識別。在神經網絡運用領域里,算法的確定無法用一個完全標準,主要是靠經驗來選擇的。基于以上原因,花生仁外衣完整性檢測神經網絡的設計算法選擇BP算法[9],該算法能實現輸入與輸出之間的非線性映射,對于樣本數量有限的情況也同樣適用。一個典型的BP網絡結構如圖3所示。BP神經網絡通常具有多個隱含層。本文中,隱層神經元采用Sigmoid型傳遞函數,輸出層采用logsig型傳遞函數。花生仁的外衣完整性檢測是一種模式識別。根據影響花生仁外衣完整性的顏色特征參數,對花生仁外衣完整性進行識別。在神經網絡運用領域里算法的確定無法用一個完全標準的算法確定,主要是靠經驗來選擇的。基于以上原因,花生仁外衣完整性檢測神經網絡的設計算法選擇BP算法。一個典型的BP網絡結構(如圖3所示)通常具有一個或多個隱層。其中,隱層神經元通常采用Sigmoid型傳遞函數,而輸出層神經元則采用logsig型傳遞函數。
BP識別系統是以BP神經網絡分類器[10]為核心的系統,系統設計如圖4所示。BP神經網絡分類器由一個BP網絡訓練子系統生成得到,圖像由CCD攝像頭獲得后,由圖像采集卡數字化輸入計算機,提取特征區域獲得顏色特征參數,這些參數輸入BP網絡即可得到分類結果。影響花生完整性的顏色特征參數為H,I和S,因此輸入層節點數等于3;網絡的輸出有兩種情況,即完好與破損,因此輸出層有2個節點;對應于完整和破損這兩種判斷結果,分別用2位二進制編碼為10和01。隱含層的節點數的確定非常重要,數目過少,網絡將不能建立正確的判斷界,使網絡訓練不出來或不能識別以前沒有的樣本,且容錯性差;而節點數目過多,學習時間長,使網絡的泛化能力降低。本文通過多次反復訓練網絡,確定隱含層節點數目為40。本研究采用Matlab軟件及其神經網絡工具箱來實現網絡建模。在神經網絡工具箱中,對神經網絡的名稱、類型、結構和訓練函數等參數進行設置,如表1所示。
建立了BP神經網絡并對網絡進行初始化后,就可對網絡進行訓練了。將訓練步數設為500步,將訓練目標誤差goal參數設置為0.01,結果如圖5所示。圖5中,橫坐標表示本網絡的預置訓練步數,縱向坐標表示本網絡的預置訓練誤差,水平橫線表示期望的目標誤差,誤差變化曲線如圖5所示。由圖5可知,當網絡訓練到170步時,網絡誤差已經達到期望的目標值0.01,訓練即可停止。
本文采用BP神經網絡與計算機視覺技術相結合的手段,建立了一個花生外衣完整性判別系統。實驗證明,判別準確率達到87.1%。此系統很容易推廣在其他農產品的檢測中,只需要改變輸入和輸出樣本數據,重新訓練一下BP網絡,即可投入使用。因此,將BP神經網絡運用到農產品的品質檢測過程中,具有巨大的潛力和廣闊的應用前景。但必須指出的是,此方法高效可行,整個訓練過程只用了6s,且本研究建立在靜態實驗環境下,生產效率依然很低。如果要將此實驗結果運用生產實際,必須設計出配套的硬件分級設備,這將是后續研究的重點。
篇6
黑科技?神經網絡是個什么鬼
說到神經網絡,很多朋友都會認為這是一個高大上的概念。從生物學角度來說,人類復雜的神經系統是由數目繁多的神經元組合而成,它們互相聯結形成神經網絡,經過對信息的分析和綜合,再通過運動神經發出控制信息,從而實現各種精密活動,如識別各種物體、學習各種知識、完成各種邏輯判斷等。
隨著人工智能技術的發展,科學家開發出人工神經網絡,它的構成原理和功能特點等方面更加接近人腦。它不是按給定的程序一步一步地執行運算,而是能夠自身適應環境、總結規律、完成某種運算、識別或過程控制。比如多倫多大學的Krizhevsky等人構造了一個超大型卷積神經網絡,有9層,共65萬個神經。第一層神經元只能識別顏色和簡單紋理,但是第五層的一些神經元可以識別出花、圓形屋頂、鍵盤、烏、黑眼圈等更為抽象豐富的物體(圖1)。因此神經網絡實際上是基于人工智能技術而形成的一種和人類神經網絡相似的網絡系統。
媲美Photoshop 神經網絡磨皮技術背后
如上所述,現在神經網絡技術發展已經非常迅猛,而且運用在各個領域。神經網絡磨皮則是指該技術在照片識別和美化方面的運用。那么它是怎樣實現對照片的美化?在Photoshop中磨皮操作是用戶先選中人臉區域,然后再使用Photoshop內置的方法實現磨皮。神經網絡磨皮原理類似,只不過這些操作是自動完成的。
首先是對照片人臉識別。要實現對照片的美容就必須先精確識別人臉,由于人臉有五官這個顯著特征,因此神經網絡磨皮技術只要通過機器對一定數量的人臉照片進行識別、讀取,然后就可以精確識別人臉。它的原理和常見的人臉識別技術類似(圖2)。
其次則是美化。在完成人臉識別后就需要對美化操作進行機器學習,以磨皮為例。因為人臉的每個年齡階段皮膚性質是不同的,為了達到更真實的磨皮效果,神經網絡磨皮是實現用戶“回到”幼年或者“穿越”到老年臉部皮膚的效果。研究人員將年齡段分類為0~18歲、19~29歲、30~39歲、40~49歲、50~59歲和60歲以上這幾個階段(圖3)。
然后準備兩個深度學習機器同時工作。兩個機器一個用來生成人臉,一個用來鑒別人臉。而且兩個機器會通過分析人臉圖像,提前學習到各年齡段人臉大概是什么樣子的。在每個年齡分組里,研究人員讓機器學習超過5000張標記過年齡的人臉圖像。通過大量的照片學習后,機器就可以學會每個年齡分組內的標簽,它可以準確知道每個人不同年齡階段的臉部特征。這樣無論你是要磨皮為年輕時的皮膚光滑、圓潤狀態,還是要變為50歲以后皺褶、粗糙的皮膚,神經磨皮都可以輕松幫助你實現。
當然學習有個通病,就是在合成過程中,機器可能會喪失掉圖片原有的識別資料(1D)。為了解決這個問題,上述介紹中的人臉鑒別機器就發揮功效了。它通過查看這個照片的識別資料是不是唯一的,如果不是的話照片則會被拒絕輸出。研究人員讓機器合成10000張從數據庫中抽取出來的人像,這些照片之前從未用來訓練機器。然后他們用開發的軟件程序來檢測訓練前后的兩張照片是否為同一個人,測試結果顯示有80%經訓練的照片都被認為和原照片是同一個人(而作為對比,用其他方法加工照片,平均測試結果只有50%)。舉個簡單例子,如果40歲的用戶將自己磨皮為20歲的樣子,如果軟件程序來檢測訓練前后的兩張照片為同一個人,那么就輸出磨皮效果,從而讓用戶可以輕松磨皮到20歲的狀態。這樣經過訓練的神經磨皮算法可以很真實地實現人臉的磨皮。
神經網絡 不H僅是磨皮
篇7
關鍵詞 人工;神經網絡;機器學習方法
中圖分類號Q1 文獻標識碼A 文章編號 1674-6708(2011)40-0111-02
0 引言
機器學習方法經常被應用到解決醫學和生物信息學的問題。在這個報告中我列舉了一些把機器學習方法應用到生物信息學領域的實例。比如:組建多重神經網絡,運用該神經網絡對4種不同形勢的腫瘤患者進行分類。
1 介紹
人工神經網絡屬于機器學習領域。關于人工神經網絡的概念最早提出于1940年代。后來在1980年代后被推廣應用,尤其是在醫學領域。
其中一個非常有用的用途是對疾病進行分類,達到診斷的目的,或者對基因表達進行分類。在這類神經網絡里面,k點最近鄰居算法是最常被采用的算法。
人工神經網絡的優點是:不需要人們蛆關注神經網絡里面的細節信息;人工神經網絡可以很容易地被重新訓練來應對不同地分類數據。人工神經網絡可以用來解決有監督學習和無監督學習,比如:自組織特征映射(self-organized feature map)就可以用來解決無監督學習的問題。
它的不足之處在于:人工神經網絡往往需要大量的訓練數據,而這些訓練數據往往不是很容易獲得。人工神經網絡可以被看作是一個黑盒,它的細節隱藏在點點之間的權值里面。這些權值的意義是人類無法理解的。同時,人工神經網絡需要被仔細的訓練以避免過擬合的情況出現。我們常常需也要降低高維數據的維度。下面,我將分析介紹人工神經網絡的具體應用。
人工神經網絡的結構如圖1所示:
X1 ,X2 ,X3是該神經網絡的輸入值,w0 ,w1 ,w2 ,w3 是該神經網絡的輸入結點到內部節點的路徑權值,每個神經元的激活函數是如上圖右側所示的函數圖像。
這個函數被稱作為sigmoid函數,表達式如下:
多重神經網絡通常有3層,事實上,3層神經網絡以能進行很好的分類效果。這三個層包括輸入層,隱藏層,輸出層。在每個神經元內部我們可以選擇sigmoid激活函數或其他種類的激活函數。
如圖2所示:
單個神經元僅能提供線性的分割面,所以多層神經網絡可以提供非線性的分類函數(即:若干個線性分割面的復雜組合)。這并不意味著4層神經網絡就一定比3層神經網絡能一共更好的分類效果,因為層數越多,需要的訓練集就越龐大,得到的效果也不會提高。
既然有訓練問題,就會涉及到訓練算法。較為早的和著名的訓練算法是delta 規則。它于20世紀60年代被提出。它的原理是計算理論輸出值和世紀輸出值的均方差。tp 為理論輸出值,yp為實際輸出值,表示為:
訓練的開始階段,我們通常設定一個隨機選取值,令該值等于:
該公式里,α是學習速率,學習速率越大,學習的過程就越快,完成學習的時間短。但如果學習的速率過大,可能導致網絡的理想權值在合理結果的附近游擺而永遠無法獲得理想的權值。
神經網絡被訓練好了以后,它就被用到解決目標問題。原始的數據集可以被分為兩部分:一部分用來訓練,一部分用來測試。
有時候神經網絡會把訓練數據集里面的噪音點的特征納入自己的權值表達里,從而該神經網絡無法真正體現該點集的真實特征。我們把這種情況叫做過擬合。過擬合是由于網絡比待估函數復雜造成的。比如一個可以同3層網絡解決的問題,我們用4層網絡或者由更多神經元的三層網絡去解決該問題,就容易造成過擬合。為了更好的明確訓練時所采用的神經網絡的隱藏層的層數,Livingstone 和 Manalack 提出了如下計算公式:
D = m*o/w
該公式里m是訓練樣本的數目,o是該網絡的輸出值,w是網絡權值的數目,D就是隱藏層的數目。
得到了隱藏層的數目之后,我們可以以這個數目創建神經網絡,邊訓練邊削減,直到我們獲得一個一半化的網絡。對于沒有隱藏網絡層或只有一個隱藏網絡層的神經網絡,我們需要先確定它要解決的問題是否是線性的。
適當的訓練方案是能也可以使網絡的復雜性和數據的復雜性得到合適的匹配。一個合適的訓練方案應該是如下步驟:首先選擇一個很大的網絡并且把它的每個權值都設到一個很小的值上。通過訓練,這些權值可以逐漸游擺到一個合理的值。
由于初始數據集通常要被分為訓練集和測試集。在醫學領域,我們能獲得的數據集往往很小,比如某種病的病人數目不會很大。所以我門需要采用交叉驗證的技巧來是較小的數據集在被分為訓練集和測試集之后能較好的訓練神經網絡。
篇8
[關鍵詞] Spiking神經網絡 學習模型 股市預測
一、引言
隨著經濟的增長,對于股市的預測將變得越來越重要,也成為經濟理論研究中的一個重要課題。股票市場的變化有很多因素,是一個復雜的非線性系統,而人工神經網絡能夠從大量復雜的數據中找到數據間的內在聯系,具有良好的自我學習和抗干擾能力,在股票預測領域中取得了顯著的效果。本文應用一種更接近于生物神經系統的Spiking神經網絡,采用基于粒子群算法的學習模型,構建了滬市上證綜合指數的學習預測模型,并用實際數據進行了分析實驗。
二、Spiking神經網絡及其學習模型
Spike神經元模型是更接近生物神經元的一個數學模型,由Spike神經元構成的人工神經網絡稱為Spiking神經網絡。在Spiking神經網絡中,一個Spike神經元在t時刻接收來自于父突觸神經元的多個post-synaptic potential(PSP)信號,不斷改變自己的膜電壓。當它的膜電壓超過閾值時,產生一個spike,并通過突觸連接向外發送PSP信號。用于描述PSP信號的spike響應函數定義為:
三、上證綜合指數的預測
滬市上證綜合指數是上海證券交易所編制的,以上海證券交易所掛牌上市的全部股票為計算范圍,以發行量為權數綜合,上證綜指反映了上海證券交易市場的總體走勢,所以對上證綜指的預測具有重要的意義。文中選取了2006年6月~2007年7月共286個工作日的滬市上證綜合指數作為研究的原始數據,利用滑動窗口技術,通過前6天收盤時的上證指數來預測第7天收盤時的上證指數。
我們構建了具有6個輸入神經元、4個隱含層神經元和1個輸出節點的前向全連接Spiking神經網絡,并利用以上的Spiking神經網絡學習模型進行測試。選取了原始數據中的前276個數據構成神經網絡的訓練集,后10個數據用于測試。在實驗前,我們對原始數據進行歸一化的處理轉換為[0,1]之間的值。把歸一化后的前6天收盤時的上證指數分別作為6個輸入神經元的spike時間加入到Spiking神經網絡中進行學習和計算,獲得神經網絡輸出節點的spike時間,該時間對應于第7天的收盤指數。按本文式(3)計算獲得Spiking神經網絡的學習誤差,通過粒子群算法不斷調整神經網絡的參數使誤差最小化。獲得了最優的Spiking神經網絡后,用測試集的數據對其性能進行了測試。經Spiking神經網絡學習預測后的上證指數變化如圖。
結果表明,與傳統BP算法相比,基于粒子群算法的Spiking神經網絡具有較快的運算速度和逼近性能, 同時可以克服SpikeProp算法陷入局部最優解和對權值有約束的缺點,可以較好地處理股票類非線性數據的學習和預測。
四、結論
股票市場的不確定因素太多,是一個復雜的非線性系統,而神經網絡具有自我學習的能力,能很好地解決不明確環境中的非線性應用問題。Spiking神經網絡作為一種新型的動態的神經網絡,其利用動態的spike時間進行信息編碼和計算的特點與股票市場中動態的時間序列相吻合。文中對應用Spiking神經網絡預測國內股票市場做了初步的探討,獲得了較好的擬合效果。進一步改進原始數據的處理方式,提高Spiking神經網絡的自適應能力,將能得到更好的預測效果。
參考文獻:
[1]Sander M:Bohte, Spiking Neural Networks [D].ISBN 90-6734-167-3, 2003
[2]Gerstner W, Kistler W. Spiking Neuron Models: Single Neurons, Populations, Plasticity [M]. Cambridge University Press, 2002
[3]韓文蕾王萬誠:概率神經網絡預測股票市場的漲跌[J].計算機應用與軟件,2005,22(11):133~135
篇9
關鍵詞:強化學習;神經網絡;馬爾科夫決策過程;算法;應用
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2012)28-6782-05
在機器學習領域,大致可以將學習分為監督學習、非監督學習和強化學習三大類。強化學習以其在線學習能力和具有無導師制的自適應能力,因此被認為設計智能Agent的核心技術之一。從20世紀80年代末開始,隨著數學基礎日益發展的支持,應用范圍不斷擴大,強化學習也就成為目前機器學習的研究熱點之一。在研究過程中,隨著各種方法、技術和算法大量應用于強化學習中,其缺陷和問題也就日漸顯現出來,尋找一種更好的方式和算法來促進強化學習的發展和廣泛應用,是研究人員探討和研究的重點。因此,神經網絡及其算法以其獨特的泛化能力和存儲能力成為眾多研究人員重視的研究對象。
在此之前,已有大量研究者通過神經網絡的特性來加強強化學習的效果及應用。張濤[2]等人利用將Q學習算法和神經網絡中的BP網絡、S激活函數相結合,加上神經網絡的泛化能力,不僅解決了倒立擺系統的一系列問題,而且還進一步提高了強化學習理論在實際控制系統的應用。林聯明在神經網絡的基礎研究Sarsa強化算法,提出用BP網絡隊列保存SAPs,解決由于過大而帶來的Q值表示問題[3]。強化學習理論在機器控制研究中也應用廣泛。段勇在基于行為的移動機器人控制方法基礎上,將模糊神經網絡與強化學習理論相結合,構成模糊強化系統,解決了連續狀態空間和動作空間的強化學習問題和復雜環境中的機器人導航問題[4]。由此可見,將神經網絡與強化學習相結合,已經是現今強化學習研究的重點方向,也已經取得了頗豐的成果。但是,如何將神經網絡和強化學習理論更好的融合,選擇何種算法及模型,如何減少計算量和加快學習算法收斂速度,以此來推動強化學習理論研究更向前發展,解決更多的實際應用問題,這些依然還是待解決的研究課題之一。下面,根據本人對強化學習的研究,朋友給予的指導以及參照前人的研究成果,對基于神經網絡的強化學習作個基本概述。
1 強化學習
強化學習(reinforcement),又稱再勵學習或評價學習,它是重要的機器學習方法之一,在機器人控制、制造過程控制、任務調配及游戲中有著廣泛的應用。
1.1 定義
所謂強化學習就是智能Agent從環境狀態到行為映射的學習,并通過不斷試錯的方法選擇最優行為策略,以使動作從環境中獲得的累積獎賞值最大。
強化學習狀態值函數有三個基本表達式,如下:
這三個狀態的值函數或狀態—動作對函數的值函數是用來表達目標函數,該目標函數是從長期的觀點確定什么是最優的動作。其中[γ]為折扣因子,[rt]是agent從環境狀態[st]到[st+1]轉移后所接受到的獎賞值,其值可以為正,負或零。其中式(1)為無限折扣模型,即agent需要考慮未來h([h∞])步的獎賞,且在值函數以某種形式進行累積;式(2)為有限模型,也就是說agent只考慮未來h步的獎賞和。式(3)為平均獎賞模型,agent考慮其長期平均的獎賞值。最優策略可以由(4)式確定
1.2 基本原理與一般結構
強化學習就是能夠和環境進行交互的智能Agent,通過怎樣的學習選擇能夠達到其目標的最優動作。通俗的說,在Agent與環境進行交互的過程中,每個行為動作都會獲得特定的獎賞值。如果Agent的某個行為策略導致環境正的獎賞值(強化信號),那么Agent以后產生這個行為策略的趨勢就會加強。Agent的目標就是對每個離散的狀態發現最優策略以期望的折扣獎賞和最大。
在上述定義中描述了強化學習的三個狀態值或函數動作對函數來表達目標函數,可以求得最優策略(根據(4)式)。但是由于環境具有不確定性[5],因此在策略[π]的作用下,狀態[st]的值也可以寫為
強化學習把學習看作試探評價過程,可用圖1描述。強化學習選擇一個動作作用于環境,環境受到作用后其狀態會發生變化,從一個狀態轉換到另一個狀態,同時產生一個強化信號反饋給Agent,即獎懲值。Agent接受到獎懲值和環境狀態變化,進行學習更新,并根據獎懲值和環境當前狀態選擇下一個動作,選擇的原則是使受到正強化(獎)的概率增大。選擇的動作不僅影響立即強化值,而且影響環境下一時刻的狀態及最終的強化值。
2 神經網絡
2.1 神經網絡概述
神經網絡是指模擬人類大腦的神經系統的結構與功能,運用大量的處理部件,采用人工方式構造的一種網絡系統。神經網絡是一種非線性動力學系統,并且具有以分布式存儲和并行協同處理的特點,其理論突破了傳統的、串行處理的數字計算機的局限。盡管單個神經元的結構和功能比較簡單,但是千千萬萬個神經元構成的神經網絡系統所能表現的行為卻是豐富多彩的。
單個神經元的模型如圖2所示。
人工神經元模型由一組連接,一個加法器,一個激活函數組成。連接強度可由各連接上的值表示,權值為正表示激活,權值為負表示抑制;加法器用于求輸入信號對神經元的相應突觸加權之和。激活函數用于限制神經元輸出振幅。
神經元還可以用如下公式表示
激活函數主要有閾值函數、分段線性函數、非線性轉移函數三種主要形式。
一般來說,神經網絡在系統中的工作方式是:接受外界環境的完全或者不完全的狀態輸入,并通過神經網絡進行計算,輸出強化系統所需的Q值或V值。人工神經網絡是對人腦若干基本特性通過教學方法進行的抽象和模擬,是一種模仿人腦結構及功能的非線性信息處理系統。
2.2 強化學習與神經網絡的融合
經過研究發現,神經網絡的眾多優點,可以滿足強化學習研究的需要。首先,由于神經網絡模仿人的大腦,采用自適應算法,使得Agent智能系統更能適應環境的變化。此外,神經網絡具有較強的容錯能力,這樣可以根據對象的主要特征來進行較為精確的模式識別。最后,神經網絡又有自學習,自組織能力和歸納能力的特點,不僅增強了Agent對不確定環境的處理能力,而且保證了強化學習算法的收斂性。神經網絡也有無導師學習機制,正好適用于強化學習。
強化學習和神經網絡的融合重點在于如何運用神經網絡多重特性,能夠快速高效地促進Agent智能系統經歷強化學習后,選擇一條最優行為策略來滿足目標需求。強化學習的環境是不確定的,無法通過正例、反例告知采取何種行為。Agent必須通過不斷試錯才能找到最優行為策略。但是在此過程中,會遇到許多問題,比如輸出連續的動作空間問題,但可利用神經網絡的泛化特征,實現了輸出在一定范圍內的連續動作空間值[2]。所以,簡單的講,將神經網絡和強化學習相融合,主要是利用神經網絡強大的存儲能力和函數估計能力。目前,在函數估計強化學習研究上,神經網絡是研究熱點之一。
3 馬爾科夫決策過程
本文主要論述馬爾科夫型環境下的強化學習,可以通過馬爾科夫決策過程進行建模。下面給出其形式定義:
基本的POMDP由四個元組成:。S是指一個環境狀態集,可以是有限的,可列的或者任意非空集;A為Agent行為集合,用A(s)表示在狀態s處可用的決策集;獎賞函數R(s,a):[A×S]->Real;T:[A×S]->PD(S);T(s,a,s')為Agent在狀態s采用a動作使環境狀態轉移到s'的概率。
一個有限的馬爾科夫決策過程有5元組成:;前四個元與上述是一致的,V為準則函數或者目標函數[3],常用準則函數有期望折扣總報酬、期望總報酬和平均報酬等并且可以是狀態值函數或狀態-動作對值函數。
馬爾科夫決策過程的本質是:當前的狀態轉變為另一個狀態的概率和獎賞值只取決于當前的狀態和選擇的動作,與過去的動作和狀態無關。所以,在馬爾科夫環境下,已知狀態轉移概率函數T和獎賞函數R,可以借助于動態規劃技術求解最優行為策略。
4 改進的強化學習算法
到目前為止,強化學習領域提出的強化學習算法層出不窮,如Sutton提出的TD算法[6],Watkins提出的Q-Learning算法[7],Rummery和Niranjan于1994提出的Sarsa算法[8],以及Dyna-Q學習算法[9]等。致力于這方面研究的研究人員,都在極力尋找一種既能保證收斂性,又能提高收斂速度的新型學習算法。本文主要在基于神經網絡的特性,研究并提出改進的強化學習算法。
4.1 基于模糊神經網絡的Q([λ])學習算法
Q學習算法是強化學習領域重要的學習算法之一[7,10],它利用函數Q(x,a)來表達與狀態相對應的各個動作的評估。Q學習算法的基本內容為:
(1)任意初始化一個Q(x,a)
(2)初始化 s
(3)從決策集中隨即選擇一個動作a
(4)采取動作策略a,觀察[r,][s]'的值
(5)計算 [Qs,aQs,a+αr+γmaxa'Qs',a'-Qs,a], (11)
(7)重復(2)-(6)步,直到s終結。
式(11)使用下一狀態的估計來更新Q函數,稱為一步Q學習。將TD([λ])的思想引入Q學習過程,形成一種增量式多步Q學習,簡稱Q([λ])學習[11]。步驟與Q算法類似,其計算公式如下:
如果 [s=st,a=at],則[Qst,at=Qst,at+αtγt+γtetst+at]; (12)
4.2 基于BP神經網絡的Sarsa算法
描述如下:(1)H是用于保存最近訪問的Q值,當滿的時候送至神經網絡訓練。
如果表H已滿,則利用H中的樣本對網絡進行訓練,版本號自動增加1
若網絡隊列q也已滿,則隊尾元素出隊,把新訓練的神經網絡入隊q;
清空訓練集;
該算法的主要貢獻是引入神經網絡隊列保存大量的Q值表,從來降低了保存大量Q值所要花費大量的內存空間,更重要的是解決了單個神經網絡“增量式”學習所帶來的“遺忘”問題。
5 強化學習應用
由于強化學習在算法和理論方面的研究越來越深入,在大空間、復雜非線性控制,機器人控制、組合優化和調度等領域呈現出良好的學習性能,使得強化學習在人工智能,控制系統,游戲以及優化調度等領域取得了若干的成功應用,而本文主要介紹基于神經網絡的強化學習算法在某些領域的應用。
在非線性控制系統方面,張濤等人[2]將BP網絡運用于 Q-Learning算法中,成功解決了連續狀態空間的倒立擺平衡控制問題和連續狀態空間輸入、連續動作空間輸出的問題,從而提高了強化學習算法的實際應用價值;在機器人控制方面,應用更為廣泛,Nelson[13]等人考慮了基于模糊邏輯和強化學習的智能機器人導航問題,并且段勇等人[4]基于該理論,成功地將模糊神經網絡和強化學習結合起來,采用殘差算法保證函數逼近的快速性和收斂性,有效地解決了復雜環境下機器人導航的問題。在游戲方面,Tesauro采用三層BP神經網絡把棋盤上的棋子位置和棋手的獲勝概率聯系起來,通過訓練取得了40盤比賽中只輸一盤的好戰績[14]。在優化調度方面,主要包括車間作業調度,電梯調度以及網絡路由選擇等,Robert Crites等[15]將強化學習和前饋神經網絡融合利用,以最終實驗結果表明為依據,證明了該算法是目前高層建筑電梯調度算法中最優算法之一。
6 結束語
本文將強化學習和神經網絡相融合,介紹利用神經網絡強大的存儲能力、泛化能力及函數估計能力,可以解決強化學習領域遇到的連續狀態和動作輸入、輸出的問題,學習狀態空間過大的問題以及不確定環境處理的問題等。基于此,主要論述了三種神經網絡和強化學習的改進算法,它們都綜合了神經網絡的特性。最后,簡單介紹了目前基于神經網絡的強化學習應用的成功實例。目前,利用神經網絡進行強化學習依然是研究熱點課題之一。
參考文獻:
[1] 高陽,陳世福,陸鑫. 強化學習研究綜述[J].自動化學報,2004,30(1):86-100.
[2] 張濤,吳漢生.基于神經網絡的強化學習算法實現倒立擺控制[J].計算機仿真,2006,23(4):298-300.
[3] 林聯明,王浩,王一雄.基于神經網絡的Sarsa強化學習算法[J].計算機技術與發展,2006,16(1):30-32.
[4] 段勇,徐心如.基于模糊神經網絡的強化學習及其在機器人導航中的應用[J].控制與決策,2007,22(5):525-529.
[5] 劉忠,李海紅,劉全.強化學習算法研究[J].計算機工程與設計,2008,29(22):5805-5809.
[6] Sutton R S.Learning to predict by the methods of temporal differences.Machine Learning,1988,3:9-44.
[7] Watkins P.Dayan.Q-Learning.Machine Learning,1992,8(3):279-292.
[8] Rummery G,Niranjan M. On-line Q-Learning using connectionist systems. Technical Report CUED/F-INFENG/TR 166,Cambridge University Engineering Department,1994.
[9] Sutton R S,Barto A G, Williams R. Reinforcement Learning is direct adaptive optional control.IEEE Control Systems Manazine,1991,12(2):19-22.
[10] Sutton R S, Barto A G. Reinforcement Learning: An introduction[M].Cambridge:MIT Press ,1998.
[11] Peng J , Dayan P. Q-learning [J]. Machine Learning,1992,8(3):279-292.
[12] Kelley H J , Cliff E M, Lutze F H. Pursuit/evasion in orbit[J]. J of the Astronautical Sciences, 1981, 29(3):277-288.
[13] NELSON H C, YUNG. An intelligent mobile vehicle navigator based on fuzzy logic and reinforcement learning [J].IEEE Trans on Systems, Man and Cybernetics, Part B: Cybernetics,1999,29(2):314-321.
篇10
關鍵詞:風速;短期預測;相似數據;小波分析;人工神經網絡
1 引言
隨著風電場并網運行規模的增大,國內外對于風力發電并網各種課題的研究越來越深入,但關于風電場發電功率預測的研究還達不到令人滿意的程度,預測誤差一般都在15%以上[1]。
采用的方法通常包括持續法、卡爾曼濾波法、隨機時間序列法、神經網絡法。其中,人工神經網絡法進行風速或風電功率預測應用得最廣。文獻[2-3]都利用小波―BP神經網絡進行建模,但訓練樣本沒有相關性,預測精度偏低。文獻[4-5]利用改進的BP神經網絡建模,雖然運行時間縮短,但是在數據相關性和數據去噪處理方面欠缺,導致精度不高。因此,本文建立了基于相似數據并結合小波分析的BP神經網絡建模。
2 基于相似數據并結合小波分析的BP神經網絡建模
2.1 相似數據選擇辦法
2.3 反向傳播(BP)神經網絡
2.4 仿真實驗建模
3 算法對比分析
從圖4可得出,BP神經網絡模型的平均相對誤差為20.77%,而本模型為10.21%。因此,采用本模型建模得到的相對誤差較傳統的BP神經網絡模型預測精度有很大的提高。
4 結論
針對風力發電中風速預測問題,本文在BP神經網絡理論的基礎上引入相似數據并結合小波分解進行短期風速預測,得到如下結論:
⑴相似數據的選取增強了數據的相關性,提高了模型預測精度。
⑵小波分解降低了信號的非平穩性,使模型更好地擬合了風速信號的低頻和高頻特性,可進一步提高算法精度。
⑶通過對算法對比分析,表明本模型較傳統BP神經網絡模型誤差小,充分地說明此方法在工程應用上具有可行性。
[參考文獻]
[1]楊秀媛,肖洋,陳樹勇.風電場風速和發電功率預測研究[J].中國電機工程學報,2005,25(11):1-5.
[2]師洪濤,楊靜玲,丁茂生,王金梅.基于小波―BP神經網絡的短期風電功率預測方法[J].電力系統自動化,2011,35(16):44-48.
[3]厲衛娜,蘇小林.基于小波- 神經網絡的短期風電功率預測研究[J].電力學報,2011,26(6):458-461.
[4]王德明,王莉,張廣明.基于遺傳BP神經網絡的短期風速預測模型[J]. 浙江大學學報(工學版),2012,46(5):837-841.