卷積神經(jīng)網(wǎng)絡(luò)識別方法范文

時間:2024-04-02 18:04:31

導語:如何才能寫好一篇卷積神經(jīng)網(wǎng)絡(luò)識別方法,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

篇1

關(guān)鍵詞: 模式識別; 神經(jīng)網(wǎng)絡(luò); 卷積; 文字識別

中圖分類號: TN711?34; TP391.4 文獻標識碼: A 文章編號: 1004?373X(2014)20?0019?03

Large pattern online handwriting character recognition based on multi?convolution neural network

GE Ming?tao1, WANG Xiao?li1, PAN Li?wu2

(1. SIAS International School, Zhengzhou University, Zhengzhou 451150, China;

2. Henan University of Animal Husbandry and Economy, Zhengzhou 450011, China)

Abstract: Online handwriting character recognition is an important field in the research of pattern recognition. The traditional recognition method is based on the common convolutional neural networks (CNNs) technology. It has an efficient recognition rate for the small pattern character set online handwriting characters, but has low recognition rate for the large pattern character set recognition. A recognition method based on multi?convolutional neural networks (MCNNs) is presented in this paper to overcome the situation that the previous methods have the low recognition rate for large pattern character set and improve the recognition rate for the large pattern handwriting character set recognition. The stochastic diagonal Levenbert?Marquardt method is used in the system for training optimization. The experimental results show that the proposed method has the recognition rate of 89% and has a good prospect for online handwriting character recognition for large scale pattern.

Keywords: pattern recognition; neural network; convolution; character recognition

0 引 言

隨著全球信息化的飛速發(fā)展和對自動化程度要求的不斷提高 ,手寫文字識別技術(shù)被廣泛地應(yīng)用到許多方面。特別是近幾年擁有手寫功能的手機、平板電腦等智能電子產(chǎn)品的普及,聯(lián)機手寫文字識別研究已經(jīng)成為一個備受關(guān)注的主題。聯(lián)機手寫字符識別要求實時性較高,識別過程中要求特征空間的維數(shù)比較高,在進行特征樣本訓練時要求訓練的數(shù)目很大,要匹配的特征值或特征對象比較多 [1?2]。

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNNs)的優(yōu)點在于圖像的識別過程中對視覺模式的獲得是直接從原始圖像中獲得的,所以在設(shè)計系統(tǒng)時圖像的預處理工作很少,與一般神經(jīng)網(wǎng)絡(luò)相比是一種高效的識別方法。卷積神經(jīng)網(wǎng)絡(luò)在模式識別的一些領(lǐng)域具有很好的魯棒性,如在識別有變化的模式和對幾何變形的識別方面。利用卷積神經(jīng)網(wǎng)絡(luò)的手寫識別方法具有如下一些優(yōu)點:對于要檢測的圖像可以與事先制定網(wǎng)絡(luò)拓撲結(jié)構(gòu)之間有較高的匹配率;特征提取和模式分類同時進行;訓練參數(shù)往往是系統(tǒng)計算量的重要參數(shù),而卷積神經(jīng)網(wǎng)絡(luò)中利用權(quán)值共享技術(shù),這樣就可以大大降低該參數(shù),在設(shè)計系統(tǒng)結(jié)構(gòu)時使得結(jié)構(gòu)變得更簡單,從而使得整個系統(tǒng)具有更好的適應(yīng)性[3?5]。

目前,人機交互系統(tǒng)的手寫字符識別、汽車車牌號識別和信息安全中常用的人臉識別等領(lǐng)域都有卷積神經(jīng)網(wǎng)絡(luò)的成功應(yīng)用。文獻[6]用一個4層的卷積神經(jīng)網(wǎng)絡(luò)LeNet?5對Mnist庫進行識別實驗,獲得了98.4%的識別率,用2層的BP網(wǎng)絡(luò)的識別率[4,6]是87%。許多學者對卷積神經(jīng)網(wǎng)絡(luò)在聯(lián)機手寫文字識別方面做了多方位的研究。 但是,這些成功的聯(lián)機手寫文字識別主要是針對小模式字符集,利用以往的這些方法對大規(guī)模模式分類的聯(lián)機手寫文字的識別依然有識別率不高的問題。本文介紹了卷積神經(jīng)網(wǎng)絡(luò)的基本概念和一種典型的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),給出了基于多重卷積神經(jīng)網(wǎng)絡(luò)的字符識別和詞語識別模型。通過使用大字符集的UNIPEN數(shù)據(jù)庫進行訓練和測試,本文提出的方法在大模式聯(lián)機手寫識別上,取得了較高的識別速度和滿意的識別率。

1 卷積神經(jīng)網(wǎng)絡(luò)

文獻[6?7]中詳細地描述了卷積神經(jīng)網(wǎng)絡(luò)如何保證圖像對位移、縮放、扭曲魯棒性能。典型的手寫字符卷積神經(jīng)網(wǎng)絡(luò)LeNET 5的結(jié)構(gòu)圖如圖1所示[6?7]。

圖1 典型的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

在圖1中,輸入層接收要識別32×32的手寫字符圖像,經(jīng)過簡單的大小歸一化和圖像灰度處理,之后的結(jié)果作為一個采樣層的圖像;然后用一個可學習核進行卷積操作,卷積結(jié)果經(jīng)過激活函數(shù)的輸出形成這一層的神經(jīng)元,每個神經(jīng)元與輸入圖像的一個5×5的鄰域相連接,從而得到由6幅特征圖組成的第一個隱層(C1層)。每個特征圖有25個權(quán)值(如方向線段,端點、角點等),考慮到邊界效果,得到的特征圖的大小是28×28,小于輸入圖層[3?9]。卷積層的數(shù)學計算過程可表示為:

[xlj=fi∈Mjxl-1j*kernellij+blj] (1)

式中:[l] 代表層數(shù);kernel是卷積核;[Mj]代表輸入特征圖的一個選擇。每個輸出圖有一個偏置[b]。

每個卷積層的結(jié)果作為下一個次采樣層的輸入,次采樣層的作用是對輸入信息進行抽樣操作。如果輸入的特征圖為n個,則經(jīng)過次采樣層后特征圖的個數(shù)仍然為n,但是輸出的特征圖要變小(例如,各維變?yōu)樵瓉淼?0%)。因此隱層S2是由6個大小為14×14的特征圖組成的次采樣層。次采樣層計算公式可以用式(2)表示:

[xlj=fβl-1jdown(xl-1j)+blj] (2)

式中down(?) 表示次采樣函數(shù)。次采樣函數(shù)一般是對該層輸入圖像的一個n×n大小的區(qū)域求和,因此,輸出圖像的大小是輸入圖像大小的[1n]。每一個輸出的特征圖有自己的β和b。

類似的,C3層有16個10×10的特征圖組成的卷積層,特征圖的每個神經(jīng)元與S2網(wǎng)絡(luò)層的若干個特征圖的5×5的鄰域連接。網(wǎng)絡(luò)層S4是由16個大小為5×5的特征圖組成的次采樣層。特征圖的每個神經(jīng)元與C3層的一個2×2大小的鄰域相連接。網(wǎng)絡(luò)層C5是由120個特征圖組成的卷積層。每個神經(jīng)元與S4網(wǎng)絡(luò)層的所有特征圖的5×5大小的鄰域相連接。網(wǎng)絡(luò)層F6,包括84個神經(jīng)元,與網(wǎng)絡(luò)層C5進行全連接。最后,輸出層有10個神經(jīng)元,是由徑向基函數(shù)單元(RBF)組成,輸出層的每個神經(jīng)元對應(yīng)一個字符類別。RBF單元的輸出yi的計算方法如式(3)所示:

[yi=j(xj-wij)2] (3)

很多研究人員通過對字符集作彈性訓練,經(jīng)測試發(fā)現(xiàn)在MNIST字符集上的識別率可以高達99%以上[6?7] 。卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)勢主要是對小模式集上,如對數(shù)字或26個英文字母組成的集合都有著較高的識別率。然而,對大模式集的識別仍然是一個挑戰(zhàn),因為設(shè)計一個優(yōu)化的并足夠大的單一網(wǎng)絡(luò)是比較困難的,且訓練時間也較長。因此,本文的目的旨在通過組合多個對某一字符集有高識別率的卷積神經(jīng)網(wǎng)絡(luò),從而構(gòu)成多重卷積神經(jīng)網(wǎng)絡(luò),進而提高卷積神經(jīng)網(wǎng)絡(luò)對大模式集手寫字符的識別率。

2 多重卷積神經(jīng)網(wǎng)絡(luò)

2.1 多重卷積神經(jīng)網(wǎng)絡(luò)字符識別

根據(jù)傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的運算過程以及其在處理大模式集手寫字符時存在的不足,本文提出一種多重卷積神經(jīng)網(wǎng)絡(luò)來改進傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型,用多個擁有高識別率的小卷積神經(jīng)網(wǎng)絡(luò)組成一個多重卷積神經(jīng)網(wǎng)絡(luò)。每一重小卷積神經(jīng)網(wǎng)絡(luò)對某一具體字符集有較高的識別率,另外,單重卷積神經(jīng)網(wǎng)絡(luò)除了有一個正式的輸出集之外,還產(chǎn)生一個未知的輸出(即難以識別的字符),即如果一個輸入字符沒有被正確識別,它將被輸出為一個未知字符,然后輸入模式轉(zhuǎn)到下一重卷積神經(jīng)網(wǎng)絡(luò)進行識別。最后,通過一個拼寫檢查模塊進行判斷,選擇最好的結(jié)果輸出。系統(tǒng)的流程如圖2所示。

其中CNN 1是識別手寫數(shù)字的卷積神經(jīng)網(wǎng)絡(luò),CNN 2是識別手寫小寫英文字母的卷積神經(jīng)網(wǎng)絡(luò),該模型具有極強的擴展性,可以添加多任意模式的卷積神經(jīng)網(wǎng)絡(luò)(如中文,日文等)。

圖2 多重卷積神經(jīng)網(wǎng)絡(luò)字符識別示意圖

2.2 隨機對角Levenberg?Marquardt訓練方法

傳統(tǒng)的結(jié)構(gòu)比較簡單、單一的卷積神經(jīng)網(wǎng)絡(luò)多采用基本的Back Propagation(BP)規(guī)則訓練網(wǎng)絡(luò),往往需要幾百次迭代,網(wǎng)絡(luò)的收斂速度較慢。本文采用LeCun博士提出的隨機對角Levenberg?Marquardt 算法對網(wǎng)絡(luò)作訓練,該算法需要的迭代次數(shù)明顯比基本的BP 算法少[4,9]。隨機對角Levenberg?Marquardt算法的公式為:

[ηki=ε?2E?w2ij+μ] (4)

式中[ε]是全局的學習率,一般取初始值0.01,太大會使網(wǎng)絡(luò)無法收斂,太小則會降低收斂速度,且使網(wǎng)絡(luò)更容易陷入局部極小值,訓練過程中可以用啟發(fā)式規(guī)則改變[ε]的值,本文取最下值為5e-005; [?2E?w2ij]是一個估計值,根據(jù)訓練集的大小可以調(diào)整樣本數(shù)量,文中隨機選取200個樣本估算它的值;[μ]用來避免[?2E?w2ij] 太小時[ηki]的變化過大 。

2.3 多重卷積神經(jīng)網(wǎng)絡(luò)詞句識別

本文提出的多重卷積神經(jīng)網(wǎng)絡(luò)對手寫詞語的識別方法可以簡單地描述為:首先對輸入的手寫圖像進行預處理和分割,然后通過多重卷積神經(jīng)網(wǎng)絡(luò)模塊分別進行識別,最后采用單詞識別模塊對識別結(jié)果進行判斷,選擇最好的結(jié)果輸出。其過程如圖3所示。

圖3 多重卷積神經(jīng)網(wǎng)絡(luò)聯(lián)機手寫詞句識別過程

本文提出的多重卷積神經(jīng)網(wǎng)絡(luò)聯(lián)機手寫文字識別方法克服了傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)文字識別的對字符集的限制,每一重卷積神經(jīng)網(wǎng)絡(luò)是一個針對小模式的卷積神經(jīng)網(wǎng)絡(luò),易于訓練和優(yōu)化,更重要的是此方案的靈活性非常好易于調(diào)節(jié)參數(shù),可擴展性強。每一重卷積神經(jīng)網(wǎng)絡(luò)都具有可重用能力,可以根據(jù)需要加載一個或多個網(wǎng)絡(luò),可以根據(jù)新的模式添加新的網(wǎng)絡(luò)而不需改變或重建原來的網(wǎng)絡(luò)。

3 訓練和實驗

為了評估多重卷積神經(jīng)網(wǎng)絡(luò)對基于大模式字符集的聯(lián)機手寫文字識別的性能,本系統(tǒng)采用MNIST和UNIPEN兩種不同的手寫字符訓練集進行測試。UNIPEN數(shù)據(jù)庫是在1992年舉行的IEEE IAPR會議上提出并建立的,其目的是創(chuàng)建一個大型的手寫體數(shù)據(jù)庫用于為在線手寫識別提供研究和開發(fā)的基礎(chǔ),得到了多個知名公司或研究所的支持并完成了UNIPEN的規(guī)范設(shè)計。在進行數(shù)據(jù)比對實驗中,本文采用許多研究使用的MNIST手寫數(shù)字數(shù)據(jù)庫,該數(shù)據(jù)庫是NEC 研究中心設(shè)計的,是NIST(The National Institute of Standards and Technology)數(shù)據(jù)庫的一個子集,該訓練集中有大量訓練樣本和測試用例。本文默認用以下定義:

[識別率=正確識別數(shù)樣本總數(shù)×100%]

[失誤率誤識率=錯誤識別數(shù)樣本總數(shù)×100%]

實驗測試是在通用的臺式電腦上進行的。整個識別原型系統(tǒng)采用C#編寫,運行在.NetFrame 4.5平臺上。經(jīng)測試對MNIST訓練集識別正確率可達[9]99%,對UNIPEN數(shù)字識別正確率可達97%,對UNIPEN數(shù)字和大寫字母識別正確率可達89%(1a,1b) ,對UNIPEN小寫字母識別正確率可達89%(1c) 。圖4是對UNIPEN小寫字母3次訓練的均方誤差比較。

圖4 訓練的誤差數(shù)據(jù)

從圖4中可以看出,在開始的幾個訓練周期內(nèi),均方誤差(MSE)下降得很快,然后在第13個周期后神經(jīng)網(wǎng)絡(luò)達到一個穩(wěn)定的值,約為0.148 5。也就是說,網(wǎng)絡(luò)在第13個周期后,改善程度就很小。所以修改訓練錯誤率的值為0.000 45后重新進行18代的第二次訓練,均方誤差有所降低。經(jīng)過第三次的訓練后趨于穩(wěn)定,對UNIPEN小寫字母識別正確率可達89%。經(jīng)測試,通過使用隨機對角Levenberg?Marquardt方法,收斂速度比基本BP算法快了許多,經(jīng)過68代訓練后識別正確率可達89%。

4 結(jié) 語

本文提出了基于多重卷積神經(jīng)網(wǎng)絡(luò)的聯(lián)機手寫字符的識別方法,通過使用多個識別率高的卷積神經(jīng)網(wǎng)絡(luò)和隨機對角 Levenberg? Marquardt方法,可以適用于大模式聯(lián)機手寫識別。經(jīng)過實驗數(shù)據(jù)比較,該方法在大模式聯(lián)機手寫識別過程中具有很高的識別率,與此同時識別速度也很快,有很好的實時性,總體效果很好。在當今觸摸屏應(yīng)用遍及生產(chǎn)生活的各個方面的趨勢下,該方法有著廣闊的應(yīng)用前景。同時此方法為今后多手寫漢字識別的研究提供了很好的借鑒。

注:本文通訊作者為潘立武。

參考文獻

[1] 吳鳴銳,張鈸.一種用于大規(guī)模模式識別問題的神經(jīng)網(wǎng)絡(luò)算法[J].軟件學報,2001,12(6):851?855.

[2] 張輝.大規(guī)模聯(lián)機手寫漢字識別數(shù)據(jù)庫整理、統(tǒng)計與實驗分析[D].廣州:華南理工大學,2012.

[3] 徐姍姍,劉應(yīng)安,徐,等.基于卷積神經(jīng)網(wǎng)絡(luò)的木材缺陷識別[J].山東大學學報:工學版,2013,43(2):23?28.

[4] 呂剛.基于卷積神經(jīng)網(wǎng)絡(luò)的多字體字符識別[J].浙江師范大學學報:自然科學版,2011,34(4):425?428.

[5] PHAM D V. Online handwriting recognition using multi convolution neural networks [M]. Berlin Heidelberg: Springer, 2012: 310?319.

[6] LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient?based learning applied to document recognition [C]// Proceeding of IEEE. USA: IEEE, 1998: 2278?2324.

[7] SIMARD P Y, STEINKRAUS Dave, PLATT John. Best practices for convolutional neural networks applied to visual document analysis [C]// International Conference on Document Analysis and Recognition (ICDAR). Los Alamitos: IEEE Computer Society, 2003: 958?962.

篇2

關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);Morlet小波;決策理論;Hilbert變換

中圖分類號:TP18文獻標識碼:A文章編號:1009-3044(2009)32-9050-02

Wireless Signal Simulation Algorithm for Automatic Identification

ZHANG Meng

(Purchasing, China Railway Communication Co., Ltd., Beijing 100140, China)

Abstract: We have firstly discussed the modulation distinguishing method based on rational budgeting theory through the method of comparing Tine-Frequency analysis of the analysis signals formed by Hibert Transform . And on the basic of analyzing the fault of this method ,we put forward the distinguishing method based on NN. When NN is distinguishing signals, it mainly depends on the different positions of peak. Wavelet Transform here equals a mathematic microscope .it reflects the inexorable links between the signal categories and the positions of peak. Taking advantage Wavelet Transform and the simple three-layer BP NN, the more accurate Time-Frequency characteristics of signals to be distinguishing can be drawn.

Keywords: BP ANN; Morlet Wavelet; BudgetingTheory; Hibert Transform

在軍事電子對抗等多方面的重要應(yīng)用,通信信號調(diào)制的自動識別分類問題也相繼發(fā)展起來。無線電信號調(diào)制實識別就是要判斷截獲信號的調(diào)制種類。為此,需要事先對其特征進行選定,并確定它們與相應(yīng)調(diào)制種類相聯(lián)系的取值范圍,然后再對信號進行特征測量,并根據(jù)測量結(jié)果對信號的調(diào)制進行分類判決。

如果把無線電信號的調(diào)制識別與分類視為一種模式識別問題,那末,從模式識別理論來看,模式分類是模式識別的一個子系統(tǒng)。因此,在模式識別理論框架下,無線電信號的調(diào)制識別是一個總體概念。而調(diào)制分類則只是調(diào)制識別的一個分支[1]。

1 基于決策理論的模擬調(diào)制方式識別方法

此算法主要實現(xiàn)區(qū)分AM、FM、DSB、LSB、USB、VSB、AM-FM等七種調(diào)制樣式,所分析的對象序列s(n)是由接收機中頻輸出并經(jīng)過采樣得到的,這樣s(n)的采樣頻率和載頻都已知,分別記做Fs和Fc。算法分兩個步驟:

第一步,根據(jù)信號的包絡(luò)特征將AM、USB、LSB與FM區(qū)分開,因為前三種信號的包絡(luò)不為恒定值,而FM的包絡(luò)理論上是恒定值(實際中接近恒定)。因而可以從中提取一個特征參數(shù)R。參數(shù)R反映了零中心歸一化包絡(luò)的功率譜特征,FM的零中心歸一化包絡(luò)接近零,因其參數(shù)R應(yīng)遠遠小于前三種信號。實際中若R

第二步,根據(jù)信號頻譜的對稱性,將AM與USB與LSB區(qū)分開,因為AM的單邊頻譜關(guān)于載頻是近似對稱的,USB和LSB的單邊頻譜對于載頻來說分別只有上邊頻和下邊頻。因而可以從中提取另一個特征參數(shù) 。理論上,由于AM的上下邊頻對稱,所以AM的P接近零,而LSB和USB的P分別接近1和-1。實際中若|P|< 0.5,判為AM信號,若P>0.5,判為LSB,P

第三步,零中心非弱信號段瞬時相位非線性分量絕對值的標準偏差:σap 。

σap由下式定義:

(1)

式中,at是判斷弱信號段的一個幅度判決門限電平,c是在全部取樣數(shù)據(jù)Ns中屬于非弱信號值的個數(shù),?準NL(i)是經(jīng)零中心化處理后瞬時相位的非線性分量,在載波完全同步時,有:?準NL(i)= φ(i)-φ0

式中:,φ(i)為瞬時相位。用σap來區(qū)分是DSB信號還是AM-FM信號。

第四步,零中心非弱信號段瞬時相位非線性分量的標準偏差:σdp。

σdp由下式定義:

(2)

σdp主要用來區(qū)別不含直接相位信息的AM、VSB信號類和含直接相位信息的DSB、LSB、USB、AM-FM信號類,其判決門限設(shè)為t(σdp) 。

2 決策論方法的改進

前面介紹的基于決策理論的模擬調(diào)制方式識別方法存在缺陷針對上述問題,人們又提出了基于神經(jīng)網(wǎng)絡(luò)(NN)的識別方法。

2.1 BP網(wǎng)絡(luò)作為分類器的模擬調(diào)制方式識別方法

該算法用基于有監(jiān)督訓練的神經(jīng)網(wǎng)絡(luò)模型BP網(wǎng)絡(luò)作為分類器,用BP模型多層感知網(wǎng)絡(luò)與反向傳播學習算法相結(jié)合,通過不斷比較網(wǎng)絡(luò)的實際輸出與指定期望輸出間的差異來不斷的調(diào)整權(quán)值,直到全局(或局部)輸出差異極小值,不難想象該神經(jīng)網(wǎng)絡(luò)對模型細節(jié)中的諸多問題均有良好效果。

基于NN的模擬信號調(diào)制識別框圖[2]如圖1所示,該NN采用三層結(jié)構(gòu)即,1個輸入層,1個輸出層,1個中間層。中間層可采用多層。但由于受到計算復雜性的限制,目前采用單層或雙層中間層的NN比較多見。本圖中間層采用單層25個節(jié)點,輸入層和輸出層的節(jié)點數(shù)取決于信號特征參數(shù)的個數(shù)和信號的分類數(shù),因而分別為4和7。

神經(jīng)網(wǎng)絡(luò)具有信息分布式存儲、大規(guī)模自適應(yīng)并行處理和高度容錯特性,適用于模式識別的基礎(chǔ)。其學習能力和容錯特性對不確定性模式識別具有獨到之處[3]。通信信號在傳播過程中受到信道噪聲的污染,接受到的信號是時變的、非穩(wěn)定的,而小波變換特別適用于非穩(wěn)定信號的分析,其作為一種信息提取的工具已得到較廣泛的應(yīng)用。小波變換具有時頻局部性和變焦特性,而神經(jīng)網(wǎng)絡(luò)具有自學習、自適應(yīng)、魯棒性、容錯性和推廣能力,兩者優(yōu)勢的結(jié)合可以得到良好的信號模式自動識別特性,從而形成各種處理方法。

2.2 基于小波的特征提取和識別方法

小波特別適用于非穩(wěn)定信號的分析,作為一種特征提取的工具已得到較為廣泛的應(yīng)用。小波的重要特點是它能夠提供一個信號局部化的頻域信息。小波變換能夠?qū)⒏鞣N交織在一起的不同頻率組成的混合信號分解成不同頻率的塊信號,它對不同的時間和頻率有不同的解釋,因此,對調(diào)制信號進行小波分解,得到不同水平下的細節(jié)信息,這些信息對于不同類別的調(diào)制信號來說是有差別的[4]。

在實際應(yīng)用中,小波變換常用的定義有下列兩種:

(3)

(4)

式中,星號*表示共軛。式(3)表示小波變換是輸入信號想x(t)和小波函數(shù)φα, τ(t)的相關(guān)積分;式(4)用卷積代替了相關(guān)積分。兩種定義在本質(zhì)上是一致的。本為采用后者。

將式(4)中的τ和t離散化,即令τ=kTs,及t=iTs,得連續(xù)小波變換公式(4)的離散形式,又稱小波系數(shù):

(5)

Morlet小波是一種單頻復正弦調(diào)制高斯波,也是最常用的復值小波。其實、頻兩域都具有很好的局部性,它的時域形式如下:

(6)

雖然信號特征有很多種,神經(jīng)網(wǎng)絡(luò)在進行信號識別時,主要是依據(jù)譜峰位置的不同,因此提取信號特征主要任務(wù)就是尋找信號類別與譜峰位置間的必然聯(lián)系。而小波變換在這里則相當于一個數(shù)學顯微鏡,通過它,可以詳細了解各類信號在不同低頻段上的頻譜構(gòu)成。

整個系統(tǒng)在PC機上進行仿真,采用Windows2000操作系統(tǒng)和Matlab6.1和Cool Edit2.0進行聲音錄制。

在仿真中,采用44K的采樣率,錄制了一段歌聲和一段笑聲,用Matlab生成22K的正弦載波,并根據(jù)第二章的各調(diào)制樣式的定義,生成了各個仿真的調(diào)制波形。并轉(zhuǎn)化成.wav文件錄在電腦中。

3 結(jié)束語

本文僅限于理論理論研究,用MatLab仿真實現(xiàn),沒有用DSP芯片等物理電路實現(xiàn),僅為實際實現(xiàn)提供理論指導。

參考文獻:

[1] 羅利春.無線電偵察信號分析與處理[M].北京:國防工業(yè)出版社,2003.

[2] 楊小牛,樓才義,徐建良.軟件無線電原理與應(yīng)用[M].北京:電子工業(yè)出版社,2001.

篇3

[關(guān)鍵詞]主動學習;深度神經(jīng)網(wǎng)絡(luò);反饋;目標識別

中圖分類號:TP391.41 文獻標識碼:A 文章編號:1009-914X(2016)08-0383-01

Object Feedback Recognition System Base on Deep Learning

Hao Liu1,Junyu Dong1,Xin Sun1,Muwei Jian1

[Abstract]This paper proposed a novel deep neural network based object recognition method with a feedback process by using an appropriate active learning method. It selects better non-labeled samples to feedback and retrain the deep neural network model, which makes the accuracy and robustness of the object recognition system improved gradually during use. The experiments show that the proposed method can recognize the target object in a fast way and improve the accuracy of application in the real scene gradually.

[Key words]Active Learning; Deep Neural Network; Feedback; Object Recognition

1.介紹

目標識別一直以來都是機器學習領(lǐng)域研究的前沿問題,近些年來,出現(xiàn)了一些優(yōu)秀的基于特征的物體識別方法,例如基于梯度信息的SIFT/SURF[1]算法等,但隨著數(shù)據(jù)集樣本的增多,逐漸達到了一定的瓶頸。近年來,基于深度學習所提取的抽象特征在物體識別中取得了非常好的表現(xiàn)。2012年Krizhevsky等人通過使用卷積神經(jīng)網(wǎng)絡(luò)取得了較高的圖像分類準確率。2014年R. Girshick[2]等人所提出的Region Based CNN算法在目標識別領(lǐng)域也取得了較好的結(jié)果。雖然這些方法取得了較好的效果,但是日常生活中的場景是多變的,因此需要所得到的模型能夠自動學習和適應(yīng)新的場景和需求,本文將基于RCNN方法提出一種帶反饋的自適應(yīng)學習目標識別算法,它隨著反饋的增加,模型越來越完善和智能。

2.相關(guān)技術(shù)介紹

2.1 RCNN算法

Region Based CNN算法首先使用Selective search算法在圖像上產(chǎn)生約2000個候選窗口,進行目標檢測。然后使用CNN對每一個候選窗口提取4096維特征來表示每個Proposal,最后用SVM分類器對目標進行分類。

2.2 主動反饋學習

主動學習具有減少冗余和快速收斂的優(yōu)勢。通過一定的主動學習方法選擇出一個或一批最有用的樣本,并向檢查者詢問標簽,然后利用獲得的新知識來訓練分類器和進行下一輪查詢。本文使用主動學習的思想對反饋識別過程進行控制。

3.基于主動學習的物體反饋識別

目標反饋識別是一個智能化的交互過程,它先使用有限訓練數(shù)據(jù)訓練出一個初始分類模型,這個模型對物體進行識別的準確率可能并不高。接下來,我們希望后續(xù)的每次識別都能夠為模型提供信息,模型依據(jù)這些信息重新訓練,實現(xiàn)對分類模型的修改與完善。本文基于RCNN算法,首先使用有限標定樣本進行訓練,利用RCNN 生成一個初始模型。然后每次使用主動學習的方法,從未標記樣本集中選擇出n0個最有用的、最利于完善分類模型的樣本圖像;最后利用檢查者對樣本所做的標記,進一步訓練分類器,完善模型,迭代進行,最終實現(xiàn)模型的自動更新達到最優(yōu)的識別效果。

4.實驗

以1.1圖的Train圖像為例進行識別,圖1.2得到識別結(jié)果為Bus,識別發(fā)生錯誤,此時使用本文方法進行反饋,系統(tǒng)將結(jié)果反饋給分類模型,這樣選擇出的每張圖像都會反饋一個結(jié)果來優(yōu)化模型,迭代進行。如果如圖1.3再次對這張圖像進行識別,得到識別結(jié)果“未檢測到Bus”,識別正確,說明反饋過程起到了應(yīng)有的作用。通過實驗可以表明,本文提出的方法會使物體識別變得越來越智能。

5.結(jié)論

本文提出的基于深度神經(jīng)網(wǎng)絡(luò)的目標反饋識別方法,使用主動學習來對反饋識別過程進行控制,通過對VOC2007數(shù)據(jù)集中的Train類圖像進行識別試驗的結(jié)果可以看到,本文提出的方法成功提升了目標識別系統(tǒng)的準確度和魯棒性,逐漸提升了在復雜多樣的真實場景下識別目標的準確度,使得系統(tǒng)越來越完善與智能,最終實現(xiàn)了非常好的目標識別效果。

參考文獻

篇4

關(guān)鍵詞:化學計量學 分析化學 人工神經(jīng)網(wǎng)絡(luò)

化學計算學作為化學的分支學科,起步較晚,在涉及內(nèi)容上又比較廣闊,涉及到數(shù)學、統(tǒng)計學及計算機應(yīng)用技術(shù)等相關(guān)學科,可以說是一門交叉性的學科。正是因為科學技術(shù)的發(fā)展及多學科相互滲透的作用才誕生了化學計量學這門獨特的學科。涵蓋于化學測量的整個過程,采樣理論、實驗設(shè)計、選擇與優(yōu)化、變量處理及數(shù)據(jù)分析斗屬于化學計量學。化學計量學擔負的主要任務(wù)是進行化學測量數(shù)據(jù)的分析與處理,進行測量程序與實驗方法的最佳選擇,最早由瑞典化學家提出,一直沿用至今。正是因為化學計量學的巨大作用,解決了傳統(tǒng)化學研究中不能攻破的難題,成為化學研究的新方向與關(guān)注點。

一、化學計量學對于化學測量的應(yīng)用分析

在化學研究中,需要將化學計量學滲透于化學測量的全過程。在上世紀五十年代以來,新的化學儀器分析方法已經(jīng)被充分的引入到分析化學中,分析測試工作已經(jīng)逐步實現(xiàn)了儀器化、自動化與初步的計算機化,這些技術(shù)的深入應(yīng)用,為化學分析提供了可靠的測量數(shù)據(jù),但是將這些分析儀器的優(yōu)點結(jié)合起來,將雜亂無章的數(shù)據(jù)信息進行重新排列組合,最大限度的解決信息的篩選,成為化學研究工作者當前面臨的最大難題。

化學計量學在解決這一問題中發(fā)揮了重大作用。將分析分離技術(shù)集于一體,通過特定的高維儀器產(chǎn)生分析信號,利用新型的分析信號多元校正及有效分辨方法進行復雜多組分的體系定性,進行定量解析。利用這種化學計量學的方法可以對巨大的數(shù)據(jù)信息進行有效的篩選,從而提取最有用的信息,對這些有用信息進行分析,實現(xiàn)了單純的“數(shù)據(jù)提供者”到“問題解決者”的角色轉(zhuǎn)變。化學計量法對于化學測量產(chǎn)生的影響是深遠且巨大的。化學計量法應(yīng)該貫穿于化學測量的全過程。

二、當前化學計量學在分析化學中的應(yīng)用分析

(一)化學計量學在化學定量構(gòu)效關(guān)系中的應(yīng)用分析

化學定量構(gòu)效關(guān)系研究是化學學科的根本性研究問題,結(jié)合物質(zhì)的化學成分與基本的結(jié)構(gòu)進行化學性質(zhì)的測定,是我國目前化學理論研究中的重要目標。在進行研究時一般采用圖論與數(shù)值的方法進行各種化合物的表征,將所獲取的計算結(jié)果與實際的被測量化學物的物理、化學及生物特性結(jié)合起來,用比較明確的定量關(guān)系來代替含糊的定性描述。目前化學計量學在進行分析化學研究時引入了全局最優(yōu)算法,在利用誤差反向傳播的多層次感知模型進行苯酚衍生物的活性測驗時取得了明顯的研究效果,較之先前的研究方法,改進是十分明顯的。

(二)化學計量學中模式識別方法在分析化學中的應(yīng)用

化學計量學中的模式識別法是根據(jù)化學測量數(shù)據(jù)矩陣,對樣本集通過樣本性質(zhì)進行分類進行選取的方法。根據(jù)測量在多維模式空間中的相對位置不同,用線性判斷識別分析法、最鄰近法等進行模式的識別。模式識別法的研究能夠為決策及過程優(yōu)化提供最有實用價值的信息資料。我國石油化工行業(yè)、材料化學研究領(lǐng)域都基于該思想破解了很多研發(fā)難題。其中K―最鄰近法從伏安波匯總對重疊的伏安響應(yīng)信號進行區(qū)分,將K―最鄰近法用于電位階伏安波及毛細管曲線分類中,實現(xiàn)了對有機化合物構(gòu)效關(guān)系的有效表征。二SMCA法最廣泛的應(yīng)用就是食品的鑒定。

(三)化學計量學的人工神經(jīng)網(wǎng)絡(luò)應(yīng)用分析

除了我們上面提到的應(yīng)用,化學計量學在神經(jīng)網(wǎng)絡(luò)應(yīng)用方面也發(fā)揮了積極的作用。所謂的人工神經(jīng)網(wǎng)絡(luò)是基于現(xiàn)代生物學的對人腦組織進行研究而提出的,利用大量的簡單的處理單元進行充分連接,從而形成的巨大的復雜的網(wǎng)絡(luò)體系,主要是用來模擬人的大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)域的一定神經(jīng)行為。人工神經(jīng)網(wǎng)絡(luò)可以對數(shù)據(jù)模式進行合理的解析與分類,對于原因與結(jié)果關(guān)系不確定的非線性測量數(shù)據(jù)有著獨特的應(yīng)用。分析化學的不確定性很多,借助于化學計量學的人工神經(jīng)網(wǎng)絡(luò)得到了有效的應(yīng)用解決。從目前神經(jīng)網(wǎng)絡(luò)的應(yīng)用情況來看,在譜圖分析、藥物分子藥效的預測及蛋白質(zhì)結(jié)構(gòu)的預測方面都取得了不錯的成績。此外,在分析化學中應(yīng)用比較廣泛的還有遺傳算法,遺傳算法可以進行多組分分析波長選擇、數(shù)據(jù)校正優(yōu)化、核磁共振脈沖波形選擇等。人工神經(jīng)網(wǎng)絡(luò)還進一步促進了儀器聯(lián)機與實驗的自動化。在生產(chǎn)方面起到了重要的指導作用。

(四)化學計量法波普化學的應(yīng)用分析

目前在化學研究中,化學家們一直努力的目標主要是波普數(shù)據(jù)庫的有效利用。波普數(shù)據(jù)庫的質(zhì)譜、核磁共振譜、色譜等復雜分析體系的快速定性定量分析都是當前研究的重點。化學計量學為這方面的研究提供了新的突破口。各種濾波、平滑、交換、卷積技術(shù)的應(yīng)用,促進了分析化學的發(fā)展。可以直接提供不可分離的直接地測定相互干擾的共存性物種,對于完全未知的混合物也可以實現(xiàn)準確的測定。

(五)化學計量法的多元校正分析應(yīng)用

我國化學的多元化分析成為今后化學研究的大趨勢,不僅在研究目標上體現(xiàn)出多元化,對于研究對象也呈現(xiàn)出多元化的特性。這對于化學研究工作者是不小的挑戰(zhàn)。要求化學工作者能夠快速、準確的定位與定量,從而得出分析結(jié)果。在這樣的背景下,多元校正法應(yīng)用而生,其產(chǎn)生為現(xiàn)代分析儀器提供了大量的測量數(shù)據(jù),并對這些數(shù)據(jù)進行了解析,可以說多元校正法是新型的數(shù)學統(tǒng)計方法。多元校正法在多個方面進行了研究優(yōu)化,靈敏度、檢測度、精密度等都對指標進行了優(yōu)化,在對這些指標優(yōu)化后,大大擴展了分析儀器的功能與方法的有效及實用性。正是因為正交設(shè)計、均勻性設(shè)計分析、板因式設(shè)計分析等多種實驗設(shè)計優(yōu)化方法的相互協(xié)調(diào),對分析選擇性進行了改善,在一定程度上拓寬了其化學計量法多元校正的應(yīng)用領(lǐng)域。

三、結(jié)束語:

化學計量學從產(chǎn)生到現(xiàn)在大約只有30多年的歷史,但是在短短的幾十年內(nèi),其應(yīng)用不斷得到普及,其應(yīng)用效果不斷得到化學行業(yè)的肯定。將來,化學計量學將依然是令人關(guān)注的問題,有著廣闊而光明的前景。化學計量學不斷發(fā)展,將對儀器的智能化分析提供新的研究理論與方法途徑,為高維聯(lián)用儀器的發(fā)展提供新的突破口與改進點。通過本文對化學計量學在分析化學中的應(yīng)用分析,我們在看到化學計量學優(yōu)勢作用的同時,更應(yīng)該看到其發(fā)展中的不足,針對這些不足進行研究分析,在進行多次驗證的基礎(chǔ)上尋找新的解決途徑,完善這些不足,為化學計量學的發(fā)展提供更加廣闊的發(fā)展空間。在分析化學發(fā)展領(lǐng)域,增強對化學計量學的引入是今后化學研究發(fā)展的一個大方向。

參考文獻

[1]黃丹.淺談化學計量學在分析化學中的應(yīng)用及發(fā)展前景[J].今日科苑.2009(08).

[2]周統(tǒng)武,蔡娟.化學計量學的學科現(xiàn)狀與發(fā)展方向[J].中國科技信息,2009(03).

[3]周南.關(guān)于“分析化學中的計量學與質(zhì)量保證”的國際研討會[J].理化檢驗(化學分冊),2007(03).

篇5

關(guān)鍵詞:PCB;圖像處理;視覺檢測

中圖分類號:TP277文獻標識碼:A文章編號:1009-3044(2012)07-1648-06

當今世界科技發(fā)展日新月異,電子產(chǎn)業(yè)的發(fā)展直接制約著國民經(jīng)濟的騰飛與否,而PCB電路板制作工藝的提高對促進電子產(chǎn)業(yè)的發(fā)展至關(guān)重要,能否有效精確地檢測PCB電路板的缺陷一直都是電子行業(yè)的研究熱點。國外的印刷電路板自動檢測技術(shù)一直領(lǐng)先于國內(nèi),國內(nèi)的很多廠家不得不采用昂貴的外國技術(shù),雖然近年國內(nèi)的印刷電路板自動檢測技術(shù)發(fā)展迅速,但大都沒有取得令人非常滿意的結(jié)果。加入研究這一領(lǐng)域的熱潮,趕超外國的先進技技水平,打斷外國壟斷技術(shù),對于發(fā)展國民經(jīng)濟具有十分重要的意義。

1 PCB檢測系統(tǒng)的硬件設(shè)計

1.1 PCB檢測系統(tǒng)的硬件組成框圖

雖然本文所做的工作主要是軟件方面,但對于硬件系統(tǒng)的設(shè)計也是至關(guān)重要的,它對于建立有效的計算機視覺識別檢測系統(tǒng),起著決定性作用。因此,必須在綜合考慮系統(tǒng)性價比和系統(tǒng)性能的基礎(chǔ)上,設(shè)計出合理的硬件系統(tǒng)[9]。PCB檢測系統(tǒng)的硬件組成框圖如圖1所示:圖1 PCB檢測系統(tǒng)硬件組成框圖

1.2系統(tǒng)的硬件組成

系統(tǒng)的硬件組成[10]主要包括:計算機主機、CCD攝像機、圖像采集卡、照明系統(tǒng)及相關(guān)的設(shè)備。

2 PCB電路板缺陷檢測識別

PCB電路板在電子工業(yè)中的應(yīng)用越來越廣泛,如何降低電路板的故障率、提高電路板的質(zhì)量直接影響到整個產(chǎn)業(yè)的發(fā)展。因此,對于PCB電路板缺陷的識別技術(shù)的發(fā)展至關(guān)重要。PCB電路板的缺陷很多[16],主要有短路、斷路、劃痕、凸起、空洞、缺焊、過焊等等,由于實驗室設(shè)備限制和個人水平所限,本文主要研究的內(nèi)容是PCB電路板短路與斷路的檢測識別

近年來出現(xiàn)了很多圖像檢測算法,這些算法大致可分為三大類:有參考算法、無參考算法以及混合型算法。有參考算法分為兩大類:圖像對比法和模型對比法。無參考算法是一種不需要標準圖像的檢測算法,它是基于一定的設(shè)計規(guī)則來進行檢測的。混合型方法是將有參考算法與無參考算法混合使用,從而發(fā)揮出各自的優(yōu)點。比如,模板匹配法與數(shù)學形態(tài)學方法結(jié)合使用,或者連接表方法與數(shù)學形態(tài)學方法結(jié)合使用等。本文中短路與斷路的檢測識別采取了圖像對比法,即將經(jīng)過一定處理后的圖像進行相減,從而分析相應(yīng)的結(jié)果;而對焊點缺陷的識別主要采用模板匹配法與數(shù)學形態(tài)學方法結(jié)合使用。

2.1 PCB電路板缺陷檢測識別的主要流程圖

圖2為子程序流程圖;圖3為主程序流程圖。

2.2 PCB電路板短路與斷路的檢測識別

2.2.1邊緣檢測

在對圖像進行基本的處理過后可以將圖像與背景分割開來。邊緣檢測是圖像處理和計算機視覺中的基本問題,邊緣檢測的目的是標識數(shù)字圖像中亮度變化明顯的點。圖像屬性中的顯著變化通常反映了屬性的重要事件和變化。

這些包括:深度上的不連續(xù);表面方向不連續(xù);物質(zhì)屬性變化;場景照明變化。邊緣檢測是圖像處理和計算機視覺中,尤其是特征提取中的一個研究領(lǐng)域。

圖像邊緣檢測大幅度地減少了數(shù)據(jù)量,并且剔除了可以認為不相關(guān)的信息,保留了圖像重要的結(jié)構(gòu)屬性。有許多方法用于邊緣檢測,它們的絕大部分可以劃分為兩類[17]:基于查找一類和基于零穿越的一類。基于查找的方法通過尋找圖像一階導數(shù)中的最大和最小值來檢測邊界,通常是將邊界定位在梯度最大的方向。基于零穿越的方法通過尋找圖像二階導數(shù)零穿越來尋找邊界,通常是Laplacian過零點或者非線性差分表示的過零點。

1)Roberts算子

邊緣,是指周圍像素灰度有階躍變化或屋頂?shù)茸兓哪切┫袼氐募稀D像的邊緣對應(yīng)著圖像灰度的不連續(xù)性。顯然圖像的邊緣很少是從一個灰度跳到另一個灰度這樣的理想狀況。真實圖像的邊緣通常都具有有限的寬度呈現(xiàn)出陡峭的斜坡狀。邊緣的銳利程度由圖像灰度的梯度決定。梯度是一個向量,?f指出灰度變化的最快的方向和數(shù)量,如式2-1所示。

?f=(決定的。

因此最簡單的邊緣檢測算子是用圖像的垂直和水平差分來逼近梯度算子,式2-4所示。?f=(f(x,y)-f(x-1,y),f(x,y)-f(x,y-1))(式2-4)

因此當我們想尋找邊緣的時候,最簡單的方法是對每一個像素計算出(2,4)的向量,然后求出他的絕對值,然后進行閥值操作就可以了。利用這種思想就得到了Roberts算子,由式2-5所示。

R(i,j)=

(式2-5)

它是一個兩個2×2模板作用的結(jié)果。

2)Sobel算子

該算法通過2個3*3的模板,對選定的二維圖像中同樣大小窗口進行卷積,通常是一個模板對一個邊緣響應(yīng)大,另一個模板對水平邊緣響應(yīng)大,兩個卷積值對最大值作為該點對輸出。對于圖像上的任意點(i,j)進行卷積,可得其X方向上的差分由式2-6、式2-7所示。Δx=f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)](式2-6)Δy=f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)-[f(i+1,j+1)+2f(i+1,j)+f(i+1,j+1)](式2-7)則輸出圖像公式如式2-8所示。

用sobel算子檢測階躍邊緣得到的邊緣寬度至少為兩個寬度。3)Laplacian邊緣檢測算子

Laplacian算子定義由式2-9所示。

Δ2f(x,y)=

(式2-9)它的差分形式由式2-10所示。

Δ2f(x,y)={[f(x+1,y)-f(x,y)]-[f(x,y)-f(x-1,y)]}+{[f(x,y+1)-f(x,y)]-[f(x,y)-f(x,y-1)]}

=f(x+1,y)+f(x-1,y)+f(x,y-1)+f(x,y+1)+f(x,y+1)+4f(x+1,y)(式2-10)

Laplacian算子是一種各向同性算子,在只關(guān)心邊緣的位置而不考慮其周圍的灰度象素差值時時比較合適,Laplacian算子對孤立象素的響應(yīng)要比對邊緣或線的響應(yīng)更要強烈,因此只適用于無噪聲圖像。

原圖像與用三種邊緣檢測算子處理后的圖像如下所示:圖6 Sobel邊緣檢測圖7 Laplacian邊緣檢測

從上面四幅圖分析比較可得出結(jié)論:用Roberts邊緣檢測得出的圖像較之其他方法更為清晰,噪點更少,圖像更為連續(xù),所以本文中采用Roberts算子來進行邊緣檢測。

2.2.2閾值分割

閾值分割法是一種基于區(qū)域的圖像分割技術(shù),其基本原理是:通過設(shè)定不同的特征閾值,把圖像象素點分為若干類。常用的特征包括:直接來自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。設(shè)原始圖像為f(x,y),按照一定的準則f(x,y)中找到特征值T,將圖像分割為兩個部分,分割后的圖像為:

若取:b0=0(黑),b1=1(白),即為我們通常所說的圖像二值化。

在數(shù)字化的圖像數(shù)據(jù)中,無用的背景數(shù)據(jù)和對象物的數(shù)據(jù)經(jīng)常放在一起,同時,圖像中還含有各種噪聲,因此可以根據(jù)圖像的統(tǒng)計性質(zhì),從概率的角度來選擇合適的閾值。

1)最大方差閾值法

把待處理圖像的直方圖在某一閾值處分割為兩組,當被分割成的兩組間的方差最大時,便可以決定閾值了。

設(shè)灰度圖像f(x,y)的灰度級為0-L,灰度級I的像素為Ni,則圖中:

總象素數(shù)N=∑j=0 i=LNi(式2-11)灰度級i出現(xiàn)的概率Pi= 1-ω(K)(式2-16)則兩組間的數(shù)學期望為ω0μ0ω1μ1=μ(式2-17)兩組間的方差為ρ2(k)

ρ2(k)是K的函數(shù),計算k取從0,1,2…L時ρ2(k)的值,當多的值為最大時,K即為閾值。

2)雙峰法

根據(jù)圖像的直方圖具有背景和對象物的兩個峰,分割兩個區(qū)域的閾值由兩個峰值之間的谷所對應(yīng)的灰度值決定。設(shè)灰度圖像f(x,y)的灰度級為0-L,灰度i的像素為Pi,分別計算

因為實際PCB電路板有著許多的劃痕、污點等,使用最大方差閾值法時,會在處理后的圖像上產(chǎn)生許多誤點,而影響實際結(jié)果的分析,而雙峰法能夠順利地濾除這些干擾,這個結(jié)論在分析對比以上圖像時也可得出。所以本文選用了雙峰法來進行閾值分割。

2.2.3粒子分析與圖像對比

經(jīng)過邊緣檢測和閾值分割的圖像中會存在許多瑕點,這些點會影響到最后的圖像識別與分析,有可能會增加多余的殘留圖像。本文中利用NI VISION ASSISTANT中的REMOVE SMALL OBJECTS功能進行去除,如圖11和圖12所示。圖11原圖像圖12粒子分析

將標準PCB圖片減去缺陷缺陷PCB圖片,便可以得到缺陷板的斷路部分的圖像,再利用NI ASSISTANT中的PARTICLE ANALYSIS可以得到斷路部分的具體分析,如圖13示。

將缺陷PCB圖片減去標準PCB圖片,便可以得到缺陷板的短路部分的圖像,與上述相同的方法,便可以得到短路部分的具體分析,如圖14所示。

3結(jié)束語

利用LABVIEW來進行PCB電路板缺陷的識別與檢測是一項非常好的課題,它在近些年已經(jīng)得到了一定的發(fā)展,并將得到更大的進步。限于本人能力和時間,本文的研究還未涉及很深的領(lǐng)域,可以在以下方面加以改進:

1)本文中只利用到NI公司的LABVIEW和IMAQ VISION,更好的設(shè)計可以再利用其他語言如VISUAL BASIC,C++等編程語言加以輔助設(shè)計,相信可以取得更加令人滿意的結(jié)果。

2)由于實驗設(shè)備等其他因素,本文中只重點研究了PCB電路板短路與斷路的檢測識別,PCB電路板的其他缺陷還有待于進一步的分析研究、分類和總結(jié),并設(shè)計出更好的檢測方法,以真正滿足PCB電路板檢測的需求。

3)照明設(shè)備的限制在很大程度上影響到了圖像的檢測效果,為取得PCB缺陷檢測的進一步進展,在照明設(shè)備的選擇上必須重視,并且設(shè)計出更好的圖像采集系統(tǒng)。

4)在識別與檢測手段上,可以引入更新更好的方法,而不要局限于在傳統(tǒng)的方法中分析比較,例如基于BP神經(jīng)網(wǎng)絡(luò)的識別檢測,圖像的模糊決策等將有待于進一步研究。

總之,基于LABVIEW的機器視覺檢測系統(tǒng)已經(jīng)取得了不錯的進展,高速發(fā)展的PCB制造技術(shù)和計算機技術(shù)對于PCB缺陷的檢測提出了更高的要求,同時也大大地促進了PCB缺陷檢測技術(shù)的發(fā)展。利用機器視覺檢測在未來的較長的一段時間內(nèi)將占據(jù)檢測行業(yè)的半壁江山,相信在未來會取得更大的發(fā)展。

參考文獻:

[1]程學慶,房曉溪.LabVIEW圖形化編程與實例應(yīng)用[M].北京:中國鐵道出版社,2005.

[2]胡仲波.基于虛擬儀器技術(shù)的PCB視覺檢測系統(tǒng)[D].南京:南京理工大學碩士學位論文,2006.

[3]段峰,王耀南.機器視覺技術(shù)及其應(yīng)用綜述[J].自動化博覽,2002,19(3).

[4]周長發(fā).精通Visual C++圖像處理編程[M].北京:電子工業(yè)出版社,2004.

[5]陳錫輝,張銀鴻.LabVIEW 8.20程序設(shè)計從入門到精通[M].北京:清華大學出版社,2007.

[6]鄭偉.圖像法檢測印刷電路板缺陷[M].西安:西安理工大學,2002.

[7] National Instruments,IMAQ User Manual Concepts[Z].1999.

[8]李強.PCB板缺陷自動檢測技術(shù)的分析研究[D].合肥:合肥工業(yè)大學,2002.

[9]傅茂名.基于形態(tài)邊緣檢測算法的一種改進[J].電子科技大學學報,2005(2).

[10]王思華.計算機視覺新技術(shù)及其在IC標記質(zhì)量檢驗系統(tǒng)設(shè)計中的應(yīng)用[J].電子技術(shù)應(yīng)用,2000(9).

[11]岳永哲.圖像處理技術(shù)在閱卷系統(tǒng)中的應(yīng)用[D].北京:北京工業(yè)大學,2006.

[12] Bruce sehneier.Applied Cryptography protocols,Algorithms,and SourceCode[M].C Jolm Wiley & Sons,Inc,1994.

[13] William work Security Essentials:Applications and Standard[M].Prentice Hall/Pearson,2002.

[14]高育鵬,楊俊,何廣軍.基于圖像識別的自動閱卷系統(tǒng)研究[J].現(xiàn)代電子期刊,2006(22).

[15]楊青燕,彭延軍.基于灰度圖像的答題卡識別技術(shù)[J].山東科技大學學報:自然科學版,2009(3).

[16]周海濤,韓曉軍.基于數(shù)字圖像處理的答題卡識別方法研究[J].電腦知識與技術(shù),2008(28).

[17]周萬珍,鄭廣,王建霞,等.數(shù)字圖像處理技術(shù)在客觀題閱卷中的應(yīng)用[J].數(shù)學的實踐與認識,2006(8).

[18]王勝春.基于SVM的信息卡識別系統(tǒng)[D].長沙:湖南師范大學,2008.

[19]吳志明.SMT系統(tǒng)中焊點位置的檢測[D].哈爾濱:哈爾濱工業(yè)大學,2006.

[20]楊敏,王春青,鄒增大,等.表面組裝印刷電路板上焊點信息的自動獲取[J].焊接學報,2005,39(6).