模式識別技術范文

時間:2023-03-22 22:48:25

導語:如何才能寫好一篇模式識別技術,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

模式識別技術

篇1

關鍵詞:模式識別;特征提??;分類器;刑事科學技術

中圖分類號:TP391文獻標識碼:A文章編號:1009-3044(2008)34-1855-02

Theory andApplications of Pattern Recognition in Criminal Science and Technology

ZHANG Song-lin1, GAO Pei-pei2

(1.Department of Electronics of Henan Mechanical and Electrical Engineering College, Xinxiang 453003,China;2.Department of Forensic of Xinxiang Medical university, Xinxiang 453002, China)

Abstract: Pattern Recognition in recent years in criminal science and technology has been widely applied,Summary of the identification process of pattern recognition and identification method commonly used,and application of pattern recognition in criminal science and technology.

Key words: pattern recognition; feature extracting; classifier; criminal science and technology

1 引言

模式識別(Pattern Recognition)是一種從大量信息和數(shù)據(jù)出發(fā),在已有認識和經(jīng)驗的基礎上,利用計算機及數(shù)學推理的方法對信息特征自動完成識別的過程。模式識別屬計算機科學中人工智能的研究范疇[1],內(nèi)容非常廣泛。20世紀70年達國家開始將模式識別廣泛技術應用于刑事偵察部門[2],近年來,模式識別在我國刑事技術的應用也取得長足發(fā)展,模式識別在刑事技術中的應用不僅提高了刑事科學技術水平,也極大地提高了刑事科學技術現(xiàn)代化的建設。

2 模式識別與模式識別系統(tǒng)

模式識別是對表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的或邏輯關系的等)特征信息進行處理和分析,以對事物或現(xiàn)象進行描述、辨認、分類和解釋的過程。

模式識別的研究主要集中在兩方面[3-4],一方面研究生物體(包括人)是如何感知對象的,另一方面是在給定的任務下,如何用計算機實現(xiàn)模式識別的理論和方法。前者屬于認知科學的范疇;后者則是通過數(shù)學家、信息學專家和計算機科學工作者研究的范圍,目前已經(jīng)取得了系統(tǒng)的研究成果。

模式識別通常包括相互關聯(lián)的兩個階段:學習階段和實現(xiàn)階段,前者是對樣本進行特征選擇,尋找分類的規(guī)律構筑分類器,后者是根據(jù)分類規(guī)律對未知樣本集進行分類和識別,模式識別系統(tǒng)框圖如圖1所示。

圖1 模式識別系統(tǒng)框圖

1) 數(shù)據(jù)采集及預處理:

數(shù)據(jù)采集是指把被研究對象的各種信息轉換為機器可以接受的數(shù)值或符號集合。這種數(shù)值或符號所組成的空間為模式空間。為了從這些數(shù)字或符號中抽取出對識別有效的信息,必須進行預處理,包括進行二值化處理、數(shù)字濾波進行平滑去噪處理及規(guī)范化處理等。

2) 特征提?。?/p>

預處理后的信息送入特征提取模塊抽取特征用于分類器的設計。特征提取的目的是從原始信息中抽取出用于區(qū)分類型的本質(zhì)特征。無論是識別過程還是訓練學習過程,都要對研究對象固有的、本質(zhì)的重要特征或屬性進行量測并將結果數(shù)值化或符號化,形成特征矢量。比如,指紋識別時,提取的特征有紋理、交叉點、形狀等。特征的提取和選擇對識別過程是至關重要的,如果模式選擇得好,對不同類的模式就能表現(xiàn)出很大的差別,就能比較容易地設計出性能較高的分類器。因此特征的選擇會直接影響到分類器的構造和識別的效果。

雖然特征的提取和選擇在模式識別中占有如此重要的地位,但是迄今沒有特征提取和選擇的一般方法,大多數(shù)的方法都是面向問題的。有人可能認為在處理識別問題時,模式特征取得越多越好,或者說,模式向量的維數(shù)越高,對分類器的設計越是有利。經(jīng)常有這樣的情況,當用一組特征做出來的分類器不能滿足要求的話,自然就會想到增加新的特征。雖然知道特征的增加同樣也會增加特征提取的困難和分類計算的復雜性,但總認為這樣可以改進分類器的性能。但是,在實際工作中,往往會發(fā)現(xiàn)當特征的數(shù)目達到某個限度后,不但不能改善分類器的性能,反而使它的工作惡化,產(chǎn)生這個問題的基本原因是用以設計分類器的樣本數(shù)目是有限的。為了使模式識別的結果滿意,在增加特征的同時,必須增加供學習的樣本數(shù)量。

3) 分類器設計及分類識別:

生成的模式特征空間,就可以進行模式識別的最后一部分:分類器設計及分類識別。該階段最后輸出的可能是對象所屬的類型,也可能是模型數(shù)據(jù)庫中與對象最相似的模式編號。分類器設計及分類識別通常是基于已經(jīng)得到分類或描述的模式集合而進行的。這個模式集合稱為訓練集,由此產(chǎn)生的學習策略稱為監(jiān)督學習。學習也可以是非監(jiān)督性學習,在此意義下產(chǎn)生的系統(tǒng)不需要提供模式類的先驗知識,而是基于模式的統(tǒng)計規(guī)律或模式的相似性學習判斷模式的類別。分類器設計及分類識別的方法有很多,常見的模式識別方法:模板匹配、統(tǒng)計模式識別、句法(或結構)模式識別、模糊模式識別和神經(jīng)元網(wǎng)絡模式識別。

3 模式識別方法

3.1 模板匹配

模板匹配是一種相對簡單的也是早期常用的模式識別方法之一。匹配是模式識別的一種分類操作,主要是判斷同一類的兩個實體特征間的相似性。模板匹配的基本思想主是利用實體的特征進行模板匹配。但是該方法計算量非常大,同時該方法的識別率嚴重依賴于已知模板,如果已知模板產(chǎn)生變形,會導致錯誤的識別結果。

3.2 統(tǒng)計模式識別

統(tǒng)計模式識別理論是一種相對較為完善和成熟的識別理論。統(tǒng)計模式識別,又稱決策理論識別,該方法基于模式的統(tǒng)計特征,用一個n維特征空間(特征集)來描述每個模式,然后基于概率論矩陣理論等知識,利用合適的判別函數(shù),將這個n維特征空間劃分為m個區(qū)域,即類別。特征值分布函數(shù)可以通過指定或學習得到。統(tǒng)計模式識別經(jīng)常用于解決分類問題?,F(xiàn)在研究的一個熱點-支持向量機就是基于統(tǒng)計學習理論基礎上的一個新的模式識別方法。

3.3 結構(句法)模式識別

結構(句法)模式識別主要是基于特征的結構相關性將復雜的模式用簡單的子模式或基元遞歸來描述,這種描述與文字中的句子通過多個單詞來描述相似。

3.4 神經(jīng)網(wǎng)絡模式識別

神經(jīng)網(wǎng)絡可看作是由大量交互的神經(jīng)元構成的計算系統(tǒng)[5],神經(jīng)模式識別即是利用神經(jīng)元網(wǎng)絡中出現(xiàn)的神經(jīng)計算模式進行。神經(jīng)元網(wǎng)絡允許模式可以有噪聲,若訓練得當,神經(jīng)元網(wǎng)絡會對未知模式的類別做出正確的響應。

4 模式識別在刑事科學技術中的應用

經(jīng)過多年的發(fā)展,模式識別已被廣泛應用在了刑事科學技術領域[6],如痕跡檢驗、票證印章識別、相貌識別等。

4.1 痕跡鑒別

痕跡鑒別是在刑事科學技術中廣泛應用于查證、披露和確認罪犯的一種十分有效的技術手段。主要包括指紋鑒別、足跡鑒別、掌紋及皮膚紋鑒別、槍彈痕跡鑒別、兇器及作案工具鑒別和汽車輪胎等其它痕跡的鑒別。其中指紋識別[7,8]最為常用,經(jīng)專家證實,每個人的手指、腳、腳趾內(nèi)側表面的皮膚凸凹不平產(chǎn)生的紋路會形成各樣的圖案,而這些皮膚的紋路在圖案、斷點和交叉點上各不相同,是唯一的。依靠這種唯一性,就可將一個人同他的指紋對應起來,從而識別出對應的案犯?,F(xiàn)代公安系統(tǒng)中的指紋自動識別系統(tǒng)即是利用計算機進行自動識別,并與人工認定相結合,效果十分顯著。這種識別技術還可以用于金融、保險、出入境安全通道、醫(yī)療卡、安全系統(tǒng)等重要業(yè)務的身份鑒別。

4.2 票證印章識別

票證包括護照、支票、銀行信用卡、股票、國庫券、發(fā)貨票、產(chǎn)權證、工作證等有價證券、證件和票據(jù),一般票證均采取相應的高新技術防偽措施如在票證上印刷上有特殊花紋、加金屬線和熒光粉材料等。除了用一些簡易的紫外線方法檢驗外,通常可將形成防護信息轉換成代碼均勻散布在票證上[2],鑒別時只需將防護信息代碼提取出來由計算機進行自動識別,如直接通過刷卡、掃描等方式即可鑒別真?zhèn)巍?/p>

4.3 生物特征識別

所謂生物特征識別是指通過計算機與生物統(tǒng)計學等手段利用人體所固有的生理特征或行為特征來進行個人身份鑒別[9,10]。生理特征多為先天性的;行為特征則多為后天性的。同時用于身份鑒別的生物特征應具有普遍性、唯一性和可接受性等特點。

基于生理特征的識別技術包括人臉識別、虹膜識別、視網(wǎng)膜識別、掌紋識別、手形識別、人耳識別、基因識別及紅外溫譜圖識別等?;谛袨樘卣鞯淖R別技術主要有步態(tài)識別、擊鍵識別和簽名識別等。

5 結束語

隨著計算機軟硬件技術的快速發(fā)展,模式識別得到了更多的關注,模式識別技術越來越完善,應用領域也越來越廣泛。模式識別技術在刑事科學技術領域中的應用,將為刑事科學技術的發(fā)展,刑事科學的現(xiàn)代化進程推向一個新的高度。

參考文獻:

[1] 邊肇祺,張學工.模式識別[M].2版.北京:清華大學出版社,2000.

[2] 賈鐵軍,李錦.人工智能在刑事技術中的應用[J].刑事技術,2002,(6):56-60.

[3] 嚴紅平,潘春洪.模式識別簡述[J].自動化博覽.2006(2):22-26.

[4] 熊超.模式識別理論及其應用綜述[J].中國科技信息,2006(6):171-172.

[5] 潘盛輝,韓峻峰.基于神經(jīng)網(wǎng)絡的模式識別及其應用[J].廣西工學院學報,2000,11(4):33-36.

[6] 賈玉文,張書杰.刑事科學技術[M].2版.北京:人民衛(wèi)生出版社,1999.

[7] 楊宏林,吳陳.指紋識別方法綜述[J].華東船舶工業(yè)學院學報,2003,17(3):37-42.

[8] 謝健陽,李鐵才,唐降龍,等.指紋識別系統(tǒng)的設計與實現(xiàn)[J].微計算機信息,2006,22(3):156-157.

[9] 周激流,張曄.人臉識別理論研究進展[J].計算機輔助設計與圖形學學報,1999,11(2):180-184.

篇2

關鍵詞:模式;模式識別;模式識別的應用

1 引言

人們在觀察事物或現(xiàn)象的時候,常常要根據(jù)一定需求尋找觀察目標與其他事物或現(xiàn)象的相同或不同之處,并在此特定需求下將具有相同或相似之處的事物或現(xiàn)象組成一類。例如字母‘A’、‘B’、‘a(chǎn)’、‘b’,如果從大小寫上來分,會將‘A’、‘B’ 劃分為一類,‘a(chǎn)’、‘b’劃分為另一類;但是如果從英文字母發(fā)音上來分,則又將‘A’、‘a(chǎn)’劃分為一類,而‘B’、‘b’則為另一類。人們也可以正確地區(qū)分出它們,并根據(jù)需要將它們進行準確歸類,當然, 前提條件是人們需要對‘A’、‘B’、‘a(chǎn)’、‘b’一般的書寫格式、發(fā)音方式等有所了解。人腦的這種思維能力就構成了“模式識別”的概念。那么,什么是模式?什么是模式識別呢?

2 模式和模式識別

從以上的例子可以看出,對字符的準確識別首先需要在頭腦中對相應字符有個準確的認識。當人們看到某物或現(xiàn)象時,人們首先會收集該物體或現(xiàn)象的所有信息,然后將其行為特征與頭腦中已有的相關信息相比較,如果找到一個相同或相似的匹配,人們就可以將該物體或現(xiàn)象識別出來。因此,某物體或現(xiàn)象的相關信息,如空間信息、時間信息等,就構成了該物體或現(xiàn)象的模式。Watanabe定義模式“與混沌相對立,是一個可以命名的模糊定義的實體”。比如,一個模式可以是指紋圖像、手寫草字、人臉、或語言符號等。廣義地說,存在于時間和空間中可觀察的事物,如果可以區(qū)別它們是否相同或相似,都可以稱之為模式;狹義地說,模式是通過對具體的個別事物進行觀測所得到的具有時間和空間分布的信息;把模式所屬的類別或同一類中模式的總體稱為模式類(或簡稱為類)。模式識別則是在某些一定量度或觀測基礎上把待識模式劃分到各自的模式類中去。計算機模式識別就是是指利用計算機等裝置對物體、圖像、圖形、語音、字形等信息進行自動識別。

模式識別的研究主要集中在兩方面,一是研究生物體( 包括人) 是如何感知對象的,二是在給定的任務下,如何用計算機實現(xiàn)模式識別的理論和方法。前者是生理學家、心理學家、生物學家、神經(jīng)生理學家的研究內(nèi)容,屬于認知科學的范疇;后者通過數(shù)學家、信息學專家和計算機科學工作者近幾十年來的努力,已經(jīng)取得了系統(tǒng)的研究成果。

3模式識別的方法

現(xiàn)在有兩種基本的模式識別方法,即統(tǒng)計模式識別方法和結構(句法)模式識別方法。統(tǒng)計模式識別是對模式的統(tǒng)計分類方法,即結合統(tǒng)計概率論的貝葉斯決策系統(tǒng)進行模式識別的技術,又稱為決策理論識別方法。利用模式與子模式分層結構的樹狀信息所完成的模式識別工作,就是結構模式識別或句法模式識別。

4.模式識別的應用

經(jīng)過多年的研究和發(fā)展,模式識別技術已廣泛被應用于人工智能、計算機工程、機器學、神經(jīng)生物學、醫(yī)學、偵探學以及高能物理、考古學、地質(zhì)勘探、宇航科學和武器技術等許多重要領域,如語音識別、語音翻譯、人臉識別、指紋識別、手寫體字符的識別、工業(yè)故障檢測、精確制導等。模式識別技術的快速發(fā)展和應用大大促進了國民經(jīng)濟建設和國防科技現(xiàn)代化建設。

4.1 字符識別

字符識別處理的信息可分為兩大類:一類是文字信息,處理的主要是用各國家、各民族的文字( 如: 漢字,英文等)書寫或印刷的文本信息,目前在印刷體和聯(lián)機手寫方面技術已趨向成熟,并推出了很多應用系統(tǒng);另一類是數(shù)據(jù)信息,主要是由阿拉伯數(shù)字及少量特殊符號組成的各種編號和統(tǒng)計數(shù)據(jù),如:郵政編碼、統(tǒng)計報表、財務報表、銀行票據(jù)等等,處理這類信息的核心技術是手寫數(shù)字識別。

4.2 語音識別

語音識別技術技術所涉及的領域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。近年來,在生物識別技術領域中,聲紋識別技術以其獨特的方便性、經(jīng)濟性和準確性等優(yōu)勢受到世人矚目,并日益成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌踩炞C方式。而且利用基因算法訓練連續(xù)隱馬爾柯夫模型的語音識別方法現(xiàn)已成為語音識別的主流技術。該方法在語音識別時識別速度較快,也有較高的識別率。

4.3 指紋識別

我們手掌及其手指、腳、腳趾內(nèi)側表面的皮膚凹凸不平產(chǎn)生的紋路會形成各種各樣的圖案。而這些皮膚的紋路在圖案、斷點和交叉點上各不相同,是唯一的。依靠這種唯一性,就可以將一個人同他的指紋對應起來,通過比較他的指紋和預先保存的指紋進行比較,便可以驗證他的真實身份。一般的指紋5個大的類別:左旋型(leftloop),右旋型(right loop),雙旋型(twinloop),螺旋型(whorl),弓型(arch)和帳型(tented arch),這樣就可以將每個人的指紋分別歸類,進行檢索。指紋實現(xiàn)的方法有很多,大致可以分為4 類:基于神經(jīng)網(wǎng)絡的方法、基于奇異點的方法、語法分析的方法和其他的方法。

4.4細胞識別

細胞識別是最近在識別技術中比較熱門的一個話題。以前,對疾病的診斷僅僅通過表面現(xiàn)象,經(jīng)驗在診斷中起到了主導作用,錯判率始終占有一定的比例;而今,通過對顯微細胞圖像的研究和分析來診斷疾病,不僅可以了解疾病的病因、研究醫(yī)療方案,還可以觀測醫(yī)療療效。如果通過人工辨識顯微細胞診斷疾病也得不償失,費力費時不說,還容易耽誤治療。基于圖像區(qū)域特征,利用計算機技術對顯微細胞圖像進行自動識別愈來愈受到大家的關注,并且現(xiàn)在也獲得了不錯的效果。但實際中,細胞的組成是復雜的,應該選擇更多的特征,建立更為完善的判別函數(shù),可能會進一步提高分類精度。

參考文獻:

[1] 邊肇祺,張學工等編著. 《模式識別》(第二版). 北京:清華大學出版社,2000.

[2] 王碧泉,陳祖蔭. 《模式識別理論、方法和應用》. 北京:地震出版社,1989.

篇3

關鍵詞:實體識別; 屬性模式; 擴展性; 框架

中圖分類號:TP319.9 文獻標識碼:A文章編號:2095-2163(2014)01-0065-04

0引言

實體識別就是判別來自一個數(shù)據(jù)源或多個數(shù)據(jù)源的描述是否指向同一個實體。此問題由來已久,現(xiàn)已提出很多方法。解決實體識別問題所利用的信息可分為兩類,屬性特征信息和關系信息。基于屬性特征的方法最簡單、使用得也最多,但卻因屬性信息有限,在某些情況下并不足以提供高置信度的判斷結論。越來越多的方法開始利用屬性的關系或規(guī)則進行實體識別,但利用這種關系的方式卻各不相同,導致缺乏通用性。對每個實體識別問題都需要重新設計解決方案也必將是低效的,因而需要開展研究,予以改進。

本文將不同屬性與實體的關系模式概括為四種類型,通過模式類型決定相似度計算策略,再根據(jù)屬性的格式?jīng)Q定基本的相似度計算函數(shù)。系統(tǒng)將多個屬性的相似度組織成向量的形式表示,通過監(jiān)督學習的方法形成判決器,最后在實體關系圖上完成迭代劃分。

1相關研究

文獻[1,2]研究了相似函數(shù)選擇和閾值確定問題。通過發(fā)現(xiàn)相似函數(shù)和閾值的冗余,去除不合適的相似函數(shù)和閾值設置。為了有效整合多種方法的優(yōu)點,文獻[3]提出了一種按有監(jiān)督學習的結果聚類分配權重的方法,為權重分配提供了新的思路,但選擇作為聚類的特征是經(jīng)驗性的,是否可以推廣尚未確定。文獻[4]設計了一個領域無關的實體識別系統(tǒng),可以通過學習的方式對數(shù)據(jù)的格式進行轉化,以滿足識別系統(tǒng)進行比較的需要。文獻[5]研究了利用合作者集合的相關性的方法,實驗證明其優(yōu)于一般的非整體分析的方法。

2基于屬性模式的實體識別框架介紹

系統(tǒng)結構如圖1所示,主要分為以下幾個部分:

(1)相似度度量策略形成模塊。該模塊通過屬性的模式和數(shù)據(jù)格式自動地選擇相似度函數(shù),形成相似度度量策略。

(2)相似度計算模塊。該模塊按照選擇的相似度函數(shù)計算實體對的相似度。

(3)判決器模塊。該模塊在訓練階段統(tǒng)計實體對的相似度分布情況,在實體劃分階段輔助判斷。

(4)實體關系圖。實體劃分階段在實體關系圖上迭代進行,每次完成實體合并以后,重新計算經(jīng)過調(diào)整的實體對的相似度,直到所有相似邊都處理完畢,實體劃分結束。

3系統(tǒng)各部分的實現(xiàn)

3.1相似度計算策略的形成

為了實現(xiàn)系統(tǒng)的通用性,相似度計算策略必須領域無關地進行。為此分析了實體與屬性間的關系,按其特點進行了分類。利用各屬性的模式可以確定相似度計算的方法。

3.3實體劃分算法

實體劃分在實體關系圖上進行。實體關系圖的頂點表示記錄,邊表示實體對間的相似度,通過邊的操作進行實體劃分。

關系圖的頂點分為兩類,一類是原始頂點,其中只包含一條記錄;另一類是劃分過程中新形成的點,稱為超點,超點帶有表示實體的標簽,且包含此實體的記錄的集合。邊e代表的是實體對間存在相似,邊的權值為相似向量。原始關系圖中僅含原始頂點,當所有實體對的相似向量計算完畢,并建立起原始關系圖后,就可開始進行實體劃分了。

實體劃分算法主要過程為:從未標記邊中選擇相似度最大的邊,查詢判決器,若大于判斷閾值,則判為同一實體,合并相關頂點,即CLUSTER操作,有關邊的相似度則需要進行重新計算;否則即對邊做暫時標記。繼續(xù)在剩下未標記邊中尋找相似度值最大的邊,重復此過程。當沒有未標記邊剩余時,再對標記邊進行拆分操作SPLIT,直到無邊剩余。

CLUSTER操作主要是對頂點進行合并或創(chuàng)建。當邊的對象(e.O)與端點標簽相同時進行合并,否則就需要新建頂點。具體操作如表2所示。其中,邊所連接的記錄為x和y,記錄所在的頂點分別為u,v。頂點調(diào)整過程中,特別當頂點包含的記錄增多后,頂點的屬性集合增大,此屬性的相關度也可能增大,此時需要重新計算有關邊的相似度。

5結束語

本文提出了一種基于模式的實體識別方法,針對模式特點的相似度計算方法更具有通用性。以向量表示屬性的相似度,通過監(jiān)督學習形成判決器。實體劃分階段每次選擇最相似的實體對,通過查詢判斷單元進行判斷,更新相關實體對的相似向量,并迭代進行實體劃分。實驗結果表明能自動有效地進行實體劃分。現(xiàn)存的問題包括平均劃分相似空間的方法不夠精細,用戶要求的準確率較高時,召回率較低。下一步的研究重點包括判斷器的劃分方式以及當用戶輸入較高判斷閾值情況下如何提高系統(tǒng)的召回率。

參考文獻:

[1]MENESTRINA D, WHANG S E, GARCIA-MOLINA H. Evaluation of entity resolution approaches on real-world match problems[C]//VLDB, 2010:208-219.

[2]WANG Jiannan, LI Guoliang, YU Xu , et al. Entity matching: how similar is similar[C]//VLDB,2011:622-633.

[3]CHEN Z, KALASHNIKOV D V, MEHROTRA S.Exploiting context analysis for combining multiple entity resolution systems[C]//SIGMOD,2009:207-218.

篇4

關鍵詞:虹膜識別;防偽;互聯(lián)網(wǎng)金融

一、引言

互聯(lián)網(wǎng)金融防偽技術最常見的就是二維碼。隨著二維碼的發(fā)展,“掃一掃”這個簡單的動作可以完成人們?nèi)粘I钪性S多事情,其中,二維碼防偽就是二維碼在互聯(lián)網(wǎng)金融的主要應用之一,用戶可以用手機掃描二維碼來登陸P2P平臺進行交易,又因二維碼是隨機生成,不易被竊取,所以防偽效果顯著。

指紋防偽技術識別作為最成熟的生物識別技術,主要應用于互聯(lián)網(wǎng)交易支付方面,比之普通的圖案識別和密碼識別,指紋防偽具有較高的安全性和快捷性,也是當前人們比較依賴和慣用的防偽方式。

當然,還有其他一些防偽技術,就不多做介紹了??傊?,防偽技術的出現(xiàn)是為了解決在互聯(lián)網(wǎng)金融中的詐騙造假問題,這不僅是廣大互聯(lián)網(wǎng)金融參與者所關注的焦點,政府對此也保持高度重視,在2016年政府工作報告中,總理提出“規(guī)范互聯(lián)網(wǎng)金融,大力發(fā)展綠色金融”??梢钥闯龌ヂ?lián)網(wǎng)金融的防偽工作并不完善,仍需繼續(xù)努力。

二、虹膜識別防偽技術的優(yōu)點

(1)識別度高

每個人眼睛里的虹膜都是獨特的,絕無僅有的。甚至同一個體左右眼睛的虹膜也有所差別。所謂的虹膜識別技術,就是讀取虹膜的細節(jié)表象特征,經(jīng)識別后,轉化為特殊的虹膜密碼,再儲存到計算機內(nèi)連網(wǎng)錄入數(shù)據(jù)庫。虹膜識別的出錯率極低,是因為虹膜組織紋路復雜且細節(jié)繁多,一個虹膜的讀取點數(shù)量大約是其他傳統(tǒng)生物識別的20~30倍。如此龐大的信息量汲取確保了虹膜識別的精確程度,極大地提高了安全性。

(2)永久不變性

虹膜生長地很快,是人身體最早成熟的器官之一。從嬰兒時期開始,只需3年時間就可以發(fā)育成熟,一旦成熟就終身不變。而且,普通疾病(如:流感)不會對虹膜造成傷害,虹膜也不會因特殊職業(yè)(如:跳水運動員等長期眼睛接觸水的工作)或者特殊喜好(如:長期戴美瞳,隱形眼鏡)等因素造成磨損。

(3)高防偽性

虹膜是“最難偽造的”人體生物特征,因為它極強的生物活性與人體生命現(xiàn)象是相呼應的。比如,在生活中,虹膜會對光線敏感,會隨光線強弱變化而變化;在生理上,瞳孔會自我無意識地縮放,虹膜也相應地自然變化;在醫(yī)學上,醫(yī)生會用聚光手電筒照病人的眼睛也是因為虹膜會隨身體狀況變化而呈現(xiàn)不同的特征。所以,若有非法分子想用剝離人體的眼球、照片等死物來代替活體虹膜識別都是絕對不可行的,從而保證了虹膜防偽的高執(zhí)行力和高辨識率。

(4)非接觸性

虹膜識別需要使用專門的檢測儀器,用戶只需眼睛對著儀器的特殊鏡頭,無需觸碰到儀器就可以完成識別檢測。所以,在虹膜識別與個人信息錄入時,全過程可高效快速地完成。沒有直接的身體接觸,也不會冒犯他人。

三、虹膜識別防偽技術的基本原理

虹膜防偽技術是基于虹膜識別技術與個人信息庫相結合的一項防偽技術。為了更好的運用這種技術,有三個方面比較重要。

第一部分重點是虹膜圖像的定位,虹膜的歸一化(盡量消除由于旋轉、位移、圖片的放大縮小以及一些采集圖像過程中的外部光線、像素等因素對每個人的虹膜特征的模糊與改變),將虹膜的圖像(如圖3.1)的分辨率提高以便于更好的識別不同個體的虹膜圖像的特征,提取這些精化的虹膜圖片以及將這些信息集合起來創(chuàng)立一個虹膜的大數(shù)據(jù)信息庫。

第二部分的重點主要是采集現(xiàn)有利用互聯(lián)網(wǎng)金融平臺進行投資與理財?shù)目蛻舻纳锾卣髯R別的數(shù)據(jù)――左右眼虹膜。同時,將這些金融平臺的客戶信息與自身的虹膜圖像相鏈接。將個人的投資信息、信用信息等個人財務類信息的信息庫和之前采集的虹膜信息庫結合,達到虹膜信息匹配時可以調(diào)出個人信息的目的。

第三部分重點是防偽技術。由于與虹膜系統(tǒng)鏈接的是需要安全度高的金融財務等信息,因此要最大程度上降低偽造虹膜盜取信息的可能性。外置的采集虹膜的機器需要能夠識別所采集到的虹膜圖像是否是活體虹膜。內(nèi)部的采集虹膜特征的算法能夠更加精確的提取不同個體的虹膜特征。

四、虹膜識別防偽技術在互聯(lián)網(wǎng)金融的應用

近年來,中國的互聯(lián)網(wǎng)金融發(fā)展十分迅速,證券公司、基金公司、銀行以及其他網(wǎng)上的小型P2P平臺等等都開通了網(wǎng)上直接投資理財,自行贖回等業(yè)務。盡管這極大便利了廣大投資者,但是存在較大的網(wǎng)上信息安全隱患。違法人員盜用他人的身份信息致使投資者財務損失的情況屢有發(fā)生。這使得現(xiàn)有的僅憑借數(shù)字字母組合密碼以及身份證號碼或是短信驗證碼等方式即可操作個人的網(wǎng)上賬戶極不安全。雖然現(xiàn)在已有一些平臺例如螞蟻聚寶等能夠使用指紋解鎖或是刷臉支付,但這些生物識別方式相對于虹膜識別精度欠缺,并且有比較大的局限性。虹膜識別技術因其特有的極高的不可復制性以及穩(wěn)定性等能夠有效防止他人使用違法手段偽造虹膜圖像竊取個人的重要金融財務信息。虹膜識別防偽技術作為一種比指紋、臉部識別更加精準的方式,將其與蓬勃發(fā)展的互聯(lián)網(wǎng)金融相結合是發(fā)展的必然趨勢。

五、虹膜識別防偽技術的未來發(fā)展

由基因與外部環(huán)境共同決定的虹膜的獨一無二的性質(zhì)(每個人的左右眼虹膜也有較大的區(qū)別)使得其在生物識別技術中獨樹一幟。當下,已經(jīng)有許多公司將虹膜技術運用到產(chǎn)品中,如三星公司決定Galaxy Note 7手機將采用虹膜識別技術、微軟Lumia950/950*L搭載基于Windows Hello的虹膜識別功能以及中興Grand S3利用虹膜識別技術安全支付或是訪問機密文件等。不僅是這些公司將虹膜識別技術運用到生產(chǎn)的產(chǎn)品中,許多其他公司也在研制與開發(fā)虹膜識別技術,力圖降低虹膜技術運用的成本。使得虹膜識別技術在我們的日常生活中得到普及。

六、結束語

隨著技術的發(fā)展,虹膜作為一種人體固有的生物特征,終身不變以及準確度高和識別速度快的特點,虹膜防偽技術在這個信息爆炸的時代的需求增加將會是不可阻擋的趨勢。同時,虹膜防偽技術為人們?nèi)蘸笊顜淼谋憷约皠?chuàng)造的經(jīng)濟價值也是不可估量的。

參考文獻:

[1].2016年國務院政府工作報告[R].新華網(wǎng),2016-03-05.

[2]王蘊紅,朱勇,譚鐵牛.基于虹膜識別的身份鑒別[J].自動化學報,2002(01).

[3]Boles W, Boashah B. A human identification technique using images of the iris and vavelet transform. IEEE Trans.On Signal Processing,1998(04).

[4]李海青,孫哲南,譚鐵牛,等.虹膜識別技術進展與趨勢信息安全研究[J].2016(01).

[5]田啟川,劉正光.虹膜識別綜述[J].計算機應用研究,2008(05).

[6]尚睿.虹膜識別技術的最新進展綜述[J].電腦知識與技術,2015(22).

篇5

【摘要】 目的: 建立適用于社區(qū)中腦膜炎與其他中樞神經(jīng)系統(tǒng)疾病的鑒別診斷模型。方法:采用不等帶寬核密度估計的非參數(shù)判別分析,對中國典型病例大全近四年內(nèi)符合納入標準的161例腦膜炎和161例非腦膜炎患者完整的病例資料進行分析。結果: 經(jīng)交叉證實法得到腦膜炎組的判別正確率為83.95 %,對照組為71.25 %,總的判斷正確率87.64 %。同時對資料進行l(wèi)ogistic回歸和人工神經(jīng)網(wǎng)絡模型進行分析,并進行與人工神經(jīng)網(wǎng)絡和logistic回歸所建立的模型進行比較。結論: 非參數(shù)判別分析建立的腦膜炎診斷模型是理想模型。

【關鍵詞】 非參數(shù)判別; 交叉證實; 診斷模型; 腦膜炎

腦膜炎是由病原體引起的中樞神經(jīng)系統(tǒng)嚴重的感染性疾病。由于發(fā)病原因復雜,診斷難度大,病程兇險且可造成流行,因此,在亞洲一些地區(qū),流行性腦膜炎是15歲以下的孩子死亡的主要原因之一。流行性腦膜炎在流行強度較大的時候會導致3000~10000人死亡[1]。腦膜炎早期的癥狀不具有特異性,因此在社區(qū)醫(yī)生水平有限的情況下很難得到重視,而大部分的腦膜炎都是急性的,尤其是流行性腦脊髓膜炎,一旦沒有及時診斷,對病人的生命和愈后都會造成很大的影響。因此,建立適合于社區(qū)的腦膜炎初篩診斷模型對提高社區(qū)衛(wèi)生服務能力是很有意義的。

1 資料和方法

1.1 資料來源

在互聯(lián)網(wǎng)上系統(tǒng)檢索國內(nèi)信息量最大且有高影響力的《中國期刊全文數(shù)據(jù)庫》(CNKI) 及其新近開發(fā)的含有100多萬病例的醫(yī)學數(shù)據(jù)庫《中國典型病例大全》(Medical Case),以醫(yī)學主題詞表中的“腦膜炎”為關鍵詞,以“病例報告、病例分析”為副關鍵詞,檢索2005年1月~2009年3月的相關臨床病例。

1.1.1 腦膜炎病人納入標準 ①數(shù)據(jù)庫中有完整癥狀、體征和實驗室檢查記錄,及臨床診斷明確的腦膜炎病例、病案;②年齡≥3周歲;③首次發(fā)病或首次因腦膜炎住院的患者;④發(fā)病前無肢體癱瘓或腦與腦神經(jīng)功能障礙等的患者。

1.1.2 對照組病人選擇標準 ①數(shù)據(jù)庫中有完整癥狀、體征和實驗室檢查記錄及臨床診斷明確,并有治療記錄的其他相關的同期非腦膜炎的中樞神經(jīng)系統(tǒng)病例、病案;②病人≥3周歲且與腦膜炎病例年齡相近。

1.1.3 病例排除標準 ①患有嚴重并發(fā)癥;②患有嚴重精神疾病、癡呆者;③交叉重復的病案;④多臟器功能衰竭等嚴重病人;⑤由其他醫(yī)院轉院過來的病人;⑥醫(yī)院獲得性腦膜炎病人(如因手術感染所致)。

1.1.4 質(zhì)量控制 對病例篩選和數(shù)據(jù)錄入進行質(zhì)量控制:①制定統(tǒng)一標準選擇病例;②建立數(shù)據(jù)庫,統(tǒng)一調(diào)查項目;③雙錄入,及時糾錯;④注明資料出處,從病例篩選、數(shù)據(jù)錄入、統(tǒng)計分析等各步分別進行核準。

1.2 研究方法

1.2.1 數(shù)據(jù)挖掘 數(shù)據(jù)挖掘是一個利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)間關系的過程[2]。臨床醫(yī)學上大量的數(shù)據(jù)中蘊含著豐富的信息。利用數(shù)據(jù)挖掘技術, 通過數(shù)據(jù)訓練集所訓練得到的算法模型能夠有效應用于疾病診斷, 并獲得很高的準確率。尤其是臨床上大量的數(shù)據(jù)都還為得到挖掘利用,本研究對《中國期刊全文數(shù)據(jù)庫》和《中國典型病例大全》兩個數(shù)據(jù)庫中收集回顧近四年符合納入標準的161例腦膜炎和161例非腦膜炎患者完整的病例資料進行判別分析研究。

1.2.2 判別分析 判別分析是根據(jù)已得到的一批分類明確的樣品,建立較好的判別函數(shù),使產(chǎn)生錯判的事例最少,進而對給定的一個新樣品,判斷它來自哪個總體。判別分析近年來在自然科學、社會學及經(jīng)濟管理學科中都有廣泛的應用。在醫(yī)學上也已逐步用于疾病的診斷。本研究采用不等帶寬核密度估計的非參數(shù)逐步判別分析。下面介紹不等帶寬核密度估計的非參數(shù)判別分析的主要步驟:

首先建立判別對象x 與j 類中判別對象Y間的平方距離函數(shù):

D2(X,Y)=(X-Y)COV-1j(X-Y)

(X-Y) :對象X與j 類中對象Y的各相同指標差值向量;COV-1j(X-Y) :對象X與j 類中各對象Y的各相同指標差值的協(xié)方差矩陣之逆矩陣。

其次求出判別函數(shù):

F(X / j)=n-1jSUiMexp(-5D2(X,Yji/ |R2)

D2(X,Yji) :對象 X與j 類中第i 個對象Yji 間的平方距離;R2 :各指標分別與分類變量間相關系數(shù)的平方之均值。

然后計算后驗概率:

Pr(j / j)=PRIOPjF(X| j) / SUkMPRIORkF(X|k)

PRIORk 為k 類的先驗概率。

最后將判別對象判入后驗概率大的類別中[3]。

1.2.3 統(tǒng)計學方法 應用SAS9.0軟件編程建立非參數(shù)判別分析模型,對322例病例組和對照組資料進行判別歸類,最后采用交叉驗證法來驗證判別函數(shù)的功效。

轉貼于   2 結果

2.1 變量賦值和單因素結果

單因素分析與判別指標的選擇,首先選取以下癥狀或體征作為自變量進行數(shù)據(jù)錄入和單因素分析。表1 判別分析引入變量賦值表

分類變量(病案中明確檢查診斷為依據(jù)) g :g = 1 (腦膜炎) 、g= 0(非腦膜炎) 。對上述癥狀體征采用單因素卡方檢驗進行比較,在腦膜炎患者中,多數(shù)病人具有發(fā)熱、頭痛、腦膜刺激征,在病例組中發(fā)生頻率均比對照組高,差異有統(tǒng)計學意義(P

2.2 判別分析中訓練集和測試集的選擇

訓練樣本為322例數(shù)據(jù)中按年齡排序,然后每間隔一例取一例為訓練樣本,病例組中81例,對照組中80例共161例數(shù)據(jù)。測試樣本為:322例數(shù)據(jù)中除去161例訓練樣本剩余的161例數(shù)據(jù),其中病例組80例,對照組81例。

2.3 交叉證實結果

2.3.1 本研究采用不等帶寬核密度估計的非參數(shù)判別分析,對訓練樣本進行判別分析,采用交叉證實法(Cross validation)來檢驗判別函數(shù)所建立的模型的判別效果,可以得到診斷模型的靈敏度為65.4%,特異度為76.3%,陽性預測值為73.6%,陰性預測值為68.5%,調(diào)整一致性為71.0%。判別結果見表2。表2 判別分析模型診斷模型腦膜炎訓練樣本

2.3.2 應用判別結果 用根據(jù)訓練樣本所建立的判別函數(shù)對剩下的161例測試集進行判別分析,得出測試樣本的靈敏度為71.3%,特異度為84.0%,陽性預測值是81.4%,陰性預測值是74.7%,調(diào)整一致性為77.9%。得到判別結果見表3。表3 判別分析模型診斷腦膜炎測試樣本與金標準比較

3 討論

國外已有的輔助醫(yī)生進行快速篩檢的腦膜炎診斷三聯(lián)征有:澳大利亞的“發(fā)熱、嘔吐、頭痛”[4];而國際上更多用的是“發(fā)熱、頸強直、意識狀態(tài)改變”[5]。本研究將發(fā)熱、頭痛及腦膜刺激征作為診斷腦膜炎的三聯(lián)征,并用非參數(shù)判別的方法建立判別函數(shù)來檢測“發(fā)熱、頭痛和腦膜刺激征”作為腦膜炎診斷三聯(lián)征的效果,得出此診斷模型的靈敏度是71.3%,特異度是84.0%,陽性預測值是81.4%,陰性預測值是74.7%;與金標準的診斷符合率為77.9%,說明該三聯(lián)征的診斷效果已比較理想。但實際效力如何還有待于臨床實踐的檢驗。

非參數(shù)判別分析方法的應用并不多見,但是對于自變量主要為二分類的資料,作者認為應選用非參數(shù)的判別分析,本研究采用不等帶寬核密度估計的非參數(shù)判別分析,對訓練樣本判別對象,采用交叉證實法(Cross validation)來檢驗判別效果:在161測試樣本中,80 例腦膜炎病人有68例判為腦膜炎,13 例錯判為非腦膜炎,判別正確率為83.95 %;81 例非腦膜炎病人有57例判斷為非腦膜炎,有23 例錯判為腦膜炎,判別正確率為71.25 %;總判別正確率=87.64 %,判別效果良好。

以上研究結果表明,基于網(wǎng)絡數(shù)據(jù)庫的資料進行三聯(lián)征的研究是可行的,應深入進行有關的研究工作。然而,用網(wǎng)絡數(shù)據(jù)庫中的資料進行研究也有一定的缺點,例如在病歷報告或病例分析中的癥狀、體征常不描述,或雖已描述但不完整,且易受作者主觀取舍的影響。另外由于發(fā)表在中國典型病例大全上的腦膜炎病例數(shù)量有限,在以后研究的過程中應盡量增大樣本量來減小偏倚。

參考文獻

1 R′emy Teyssou , Erwan MurosLe Rouzic. Meningitis epidemics in Africa: A brief overview. Vaccine2007,25: A3~A7.

2 David Martens, Liesbeth Bruynseels, Bart Baesens. Predicting going concern opinion with data mining. Decision Support Systems, 2008, 45: 765~777.

3 高歌, 王艾麗, 曹曉韻. 非參數(shù)逐步判別分析在腦中風分類診斷中的應用.數(shù)理統(tǒng)計與管理, 2004, 23(5): 48~51.

篇6

好的體驗

觸摸不是新鮮的概念,但是在iOS設備帶來大跨越之前,它沒有在與鍵盤加鼠標的競爭中占到便宜,觸摸板、電阻屏、單點觸摸都是其發(fā)展過程中所經(jīng)歷的步驟。Windows系統(tǒng)統(tǒng)治了30年的PC領域,“焦點”概念從面向對象的編程理念開始滲透,多點概念一直被忽略,直到Windows 8的出現(xiàn),由多個手指(尖)所呈現(xiàn)的所謂手勢,成為重要性與鼠標指針等價的人機互動信息。

電腦如何知道人的意圖?如果電腦知道,并且理解正確,還能及時反饋,那么對用戶來說就是好的使用體驗??此坪唵?、說起來容易的“好”,實現(xiàn)起來并不容易,這需要在電腦設計和制造的過程中,上至操作系統(tǒng)、驅動程序,下至硬件調(diào)試和軟件開發(fā)等產(chǎn)業(yè)鏈的通力合作。精度、靈敏度、響應速度、誤觸識別等幾項是考察觸摸技術的基本指標,而壓力識別、多指手勢、觸控兼容性則對觸摸技術提出了更多的挑戰(zhàn)。

精度差異

相對于顯示面積狹小的手機等智能終端,筆記本電腦上的觸摸屏硬件結構限制較少,但是考慮到與屏幕面積、感應網(wǎng)格密度線性相關的成本,目前大尺寸的觸摸屏定位的絕對精度仍遜色于手機。甚至在入門產(chǎn)品上,32×18的觸摸傳感器矩陣仍在使用,對14英寸、1366×768(點距0.225mm)分辨率的主流屏幕來說,剛剛能夠滿足微軟所規(guī)定的觸摸感應區(qū)域9mm直徑的精度下限。而對主流產(chǎn)品來說,觸摸精度為30個像素的水平,折合觸摸響應區(qū)域直徑也達到了6mm以上。

隨著觸摸屏幕參數(shù)規(guī)格的提升,用手指操作的體驗仍舊能夠得到提升,本次CHIP選取的屏幕尺寸為11.6英寸的華碩VivoBook S200E就是其中的代表,該產(chǎn)品觸控芯片、傳感器網(wǎng)絡和驅動程序,與主流華碩筆記本電腦相同,具有一定代表性。在測試中,S200E的觸摸屏表現(xiàn)出良好的靈敏度和精度,在使用2mm厚硬幣進行測試的過程中,該機依舊保持了準確的接觸位置識別能力,而主流機型需要使用厚度近5mm的硬幣方可實現(xiàn)定位識別。使用硬質(zhì)金屬材料在電容式觸摸屏上慢速劃動,所繪制的線條會呈現(xiàn)特有的抖動現(xiàn)象,其中水平和垂直線條可保持筆直,而斜線條的抖動距離與傳感器分布密度相關。S200E的每個抖動波浪斜向距離約7mm,映射至水平及垂直方向約為5mm,即傳感器矩陣密度,由此推算其有效感應區(qū)域直徑不大于2.5mm,精度兩倍于主流產(chǎn)品。

隨著硬幣滑動速度提高,曾經(jīng)彎曲的線條逐漸變得平滑,靈敏度越高的屏幕線條從彎曲到平滑的速度越低,出現(xiàn)“斷線”情況的滑動速度越高。在這個測試中,S200E的表現(xiàn)非常出色,使用手指滑動從未出現(xiàn)過斷線現(xiàn)象。

改進軟件

S200E觸摸屏采用了Atmel maXTouch Digitizer感應芯片,除了硬件規(guī)格高之外,其驅動程序還經(jīng)過特殊調(diào)教,提升了USB接口的默認采樣速度,以及觸摸感應的優(yōu)先級。因而它有著較其他產(chǎn)品更高的靈敏度就不足為奇了。除了常規(guī)的觸摸屏增強外,S200E對觸摸板特性也進行了增強。Windows 8內(nèi)置的多點觸摸特性僅支持觸摸屏,而觸摸板的多點觸摸功能并未進一步開發(fā)。利用華碩開發(fā)的ASUS Smart Gesture軟件,其觸摸板增加了1至3指的手勢操作和類似于觸摸屏的邊緣手勢操作功能,無論用戶習慣使用哪個觸控設備,都能獲得一致的使用體驗。

手的表達

篇7

 

模式識別技術的應用,使微電子封裝工藝得到迅猛的發(fā)展。如引線腳數(shù)逐年提高,平均每年増加16%,PGA的引線腳數(shù)己由300?400條増到1000條,QFP>400條,BGA>60條,引線節(jié)距逐年下降,己由2.54—1.27—0.65—0.5—0.4—0.3—0.15—0.1mm。

 

1基本概念

 

1.1模式識別技術

 

模式是對某些感興趣的客體的定量或結構的描述,模式類是具有某些共同特性的模式的集合。模式識別就是用計算機來模擬和實現(xiàn)人的識別與理解功能(包括視覺信息與聽覺信息),依靠這種自動技術,機器將自動地(或人盡量少地干涉)把待識別模式分配到各自的模式類中去。模式識別技術有統(tǒng)計模式識別(幾何方法),句法模式識別(結構方法),模糊模式識別與智能模式識別。模式識別技術廣泛地應用于軍事(目標識別,定位),公安安全(指紋,聲紋,身份證實與識別),地質(zhì),石油,資源,農(nóng)業(yè),醫(yī)療衛(wèi)生與自動化控制中,在微電子工業(yè)生產(chǎn)中己得到越來越廣泛的應用。

 

1.2模式識別的系統(tǒng)結構

 

模式識別的系統(tǒng)結構如圖1所示,分為識別模式與訓練模式兩部分。先設定訓練模式,對訓練樣本數(shù)據(jù)采集后把不同特征的非電量,如圖像、聲音、灰度等轉變?yōu)殡娦盘?,使計算機能夠辨識。后經(jīng)預處理可以濾除干擾、噪聲,再經(jīng)特征提取與選擇后進入分類器,提供分類決策。在待識別模式中對待識別樣本同樣經(jīng)過數(shù)據(jù)采集、預處理、特征提取與選擇后,從訓練模式中的分類器中提取分類決策,得到識別結果。若分類器不能提供目前的分類決策,則得到錯誤檢測,需要更新訓練模式,直到重新獲得正確的分類決策。

 

其中最重要的一個環(huán)節(jié)就是特征(基元)的提取與選擇。這是一個去粗取精,由量測空間經(jīng)過變換降維到特征空間的過程。具體到微電子封裝工藝中,就是識別元件的圖案并確定切割線、粘取點與焊接點等的過程。

 

2模式識別技術在微電子封裝工藝中的應用

 

2.1SOT—23塑封工藝的流程及模板匹配法

 

SOT—23工藝是一種二極管、三極管或其他元器件表面貼片塑封工藝。其工藝流程如圖2所示。

 

其中前幾道工序,如劃片、粘片與焊線對整個流程的質(zhì)量與產(chǎn)量影響很大,而其中所依賴的關鍵技術就是模式識別技術。在自動化日益發(fā)展的今天,任何形式的模式識別技術與人工智能,都能使生產(chǎn)力更上一個新的臺階,實際上,我們剖析開來,在整套貌似先進的SOT—23生產(chǎn)線的工藝過程中,采用的都是比較原始、比較基本的模板匹配法。

 

模板匹配法基本上是一種統(tǒng)計識別方法,就是定義一個標準樣本作為模板,輸入待識別模式與之比較,也就是看兩者是否匹配在一定的誤差范圍內(nèi)判斷結果。因為每一模板與未知樣品匹配得好壞,取決于模板上各單元與樣品上各相應單元的匹配與否,若分別處于模板與樣品上的絕大多數(shù)單元均相匹配,則稱該模板與樣品“匹配得好”,反之則稱“匹配不好”,并取匹配最好的作為識別結果。采用比較多的有光學模板匹配、模擬灰度和數(shù)字灰度。SOT—23工藝中采用的就是這種灰度匹配法,提取圖像的灰度作為特征基元來作匹配。

 

2.2劃片工序中的模式識別技術

 

由于生產(chǎn)的線寬微細化(0.5?0.25/mm,開發(fā)水平0.18?0.07/mm),并且每四年縮小1/2,為保證數(shù)以萬計的芯片得到正確、無偏離、無損傷的切割,就需要高標準的采用模式識別技術的劃片機。劃片工序的流程如圖3所示。

 

此工序中,關鍵是預先對灰度與芯片和間隔寬度的調(diào)整與設置,即劃片機的核心技術就是運用模式識別中對灰度特征基元的提取與識別,達到自動識別的目的。一般采用手工與自動配置相結合的方法,隔一定的時間進行人工檢查以免意外損傷。即使是劃片機的一些枝節(jié)技術也離不開模式識別技術,如對芯片字符、碼確認的字符識別裝置,就是對最典型最通用的模板識別技術的應用。

 

2.3粘片工序中的模式識別技術

 

粘片工序在SOT—23工藝流程中尤為重要,是承前啟后的關鍵工序,因為粘片的成功數(shù)量決定了產(chǎn)品的產(chǎn)量,粘片的質(zhì)量直接影響焊線工序的質(zhì)量,所以粘片工序要解決的問題就是把歪粘、錯粘、漏粘數(shù)目降到最低水平。由于芯片生產(chǎn)的差異,使不同的廠家的產(chǎn)品在圖案灰度與邊緣界定上都有很大的差異,所以提高模式識別的能力更為必要。粘片工序的流程如圖4所示。

 

選好標準圖案后存儲到系統(tǒng)中,存儲圖案灰度就是提取一個特征,其中包括了芯片的大小尺寸和灰度等特征,以此作為模式識別的一個標準模板《,在粘取一個目標與模板比較中,就要處理歪斜、灰度過低等現(xiàn)象。設一個待識別目標的某項指標為石,則內(nèi)-乃|<(/=1,2,3..,為對應此項的閾值)時可以判斷此

 

項指標在所限制的閾值范圍內(nèi),符合(或基本符合)決策要求。如果各項指標都在其限定的閾值范圍內(nèi),可以判定此目標與標準模板匹配,即各項指標的總和使機器判斷是丟棄或粘取此目標。

 

粘片工序中,在注意熔化溫度的同時,隨時調(diào)整標準模板與選擇適當?shù)幕叶纫灿葹橹匾?/p>

 

2.4焊線工序中的模式識別技術

 

用焊線機把芯片的極點與引線框架焊接起來,引出管腿。由于芯片極點區(qū)域窄小,必須保證焊點在極點區(qū)域內(nèi)部,不能有一絲的越出極點邊界和拉絲現(xiàn)象,否則,極點間就會短路。與粘片機相比,焊線機必須具有更強的識別能力,并且在一個芯片上面有不同的極點,識別的區(qū)域更為多樣和細微。

 

焊線工序的識別過程類似于粘片工序。

 

對于小尺度芯片,除了正確地把握金線的熔化溫度和焊點大小外,對焊點區(qū)域識別的精確把握也是焊線成品質(zhì)量提高的重要一環(huán),如果對標準模板灰度和坐標位置選擇不當,就會導致大量半成品的浪費。

 

同時,焊線工序對粘片工序有很大的依賴性,如果粘片工序中的漏、歪片和熔化過度片很多,自動匹配就無法進行。若設置為忽略不能匹配的芯片,勢必造成很大的浪費;若用手工單個焊接不能匹配的芯片,會影響流水線的進程。因此,粘片機與焊線機在某些參數(shù)的設置上必須協(xié)調(diào)統(tǒng)一。

 

3結束語

 

模式識別技術在微電子封裝工藝中得到了廣泛的應用,在更為復雜的封裝工藝中,幾乎每一個自動化進程都與模式識別技術相結合。模式識別技術的應用對于提高半導體分立元器件和集成電路的產(chǎn)量與質(zhì)量,提高集成化和智能化進程具有重大的意義。

 

參考文獻:

 

[1]沈青,湯霖.模式識別導論[M].長沙:國防科技大學出版社,1991.

 

[2]李介谷,蔡國廉.計算機模式識別技術[M].上海:上海交通大學出版社,1986.

篇8

關鍵詞:仿生;模式識別;神經(jīng)網(wǎng)絡;分類器

中圖分類號: F224-39 文獻標識碼: A 文章編號: 1673-1069(2017)02-154-2

1 仿生模式識別的引入

為了適應現(xiàn)實需要,人們開始希望機器能夠代替人類完成某些繁重的識別工作。我們通常所說的模式識別就是指運用機器進行分類識別。以往的識別方法,多數(shù)是建立在“分類劃分”的基礎上,根據(jù)給定的分類準則來找尋“最優(yōu)的分類界面”,具體的實現(xiàn)算法也都是注重于不同類樣本的區(qū)別,即,一類樣本與有限種類已知樣本之間的區(qū)分。基于此出發(fā)點的局限性,識別當中出現(xiàn)的問題是顯而易見的:首先,如果遇見未學習過的新事物,常常會牽強地認為它是某一類已學過的舊事物;其次是對未學習過的新事物進行學習時,往往會破壞掉原來的規(guī)矩,打亂舊事物的識別。針對以上的缺陷,才有了仿生模式識別的概念。仿生模式的目標是找到同類事物的最佳覆蓋面。

2 仿生模式識別在神經(jīng)網(wǎng)絡中的超曲面劃分

2.1 多權值神經(jīng)網(wǎng)絡的高維封閉曲面

(5)式中Wji和W′ji是方向權值,它們決定了曲面的方向,W′ji是核心權值,它決定了曲面的幾何中心。Xj為第j個輸入端的輸入;n是輸入空間維數(shù);p為冪參數(shù),用以控制曲面的彎曲程度;s表示單項正負號方法的參數(shù),若S=0單項符號只能為正,若S=1時單項的符號和Wji的符號相同;若設置了S=0,則該式就變成了一個封閉超曲面的神經(jīng)元。f函數(shù)的基設置為一個定值時,輸入點的軌跡是一個封閉的超曲面,其核心位置由決定。

用p值來改變封閉超曲面的形狀,如圖1~圖8所示。若使權值取不同的值,就相當于將封閉曲面在不同方向進行拉伸或壓縮,θ取值不同,則偏離核心位置的程度也不同。

2.2 通用超曲面神經(jīng)網(wǎng)絡的計算式

上式中,Ymi(t+1)是輸入空間的第i個神經(jīng)元在輸入第m個對象,在t+1時間的輸出狀態(tài)值。i是神經(jīng)元數(shù)量,最大是1024。Wji與W′ji是第j個輸入節(jié)點至第i個神經(jīng)元的“方向”權值和“核心”權值;fki是第i個神經(jīng)元的輸出非線性函數(shù),下標ki是第i個神經(jīng)元的非線性函數(shù)在函數(shù)庫中的序號;Imj表示的是第m個輸入對象中的第j個輸入值;W′cgi和是Wcgi第cg個(取值范圍[1,256])神經(jīng)元輸出到第i個(取值范圍[1,1024])神經(jīng)元的權值“核心”和“方向”權值;p表示的是冪參數(shù);而S是單項正負符號規(guī)則;(t)為當輸入為第m個對象時第cg個神經(jīng)元在時間t的輸出狀態(tài)值,θ([1,1024])是第i個神經(jīng)元的閾值;λi是神經(jīng)元非線性函數(shù)坐標比例因子;Ci是神經(jīng)元輸入規(guī)模比例因子。

由傳統(tǒng)的BP神經(jīng)網(wǎng)絡和經(jīng)向基RBF神經(jīng)網(wǎng)絡及超曲面神經(jīng)網(wǎng)絡對圖9中三類事物的分類邊界分別為折線和圓環(huán)及橢圓的并,可見超曲面神經(jīng)網(wǎng)絡具有更準確的分類效果。

3 總結

仿生模式識別是對事物逐類分別訓練“認識”的過程。它的顯著優(yōu)點是對于沒有經(jīng)過訓練的對象會拒識,而新增加樣本的訓練不會影響到原有的識別。因此,仿生模式識別,較之原有的識別模式識別效果更佳,可以廣泛應用在人臉識別,語音識別等眾多領域。

參 考 文 獻

[1] 覃鴻,王守覺.多權值神經(jīng)元網(wǎng)絡仿生模式識別方法在低訓練樣本數(shù)量非特定人語音識別中與HMM及DTW的比較研究[J].電子學報,2005(5).

篇9

關鍵詞:動作捕捉技術;三維人體動作;智能舞蹈教學;運用

中圖分類號:G642 文獻標志碼:A 文章編號:1007-0125(2013)11-0247-01

一、動作捕捉技術

動作捕捉(Motion capture)技術所涉及的內(nèi)容較為廣泛,主要包含有尺寸的測量、物理空間內(nèi)的物體定位以及方位的測定等。就其技術角度而言,運動捕捉的實質(zhì)就是對物體在三維空間之中的運動軌跡進行一定程度的測量、跟蹤以及記錄。一般情況下,具有典型性的運動捕捉設備主要包含了四個組件,分別是傳感器、信號捕捉設備、數(shù)據(jù)傳輸設備以及數(shù)據(jù)處理設備。下面就這四個組件進行簡要闡述:

(一)傳感器:傳感器就是一種跟蹤裝置,一般情況下,它是被設置在運動物體的關鍵位置,其功能主要是對運動物體的運動位置信息進行提供;

(二)信號捕捉設備:一般情況下,如果動作捕捉系統(tǒng)具有一定的差異性,那么信號捕捉設備也會有多不同,其主要功能是對傳感器所提供的位置信號進行有效捕捉;

(三)數(shù)據(jù)傳輸設備:對于動作捕捉系統(tǒng)而言,它需要將大量的運動數(shù)據(jù)從數(shù)據(jù)捕捉設備傳輸?shù)接嬎銠C系統(tǒng)之中進行處理,同時,這一過程還需要保證傳輸?shù)臏蚀_性與高效性,數(shù)據(jù)傳輸設備便是負責這項工作的設備;

(四)數(shù)據(jù)處理設備:一般情況下,當捕捉到相關的數(shù)據(jù)之后需要進行一定程度上的修正與處理,在這項工作完成之后,還需要將其余三位模型向進行有效的結合,這樣才能完成接下來的操作。

二、三維人體動作的識別

一般情況下,三維人體動作的識別主要包含了三種模式,分別為已分割的動作模式識別、連續(xù)的動作模式識別以及實時動作數(shù)據(jù)流識別。

(一)已分割的動作模式識別:它首先進行一個假設,即每一個動作樣本都是事先由人工或者運動機器方法進行分割,同時,它僅僅只包含有一個動作模式。因此,對于已分割的動作模式識別就是要對各個未知的動作模式進行一定程度上的分類,使其歸類到已經(jīng)定義的動作類別當中去。

(二)連續(xù)的動作模式識別:對于未知的數(shù)據(jù)動作而言,它一般都包含了多個動作模式,除此之外,這些動作模式的類型以及首尾幀都是未知的。所以,對于連續(xù)的動作模式識別,不能像已分割動作模式的識別一樣,僅僅對未知動作直接同訓練數(shù)據(jù)進行匹配識別。相反,連續(xù)的動作模式識別應該先對未知動作進行一定程度上的自動分割,并使其成為獨立的動作模式,然后再對其進行一定程度的識別。

(三)實時動作數(shù)據(jù)流識別:這一模式的數(shù)據(jù)識別最為復雜,一般情況下,它是發(fā)生在實際的實時應用當中。對于實時動作數(shù)據(jù)流的識別之所以如此復雜,主要是以為內(nèi)其待識別的數(shù)據(jù)流都是通過現(xiàn)場捕捉而得到的,除此之外,他還要求能夠在捕捉的同時進行一定程度上的識別處理,這樣一來,識別系統(tǒng)就能夠以處理結果為依據(jù),對用戶的輸入動作進行及時的反應。

三、三維人體動作在智能舞蹈教學中的運用

對于動作捕捉數(shù)據(jù)而言,它可以對先后動作進行一定程度上的比較,然后再再將比較所得到的信息進行相應的反饋。針對這一情況,本文介紹一種智能舞蹈教學系統(tǒng),這一系統(tǒng)主要是由C++編程語言以及OpenGL軟件包共同實現(xiàn),在對這一系統(tǒng)進行使用時,有兩種模式可以供用戶選擇,這兩種模式分別為訓練模式以及舞蹈模式。

訓練模式:訓練模式主要是供用戶進行自主學習。首先系統(tǒng)對相關動作進行一定程度上的捕捉,然后系統(tǒng)根據(jù)所捕捉到的動作進行處理,使其以三維動畫的形式向用戶進行呈現(xiàn),用戶就可以根據(jù)系統(tǒng)所提供的三維動畫進行自主學習。

舞蹈模式:舞蹈模式全稱為自由舞蹈模式。在這一模式之下,用戶可以在一定的時間內(nèi)進行自由舞蹈,在用戶舞蹈的同時,系統(tǒng)也會對其動作進行實時捕捉,然后將捕捉到的信息由識別引擎進行識別,這樣一來,不僅提高了這一系統(tǒng)的有效性,同時也增添了一些樂趣。

四、結束語

隨著動作捕捉技術與三位人體動作識別技術的發(fā)展,使得它們在越來越多的領域中得到廣泛使用。本文主要針對三維人體動作及其在智能舞蹈教學中的運用進行研究與分析,希望我們的研究能夠給讀者提供參考并帶來幫助。

參考文獻:

[1] 楊洋.三維人體動作分析及其在智能舞蹈教學系統(tǒng)中的

應用[D].合肥:中國科學技術大學,2012.

[2] 孫運達.多視點非接觸式人體運動捕捉的研究[D].北京:

北京交通大學,2006.

篇10

設計模式識別是對程序源代碼信息進行分析,抽取出其中所運用的設計模式,是軟件逆向工程的一部分。因此,設計模式識別的對象一般為面向對象程序系統(tǒng)的源代碼信息。本文以Java源代碼為設計模式識別目標,結合Java語言的特點進行源代碼信息的抽取。

1.1源代碼信息抽取

根據(jù)DPDLXS語言的定義規(guī)則,將設計模式的特征信息描述為類角色Roles、類之間關系Relations和自定義類型TypeRep3個部分。源代碼信息的抽取也遵循DPDLXS語言的定義規(guī)則,解析為類角色Roles和類之間關系Relations。其中,一個類角色Roles又分為類屬性Attribute和類操作Operation子元素以及各自的屬性。根據(jù)Java語言的特點和設計模式描述語言DPDLXS的定義規(guī)則,給出了源代碼信息抽取流程,如圖1所示。

1.2類無向圖和連通分量

對源代碼進行設計模式的識別往往都是以一個工程或一個面向對象程序系統(tǒng)為一個整體進行分析,其中包含了數(shù)量龐大的類文件。然而,一個設計模式所參與的類角色只有3-5個左右,為了匹配一個設計模式的特征而去遍歷整個工程的類文件顯然是不可取的。根據(jù)設計模式的結構特征,構成一個設計模式的每個角色類至少與其他角色類存在一種關系,包括一般化關系(Generation)、關聯(lián)關系(Association)、聚合關系(Aggrega-tion)、合成關系(Composition)和依賴關系(Dependency)。從圖論的角度上來說,如果把每一個類角色看成是一個頂點(Vertex),類角色之間的任何一種關系看成是兩個頂點之間的一條邊(Edge),整個設計模式類圖就可以看成是一個無向圖,而且是一個任意兩個頂點都連通的連通圖(ConnectedGraph)[11]。同理,待識別的整個工程的源代碼類圖就可以看成是一個龐大的無向圖,如圖2所示;無向圖中的每一個極大連通子圖都是一個連通分量(ConnectedComponent)[11],如圖3所示。因此,匹配的某一設計模式特征的待識別類候選集合一定是該工程無向圖中一個頂點數(shù)目大于等于設計模式角色類數(shù)目的連通分量。2.3關聯(lián)度通過引用圖論中無向圖和連通分量的概念,將設計模式的識別從源代碼中匹配特定設計模式特征轉化成在無向圖中查找滿足頂點數(shù)目的連通分量。通過過濾不滿足該設計模式角色類數(shù)目的連通分量可以減小候選集合,從而減小搜索空間,提高識別效率。然而,在信息抽取的初級階段并不知道待識別工程源代碼無向圖的連通分量。為了方便遍歷無向圖從而得到該無向圖的連通分量,本文將待識別源代碼的無向圖表示成一種鏈式存儲結構———鄰接表[11]。本文根據(jù)從源代碼信息中抽取出的類之間關系信息來構建無向圖,得到無向圖的頂點集合V和代表類之間關系的邊集合VR。將集合V中的每一個頂點都表示成一個頭結點,如圖4(a)所示;根據(jù)集合VR中頂點之間的關系構建該頭結點包含的表結點,如圖4(b)所示,從而得到圖2中無向圖對應的鄰接表,如圖5所示。運用鄰接表這種鏈式存儲結構,從第一個頭結點開始遍歷可以得到無向圖的所有連通分量。無向圖連通分量的具體深度遍歷算法如下:Step1遍歷頭結點,設置該頭結點的visited為true;若該頭結點的鏈域為空而且是第一個頭結點,則結束;若不是第一個頭結點則返回上一層表結點,跳到Step4;若鏈域不為空則繼續(xù)下一步。Step2遍歷鏈域所指向的表結點,根據(jù)表結點的鄰接點域找到下一個頭結點。Step3若該頭結點的visited為true,則返回上一層表結點,跳到Step4;否則跳到Step1。Step4遍歷表結點的鏈域,若鏈域不為空則跳到Step2;若鏈域為空,則返回上一層表結點并判斷是否存在上一層,若存在則跳到Step4;否則結束。該算法一次遍歷結束后,所有遍歷到的頂點集合就是一個連通分量。然后尋找下一個visited為false的頭結點作為第一個結點繼續(xù)遍歷,直到遍歷完所有頭結點。利用該算法對圖5所示鄰接表進行遍歷可以得到兩個連通分量,其頂點集合分別為:S1{A,C,B,E}和S2{D}。每一次遍歷都可以得到一個連通分量,每個連通分量都是待識別源代碼類圖中至少與其他類存在一個關系的所有類集合。該集合中的類彼此之間存在著可能構成某種設計模式的類關系。因此,本文提出用關聯(lián)度(Correlation)的概念來衡量和唯一標識待識別源代碼之間的這種聯(lián)系。每一個關聯(lián)度值標識了一個連通分量,連通分量中的各個類擁有相同的關聯(lián)度值,其集合稱為關聯(lián)類集合。

2設計模式識別

在完成源代碼信息抽?。ò愋畔ⅰ㈩惖膶傩院筒僮鳎貏e是根據(jù)類之間的關系構建了關聯(lián)類集合)之后,需要根據(jù)具體設計模式特征來檢測和識別源代碼中運用的設計模式。

2.1設計模式識別流程

為了減小設計模式識別的搜索空間,本文在源代碼信息抽取階段將待識別源代碼類組合成一個個關聯(lián)類集合。根據(jù)設計模式角色類之間的關系特征可以得出:只有同一個關聯(lián)類集合中存在該設計模式的所有角色類,并且關聯(lián)類之間符合對應角色類之間的所有關系特征,才能判定關聯(lián)類集合運用該設計模式。因此,首先可以根據(jù)設計模式角色類數(shù)目過濾類數(shù)目不足的關聯(lián)類集合;其次可以根據(jù)設計模式所蘊含的角色類之間的關系特征過濾不滿足類之間關系類型和關系數(shù)目的集合;最后根據(jù)設計模式的具體特征約束遍歷滿足條件的候選關聯(lián)類集合,得出最終的識別結果。具體的識別流程如圖6所示。

2.2基于關聯(lián)度和特征約束的設計模式識別算法

根據(jù)本文提出的源代碼類角色信息間關聯(lián)度的概念以及設計模式識別的流程,充分利用關聯(lián)類集合和設計模式特征約束來減小設計模式識別的搜索空間,可以得出基于關聯(lián)度和特征約束的設計模式識別算法DETECT_DESIGNPA=TTERNS,具體描述如算法1所示。

3結果和分析

根據(jù)所提出的源代碼信息抽取流程以及基于關聯(lián)度和特征約束的設計模式識別算法,本文對Junit、JHotDraw和Jrefactory3個開源應用程序進行信息抽取和部分設計模式的識別。

3.1工廠方法模式

基于提出的源代碼信息抽取流程(見圖1),本文從源代碼文件數(shù)目、類、屬性、方法和類之間的關系數(shù)目以及源代碼行數(shù)等方面對3個開源應用程序源代碼進行信息抽取。其抽取結果如表1所列。從表1的抽取結果可以看出,這3個開源應用程序在文件數(shù)目以及代碼復雜性等方面各不相同。類之間存在的關系越多,體現(xiàn)了源代碼結構復雜度越高,同時也意味著可能運用了更多的設計模式。

3.2設計模式識別結果