計算機視覺研究領域范文
時間:2024-01-12 17:49:30
導語:如何才能寫好一篇計算機視覺研究領域,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
Abstract: This paper puts forward the camera calibration method in computer vision, through analysis of principle of computer vision, and analyzes the application of camera calibration methods in computer vision.
關鍵詞: 計算機;視覺;攝像機;定標
Key words: computer;visual;camera;scaling
中圖分類號:TP391.4 文獻標識碼:A 文章編號:1006-4311(2013)24-0193-02
0 引言
在計算機技術快速發展的今天,人們越來越依賴于計算機,計算機在人們的生活工作中占有重要的地位。計算機中的各種應用層出不窮,廣泛應用在各個領域,計算機視覺在攝像中的應用為攝像機定標方法提供了巨大的參考價值。由于人們對攝像機拍攝效果的要求,使得攝像機在不斷改革更新,攝像機的定標方法是攝像機研究領域備受關注的話題。計算機視覺中攝像機的定標方法是攝像機研究領域所推崇的,它受到了研究人員的高度重視。計算機視覺中攝像機的定標方法呈現出了高質量的攝像效果,極大地滿足了人們對攝像機攝像效果的要求。
1 計算機視覺投影原理
計算機視覺投影原理是利用光的折射現象,把視覺中呈現的影像投射到攝影機的屏幕上,形成了固定的圖像。在計算機視覺中攝影機的成像原理就是利用光的感應,通過對攝像機的焦距進行調整,確定拍攝目標在攝像機鏡頭中的位置,然后利用光的折射形成固定的圖像。在進行攝像時調整焦距是非常關鍵的,焦距就是鏡頭與目標之間的距離,這兩者距離的遠近決定了攝像的效果。如果焦距太遠的話,目標成像就會非常小甚至是模糊。如果焦距太近的話,目標成像會很大也會導致無法看清圖像,所以調整焦距是非常必要的,只有調好了焦距才會形成高質量的圖像。
2 計算機視覺中的攝像機定標方法
2.1 三維立體定標法 攝像機的成像往往都是三維立體的,把圖形通過每個立體面詳細的表現出來,以達到完美的效果。要想達到三維立體的效果在對攝像目標的位置進行確定時,就要找出目標的三維坐標點,以便接下來的攝像工作可以順利進行。然后在圖像投影中找到對應的三維坐標,這一步決定了整個攝像過程的設計方案。最后確定目標在攝影鏡頭中的實際三維坐標,根據鏡頭中目標的實際三維坐標形成具體的圖像。三維立體定標方法的操作原理就是把目標的三維投影進行分步成像,和實際成像效果相聯系,形成鏡頭中具體的三維圖像。在計算機視覺中把三維成像圖進行處理,對三維定標的參數進行分析,找出最優的三維成像方法,使攝像機呈現出高質量的攝像效果。
2.2 平面定標法 平面定標法就是利用多個成像平面對目標的位置進行分析,選擇合適的成像平面對目標進行位置的確定。每個平面的成像都是不同的,由于每個平面的成像都是在運動的,所以應該在攝像機與目標之間的平面內找到一個點,來分析目標與攝像機之間的成像規律,然后根據這一規律對目標進行定標,使攝像機中運動的目標給人們帶來不一樣的感受。隨著目標的不斷運動,攝像機與目標之間平面內的點會越來越多,對物體的定標會受到這些點的影響,物體定標的準確度也越來越高,為攝像機定標提供了可靠的信息支持,會減少攝像機定標的成本,提高了攝像的經濟效益。相比三維立體定標法,平面定標的精確度更高,定標所用的時間相對較短,所以平面定標法在攝像研究領域中值得推廣。
2.3 雙平面定標法 所謂的雙平面定標法就是利用鏡頭與目標之間的兩個平面的成像點來進行定標,不需要成像平面上的光線通過平面中心,只要選取兩個平面之間任意兩點坐標來對定標參數進行計算分析,得出具體的成像圖。這種定標方式不受平面中心的影響可以在任意點上成像,減少了定標參數的數量,提高了定標的工作效率。但是由于雙平面定標法只是任意選取兩平面上的點,對定標的精確度造成了一定的影響,使計算機對參數的運算缺少可靠的數據支持,一定程度上降低了攝像機的成像清晰度,使計算機視覺中攝像機的定標精度存在一定的偏差,呈現出來的具體圖像質量相對比較差。
2.4 直線兩點定標法 在三維立體和平面定標法的基礎上,又進一步研究了直線兩點定標法,極大程度上滿足了人們對攝像效果的要求。直線兩點定標法是利用定標物與攝像機鏡頭之間的直線上的兩點進行定標。然后通過計算機視覺對這兩點的坐標參數進行分析,然后攝像機利用這些參數對攝像機的焦距進行調整,確定物體的具置。在三維立體和平面定標的基礎上對計算機視覺程序進行改進升級,進一步提高對物體定標的精確度。對原有定標方法進行創新改進得出了直線兩點定標法使定標參數的數量大幅度的下降,節省了很多的人工成本,攝像機的清晰度也會大大提高。
2.5 透視變換焦距的定標法 透視變換焦距定標法是通過分析鏡頭與目標之間的距離,不斷調整兩者之間的距離使鏡頭里呈現出來的圖形清晰為止,然后就將現在的目標設置為定標物。由于這種定標方法不用去分析具體的定標參數被人們廣泛的應用。隨著科技的發展現在的攝像機都有自動調整焦距功能,不用人為的去調整焦距,使定標物更快地呈現在鏡頭中,節省了大量的定標時間,計算機的運算速度也加快了。但是這種定標方法也存在一定的缺陷,在實際操作如果不考慮攝像環境以及攝像鏡頭的變化,定標的精確度會存在一定的偏差,導致鏡頭中的定標物成像不清晰。
3 計算機視覺中攝像機定標方法的應用
3.1 在計算機視覺中攝像機的主動定標 計算機視覺中攝像機的定標方法推動了計算機技術在攝像機中的廣泛應用。計算機視覺中攝像機的主動定標是計算機技術在攝像機中的顯著應用。計算機技術使攝像機在定標過程中主動尋找定標物,使焦距和視角很好地配合,充分發揮計算機視覺在攝像機中的成像原理,把定標方法合理地運用在攝像機主動定標過程中,使攝像機的清晰度得到大幅度地提升。
3.2 分層次進行攝像機的定標 隨著計算機技術在攝像機定標中的不斷發展更新,攝影者喜歡分層次地進行定標,把自己的觀點融入到攝像機定標過程中,用自己的思維對定標參數進行分析,利用計算機視覺成像原理把定標物直觀的反映在計算機上,以便更好的對定標物進行分析,以其中一個定標物的成像平面來確定定標物的具體成像圖,使攝像機鏡頭中的定標物圖像可以更清晰。這種分層次的定標使計算機技術可以更好的應用在攝像機定標過程中,呈現出高質量的攝像效果。
4 總結
在計算機視覺中攝像機的定標方法都是可行的,但各種方法都存在一定的缺陷,所以在實際應用中還應該根據攝影環境以及攝影機的質量選擇最優的定標方法,保證定標參數的準確性,在鏡頭里呈現出清晰的成像。針對計算機視覺中攝像機定標方法的缺陷,攝像機的研究領域應該要不斷更新攝像機定標方法,提高攝像機定標的精確度,不斷滿足人們對攝像機清晰度的要求,呈現出清晰的攝像效果。
參考文獻:
[1]邱茂林,馬頌德,李毅.計算機視覺中攝像機定標綜述[J].自動化學報,2000(1).
[2]伍雪冬,蔣新華,李建興,黃靖.計算機視覺中傳統攝像機定標方法綜述[J].福建工程學院學報,2007(1).
篇2
關鍵詞:三目攝像機;標定;立體視覺;外部參數
一、緒論
1.1研究的背景及意義
計算機視覺是當今極為重要的學科之一,它在具有很強的挑戰性的同時又擁有廣泛的應用前景和實用價值。計算機視覺以視覺理論為中心,以圖像處理、模式識別、計算機技術和生理學、心理學為基礎,研究內容主要有兩個方面:一是開發從輸入圖像數據自動構造場景描述的圖像處理系統;二是理解人類視覺機理,用機器代替人去做人類難以達到或根本無法達到的工作[1]。
計算機視覺應用的廣泛性體現在其不僅用于文字、指紋、面部、商標以及圖像數據庫、檢測集成電路芯片、多媒體技術這些圖像方面,還應用到機器人導航、工業檢測和產品的自動裝配、CT圖像器官重建和遙感照片解釋等空間物體的定位、識別以及重建上?,F如今,計算機視覺已經應用到機器人、地理、醫學、物理、化學、天文等各大的研究領域。
作為多個學科交叉與融合中心的計算機視覺,攝像機是其研究的重要工具,而攝像機標定又是計算機視覺研究的一個關鍵問題,故攝像機的標定越來越受到廣泛的重視。攝像機標定是通過物體空間上的點與圖像中的對應點的幾何關系,來確定攝像機的內外參數的過程。標定結果是否準確影響著三維測量的精度和三維重建的結果,而且實時的標定更能滿足自動導航機器視覺的需要[2]。
伴隨著應用的發展,攝像機廣泛地被應用于三維立體的測量、視覺檢測、運動檢測等領域。由此,對攝像機標定的精度要求也日益增加。攝像機標定結果的優劣影響了計算機視覺在各領域的應用。攝像機標定的準確與否,對能否提高計算機視覺在各領域測量的準確度有重要影響[3]。因此,研究攝像機標定方法具有重要的理論研究意義和實際應用價值。
1.2攝像機標定技術研究的發展及現狀
攝像機有一個圖像平面和提供三維空間到圖像平面轉換的鏡頭。由于鏡頭會產生畸變,不能把這個轉化過程簡單描述為投射變換。所以它表示的是畸變的模型,這些模型近似于真實數據,而其精確性則依靠于建立的模型及模型參數的準確性。
首先進行攝像機標定工作的是加拿大的Deville,他于1910年建立實驗室,使用多個瞄準儀對他的“測量攝像機”(surveying camera)進行標定[4]。上個世紀三十年代后期,美國標準局發明了一種精確鏡頭,用來檢測攝像機,同時將它用在攝像機標定上。四十年代后期,該項工作得到進一步加深,有了更多對高精度的需求和對易操作設備的需求。1955年,Carman出版了 《棋盤平面度的干涉測量和控制》,該書引起了社會各界對攝像機標定的關注。二戰時期,隨著飛機的大規模使用,航空攝影與制圖興起,為得到更加精確的測量結果,對攝像機鏡頭的校正要求也變得更高。五十到七十年代也是鏡頭校正技術發展最為迅速的時間段。在這期間,各種鏡頭像差的表達式逐步被提出并且得到普遍認同與采用,建立了很多的鏡頭像差的模型,D.C.Brown等人作出了比較大的貢獻,他們導出了近焦距情況下給定位置處徑向畸變表達式并證明了近焦距情況下測量出鏡頭兩個位置的徑向畸變就可以求出任何位置的徑向畸變[5]。這些徑向與切向像差表達式成為后來各攝像機的標定非線性模型的基礎。這段時間里,研究的重點是如何校正鏡頭與用何種方法補償鏡頭像差,這些研究對促進各性能鏡頭組的研制起到了重要作用。在1999年,張正友提出了一種簡便的攝像機標定方法,該方法介于傳統標定和自標定之間,操作方便靈活,能夠得到不錯的精度,滿足了眾多擁有桌面視覺系統的用戶在攝像機標定方面的需求。
1.3本文的主要研究內容
本文的主要研究多個攝像機的標定問題。標定主要是對攝像機內外參的測量計算,利用這些參數對多個攝像機識別的物體尺寸進行衡量并建立起多攝像機系統的數字環境。
論文的內容包括:
第一章為緒論,介紹攝像機標定相關的研究背景、國內外研究現狀。
第二章為攝像機標定理論基礎:主要介紹標定的坐標系與待標定的參數。
第三章提出本文的多攝像機標定方法與實驗過程。
第四章進行全文的總結。
二、攝像機標定方法研究
2.1攝像機標定原理
攝像機通過透鏡將三維物體投影到--維圖像平面上,這個成像變換的過程稱為攝像機成像模型。攝像機成像模型有多種,最常用的為小孔成像模型。由于實際的攝像機鏡頭會發生一定的畸變,使得空間點所成的像不在線性模型描述的位置而會發生一定的偏移,為了能準確的標定攝像機參數,標定的過程中要考慮非線性畸變因子。
一般來說,得到標定結果后要對其精度進行評估,然而很難得到準確的攝像機標定參數真值作為參考,其中基于圖像坐標和世界坐標的絕對和相對誤差的評價方法應用廣泛,本文將對這些方法的原理進行探討。
2.2攝像機標定坐標系建立
首先定義了四個坐標系,如圖1所示,圖像坐標系的坐標原點為O0,列與行由坐標軸u和v表示;成像平面坐標系的原點是攝像機光軸與圖像坐標系的交點0l,x、y 軸分別與u、v 軸平行;在攝像機坐標系中,坐標原點0c即為在攝像機的光心,Xc、Yc軸與x、y 軸平行,與圖像平面垂直是攝像機光軸作為Zc軸,0c0l為攝像機焦距f;世界坐標系是假想的參考坐標系,可固定于場景中某物體上,用于描述攝像機的位置,由Xw,Yw,Zw軸組成。
圖(1)
2.3攝像機外部參數構成
主動視覺傳感器從在笛卡爾直角坐標系中的運動表現為相應的旋轉矩陣和平移矩陣,故攝像機外部參數表現為旋轉矩陣R和平移矩陣T,則攝像機坐標系與世界坐標系的轉化關系可以表示成:
上式中(Xc,Yc,Zc)表示空間點在攝像機坐標系下的坐標,(Xw,Yw,Zw)表示空間點在世界坐標系下的坐標。根據靶標點在像空間坐標系和物方空間坐標系中的坐標,通過分解旋轉矩陣線性計算像空間坐標系與物方空間坐標之間的轉換參數,即外方位元素(攝站參數)[6]。
2.4各攝像機相對位置確定
三目攝像機擁有三個視覺傳感器,而三個傳感器之間的相對位置可通過已獲得的外部參數進行確定。將三個攝像機坐標系設置為,Oci xci yci zci(i=1,2,3),由2.3中所介紹的內容可知,這三個攝像機坐標系與世界坐標系的關系為:
i=(1,2,3)
由此我們可以得到任意兩個攝像機i,j的坐標系轉換關系:
其中: = = i,j=1,2,3
三、攝像機標定實驗過程及結果
3.1實驗系統介紹
實驗中被用來標定的是一個多攝像機系統,攝像機標定有關的基本參數、系統組成和開發環境如下:
(1)硬件環境
標定板、三目攝像機和圖像采集卡等。
(2)軟件環境
OpenCV開源視覺庫,它僅由一系列C函數和少量C++類構成,為Python、MATLAB等語言提供了接口,在圖像處理和計算機視覺方面實現了很多通用算法。
3.2實驗過程
本系統以棋盤格模板作為標定模板。采用激光打印機打印棋盤格黑白方塊間隔紙,方塊邊長為3cm,共6行9列,將打印紙固定在一塊平板上,作為標定模板,如圖(2)。安裝三目攝像機系統,調節固定好個攝像機位置,如圖(3)。手持標定板在三目攝像機前方各個位置拍攝5組共15張各姿態的照片,利用Canny算子進行像點灰度中心提取、同名像點匹配并解算出三個攝像機在標定板坐標系中的外部參數值。
3.3標定結果
攝像機1:
R= T=
攝像機2:
R= T=
攝像機3:
R= T=
四、總結
隨著計算機技術的高速發展,計算機視覺成為當今熱門的研究課題,受到了廣泛關注。本文就如何在機器視覺的理論基礎上對三目視覺系統進行標定進行了研究,討論了計算機視覺理論知識,分析攝像機標定原理以及標定坐標系的建立。同時通過計算機視覺知識的分析討論了基于三目視覺系統的攝像機標定技術,完成了三目視覺系統的外部參數標定實驗。三目攝像機測量系統外部參數的標定能夠解決測量作業現場、測量控制場建立難的問題,為快速地建立簡單實用的控制場提供了方案,有一定的實用價值。
參考文獻
[1] 荊麗秋.雙目視覺系統標定與匹配的研究與實現[D].哈爾濱工程大學,2009.DOI:10.7666/d.y1489086.
[2] 馬頌德.計算機視覺―計算理論與算法基礎[M].北京:科學出版社,1998.
[3] 王榮一.攝像機標定及關鍵技術研究[D].哈爾濱理工大學,2011.DOI:10.7666/d.y2012483.
[4] Clarke T A,Fryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66
[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.
[6] 范亞兵,黃桂平,高寶華等.三目立體工業攝影測量系統外部參數的快速標定[J].測繪工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013
篇3
關鍵詞:壁紙;計算機視覺;灰度共生矩陣;紋理
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9599 (2012) 11-0000-01
一、壁紙樣本特征參數的獲取
紋理是一種普遍存在的視覺現象,如木材表面、草坪、皮膚、織物、水波等都有各自的紋理特征,而紋理特征是一種不依賴于顏色或亮度的反映圖像中同質現象的重要特征。壁紙大都仿制木材表面、皮膚、織物等物體,具有典型的紋理特征。因此,本文采用經典的灰度共生矩陣法對壁紙進行紋理特征參數的獲取。
數學定義:灰度共生矩陣是從圖像灰度為i的像元位置為(x,y)出發,統計與其距離為d,灰度為j的像元(x+Dx, y+Dy)同時出現的頻度P(i, j, d,θ),數學表達為[1]:
P(i, j, d,θ)={[ (x, y), (x+Dx, y+ Dy) | f(x, y)= i;f(x+ Dx, y+ Dy)= j]} (1)
其中,θ為共生矩陣的生成方向,通常取0°、45°、90°、135°四個方向。Haralick等人由灰度共生矩陣提取了14個紋理特征參數,分別為角二階矩、對比度、相關、熵、方差、均值和、方差和、逆差矩、差的方差、和熵、差熵、聚類陰影、顯著聚類、最大概率,依次標為W1~ W14,表1列出了部分樣本的紋理特征參數。
二、實驗樣本
實驗樣本選用了壁紙樣本手冊中的8類樣本進行實驗測試,每類樣本包含100張初始樣本圖像,樣本庫共包含800張圖像(100×8),如圖2所示。為了便于進行識別實驗,將樣本分成3部分,依次為:標準樣本集(70×8)、測試樣本集(30×8)。
三、實驗分析
為了能真實地反映所獲取特征的識別能力,應選擇相對簡單的分類器,從而避免分類器差異對識別率的影響,因此,本研究選擇最近鄰分類器對壁紙樣本進行識別。
觀察表2可見,對壁紙測試樣本集的總體分類識別率為87.50%,獲得了較高的分類識別率。其中,對第5類板材樣本的識別率最低為750%,對第3類的識別率最高為100.0%,這也能夠反映出樣本自身的復雜程度和灰度共生矩陣特征參數對各類樣本的描述能力。
四、結論:
本文使用最近鄰分類器對壁紙測試樣本集合進行分類,總體識別率為87.50%,表明灰度共生矩陣特征參數能夠有效描述壁紙的紋理特征,同時也表明采用計算機對板材進行分類識別取代人工識別是基本可行的。
參考文獻:
[1]莊軍,李弼程.一種基于灰度共生矩陣的文本圖像識別方法[J].計算機工程,2006,32(3):214-216
[2]王克奇,王輝,白雪冰.基于模擬退火算法和最近鄰分類器識別率的特征選擇方法[J].自動化技術與應用,2007,26(1):27-29
[3]楊彩霞.基于Gabor變換與最近鄰分類器的字符識別方法[J].西安文理學院學報(自然科學版),2010,13(4):83-85
篇4
(上海大學通信與信息工程學院,上海200072)
摘要:運動目標的檢測是數字圖像處理和模式識別的基礎,也是計算機視覺研究的一個重要領域。以C#為主要研究工具,對基于相鄰幀差法及背景差分法的視頻目標檢測算法進行了研究,主要對其原理和算法進行研究。最后利用以AForge.NET架構類庫,利用圖像灰度的絕對值是否大于設置的閾值實現了對運動目標進行檢測,實驗結果表明,采用該算法可以對運動目標進行較為精確的檢測。
關鍵詞 :運動檢測;AForge.NET;幀差法;背景差分法
中圖分類號:TN911.73?34 文獻標識碼:A 文章編號:1004?373X(2015)17?0058?03
0 引言
由于微電子技術的發展與社會生活水平的提高及各種安防需求的增多,運動目標檢測逐步成為當前監控系統研究領域的熱點,更是計算機視覺領域中視頻跟蹤算法和識別技術的基礎,該算法的檢測精度直接影響了后續的運動目標跟蹤及識別效果。目前,運動目標檢測領域比較常用的方法有:光流法、幀間差分法和背景差分法。
光流法是相對于觀察者的運動目標造成的觀測目標、表面或邊緣的運動[1]。但是該算法計算量比較大,并且存在抗干擾能力差,所以對于實時性要求較高的場合,該檢測算法在視頻運動檢測應用中并不是特別的適用,目前在運動檢測中最常用的方法實際上是背景差分法[2]和幀間差分法[3]。
幀間差分法是一種通過對視頻圖像序列中相鄰兩幀作差分運算來獲得運動目標輪廓的方法,非常適用于存在多個運動目標和攝像機移動的情況[4]。由于該算法對光線及場景變化具有較強的抗干擾性,且無需獲得背景圖像,更新速度快,所以非常適用于實時性較強的應用場合。但是該算法存在閾值難以確定的問題,這個現象在低對比度灰度圖像序列別明顯,導致對目標對象的完整區域提取不完整而產生空洞的現象。
背景差分法是采用圖像序列中的當前幀和背景參考模型比較,來檢測運動目標的一種方法,其檢測性能依賴于所使用的背景建模技術[5]。該算法可以實現緩慢的背景變化過程中對目標進行精確快速的分割,所以具有很強的適用性,然而對于突然的光照變化和背景擾動,對物體帶有影子的圖像分割出來的前景圖像可能帶有影子區域[6],為此可以通過建立實時更新的背景模型機制將前景區域分割出來,就可以減少動態場景變化對運動分割的影響[7]。
本文利用AForge.NET[8]架構類庫,在Microsoft VisualStudio 2010中分別實驗了幀間差分法與背景差分法,并實現運動目標的檢測。實驗結果表明,利用幀間差分法可以快速實現運動目標的檢測,但是對于運動速度較慢的目標檢測效果不是特別理想。為此,對于緩慢變化的運動目標引入背景差分法,利用類庫中MoveTowards類建立實時有效的背景模型,有效地解決目標低速運動識別率較低的問題,提高了目標檢測的準確率。
1 AForge.NET 簡介
AForge.NET是一個專門為開發者和研究者設計的基于C#框架,包括計算機視覺與人工智能、圖像處理、神經網絡、遺傳算法、機器學習、模糊系統、機器人控制等領域[9]。AForge.NET 是一個不斷完善和發展的計算機視覺和圖像處理庫,目前的最新版本是2.2.5。
這個框架由一系列的類庫組成,主要包括有:
AForge.Imaging:日常的圖像處理和過濾器;
AForge.Vision:計算機視覺應用類庫;
AForge.Neuro:神經網絡計算庫AForge.Genetic?進化算法編程庫;
AForge.MachineLearning:機器學習類庫;
AForge.Robotics:提供一些機器學習的工具類庫;
AForge.Video:一系列的視頻處理類庫;
AForge.Fuzzy:模糊推理系統類庫;
AForge.Controls:圖像,三維,圖表顯示控件。
2 檢測原理
幀差法及背景差分法主要原理就是圖像的差分技術。設在一個時間軸上相鄰時刻點ti 采集到的圖像幀分別為f (x,y,ti),ti + 1 采集到的幀為f (x,y,ti + 1),則可以得出:
//對兩幀數據差值進行數據濾波
Bitmap tmp3 = erosionFilter.Apply(tmp2);
上面幾行代碼可以計算出當前幀與上一幀這兩幀數據相差的像素數據,通過設定特定的閾值,就可以實現對運動目標的報警功能。在本文所做的實驗中,為了形象展示當前幀與上一幀數據的差值數據,把連續兩幀數據差值用過紅色高亮數據進行顯示。實驗結果表明,通過差幀法可以快速實現運動目標的檢測,由于幀差檢測法存在閾值難以確定的問題,特別是對于低速運動的運動目標,如果設定較低的閾值則存在誤觸發虛報的問題,而對于設定的高閾值,因為具有較低的檢測靈敏度,則存在漏警的問題,實驗結果如圖2所示。
為此,本文引入了背景差分法技術,相對幀差檢測算法,該算法使用AForge.NET的MoveTowards類實現實時背景的建模,再通過當前圖像幀與建模形成的背景幀數據進行差分運算,實現運動目標的檢測。該算法可以解決幀差檢測法閾值難以確定的問題,可以實現低速運動目標精確的定位與檢測。
背景差分法與幀間差分法的區別只是有了一個背景更新的過程,本文新背景的建立是通過AForge.NET視頻庫中類實現,該類背景提取算法原理是當前幀與前一個背景幀求加權平均得出當前背景幀數據。背景差分法的具體算法流程如圖3所示。
背景差分法相關實現代碼如下:
// 初始化背景類
MoveTowards moveTowardsFilter = new MoveTowards();
// 把當前幀復制給該類
moveTowardsFilter.OverlayImage = currentFrame;
// 通過前一幀與當前幀建立新的背景
Bitmap tmp = moveTowardsFilter.Apply(backgroundFrame);
// 把原先老的背景去除掉
backgroundFrame.Dispose();
//把當前計算出來的背景幀保存下來,為下一背景幀計算做準備
backgroundFrame = tmp;
背景差分法運動檢測算法的相關實驗結果如圖4所示。
從圖4 可以看出,背景差分法具有更好的目標輪廓,通過當前幀與背景幀比較的運動檢測算法,可以很好地解決運動目標低速運行的問題,可以較為精確地實現與運動目標的檢測。所有背景差分法與幀差法相比,具有更高的檢測精度,非常適合工程中的應用。
4 結語
本文利用AForge.NET 類庫,分別采用幀差法及背景差分法對運動目標進行實時檢測。實驗結果證明,利用AForge.NET可以實現運動目標的檢測功能,并且具有很強的實時性。幀差法可以快速地檢測運動目標,但是由于其特性決定了其對于低速運動目標的檢測較背景差分法檢測靈敏度要低。本文只針對運動目標進行簡單的檢測,對于更進一步的問題將在后續工作中繼續研究。
參考文獻
[1] 陳銀,任侃,顧國華,等.基于改進的單高斯背景模型運動目標檢測算法[J].中國激光,2014(11):245?253.
[2] 紀青華,禹素萍.基于Surendra背景減除法和四幀差分法的目標檢測算法[J].計算機應用與軟件,2014(12):242?244.
[3] 邱斌,干紅華,張亶.基于時空信息的運動目標分割算法[J].激光雜志,2014(12):40?44.
[4] 柴池.基于背景差分和三幀差分的運動目標檢測[J].網絡安全技術與應用,2014(11):75?76.
[5] 黃素茵.基于視頻監控運動目標檢測算法研究[D].廣州:華南理工大學,2013.
[6] 余啟明.基于背景減法和幀差法的運動目標檢測算法研究[D].贛州:江西理工大學,2013.
[7] 嚴曉明.一種基于改進幀差法的運動目標檢測[J].莆田學院學報,2011(5):69?72.
[8] KIRILLOV A. AForge.NET framework [EB/OL].(2010?03?02)[2010?12?20]. http:// aforgenet. com.
篇5
關鍵詞:圖像內容檢索; 紋理特征;視頻水??; 高壓縮; 魯棒性
中圖分類號:TP391.41 文獻標識碼:A
1 引 言20世紀70年代末期,基于文本的圖像檢索技術(textbased image retrieval)方興未艾。當時流行的圖像檢索系統是將圖像作為數據庫中存儲的一個對象,用關鍵字或自由文本對其進行描述。查詢操作是基于該圖像的文本描述進行精確匹配或概率匹配。然而,完全基于文本的圖像檢索技術存在著嚴重的問題。90年代初期,隨著大規模數字圖像庫的出現,基于內容的圖像檢索技術(contentbased image retrieval)應運而生。區別于原有系統中對圖像進行人工標注的做法,基于內容的檢索技術自動提取每幅圖像的視覺內容特征作為其索引,如色彩、紋理、形狀等。此后幾年中,這個研究領域中的許多技術發展迅速,一大批研究性的或商用的圖像檢索系統被建立起來。這個領域的發展主要來歸功于計算機視覺技術的進步,在文獻[1]中有對這一領域的詳細介紹。
圖像特征的提取與表達是基于內容的圖像檢索技術的基礎。從廣義上講,圖像的特征包括基于文本的特征(如關鍵字、注釋等)和視覺特征(如色彩、紋理、形狀、對象表面等)
兩類。由于基于文本的圖像特征提取在數據庫系統和信息檢索等領域中已有深入的研究,本文我們主要介紹視頻圖像視覺特征的提取和表達。并利用特征提取選定相應幀,并在選定的特定幀中嵌入水印。
2 Tamura紋理特征
紋理特征是一種不依賴于顏色或亮度的反映圖像中同質現象的視覺特征[2]。它是所有物體表面共有的內在特性,例如云彩、樹木、磚、織物等都有各自的紋理特征。
基于人類對紋理的視覺感知的心理學的研究,Tamura等人提出了紋理特征的表達[3]。Tamura紋理特征的六個分量對應于心理學角度上紋理特征的六種屬性,分別是粗糙度(coarseness)、對比度(contrast)、方向度(directionality)、 線像度(linelikeness)、規整度(regularity)和粗略度(roughness)。其中,前三個分量對于圖像檢索尤其重要[4]。接下來我們就著重討論粗糙度、對比度和方向度這三種特征的定義和數學表達。
計算技術與自動化2011年9月
篇6
關鍵詞 SIFT 尺度空間 圖像匹配 特征描述符
中圖分類號:TP39 文獻標識碼:A
Research on the Simplified SIFT Feature Matching Algorithm
YIN Lihua[1], CHEN Yong[1], YANG Yuping[2]
([1] Chongqing Normal University, Chongqing 401331;
[2] Chongqing College of Electronic Engineering, Chongqing 401331)
Abstract For SIFT algorithm, for the matching problem of the classic descriptors for feature dimension is too high and lead to reduced efficiency, this paper presents a simplified SIFT feature matching algorithm, the first of the operator dimensionality reduction to improve the speed, then use two-way matching to eliminate errors together with the algorithm to ensure the accuracy of experiments and achieved good results, verify the feasibility of the method.
Key words SIFT; scale space; image matching; feature descriptors
0 引言
圖像匹配是同一場景在兩個不同視點下的圖像之間的對應關系,是虛擬現實、計算機視覺等研究領域的一個熱點,也是計算機視覺應用,如深度恢復、攝像機標定、運動分析以及三維重構等研究的基本問題。①總結起來,圖像匹配算法大致分為:基于面積的方法、②基于比值的方法③等,但這些算法有著共同的缺點。本文提出一種簡化的SIFT算法,通過減少特征描述符的維數來降低計算的復雜度,并采用雙向匹配增強匹配的精度。
1 SIFT算法研究
SIFT( scale invariant feature transform,即尺度不變特征變換)算法是David G.Lowe于1999年提出,2004年進行了總結和完善的特征匹配算法,SIFT特征匹配算法共分為如下五個步驟:
1.1 尺度空間的形成。
Koendetink等人證明了高斯卷積核是實現尺度變換的惟一線性核,因此,一幅二維圖像的尺度空間可定義為:
() = ()* () (1)
式中:L為尺度空間,()為空間坐標, 則為尺度因子。 的值越小表示圖像越清晰,越大則表示圖像越模糊。為了提高尺度空間中被檢測關鍵點的穩定性,采用了高斯差分尺度空間()。定義為兩相鄰尺度的高斯核差分,公式如下:
() = [ () ()]* () = () - () (2)
1.2 空間極值點的檢測
在中,為確保在尺度空間及二維圖像空間都能檢測到極值點,每一個像素點(最頂層和最底層像素點除外)要和其上下兩層各9個及同層8個相鄰點進行比較。并通過擬和三維二次函數來精確確定特征點的尺度和位置,同時去除對比度低的特征點和不穩定的邊緣特征點,以增強圖像匹配的穩定性、提高抗噪聲能力。
1.3 特征點方向分配
為使算子具備旋轉不變性,統計特征點鄰域像素的梯度方向直方圖,以確定每個特征點的方向參數。
1.4 特征點描述器的生成
為了增強算子的抗噪能力,每個特征點選用16個種子點來描述,而每個種子點又有8個方向的向量信息,因此,每個特征點就能形成16共128維的SIFT特征向量。
1.5 特征匹配
SIFT算法選用歐式距離作為特征點的相似性度量函數,設定一個閾值,當距離小于這個閾值時就接受這一對匹配點。
2 簡化的SIFT算法研究
2.1 簡化算法的匹配步驟
經典算法中,第三步的計算時間在整個算法中占了70%多,大大地降低了算法的速度,影響了實時性。為了改善這一狀況,將第二、三步合并,并在對特征點進行描述時,把原來的128維向量降為現在的12維向量。匹配步驟如下:
2.1.1 初步特征點的檢測(方法同原算法)
2.1.2 形成特征向量
(1)以初步檢測到的特征點為中心采用圓形窗體來確定需要統計的領域范圍,選取圓形窗口半徑為4.5s,在該窗體內統計12個梯度方向。
(2)歸一化這12個梯度方向,以保證算子的光照不變性。用表示特征向量,即 = ,歸一化后得到:
(3)
(3)為保證算子的旋轉不變性,查找最大的梯度方向統計量。向左循環移動整個向量序列,直至梯度方向統計量最大的元素移動到序列的第一個元素。
2.1.3 特征匹配
為保證算法的精度,采用雙向匹配。即第一次匹配完后,記錄下成功匹配的坐標對,然后交換匹配對的坐標位置,再匹配一次,如果這兩次匹配得到的坐標對是一樣的,就接受這一對匹配點。
2.2 維數設定
簡化算法中最重要的一步就是圓形窗口中維數n的設定,實驗結果表明,當<12時,匹配效率隨著維數的增加呈指數級增加;反之,當>12時,匹配效率卻隨著維數的增加反而下降。由此可得,當 =12時,匹配效率最高, =12即為所需確定的維數。對于匹配效率,定義為:
匹配效率 = (4)
3 仿真實驗及結果
為了驗證算法,在CPU為Intel Corei3 2.20GHz,內存為2G的PC機上采用Matlab7.8軟件平臺進行實驗。為了證明算法對物體旋轉、遮擋和光照的魯棒性,在設計場景的時候將物體任意擺放,在不同的光照條件下進行實驗,部分效果及結果如圖表所示,其中圖1(a)為SIFT算法匹配圖像,圖1(b)為簡化SIFT算法匹配圖像,表1為兩種算法匹配對比結果。
4 結論
總之,本文研究了經典SIFT算法,并分析了算法的優勢及其局限性,從匹配速度上加以了改進。首先利用圓形窗口本身的旋轉不變特性對算法進行降維,從原來的128維降為12維;其次采用雙向匹配提高匹配的精度,去除可能存在的不明顯誤匹配。將匹配結果同原SIFT算法進行了比較,試驗結果表明本文改進算法比原SIFT算法在速度上有了很大的提高,同時在一定程度上也保證了精度。
注釋
① 孔曉東,屈磊,桂國富等.基于極約束和邊緣點檢測的圖像密集匹配[J].計算機工程,2004(20):178-179.
篇7
關鍵詞:視頻檢測;蜂群算法;互信息
中圖分類號:TP391 文獻標識碼:A
Abstract:Here,a video object detection method based on an improved bee colony algorithm is presented.First,the maximum mutual information values of two images are obtained through optimization.Then,the best spatial matching parameters are acquired,and finally the target is detected through the three frame difference pared to the traditional algorithm,the proposed algorithm can restrain the residual background noise,and does not require the image pre-processing,feature selection and background updating,which reduce the complexity of the pared with the results based on the traditional bee colony algorithm,the effectiveness and reliability of the improved algorithm are demonstrated.
Keywords:video detection;bee colony algorithm;mutual information
1 引言(Introduction)
近年來,科學技術的不斷發展以及人民生活水平的不斷提高使人類對生活質量和本身的安全性保證需求愈來愈高。視頻監控由于能形象、直觀地表示信息而被應用于大部分公共場所。相比較傳統的視頻監控,高端化的視頻監控系統可通過計算機視覺、圖像處理等技術提取出人們感興趣的目標信息圖像,然后對其進行檢測、跟蹤、分類以及行為理解和描述等過程來判別監控畫面中的情況,代表了未來視頻監控產業的發展趨勢。視頻監控系統的關鍵技術主要有四個方面:目標的檢測,目標的跟蹤,目標的分類,行為的理解與描述。
視頻目標檢測在人機交互、視頻監控、交通視頻、視頻會議、客流量統計等許多方面都有非常重要的應用,是當今計算機視覺領域的研究熱點與難點之一。傳統的檢測算法[1]如背景差分法、相鄰幀差法、光流場法等已相對成熟,但存在不足:背景差分法對光線等外在因素的變化過于敏感,幀差法檢測目標的完整性較差,光流場法的計算比較復雜且容易被外界噪聲干擾。因此,學者們提出了許多改進算法,如背景移動補償算法[2]、幀間差法與背景差分相結合的算法[3]等。
2 互相關信息(Mutual information)
互相關信息是一種具有測量圖像間的統計相關性作用的信息理論概念。它代表圖像間的重合區域,重合區域越多,互相關信息越大。當兩幅圖像在幾何上完全重合時的互相關信息是最大的,稱為最大互信息。
假設有兩個隨機變量A和B,灰度值范圍為0―255,和分別是它們各自的概率密度函數,表示它們之間的相關密度函數。那么隨機變量A和B的互相關信息表示如下:
由于聯合熵的值取決于邊緣熵與變換函數,因此需要找出最優變換函數對圖像進行配準,以讓聯合熵最小,則此時的互相關信息為最大互信息。因為互相關信息是關于圖像全部像素的,所以帶來的計算量較大。小波變換為一種擁有多分辨率的時間――尺度分析方法,本文結合小波分解的方法,對配準圖像進行小波變換,主要包括平移和旋轉,因此,通過對小波變換函數中平移和旋轉參數的最優化以獲得最大互信息。
3 改進蜂群算法(Improved bee colony algorithm)
所謂人工蜂群算法就是對蜜蜂行為加以模擬而提出的一種優化算法。蜂群中出現群體智慧的最小搜索模型主要包括四個基本的組成要素:食物源、引領蜂、偵查蜂與跟隨蜂。
在蜂群算法中,優化問題的一個可能解就是一個食物源的位置,解的質量(適應度)就是食物源的花蜜數目。詳細過程如下:起先,生成具有個解(食物源)的初始種,其中的各個解――是一個維數為D(待優化參數的數目)的向量;其次,所有的食物源都要被蜜蜂進行反復(次數為MCN)搜尋:對應的食物源(解)先被引領蜂在鄰域作一次搜尋,通過對比搜尋前后兩個食物源的花蜜數目后,選取適應度相對高即花蜜數目大的食物源(解)來采蜜;結束搜尋以后,所有的引領蜂將食物源上花蜜數目的信息傳遞給跟隨蜂,跟隨蜂通過獲得的信息按照一定的概率選取食物源,即花蜜越多的食物源被選擇的可能性越大。而后,跟隨蜂為了選取更好的解也作一次與引領蜂相同的鄰域搜尋。
其中,,,以上和都是隨機選擇的,并且。在-1和1之間。
在蜂群算法中,通過次循環之后得不到改善的解要被丟棄,這里的“”便是算法中的一個關鍵的控制參數。假設是被丟棄的解,偵查蜂可以隨機生成一個新解對進行代替。
以上表述可以看出,蜂群算法中的三個控制參數――食物源的數目、引領蜂的數目、跟隨蜂的數目(SN)是相等的。以上整個算法的核心包括三個部分:(1)引領蜂:鄰域搜索;(2)跟隨蜂:將搜尋范圍縮小后對鄰域作搜尋;(3)偵查蜂:隨機搜索。
因為蜜蜂隨機選擇鄰域個體,并且未考慮食物源之間的內部聯系,致使收斂速度較為緩慢。為了提高收斂性能,提出改進蜂群算法,將式(4)變化為
式中,―遺忘因子,代表搜尋其它食物源時對當前食物源的記憶強度,并且為了使蜜蜂充分的利用鄰域個體的搜索信息從而更好地尋找到全局的最優點,在下一食物源的搜索過程中遺忘因子會動態調整;―鄰域因子,確定信息共享的強度是根據鄰域個體食物源的優劣來進行的,在搜索后期為了使蜜蜂具有較強的全局尋優能力,鄰域因子進行動態變化。為常量,以1為分界線,當食物源質量比蜜蜂當前食物源質量劣時取1,從而讓蜜蜂可以向高質量的食物源移動。
鄰域因子、遺忘因子中的參數、隨搜索進程動態變化如下:
式中,iter代表搜索步數;、、與都是常量,取值在[0.1,1.5],且、。為了使蜜蜂迅速向最優食物源區域移動,遺忘因子中的參數隨搜索進程從逐漸下降至,取值范圍在[0.8,1];隨著搜索的進行,鄰域因子中的參數從逐漸上升到,代表逐漸增大鄰域個體與當前蜜蜂的信息共享強度,β取值范圍在[1,1.2]。
4 三幀差分法(Three frame difference method)
三幀差分法把相鄰三幀圖像當作一組進行差分,可以將實際運動目標的輪廓完整的檢測出來,具體算法如下:
(1)讀取圖像序列中的三幀圖像、、,依次計算出相連兩幀圖像的絕對差值灰度圖、,設置閾值T對差值圖像進行二值化,提取運動目標區域如下:
(2)通過邏輯“與”運算提取和的交集,獲取運動目標:
5 計算分析(Calculation and analysis)
5.1 基于改進蜂群算法的視頻目標檢測算法流程
(1)首先通過小波變換將圖像映射到小波域。
(2)利用式(1)作為衡量標準進行基于互相關信息的圖像配準計算。
(3)采用改進的蜂群算法優化兩幅圖像間的互信息值,此算法通過迭代后將獲得最優的小波變換平移參數與旋轉參數。
(4)最終依靠三幀差分法實現對圖像中運動目標的增測,使用矩形框將目標進行標記,完成目標檢測。
5.2 結果與分析
圖1和圖2分別為基于蜂群算法和改進蜂群算法的視頻目標檢測結果。從中可看出,基于蜂群算法檢測到的目標范圍過大,而基于改進蜂群算法檢測出的目標范圍更加精確,也更能夠反映出真實情況。
6 結論(Conclusion)
本文在基于互相關信息進行目標檢測的基礎上,利用改進的蜂群算法對兩幅圖像間的互相關信息進行優化,得到最大互信息值,進而獲得最佳空間匹配參數并完成對圖像的空間配準,最后通過三幀差分法檢測出目標。通過與傳統蜂群算法的結果對比,證明了改進算法的有效性和可靠性。
參考文獻(References)
[1] 萬纓,韓毅,盧漢清.運動目標檢測算法的探討[J].計算機仿真,2006,23(10):221-226.
[2] 於時才,吳鍵.運動背景下的運動目標檢測方法[J].計算機仿真,2011,28(2):292-294.
[3] 朱明旱,羅大庸,曹倩霞.幀間差分與背景差分相融合的運動目標檢測算法[J].計算機測量與控制,2005,13(3):215-217.
[4] Teodorovi'c,Dell Orco.Bee colony optimization-a cooperative learning approach to complex transportation problems[M].In Proceedings of the 10th Ewgt Meeting,Poznan,13-16 September 2005.
作者簡介:
仲 躍(1960-),男,碩士,高級工程師.研究領域:水利信息系統應用開發.
楊 勁(1986-),男,碩士,工程師.研究領域:計算機圖形學和圖像處理.
顧 京(1985-),男,碩士,工程師.研究領域:信息系統建模與仿真.
篇8
關鍵詞:人臉修飾;頻域濾波;幾何表示;演化模型
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2015)22-0119-03
Abstract: With the popularity of digital cameras, mobile phones and other camera equipment, automatic face modification technology has become a research hotspot in the field of computer vision, digital image processing. In this paper, the framework and the new progress of automatic face modification technology are summarized. The algorithm based on frequency domain filtering, the algorithm based on geometric representation, and the algorithm based on age evolution model are summarized. The main algorithms are introduced and the advantages and disadvantages of various algorithms are also analyzed. Through the research on the practical problems in the domestic and international application, the challenge and the shortage of the automatic face modification technology are presented.
Key words: face modification; frequency domain filtering; geometric representation; evolution model
隨著圖像信息處理技術的不斷進步,以及拍照設備的普及,人們對照片的處理需求不斷提高,尤其是針對面部圖像的修飾技術已成為電腦軟件和手機軟件的一個開發熱點,比如:美圖秀秀、人人-美顏美圖、光影魔術手等。這些軟件不要求用戶具有專業的圖像處理技術,可以方便地實現美化照片的效果。
人臉自動修飾與渲染是計算攝影領域中新的研究熱點。其主要關注人臉照片品質的提高,更關注對人臉的某些屬性的處理,如:對人臉皺紋的去除、膚色的改善、光潔度的提高等。人們希望經自動修飾與渲染的照片,能夠符合視覺感知習慣、更具吸引力,改變傳統的攝影、圖像處理工作需繁復的人工操作的現狀。因此,在攝影、廣告設計、電影制作、數字娛樂、專業研究領域都有著廣泛的應用前景。
本文對自動人臉修飾技術的研究背景、研究現狀進行了綜述,列舉了近幾年自動人臉修飾技術的主要算法,以及算法的改進、對比,最后對自動人臉修飾技術發展趨勢、存在的問題、下一步的研究方向進行了闡述。
1 人臉修飾技術研究進展
1.1 基于頻域濾波的方法
該算法可以實現圖像中高頻率瑕疵(如:皺紋、斑點)的去除,進而完成人臉的修飾,使處理后圖片看上去更白、更美觀,但該算法當遇到大范圍皺紋、斑點等瑕疵時的處理效果不理想。
1.2 基于幾何表示的方法
此外還有一些修改人臉外形的算法,通過對面部輪廓和器官作適當變形,使其更加貼近最優臉型,達到優化人臉的目的。但該類算法容易造成修改后的人臉對標準人臉的依賴,調整過大時,容易造成人臉原來特征的丟失。
1.3 基于年齡演化模型的方法
基于年齡演化模型的算法通?;贔G-NET數據庫、MORPH數據庫開展實驗。FG-NET數據庫包含了82個人,年齡從0~69歲,共有1002張照片,為包含大的年齡跨度里面收集的照片直接采自被拍攝者的老照片,因此拍攝角度、環境、光照條件都不能一致,有的照片還有帽子、眼鏡等遮擋,年代很早的照片都是黑白照片,而且早期的照片,受拍照攝備所限,畫面不夠清晰。但FG-NET仍然是現有的人臉年齡數據庫中,唯一包含了0~18歲照片的數據庫,而且照片反映的年齡跨度大、且密集。
MORPH數據庫是最大的、已公開的縱向人臉數據庫。該數據庫包含超過13000人的55000幅圖像,年齡跨度在16歲到77歲之間,并且該數據庫還在不斷擴種中。MORPH數據庫除了包含人臉照片,還包含被拍照者的年齡、性別、種族、體重、身高等信息,可供面部分析、年齡分析、面部識別的研究使用。
現階段年齡相關的人臉數據庫還很不完善,人臉圖像的采集需要經歷相當長時間的跟蹤拍攝,這需要相當長時間的積累,并且考慮包含不同種族、性別、地域的人臉照片。
在計算機視覺領域,年齡演化問題是一個研究熱點?;谀挲g演化模型的自動人臉修飾技術的關鍵是通過各年齡段的人臉照片構建合適的年齡演化模型。
早期的基于年齡演化模型的自動人臉算法中,結合了小波變換的內容,如:參考文獻[3]中,Tidderman提出了通過小波變換建立特征向量,并針對不同年齡構建合成人臉。實驗結果表明,當使用小區域邊緣強度加權來保留邊緣特征后,根據年齡進行人臉修飾的效果更明顯。對這一算法進一步改進,通過MRF模型在小波變換后進行年齡演化過程中的人臉特征學習,可以實現人臉的年輕化修飾、以及性別修改。實驗結果表明,MRF模型比單純使用小波變換對人臉的修飾效果要好。
此外,還有根據生物學、遺傳學等領域的研究來建立年齡演化模型的方法。如:參考文獻[4]中,Ramanathan根據生物學中顱面骨的生長規律,對0-18歲期間的人臉建立基于年齡影響的模型,融入人體測量學的方法,即:人臉不同部位在不同年齡段會有不同的生長進度,來提取不同年齡段人臉的特征。圖3顯示了側面人臉隨年齡增長的模型,及對應不同年齡跨度,產生的特征參數k。通過最優化計算人臉成長參數k,來實現不同年齡人臉比例的轉換,圖4顯示了參考文獻[4] 的實驗結果。
針對成年人的年齡演化模型,如:參考文獻[5]中,Ramanathan考慮到人的衰老,主要體現在面部肌肉的彈性變差、皺紋的增加,提出了與年齡相關的形狀、紋理變化的模型,可以用來修飾人臉產生老化特征,如:額頭皺紋、眼角紋、嘴角紋等。實驗通過將數據庫人臉按年齡分組,年齡跨度在10歲,如:21-30歲一組,31-40歲一組等,搜集的實驗數據可以很好的反映隨年齡、性別、種族等變化而產生的形狀、紋理特征。
綜上,基于年齡演化模型的自動人臉修飾技術先要對人臉數據庫按年齡分組,對不同分組提取特征,得到經年齡演化修飾后的圖像。實驗效果很大程度上依賴于人臉數據庫,為了得到好的演化效果,需要使用年齡跨度大的人臉照片。
2 總結
本文總結了國內外關于自動人臉修飾技術的算法框架,主要針對基于頻域濾波的算法、基于幾何表示的算法、基于年齡演化模型地算法進行了歸納,這些算法仍存在很大的改善空間,下一步研究可以考慮如下問題:
1)自動人臉修飾技術最重要的是保留人臉的個性化特征,不能在修飾后面目全非,因此如何在特征提取過程中盡量保留原照片的個性化特征,仍然需要繼續探討。
2)現階段的自動修飾技術,會使修飾的結果和方向趨于一致,如何使美化修飾過程具有一定的個性化是一個有待進一步研究的問題。
最后,為了使自動人臉修飾技術的應用更具有利用價值,在算法的改進中不能只局限于現有的數據模型、年齡演化模型,可以跨學科地嘗試、引入新的模型方法,以期在更具有實用價值的指導下設計新的算法或改進。
參考文獻:
[1] 韓靜亮,趙曦,趙群飛,等.基于迭代多級中值濾波的人臉美化算法[J].計算機應用與軟件,2010,27(5): 227-229.
[2] Leyvand T, Cohen-Or D, Dror G, et al., Data-driven enhancement of facial attractiveness, in ACM Transactions on Graphics(TOG), 2008: 38.
[3] Tidderman B, Stirrat B, Perrett D I, Towards realism in facial image transformations: Results from a wavelet mrf method, Computer Graphics Forum,2005, vol. 24: 449-456.
篇9
關鍵詞:智能;監控技術;安防;應用
中圖分類號:TB381 文獻標識碼:A 文章編號:
引言
目前,傳統的視頻監控系統已經不能夠滿足快速發展的人類社會的需要,這就需要更加有效、更加智能的視頻監控技術來滿足人們的需求。在視頻監控里所說的智能視頻技術一般是指:“自動的分析和抽取視頻源中的關鍵信息?!蔽覀兛梢园褦z像機比作是人的眼睛,而智能視頻的系統和設備就好比是人用來思考的大腦。智能的視頻技術就是運用強大的計算機數據的處理功能,高速的分析視頻畫面里的大量的數據,將那些對用戶沒用的信息過濾掉,只留下一些關鍵的信息。
一、智能視頻監控技術及的工作原理
智能視頻監控是將計算機視覺技術引入到視頻監控中而產生的,目前,智能視頻監控已經成為計算機視覺中一個重要的研究領域,從監控攝像頭開始,包括運動對象提取、對象描述、對象跟蹤、對象識別和對象的行為分析,最后進行預警或報警。
智能視頻監控技術主要包括對視頻圖像序列自動地進行運動對象的提取、描述、跟蹤、識別和行為分析等方面的內容。如果把攝像機看作人的眼睛,而智能視頻系統或設備則可以看作人的大腦。智能視頻監控技術就是借助計算機強大的數據處理功能,對視頻畫面中的海量數據進行高速分析,過濾掉監控者不關心的信息,僅僅為監控者提供有用的關鍵信息。智能視頻監控以數字化、網絡化視頻監控為基礎,但又有別于一般的網絡化視頻監控,它是一種更高端的視頻監控應用。智能視頻監控系統能夠識別不同的物體,發現監控畫面中的異常情況,并能夠以最快和最佳的方式發出警報和提供有用信息,從而能夠更加有效的協助安全人員處理危機,并最大限度的降低誤報和漏報現象。其最終目的就是要使計算機能夠分析、描述和理解視頻畫面中的內容。智能視頻監控涉及到計算機視覺、圖像視頻處理和人工智能領域中的眾多核心技術,是一個非常具有挑戰性的困難問題。
二、智能視頻監控技術的主要優勢
視頻監控技術的升級換代除了追求高壓縮比、高清,還在從普通的視頻移動偵測向視頻分析邁進,具備更多面向特定應用的智能(如防丟失、風險管理、商業管理等等)。智能視頻的本質就是對于視頻圖片進行一個數學上的分析處理,然后這個處理的結果為視頻的使用者提供一個決策和行動的建議。以下是智能視頻監控的主要優勢:
1、快速的反應時間。毫秒級的報警觸發反應時間。智能視頻監控系統大大提高了報警的及時性,在事故發生的第一時間就會發出報警信號,使得事件能夠在最短的事件內得以解決。
2、更有效的監視。針對廣場、旅游景點等重要領域的監控范圍廣、人流量大,且極易發生應急事件的問題,要求高速球需具備速度快、精度高的特點,在出現警情的情況下,能夠更快速、便捷的跟蹤目標移動物體,從而改變普通高速球的“被動監控”的現狀,實現“主動監控”。安保操作員只需要注意相關信息。
3、強大的數據檢索和分析功能。能提供快速的反應時間和調查時間。智能視頻監控系統能夠有效提高報警精確度,大大降低誤報和漏報現象的發生。智能視頻監控系統的前端設備(網絡攝像機和視頻服務器)集成了強大的圖像。
4、有效擴展視頻資源的用途。無論是傳統的視頻監控系統還是網絡視頻監控系統,其所監控到的視頻畫面都只能應用在安全監視領域,而在智能視頻系統中,這些視頻資源還可以有更多的用途。
智能視頻監控設備比普通的網絡視頻監控設備具備更加強大的圖像處理能力和智能因素,因此可以為用戶提供更多高級的視頻分析功能,它可以極大的提高視頻監控系統的能力,并使視頻資源能夠發揮更大的作用。
三、智能視頻監控技術在安防領域的應用
1、主要安防應用類型
智能視頻監控除具有一般的數字監控系統的優勢外,還具有實現24×7 h全天候可靠監控、報警精確度高、響應速度快、有效擴展視頻資源的用途等特點。因此,隨著視頻監控的普及以及監控要求的提高,智能視頻監控應用范圍會不斷擴大。智能視頻監控的應用主要分為安防類應用和非安防類應用。安防類應用是目前市場上存在的主要智能視頻應用,主要包括:
(1)高級視頻移動偵測:在復雜的天氣環境中(例如雨雪、大霧、大風等)精確的偵測和識別單個物體或多個物體的運動情況,包括運動方向、運動特征等。
(2)人物面部識別:自動識別人物的臉部特征,并經與數據庫檔案的比較來識別或驗證人物身份。
(3)遺留、遺棄物品檢測:當一個物體(如箱子、包裹、車輛、人物等)在敏感區域停留的時間過長,或超過了預定義的時間長度就產生報警。典型應用場景包括機場、火車站、地鐵站等。
(4)車輛識別:識別車輛的形狀、顏色、車牌號碼等特征,并反饋給監控者??捎迷诒槐I車輛追蹤等場景中。
(5)人體行為分析:在目標檢測分類的基礎上,利用人體的各種行為特征對其進行各種行為的描述和分析,提取哪些危險和有潛在危險的行為,如打斗、搶奪和突然倒地等行為。
(6)物體追蹤:偵測到移動物體之后,根據物體的運動情況,自動發送PTZ控制指令,使攝像機能自動跟蹤物體,在物體超出該攝像機監控范圍之后,自動通知物體所在區域的攝像機繼續進行追蹤。
(7)入侵探測:可感知設定區域內突然出現和入侵的物體并及時報警。比如在戒備森嚴的軍事重地或銀行博物館等重要場所出現可疑人物等。
(8)擁擠檢測:識別人群的整體運動特征,包括速度、方向等等,用以避免形成擁塞,或及時發現異常情況。典型的應用場景包括超級市場、火車站等人員聚集的地方。
(9)物品被盜或移動檢測;當監控場景中的物體被盜和移動,算法將自動檢測這種動作,常用于貴重物品和關鍵設備的監控。
(10)焰火檢測:根據發生火情過程中煙火表現出的時一空特征進行煙火的實時檢測。
2、應用模式
智能視頻監控技術具有2種應用模式:
(1)與傳統的模擬視頻監控系統結合使用,以突破傳統視頻監控發展中遇到的瓶頸問題。主要用于對已存在的模擬視頻監控系統進行智能化改造。選擇重點、高危監控目標和場所,針對該部分圖像進行分析,選擇智能視頻服務器(IVS BOX)實現主動監控,同時將預警、警情實時發給模擬矩陣和DVR,完成快速切換和錄像。
(2)基于網絡的全數字化智能視頻監控系統。該模式主要用于新建的數字化監控系統中。同樣,選擇重點、高危監控目標和場所,直接在前端選擇智能視頻服務器(IVS BOX),實現主動監控,將預警、警情實時發給后端智能管理平臺,完成快速切換和錄像。
3、實現方式
智能視頻監控系統一般采用模塊化的設計方式,智能視頻分析模塊實現對運動目標的自動檢測、識別、跟蹤和報警,是實現智能視頻監控的核心。該模塊可以部署在監控系統的前端采集部分,也可以置于監控中心。其產品形態可以是嵌入式DSP板卡的方式(板卡可以集成在視頻服務器、數字錄像機、攝像機等設備中),也可以是純軟件的方式。
智能視頻分析模塊接收上位機發送的告警規則設置;對固定攝像頭攝取的圖像內容進行高速分析與數據處理,實現目標檢測和識別,對比預先設置的報警規則或用戶設定的條件給出預警、報警或處理結果。在發現威脅目標并進行報警的同時,對目標進行自動跟蹤。
結束語
智能化、數字化、網絡化是視頻監控發展的必然趨勢,智能視頻監控的出現正是這一趨勢的直接體現。智能視頻監控設備比普通的網絡視頻監控設備具備更加強大的圖像處理能力和智能因素,因此可以為用戶提供更多高級的視頻分析功能,它可以極大地提高視頻監控系統的能力,并使視頻資源能夠發揮更大的作用,其在安防領域的應用也必將越來越來越廣泛。
參考文獻:
[1]周永紅.智能視頻監控技術及應用[J].智能建筑與城市信息,2009,6.
[2]呂立波.淺析智能視頻監控技術及其主要應用[J].中國公共安全雜志,2009,5.
篇10
關鍵詞:字符提??;HALCON;機器視覺;圖像處理
中圖分類號:TP319
文獻標識碼:A
文章編號:16727800(2017)004008003
0引言
我國專利申請量居世界前列,每年都有數以百萬項專利申請。專利號是每個專利的唯一標識,數目繁多,統計工作量巨大,人工管理專利作業不僅效率低,還容易出錯。因此,設計一種自動識別專利發票上的專利申請號系統十分必要。本文以專利發票為實驗對象,介紹一種票據字符提取系統。 隨著計算機技術和數字圖像處理技術的飛速發展,機器視覺廣泛應用于生產生活中。視覺檢測技術作為機器視覺的重要研究領域,不僅能提高自動化程度,還能顯著提升檢測的安全性與可靠性[1]。當今幾乎所有需要人類視覺的場合都可以用機器視覺技術來代替,尤其對于需要快速、重復地從圖像中獲取精確信息的場合,機器視覺技術是實現計算機集成制造的基礎技術[23]。 HALCON是德國MVtec公司開發的具有強大圖像處理功能的軟件,包含所有標準和高級的圖像處理方法,擁有非常完善的函數庫,包括定位、匹配、識別等高級算法,能夠進行圖像獲取、模板匹配、Blob分析、邊緣提取、測量、識別等[4],具有全面的視覺處理庫和應用廣泛的機器視覺集成開發環境。HALCON通過交互編程開發應用程序,或加入新的算子來實現視覺功能,是應用效果最好的機器視覺處理軟件[2,5]。本文利用HALCON機器視覺技術設計并實現票據特定字符――專利申請號的提取。
1系統設計
基于機器視覺的專利收費票據檢測系統需要對置物臺上的專利收費票據進行采集和識別,最終提取出申請號字符。申請號字符提取系統主要由電源光源部分、z像機傳感器單元、圖像采集單元和圖像處理操作平臺等構成。通過調節器控制光源,攝像機傳感器和圖像采集單元由檢測元件控制。系統架構如圖1所示。
系統流程如圖2所示。 申請號字符提取系統中,用CMOS數字像機進行圖像采集,圖像采集單元主要完成置物臺上整個票據圖像的獲取。圖像采集和處理是機器視覺系統的核心,攝像機獲取的圖像包含了需要的所有信息,圖像質量的好壞將直接影〖HJ*3〗響系統檢測效率和精度,是整個機器視覺系統的關鍵。光源則影響整個圖像質量,合適的光源能很好地區分目標信息和背景信息,影響輸入圖像的質量和至少30%的應用效果[6]。根據應用需求,系統光源采用LED光源。系統工作時,采用檢測觸發抓拍方式獲取圖像,攝像機由檢測元件觸發控制。檢測元件由光電觸發器與反射板組成,它是一個反射型的觸發器。當票據通過置物臺時,信號強度會變化,檢測元件據此輸出控制信號來觸發攝像機拍攝圖像[7]。拍攝的圖像傳送到采集單元,再經過像機數據接口傳輸到機器視覺圖像庫中,利用軟件中的算子功能對圖像進行相應處理、識別和輸出。機器視覺軟件為HALCON 10.0。
2圖像處理技術
采用 OCR圖像處理方法檢測專利收費票據申請號字符。OCR指通過圖像處理和模式識別技術對光學字符進行識別,用于閱讀和識別特定區域字符。基于模板機制,針對不同票據,定制不同的識別要素,專利票據為印刷票據,因此采用OCR圖像處理方法對票據申請號字符進行提取,基本步驟為:獲取圖像預處理圖像分割圖像OCR匹配識別字符輸出結果。
2.1獲取圖像
圖像獲取由攝像機傳感器、檢測元件等硬件設備和HALCON軟件算子共同完成,HALCON軟件首先調用open_framegrabber算子訪問圖像采集設備,再調用grab_image算子完成采集圖像,將采集得到的圖像加以保存,然后再調用read_image和dev_display把圖像顯示出來。票據圖像如圖3所示。
2.2預處理圖像
為使采集的圖像區域特征更加明顯,目標信息更加突出,要經過一系列預處理,主要有圖像增強、灰度值調節、濾波、填充縫隙、圖像分割等[7]。
2.2.1圖像增強與灰度值調整
調用emphasize算子,使發票上的信息顯示更為明顯。為了得到更清晰的申請號字符,需要將申請號信息從整個票據復雜的背景中提取出來,消除噪聲,以降低后續步驟難度。采用閾值分割,調節灰度值調用threshold算子,調節灰度值過后的圖像突出了申請號字符信息,見圖4。
2.2.2填充縫隙與濾波 灰度值調整后的數字圖像仍存在許多噪聲,去除這些噪聲干擾,常采用數學形態學方法進行去噪[8]。數學形態學有4個基本運算:膨脹、腐蝕、開運算和閉運算。數學形態學利用結構元素作為探針不斷移動圖像信息來了解圖像的結構特征。為使圖像數字特征更為明顯,調用fill_up_shape和dilation_circle算子填充字符內部的黑色部分;對深色部分進行處理時,調用形態學opening_circle算子以抑制雜波。為滿足申請號字符精準檢測提取要求,在圖像預處理階段需將灰度值調整、填充縫隙、濾波等3種處理方式相互協調使用。
2.3申請號定位與分割圖像
申請號字符定位算法是整個字符識別的核心,從專利票據可以看到許多數字組合,但是申請號的位數是固定的,而且距離整個方框中心最近?;诖耍梢愿鶕暾執柕拈L度定位申請號,但最下排漢字會存在干擾,如圖5所示綠色部分。 通過申請號的方框兩條豎線定位中心,尋找距離中心較近目標,即為申請號位置,見圖5。HALCON主要程序如下:MiddleColumnSum:=0 for i := 1 to NumIntermediate2 by 1 MiddleColumnSum:=(Row22[i-1]+Row21[i-1])/2+MiddleColumnSum endfor MiddleColumn:= MiddleColumnSum/NumIntermediate2 **尋找與豎線中心坐標最接近的目標,即為申請號devbig:=0 dev:=0 for i := 1 to NumIntermediate3 by 1 dev :=(Row22[i-1]+Row21[i-1])/2 if(dev>devbig) devbig:=dev n:=i endif endfor
確定申請號位置后,單獨分割提出申請號部分圖像,見圖6,再應用圖像處理技術,對申請號字符串進行分割。首先進行圖像分割,通過對原始圖像進行某種方式的分割處理,提取圖像的某些特征,最常用的方法是閾值分割[910]。經過處理后,申請號字符可能存在一些微小的斷裂,此時調用closing_circle算子以連接這些微小斷裂,減少誤識別。因為申請號字符水平排列成一排,可以調用closing_rectanglel算子將申請號字符在水平方向合并成一個整目標,調用connection算子把合并后的目標區域轉換為一個個分離的對象,采用聯合與分割方法分開字符,調用intersection算子和connection算子得到分割好的底滯枷瘛>過以上步驟,整個申請號字符基本上能夠清晰地顯示出來,再使用sort_region算子將數字排列,調用region_to_bin算子把區域轉化成二值圖像,最后將圖像顯示出來,結果如圖7所示。
2.4OCR匹配
在HALCON軟件中進行OCR圖像處理和識別:根據申請號字符特征,將經過處理后的圖像與已知 “模板”進行比對,把置信度最高的值返回到class中,進行自動識別然后輸出結果。字符檢測提取 “模板”非常重要,它將決定最后匹配結果的精準度。申請號一般是非常簡單的數字和字母組合,所以本系統采用HALCON自帶的OCR模板庫即可。但是如果想識別其它文字等符號,則需要使用函數庫,或者創建及訓練ORC分類器,即建立相應的“模板”。
2.5識別字符
采用模板匹配法識別字符。將待識別的字符逐個與建立好的模板字符匹配。識別過程就是利用模板,對要識別的對象進行圖形處理,最后通過OCR模板匹配度算子得到結果。 首先調用read_ocr_class_mlp算子讀取分類文件,讀取 HALCON 自帶的 'Industrial_0-9A-Z.omc' 模板文件。do_ocr_multi_class_mlp算子將最終處理后得到的圖像與模板逐一匹配,得到匹配結果和匹配置信度,再調用smallest_rectangle1算子提取特征,得到該圖像上的字符方位,為后面定位操作提供參考。最后選擇一個起始位置顯示識別結果,這里要用到set_tposition 和write_string 兩個算子。程序運行結果見圖8。
3結語
票據特殊字符人工提取不僅工作量大、速度慢,而且枯燥乏味,容易因疏忽導致錯誤。本文將機器視覺技術應用到專利票據申請號提取中,能準確識別出專利發票收據上的申請號,實現了自動快速檢測提取,大幅降低了成本,提高了效率和準確度。此技術還可識別增值稅發票等不同種類票據,在財務管理等領域用途廣泛。
參考文獻:[1]趙杰文,陳振濤,鄒小波.機器視覺實現方便面破損在線檢測的研究[J].微計算機信息,2007,23(10):238240.
[2]孫懷遠,廖躍華,周夫之,等.基于HALCON的藥品包裝瓶批號檢測技術研究[J].包裝工程,2008,29(8):7173.[3]彭曉輝.基于HALCON的IC卡噴碼符號識別技術研究與實現[D].廣州:廣東工業大學,2006.
[4]肖海俊,葛廣英,姚坤,等.基于HALCON的噴碼字符識別技術的研究與實現[J].現代電子技術,2015,38(15):9598.
[5]郭佳寅,岳秀江,吳雙,等.基于HALCON的乳制品箱體噴碼字符識別方法研究[J].制造業自動化,2013(3):2122.
[6]楊莉,潘豐.基于機器視覺的硬盤磁體檢測系統設計[J].江南大學學報:自然科學版,2012,11(5):505-508.[7]孫懷遠,楊麗英,周夫之.基于機器視覺技術的藥品瓶包裝在線檢測系統[J].自動化與控制,2011(2):4650.[8]春霞,魏敏,唐正寧.基于數學形態學的印刷網點圖像分割方法[J].包裝工程,2007,28(6):14-15,36.