計算機視覺的優點范文

時間:2023-12-22 18:02:58

導語:如何才能寫好一篇計算機視覺的優點,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

計算機視覺的優點

篇1

關鍵詞:檢修;預決算;定額;ERP;Ajax;AOP/IOC

中圖分類號:TP311.52

隨著中國國內經濟的持續發展,國有大型石化化工企業為了加快企業發展和增強市場競爭力,需對原有煉油及化工生產裝置進行改造、擴建及設備檢維修,這些項目的結算過程通常采用手工結算方式,即使ERP上線后,設備檢維修項目的結算仍然按線下手工結算方式,這種結算方式過程中往往涉及的部門、人員較多,甚至涉及外部造價咨詢機構,處理的環節和工單數量也非常多,目前采用紙質傳遞、手工核算,審核痕跡不便查詢,各級審核人員的工作量將相當龐大,容易造成出錯,同時審核效率低,對施工單位也造成諸多不便。

為了解決石油化工行業工程項目預決算管理手工核算的問題,目前國內許多企業都做了一些有意義的探索,希望通過信息系統將工程結算流程實現電子化在線執行,提高工作效率,避免因手工操作引起的人為錯誤等,同時在流轉過程中會保留每一步的操作痕跡,并且人員的查看、修改、審核權限控制到單據的字段級別,不同人員根據分配的不同權限,處理各自的業務。此外,能與ERP系統的通過接口集成,以獲取項目的相關信息,驗證結算工程項目的合法性。

1 開發內容

(1)檢修預決算電子化管理系統將提高檢修項目結(預)算審核效率。檢修項目結算整個流程涉及的部門及人員多,審核環節多,工單數量多,目前采用紙質傳遞、手工核算,審核效率低,審核痕跡不便查詢。采用此系統后,實現全流程網上流傳、審核,提高ERP勞務工單結算及時性,及時掌握檢修項目結(預)算動態。

(2)本系統與ERP系統后臺實時關聯。此系統作為ERP工單結算的輔助系統,實時提取ERP模塊每張勞務工單數據信息,在此系統實現勞務工單結算網上審核,結算終審價再按ERP操作規則,進行SES(收貨過賬)并對工單進行技術完結。

(3)本系統進一步提高計價定額執行的統一性。在此系統實現本公司檢修計價定額庫管理,進一步提升檢修結算的工程量簽證、結(預)算計價等表單模版的規范化管理水平,嵌入檢修項目計價定額庫以及常規檢修項目統一計價表,對人工取費、材料費、機械臺班費定期統一維護,便捷追溯檢修項目計價的歷史記錄,對同類或類似項目計價進行查詢、對比,提高審核效率。

(4)本系統強化檢修項目結算的報表統計、過程跟蹤、考核。按ERP工單類型、作業類型、專業類型、時間等參數,在此系統實現實時查詢統計,對審核流程各環節進行跟蹤、提醒等動態管理,強化管理工作績效考核。

2 工藝技術

本開發和設計堅持繼承與創新,堅持現有技術與先進性、前瞻性統一,堅持系統安全性與操作靈活性統一,堅持研究與實踐緊密結合的模式。

本開發和設計的實現基于B/S結構的多層應用,客戶端不需要安裝應用,只需要IE或FireFox等瀏覽器就可以操作。由于采用HTTP協議,服務器只需對外開通“80”WEB服務端口,有效阻止網絡攻擊。

在實現方式采用以J2EE為技術框架,J2EE有著穩定、靈活、安全、可伸縮性強、易維護、支持異構環境、支持多種操作系統等先天的優勢,有大量成功的商業系統案例,保證的系統健壯性。

使用網絡WEB技術,結合ERP模塊和定額庫,實現預決算網上在線審批和管理。根據ERP工單確定檢維修預決算書工程量簽證的來源依據,進行工程量核實程序,然后根據石油化工行業定額或地方定額編制預決算書,并通過可定制的流程實現預決算書的流轉過程;審批流轉過程中系統記錄了工程量簽證和定額修改的歷史痕跡和變化的過程,并且系統可以通過Ajax技術清楚的回顯預結算的審核修改過程,而且施工單位可以實時跟蹤預決算書審核過程;結合系統數據庫可以對預決算書和各階段審核數據即時查詢和統計分析,可以達到很好地控制設備檢維修費用的作用,確保設備和裝置的安穩長運行。

通過AOP/IOC技術,基于系統核心工作流程,實現預決算的高效審核。通過制定控制審核限制和對接期限、ERP采購訂單等業務策略,以及基于定額庫關聯關系,制定預決算審核過程中定額、取費等數值計算規則和策略,達到審核高效的目的。

3 結構設計

整個開發和設計分為二個層次,基礎模塊和業務模塊,如圖1所示。基礎模塊包括基礎信息配置模塊和權限管理;業務模塊包括工作流模塊和統計分析,工作流模塊是系統的核心模塊,通過配置,實現簽證單和結算書的多種審核流程。

4 功能特點

4.1 網上審核,及時反饋。通過全流程網上流傳、審核,及時掌握檢修項目結算動態,可以有效地提高各級審核員的辦事效率;同時給各個施工單位以明確的審核結果出示時間,可以有效地促進施工單位、項目所在單位和各級審核單位之間的工作協調。同時施工單位可以在本單位進行數據上傳和審核結果查看、修正等工作,不用再頻繁的來往于本單位和審核單位之間。

4.2 結算單數據自動核對、計算。通過網上審核,系統可以充分利用信息技術來實現結算的數據自動核對、計算;系統可以實現實時計算功能,即在用戶修改單據某個數據后,馬上根據修改內容自動計算相關聯的數據。通過這些功能,可以大大減少審核員的工作量,避免誤算,提供審核效率。

4.3 進一步提高計價定額執行的統一性。通過內置定額庫管理,進一步提升結算的工程量簽證、結算計價等表單模版的規范化管理水平,嵌入項目計價定額庫以及常規檢修項目統一計價表,對人工取費、材料費、機械臺班費定期統一維護,便捷追溯檢修項目計價的歷史記錄,對同類或類似項目計價進行查詢、對比,提高審核效率和計價管理水平。

4.4 保留審核操作痕跡。在本系統中,每一步的審核過程中都會將數據修改痕跡保留下來,審核員在審核過程中可以查看前面審核人員的數據修正紀錄。在結算書審核完之后,這些修改的歷史紀錄會保存下來,供以后核查。

4.5 歷史數據查詢統計。以數字信息方式存在的結算單審核數據可以有效地進行歷史數據的管理,不用擔心數據丟失、查詢困難的問題。用戶可以方便的查詢歷史數據,同時根據選定條件來做數據的統計和分析,把歷年“死”數據盤活起來。

4.6 強化過程跟蹤、考核。通過系統進行審核流程各環節進行跟蹤、提醒等動態管理,分析某一段時間內的特定審核員的審核速度、準確程度,可以為對各級審核員的績效考核提供有用的數據基礎,強化管理工作績效考核。

5 結論

實現結算書全流程網上流傳、審核,減少結算過程中的計算差錯、結算書丟失、查找結算書困難等問題,提高勞務工單結算及時性,及時掌握檢修項目預決算動態,推進規范管理工作,強化管理工作績效考核。大力推進工程結算管理工作進步,通過信息技術帶來管理效益,同時通過和其他信息系統的整合,有效的提高企業的整體信息化水平。

參考文獻:

篇2

關鍵詞:計算機視覺;課堂考勤;深度學習;MCV架構

前言

隨著國家標準《智慧校園總體框架》(Smartcampusoverallframework)的,智慧校園的規劃與設計成為了校園建設的重點項目[1]。而課堂考勤作為學校教學管理、學生評價的重要組成部分,隨著物聯網技術、人工智能和移動通信技術的水平的提高與發展,更應該向著智能化、準確化的方向發展[2]。本文研究了的當前應用的課堂考勤方式,并做了進一步的分析,最終根據社會技術的革新與發展[3],提出了一種基于計算機視覺的實時課堂考勤系統的設計。我們的主要工作是搭建了整個系統框架,包括數據庫系統、服務器、計算機視覺模型、網絡通信、圖像采集系統、客戶端和網絡通信系統。

1課堂考勤方式現狀

目前校園中主要的課堂考勤方式存在為兩種,分別是傳統的考勤方式和生物識別的考勤方式。如圖1所示,其中傳統的考勤方式包括點名考勤和通過校園卡進行考勤,點名考勤的方式仍然是高校中最常用的考勤手段,因它不受場地的限制,可以根據點名冊直接核對現場的學生信息,但這種方式存在的缺點就是花費時間,影響上課效率,為此有些教師不進行點名,因此影響了考勤的效果。校園卡考勤解決了點名占用課堂時間的問題,但這種方式具有學生代考勤的漏洞,因為學生可以拿著別人的校園卡進行考勤。生物識別的考勤方式包括指紋考勤和人臉識別考勤,這些方式有效解決了傳統考勤方式代考勤的弊端,但這種方式受設備硬件的影響,識別能力太慢,尤其是在下課后學生較多,考勤簽退時容易發生擁擠等現象,具有安全隱患[4]。因此,為解決當前考勤方式存在的一些弊端,本文設計了一種基于計算機視覺的實時課堂考勤系統。

2系統設計基礎

2.1系統開發環境

本文設計的實時課堂考勤系統主要是使用Python開發語言,Python是目前最流行開發語言之一,主要應用于Web服務設計、大數據、人工智能等領域,它的主要優點是開發效率高、可擴展性強、跨平臺和具有可移植性等,滿足了本文系統的設計要求。另外,在開發過程還用到了基于Python的第三方軟件開發包,包括Flask用于搭建系統的Web服務器;PyQt5用于搭建系統的客戶端;OpenCV用于系統中對圖像視頻的處理;Tensoflow用于開發計算機視覺模型,搭建深度學習模型,完成人臉檢測和識別任務;Mysqlclient用于管理、訪問、查詢和更新Mysql數據庫。

2.2系統開發框架

本文設計的實時課堂考勤系統通信基于Web應用,因此選擇一個合適的服務架構有利于提高系統的開發和部署效率。目前較流行的Web應用主要有MVC(ModelViewController)和CMS(ContentManagementSystem)兩種架構。本文使用了基于Python和Flask搭建的MVC架構[5],該架構如圖2所示,主要包括模型層、視圖層和控制器。使用該框架的優點是可將視圖層和業務邏輯層進行分離開發,提高開發效率,方便系統的部署、維護和管理。

3系統設計方式

3.1系統總結構設計

本文設計的實時課堂考勤系統的總體結構如圖3所示。根據MVC構架的設計,我們將該系統分為了模型層、控制器層和視圖層,另外還包括網絡通信設備。

3.2模型層設計

模型層主要是關系型數據庫模,MySQL是目前使用最多的關系型數據庫系統,也是學校管理系統使用最多的數據系統,為了更好地與學校管理系統兼容,我們選擇了MySQL數據庫,數據表之間的關系如圖4所示。

3.3控制器層設計

控制器層主要包括服務器應用軟件和計算機視覺模型,服務器應用軟件的功能包括系統通信配置、數據業務處理和系統各模塊間的調度。計算機視覺模型是實時課堂考勤系統的核心模塊,基于深度學習卷積神經網絡實現[6],主要作用是進行人臉檢測和識別兩個部分,計算機視覺模型的工作流程如圖5所示。在人臉檢測階段使用VGG16檢測器作為主干網絡,為提高模型的檢測準確率,通過引入注意力模型和多尺度特征融合對網絡進行了優化,有效地從輸入圖片中提取人臉位置信息,得到人臉圖像。在人臉識別階段首先使用FaceNe人臉識別網絡提取人臉圖像的特征圖,然后通過決策樹算法與待檢測的人臉特征進行匹配,從而識別圖片中的學生信息。

3.4視圖層設計

本文設計的實時考勤系統的模型層主要包括圖像采集系統和客戶端。目前各學校教室內都安裝有監控設備,因此為節約成本和安裝消耗,圖像采集系統使用教室內的監控設備作為圖像采集系統,負責采集教室現場圖片。客戶端設計首先在本系統中采用應用程序接口,然后在教學管理系統中設計圖形化用戶界面,通過應用程序接口調用本系統的功能,從而減少資源浪費,方便維護和管理。

4實時考勤功能的實現

實時考勤功能的實現方式如圖6所示,首先系統啟動后,用戶可以隨時更新考勤信息,比如在數據庫中創建新的考勤表等。接著系統會自動讀取考勤表的信息,比如課程所在教室、上課時間。然后啟動考勤程序,進行簽到、簽退操作,并將考勤數據保存到考勤數據表中。整個系統啟動完成后可以自動運行,直到關閉系統,而且可以實時進行課堂考勤。

篇3

關鍵詞 計算機視覺;攝像機定標方法;應用特點;線性關系;參照物

中圖分類號:TP391 文獻標識碼:A 文章編號:1671—7597(2013)022-067-3

計算機視覺中的攝像機定標方法總得來說可以分為兩類——傳統的攝像機定標法和攝像機自定標法。為了能夠使所獲取的場景更加自然,計算機視覺系統可以通過運用攝像機定標方法,加之合理安排攝像機和計算機這兩種成像裝置,來對二維的圖像信息進行虛擬空間的三維建模,進而控制整個攝像效果。這其中攝像及內部的一些參數起到了很大的作用,最初在計算機視覺中都是采用的傳統攝像機定標方法,但是這種方法存在著一定的局限性。這種定標方法在攝像機隨意運動和未知場景的安排下很難進行有效的標定。隨著計算機視覺中的攝像機定標方法的不斷進步和發展,以及攝像機自定標方法的誕生,使得這項技術逐漸獲得了相對廣泛的應用。

1 計算機視覺中與攝像機定標解析

計算機視覺的基本任務是采集一定數量的圖片或視頻資料并進行處理,以此來獲得相應場景環境下的的三維信息。而這些三維信息與圖像、視頻對應點的相互關系需要通過攝像機的幾何模型來決定,經過計算分析得出這些幾何模型參數的過程即為攝像機定標。如此看來,計算機視覺與攝像機定標的關系密不可分,目前可知,計算機視覺與攝像機定標的結合已經運用到相關領域,如高速公路上的車輛自主導航,部分醫學圖像的處理,電腦中臉孔或指紋識別等。但是由于所使用的目標人群相對較窄,以及攝像機定標方法的相對局限,使得計算機視覺的攝像機定標無法廣泛的運用到各個行業領域。正因如此,才加大了對計算機中攝像機定標方法的研究的必要性。下面就來對攝像機定標的兩種方法進行簡要的探討。

2 傳統的攝影機定標方法及應用特點

傳統的攝像機定標方法主要是在相應的攝像機模型下面,通過對一系列的數學公式進行變換計算和改進優化,然后對標定的具體參照物進行科學的圖像處理,最終來獲取攝像機模型的主要外部參數和內部參數。但是,由于不同的標的參照物與不同的算法思路的限制,傳統的攝像機定標方法也各不相同,其大致可分為以下三種:三維型——3D立體靶標定標法、平面型——2D平面靶標定標法以及以徑向約束為基準的定標法。

2.1 基于3D立體靶標的攝像機定標

這種基于3D立體靶標的攝像機定標方法就是在攝像機的前面安置一個具有3D效果的立體靶標裝置,然后將靶標上面的任何一個點都拿出來作為i這個參照物的特征點。在計算機視覺系統的作用下,將每一個靶標上面的特征點在整個三維坐標系中進行精確的制作測定。與此同時,攝像機首先在拍攝過程中獲取靶標上面的特征點影像信息,然后對平面圖像坐標系和立體空間坐標系二者的內外部數據參數排列出非線性方程,找出方程中系數矩陣的非線性關系,最后通過數學算法中的線性變換法來對整個透視系數矩陣中的每一個元素進行求解。通常在這種定標方法的應用過程中,計算機視覺系統都會忽略攝相機鏡頭在拍攝時的非線性畸變,將透視變幻矩陣中的相關元素定義為未知數,繼而在整個定標過程確定有效的三維控制點和相應的圖像點。在裝置3D立體靶標后,整個攝像機定標就能夠根據靶標上特征點的圖像坐標和世界坐標,在數學變幻算法的應用下,計算出攝像機的內部參數和外部參數。

這種3D立體靶標的攝像機定標方法不僅能夠優化定標物的獲取方法,而且能夠適應程序功能的改進,并且較高的精度,因而得到了廣泛的應用,但是這種定標方法通常比較繁瑣。

2.2 基于2D平面靶標的攝像機定標

基于2D平面靶標的攝像機定標方法在傳統攝像機定標方法分類中屬于一種新型的定標方法,又名張正友定標法。這種定標法具有靈活適用的特點,也是對傳統攝像機定標方法的一種簡化。在定標過程中首先是要在兩個以上的不同方位對一個平面靶標進行攝相機拍攝,整個拍攝過程中2D平面靶標和攝相機鏡頭都能夠自由地進行移動,而且要保持整個攝像機的內部參數一直固定。通常在基于2D平面靶標的攝像機定標法的應用中,我們都需要先假定這個靶標在三維空間坐標系中的豎軸為0,然后為了求出攝像機內外參數的優化解,要建立相應的線性模型,通過對線性模型的線性分析來計算出優化解,最后,運用最大似然法排列參數之間的非線性關系來求出其非線性解。在整個定標流程中,必須對攝像機的鏡頭畸變的目標函數進行綜合考慮,才能夠計算出攝像機的外部和內部參數。

這種方法既具有較高的精確性,又不需要很昂貴的定標成本,因此在計算機視覺系統中很為實用。但是,這種方法在進行整個攝像機內外參數的線性分析時,因為特征圖像上面的直線在透視之后依然是直線,在進行圖像處理的過程中,會引入一定的誤差。因此,在很多具有廣角鏡頭的攝像機定標上會出現因為鏡頭畸變而引起的較大誤差。

2.3 基于徑向約束的攝像機定標

基于徑向約束的攝像機定標就是通常所說的兩步法標定方法。這種方法通常是先利用徑向一致約束對超定性的線性方程進行最小二乘法求解,這樣就能夠將除了攝像機光軸方向平移外的其他的攝像機參數,然后對攝相機鏡頭存在和不存在透鏡畸變的情況下分別進行其他攝像機參數的求解。這種方法的計算量較為適中,而且精度也比較高,適用于攝像機的精密測量。然而,兩步法對于整個定標設備的要求也高,對于簡單的攝像機標定而言不易采用。

總的來說,基于徑向約束的攝像機定標的精準是通過設備的復雜和精確來獲得的,因此具有針對性的應用特點。

3 攝像機自定標方法及其應用特點

攝像機自定標方法是指在攝像機在移動時,周圍環境中的圖像會形成一定的對應關系,通過這種對應關系來對攝像機進行定標的方法,這種方法無需依賴參照物。攝像機自定標方法主要有以下四種:基于主動視覺的自定標法、基于Kruppa方程的自定標方法、分層逐步定標法以及基于二次曲面的自定標方法等。這些方法相較于傳統的攝像機定標方法來說有了很大的改進和提高,下面就進行簡要的探討。

3.1 基于主動視覺的自定標法

目前,在攝像機自定標方法中的應用最為普遍的方法便是基于主動視覺的自定標法。這種方法主要是能夠通過對攝像機在移動過程中的對環境中的多幅圖像進行標定,進而建立對應關系來求出標定參數,由此可見,整個標定過程不需要精密的標定物,如此一來就能夠使得標定問題簡單化。主動視覺系統是這種標定方法的核心技術,就是攝像機在拍攝過程中被固定在了一個能夠得到精確控制的移動平臺上,并且這個平臺的相關參數能夠通過計算機進行精確的讀出,在整個拍攝過程中攝像機只需要通過一定的特殊運動來獲取多幅圖像信息,然后在結合攝像機運動的具體參數和圖像的參數來確定整個攝像機的內部和外部參數,達到攝像機定標的效果。其中基于主動視覺的自定標法的代表方法就是馬頌德提出的控制攝像機的兩組三正交平移運動的標定方法。后來,李華、楊長江等人對這種方法進行了改進和優化,提出了基于四組平面正交和五組平面正交運動的標定方法,并能夠利用獲取圖像中的機電信息來對攝像機的參數進行線性表定。

這種方法算法簡便,能夠獲得整個參數的線性解,但是這種方法對整個攝像機的運動平臺要求很高,因此要求必須具有精確控制的能力。

3.2 基于Kruppa方程的自定標方法

基于Kruppa方程的自定標方法主要是在整個攝像機自定標過程中導入了Kruppa方程,并對該方程進行直接求解,從而得到整個攝像機的具體參數的方法。基于Kruppa方程的自定標方法在應用時利用了極線變幻和二次曲線像的概念對Kruppa進行推導,直接進行求解。

這種標定方法不需要對整個圖像的序列進行射影重建,通常是對兩個圖像之間的信息建立一個方程,相較于逐步分層標定方法而言,基于Kruppa方程的自定標方法能夠將某些很難做到所有圖像整合到一個統一的射影框架中的情況更加具有優勢,但是這種方法還是存在著一定的局限性,它無法保證在無窮遠處的平面能夠保持所有圖像在確定的攝影平面中還具有一致性的效果。當整個攝像機拍攝的圖像的序列較長的時候,基于Kruppa方程的自定標方法就顯得很不穩定,繼而不能夠很好地算出整個攝像機的內外參數,對定標造成了一定的影響。

3.3 分層逐步定標法

分層逐步定標法是攝像機自定標方法中的一個研究熱點,在攝像機自定標的實際應用中以及逐步取代了可以直接求解的基于Kruppa方程的自定標方法。分層逐步定標法在應用過程中首先需要對整個拍攝的圖像序列進行攝影重建,這點和基于Kruppa方程的自定標方法一樣,然后利用絕對二次曲面加以約束,最后在確定出無窮遠處平面方程中的仿射參數以及攝像機內部的參數。分層逐步定標法的應用特點是必須建立在射影定標的基礎之上,利用某一幅圖形作為特征基準點進行射影對其,將整個攝像機自定標的未知數的數量減少,再運用數學算法中的非線性優化算法來進行未知數的求解。

這種方法的不知自出就是在進行非線性優化算法時,初值是通過事前的預估得到的,不能夠保證這個方程的收斂性。由于在射影重建時,選擇的基準圖像不同,整個攝像機自定標的結果也會存在差異。

3.4 基于二次曲面的自定標方法

基于二次曲面的自定標方法和基于Kruppa方程的自定標方法在本質上答題一致,這兩種方法都是利用了絕對二次曲面在歐式變幻算法的計算下維持的不變性進行的。最早將二次曲面的概念引入到計算機視覺系統中攝像機自定標方法的是Triggs,他在這種定標方法上作出了可行性的研究,最后形成了基于二次曲面的自定標方法。

在輸入了多幅的圖像并且在進行統一的射影重建的狀態下,基于二次曲面的自定標方法會比基于Kruppa方程的自定標方法更加適用一些,原因就是基于二次曲面的自定標方法包含了絕對二次曲面和無窮遠處平面的所有信息,進而能夠辦證整個圖像在無窮遠處平面的一致性。

4 傳統攝像機定標方法與自定標方法優缺點分析

從上文可知,對于傳統攝像機定標方法應該取其精華,去其糟粕;對于攝像機自定標方法,在吸取傳統攝像機定標方法的優點的同時,應該加強自身的精度要求。總而言之,兩種攝像機定標方法各自存在利弊,如何改進才是正確的研究方向。

4.1 傳統的攝像機定標方法弊端

傳統的攝像機定標方法通過實踐證明,在理論上和實際運用上十分有用的,但仍有不少地方需要進一步改進,以下為它目前存在的問題所在:1)攝像機所拍攝的圖像或視頻存在一定噪聲。在實際數據計算分析中,這種噪音無論大小,都會對內部參數的實際解造成大的干擾,并且使實際解與由約束關系所求得的解之間有著相當大的差異。因此,怎樣才能夠提高解的魯棒性、減少解之間的差異性成為了傳統攝像機定標亟待解決的1問題;2)線性模型所得的優化解并非全局的。由上可知,攝像機定標的實際過程便是獲得實際參數的過程,即使用各種不同的優化計算方法,來獲得相應的非線性方程的一組解,但實際上,以此所獲得的優化解并非全局的。因此,如何變化或者提高線性方程的解答方法也很重要;3)攝像機定標參數的不確定性。一般來講,攝像機定標參數的不確定性決定著計算參數的可信程度,同時,其對三維重建有著影響,進一步來講,攝像機定標的不確定性也決定著約束關系的不確定性傳播。因此,這個問題也需要深入進一步研究。

總之,傳統攝像機的定標方法依然存在著許多無法忽視的弊端和需要解決的問題,深入研究并盡快解決這些問題,應該是傳統攝像機的定標方法今后的大的研究方向。

4.2 攝像機自定標方法相關問題

目前普遍認為,攝像機自定標方法實現隨時隨地的校準攝像機模型參數,與傳統的攝像機定標方法相比顯得更為靈活先進。攝像機自定標方法無需參照物,僅僅從圖像或視頻的相關點中得到它們之間的約束關系,從而通過相應的分析,計算出攝像機模型的參數.這種定標方法看似毫無缺點,但自定標的精度與傳統的攝像機定標方法相比,還是存在者一定的缺點,以下便是對其缺點的歸納總結:部分攝像機自定標方法所求得的解不夠穩定。例如:在圖像或視頻存在一定噪聲的情況下,實際的解與理論的解有著相當差異,或者所求得的解并不唯一。因此,解的不穩定性和精度不夠的情況,不僅是傳統攝像機定標方法的缺點,也是自定標方法的一個問題,提高解的精度及穩定性,是自定標研究的一個重要方向。實際上,在現在的解決方案中,各種優化算法是最常用最普遍的方法,但是,在多解的情況下,優化算法也無法能夠保證得出全局的最優解。由此看來,這個問題是計算機是絕種攝像機定標方法普遍存在的關鍵性問題。

5 結束語

隨著計算機視覺系統的不斷發展,攝像機定標技術也呈現了進步的狀態。綜上所述,計算機視覺中的攝像機定標方法主要有傳統的攝像機定標法和攝像機自定標法,對這兩類的定標方法進行深入的研究能夠為全面認識和了解攝像機定標方法起到很好的幫助作用。計算機視覺中的攝像機定標方法在今后的發展過程中應該得到更多的研究,但其所存在的不足和弊端也理應得到研究人員的重視。在這個多元化信息化的世界里,計算機視覺中的攝像機定標技術若能夠根據現有的條件,適應如今的環境,選擇合適的方法,對一些還存在局限性的環節取得更好地突破,則能夠將整個定標技術提升一個高度。相信隨著未來計算機視覺系統的不斷擴展和不斷完善,攝像機定標技術的應用范圍也會越來越廣闊。

參考文獻

[1]宋雪峰,楊明,王宏.用于攝像機標定的網格狀紋理的檢測方法[A].2001年中國智能自動化會議論文集(下冊)[C].2001.

[2]譚躍鋼,吳正平.一種新的基于雙目視模型的三維重建方法[A].中國儀器儀表學會第三屆青年學術會議論文集(上)[C].2001.

[3]劉健勤,鮑光淑.面向數據采掘的自適應圖象分割技術[A].中國圖象圖形科學技術新進展——第九屆全國圖象圖形科技大會論文集[C].1998.

[4]洪俊田,陶劍鋒,李剛,桂預風,徐曉英.基于灰色關聯的數字圖像去噪研究[J].武漢理工大學學報(交通科學與工程版),2006,04.

[5]趙江濤,周仁斌,劉寶源.基于線結構激光三維掃描系統的攝像機標定方法研究[A].2010振動與噪聲測試峰會論文集[C].2010.

[6]王鵬,王紅平.基于網格圖像的雙線性插值畸變校正的方法研究[A].科技創新與節能減排——吉林省第五屆科學技術學術年會論文集(上冊)[C].2008.

[7]程建璞,項輝宇,于修洪.基于OpenCV的視覺測量技術中攝像機標定方法[J].北京工商大學學報(自然科學版),2010,01.

[8]趙越,江南.一種基于3D矩形靶標的攝像機標定算法及其實現[A].第九屆全國信息獲取與處理學術會議論文集Ⅰ[C].2011.

篇4

論文關鍵詞:表面粗糙度,非接觸,光學測量

 

隨著科學技術的進步和社會的發展,人們對于機械產品表面質量的要求越來越高。表面粗糙度是評價工件表面質量的一個重要指標,國內外很多學者在表面粗糙度檢測方面做了大量研究工作。目前測量表面粗糙度的主要方法有:接觸式測量和非接觸式測量。

1 接觸式測量

接觸式測量就是測量裝置的探測部分直接接觸被測表面,能夠直觀地反映被測表面的信息,接觸式測量方法主要是觸針法,該方法經過幾十年的充分發展,以其穩定、可靠的特點被廣泛應用。但接觸式測量存在很大的缺陷,具體表現在:(1)對高精度表面及軟質金屬表面有劃傷破壞作用;(2)受觸針尖端圓弧半徑的限制,其測量精度有限;(3)因觸針磨損及測量速度的限制,無法實現在線實時測量[1]。

2 非接觸式測量

為了克服接觸式測量方法的不足非接觸,人們對非接觸式測量方法進行了廣泛研究。研究表明,非接觸式測量方法具有非接觸、無損傷、快速、測量精度高、易于實現在線測量、響應速度快等優點。目前已有的非接觸式測量方法包括各種光學測量方法、超聲法、掃描隧道顯微鏡法、基于計算機視覺技術的表面粗糙度檢測方法等。這里我們只對基于光學散射原理的測量方法、基于光學干涉原理的測量方法和基于計算機視覺技術的測量方法做簡單介紹論文格式模板。

2.1基于光學散射原理的測量方法

當一束光以一定的角度照射到物體表面后,加工表面的粗糙不平將引起發生散射現象。研究表明:表面粗糙度和散射光強度分布有一定的關系。對于表面粗糙度數值較小的表面,散射光能較弱,反射光能較強;反之,表面粗糙度數值較大的表面,散射光能較強,反射光能較弱。

基于光學散射原理測量表面粗糙度的研究方法和理論較多。四川聯合大學和哈爾濱理工大學相繼提出了一種稱之為散射特征值的參數,表征被測物體表面上反射光和散射光的分散度,散射特征值與被測物體表面的粗糙度有很好的對應關系[2]。哈爾濱理工大學利用已知表面粗糙度參數值的標準樣塊測得其散射特征值,建立—關系曲線,從而實現利用散射特征值測量火炮內膛表面粗糙度[3]。

基于光學散射原理的表面粗糙度檢測方法,具有結構簡單、體積小、易于集成產品、動態響應好、適于在線測量等優點。該方法的缺點是測量精度不高,用于超光滑表面粗糙度的測量還有待進一步改進。

2.2基于光學干涉原理的測量方法

當相干光照射到工件表面同一位置時,由于光波的相互位相關系,將產生光波干涉現象。一般的干涉法測量是利用被測面和標準參考面反射的光束進行比較,對干涉條紋做適當變換,通過測量干涉條紋的相對變形來定量檢測表面粗糙度。該方法的測量精度取決于光的波長。但是由于干涉條紋的分辨率是以光波波長的一半為極限的,僅從條紋的狀態無法判斷表面是凸起還是凹陷,因此非接觸,作為一種具有較好分辨率、寬測量范圍的表面粗糙度在線檢測技術,這種干涉法測量技術還有待于進一步發展[4]。

基于光學干涉原理,1984年美國洛克西德導彈公司huang采用共模抑制技術研制成功了光學外差輪廓儀,光外差干涉檢測技術是一種具有納米級測量準確度的高精度光學測量方法,適用于精加工、超精加工表面的測量,而且可以進行動態時間的研究;華中理工大學采用光外差干涉方法研制出2D-SROP-1型表面粗糙度輪廓儀[5]。美國的維易科(VEECO)精密儀器有限公司,采用共光路干涉法研制了WYKO激光干涉儀和光學輪廓儀,可用來測量干涉條紋位相[6]。

基于光學干涉原理測量表面粗糙度分辨率高,適于測量超光滑表面粗糙度,但由于該方法的測量精度受光波波長的影響很大,所以其測量范圍受到一定影響。

2.3基于計算機視覺技術的測量方法

基于計算機視覺的粗糙度測量方法是指使用攝像機抓取圖像,然后將該圖像傳送至處理單元,通過數字化處理,根據像素分布和灰度、紋理、形狀、顏色等信息,選用合理的算法計算工件的粗糙度參數值。近年來,隨著計算機技術和工業生產的不斷發展,該方法受到越來越多的關注。

北京理工大學的王仲春等人采用顯微鏡對檢測表面進行放大,并通過對CCD采集加工表面微觀圖像進行處理實現了表面粗糙度的檢測[7]論文格式模板。哈爾濱理工大學吳春亞、劉獻禮等為解決機械加工表面粗糙度的快速、在線檢測,設計了一種表面粗糙度圖像檢測方法,建立了圖像灰度變化信息與表面粗糙度之間的關系模型[8]。英國學者Hossein Ragheb和Edwin R. Hancock通過數碼相機拍攝的表面反射圖來估計表面粗糙度參數非接觸,運用Vernold–Harvey修正的B–K散射理論模型獲得了比Oren–Nayar模型更好的粗糙度估計結果[9]。澳大利亞學者Ghassan A. Al-Kindi和Bijan Shirinzadeh對基于顯微視覺的不同機械加工表面粗糙度參數獲取的可行性進行了評估,討論了照射光源與表面輻照度模型對檢測的影響,結果顯示盡管從視覺數據和觸針數據所獲得的粗糙度參數存在一定差異,但是基于視覺的方法仍是一種可靠的粗糙度參數估計方法[10-11]。

可以看出,基于計算機視覺技術的測量方法主要有統計分析、特征映射和神經網絡等黑箱估計法。通過這些方法獲得的表面粗糙度參數的估計值受諸多因素的影響,難以給出其準確的物理解釋。真正要定量地計算出粗糙度參數,需要科學的計算。

但是隨著機械加工自動化水平的提高,基于計算機視覺技術的檢測方法處理內容豐富、處理精度高、處理速度快、易于集成等優點將受到越來越多的重視。

3 結束語

接觸式測量測量速度較慢,容易劃傷工件表面,并且不適用于連續生產材料表面的檢測。非接觸式測量具有無損傷、快速、測量精度高、易于實現在線測量等優點,已成為表面粗糙度檢測的重點研究方向。非接觸測量以光學法為主,隨著計算機技術和工業生產的迅猛發展,基于計算機視覺技術的表面粗糙度非接觸式檢測方法受到越來越多的重視。

參考文獻:

[1]劉斌,馮其波,匡萃方.表面粗糙度測量方法綜述[J]. 光學儀器, 2004, 26(5): 54-55.

[2]苑惠娟等.非接觸式表面粗糙度測量儀[J].哈爾濱科學技術大學學報,1995,19(6):30-34.

[3]強熙富,張詠,許文海.擴展激光散射法測量粗糙度的測量范圍的研究[J].計量學報,1990,11(2):81-85.

[4]王文卓,李大勇,陳捷.表面粗糙度非接觸式測量技術研究概況[J].機械工程師,2004,11:6-9.

[5]王菊香.2D-SROP-1型表面粗糙度輪廓儀[J].工業計量,1994,(4):27-29.

[6]徐德衍等.光學表面粗糙度研究的進展與方向[J].光學儀器,1996,18(1):32-41.

[7]王仲春,高岳,黃粵熙等.顯微成像檢測表面粗糙度[J]. 光學技術, 1998, 5: 46-48.

[8]吳春亞,劉獻禮,王玉景等.機械加工表面粗糙度的圖像檢測方法[J]. 哈爾濱理工大學學報, 2007, 12(3): 148-151.

[9]Hossein Ragheb, Edwin R.Hancock. The modified Beckmann–Kirchhoff scattering theory for rough surfaceanalysis[J]. Pattern Recognition, 2007, 40: 2004-2020.

[10]Ghassan A. Al-Kindi, BijanShirinzadeh. An evaluation of surface roughness parameters measurement usingvision-based data[J]. International Journal of Machine Tools & Manufacture,2007, 47: 697-708.

[11]Ghassan A. Al-Kindi, BijanShirinzadeh. Feasibility assessment of vision-based surface roughnessparameters acquisition for different types of machined specimens[J]. Image andVision Computing, 2008, 6: 1-15.

篇5

關鍵詞:數據融合傳感器無損檢測精確林業應用

多傳感器融合系統由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強的數據可信度和分辨能力,已廣泛應用于軍事、工業、農業、航天、交通管制、機器人、海洋監視和管理、目標跟蹤和慣性導航等領域[1,2]。筆者在分析數據融合技術概念和內容的基礎上,對該技術在林業工程中的應用及前景進行了綜述。

1數據融合

1.1概念的提出

1973年,數據融合技術在美國國防部資助開發的聲納信號理解系統中得到了最早的體現。70年代末,在公開的技術文獻中開始出現基于多系統的信息整合意義的融合技術。1984年美國國防部數據融合小組(DFS)定義數據融合為:“對多源的數據和信息進行多方的關聯、相關和綜合處理,以更好地進行定位與估計,并完全能對態勢及帶來的威脅進行實時評估”。

1998年1月,Buchroithner和Wald重新定義了數據融合:“數據融合是一種規范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數據,以獲得實際需要的信息”。

Wald定義的數據融合的概念原理中,強調以質量作為數據融合的明確目標,這正是很多關于數據融合的文獻中忽略但又是非常重要的方面。這里的“質量”指經過數據融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關的信息,甚至可更好地用于開發項目的資金、人力資源等[3]。

1.2基本內容

信息融合是生物系統所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環境和發生的事件做出估計和判斷。當運用各種現代信息處理方法,通過計算機實現這一功能時,就形成了數據融合技術。

數據融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據某些準則進行組合,以獲得被測對象的一致性解釋或描述。數據融合的內容主要包括:

(1)數據關聯。確定來自多傳感器的數據反映的是否是同源目標。

(2)多傳感器ID/軌跡估計。假設多傳感器的報告反映的是同源目標,對這些數據進行綜合,改進對該目標的估計,或對整個當前或未來情況的估計。

(3)采集管理。給定傳感器環境的一種認識狀態,通過分配多個信息捕獲和處理源,最大限度地發揮其性能,從而使其操作成本降到最低。傳感器的數據融合功能主要包括多傳感器的目標探測、數據關聯、跟蹤與識別、情況評估和預測[4]。

根據融合系統所處理的信息層次,目前常將信息融合系統劃分為3個層次:

(l)數據層融合。直接將各傳感器的原始數據進行關聯后,送入融合中心,完成對被測對象的綜合評價。其優點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數據之間配準精度較高的圖像處理。

(2)特征層融合。從原始數據中提取特征,進行數據關聯和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數量的原始信息,又實現了一定的數據壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應用較多的一種技術。但是該技術在復雜環境中的穩健性和系統的容錯性與可靠性有待進一步改善。

(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務,然后進行關聯,再送入融合中心處理。這種方法的實質是根據一定的準則和每個決策的可信度做出最優的決策。其優點是數據通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統仍能繼續工作,具有良好的容錯性,系統可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等[5,6]。

1.3處理模型

美國數據融合工作小組提出的數據融合處理模型[7],當時僅應用于軍事方面,但該模型對人們理解數據融合的基本概念有重要意義。模型每個模塊的基本功能如下:

數據源。包括傳感器及其相關數據(數據庫和人的先驗知識等)。

源數據預處理。進行數據的預篩選和數據分配,以減輕融合中心的計算負擔,有時需要為融合中心提供最重要的數據。目標評估。融合目標的位置、速度、身份等參數,以達到對這些參數的精確表達。主要包括數據配準、跟蹤和數據關聯、辨識。

態勢評估。根據當前的環境推斷出檢測目標與事件之間的關系,以判斷檢測目標的意圖。威脅評估。結合當前的態勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應同時考慮當前的政治環境和對敵策略等因素,所以較為困難。

處理過程評估。監視系統的性能,辨識改善性能所需的數據,進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導和評價、多媒體功能等。

2多傳感器在林業中的應用

2.1在森林防火中的應用

在用MODIS(ModerateResolutionImagingSpectroradiometer)數據測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態,用一般圖像增強處理方法探測燃燒區火點的結果不理想。余啟剛運用數據融合技術,在空間分辨率為1000m的熱輻射通道的數據外加入空間分辨率為250m的可見光通道的數據,較好地進行了不同空間分辨率信息的數據融合,大大提高了對火點位置的判斷準確度[8]。為進一步提高衛星光譜圖像數據分析的準確性與可靠性,利用原有森林防火用的林區紅外探測器網,將其與衛星光譜圖像數據融合,可以使計算機獲得GPS接收機輸出的有關信息通過與RS實現高效互補性融合,從而彌補衛星圖譜不理想的缺失區數據信息,大大提高燃燒區火點信息準確度和敏感性。

2.2森林蓄積特征的估計

HampusHolmstrom等在瑞典南部的試驗區將SPOT-4×S衛星數據和CARABAS-IIVHFSAR傳感器的雷達數據進行了融合,采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計[9]。

KNN方法就是采用目標樣地鄰近k個(k=10)最近樣地的加權來估計目標樣地的森林特征。研究者應用衛星光譜數據、雷達數據融合技術對試驗區的不同林分的蓄積特征進行估計,并對三種不同的數據方法進行誤差分析。試驗表明,融合后的數據作出的估計比單一的衛星數據或雷達數據的精度高且穩定性好。

2.3用非垂直航空攝像數據融合GIS信息更新調查數據

森林資源調查是掌握森林資源現狀與變化的調查方法,一般以地面調查的方法為主,我國5年復查一次。由于森林資源調查的工作量巨大,且要花費大量的人力、物力和資金。國內外許多學者都在探索航空、航天的遙感調查與估計方法。

TrevorJDavis等2002年提出采用非垂直的航空攝影數據融合對應的GIS數據信息實現森林調查數據的快速更新,認為對森林資源整體而言,僅某些特殊地區的資源數據需要更新。在直升飛機側面裝上可視的數字攝像裝置,利用GPS對測點進行定位,對特殊地區的攝像進行拍攝,同時與對應的GIS數據進行融合,做出資源變化的估計或影像的修正[10]。

試驗表明,融合后的數據可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應用于偏遠、地形復雜、不易操作、成本高的區域,同時可避免遙感圖像受云層遮蓋。

3數據融合在林業中的應用展望

3.1在木材檢測中的應用

3.1.1木材缺陷及其影響

木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節子等生長缺陷,這些缺陷極大地影響了木材及其制品的優良特性,以及木材的使用率、強度、外觀質量,并限制了其應用領域。在傳統木制品生產過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產線的生產節拍。因此必須開發一種能夠對板材雙面缺陷進行在線識別和自動剔除技術,以解決集成材加工中節子人工識別誤差大、難以實現雙面識別、剔除機械調整時間長等問題。

3.1.2單一傳感器在木材檢測中的應用

對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應力、震動、沖擊應力波、快速傅立葉變換分析等檢測方法[11,12]。超聲技術在木材工業中的應用研究主要集中在研究聲波與木材種類、木材結構和性能之間的關系、木材結構及缺陷分析、膠的固化過程分析等[13]。

隨著計算機視覺技術的發展,人們也將視覺傳感器應用于木材檢測中。新西蘭科學家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區分不同紙漿類型,測定木材纖維材料加固結合力,并動態地觀察木材纖維在材料中的結合機理。

新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經產業化,該軟件利用數碼相機或激光掃描儀采集板材的圖像,自動識別板材節子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數據。

美國林產品實驗室利用計算機視覺技術對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學基于視覺傳感器進行了定向刨花板內刨花定向程度的檢測,從而可以通過調整定向鋪裝設備優化刨花的排列方向來提高定向刨花板的強度。

在制材加工過程中,利用計算機視覺技術在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質量進行分級,實現木材的優化使用;在膠合板的生產過程中,利用計算機視覺技術在線實時檢測單板上的各種缺陷,實現單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現自動化生產過程。Wengert等在綜合了大量的板材分類經驗的基礎上,建立了板材分級分類的計算機視覺專家系統。在國內這方面的研究較少,王金滿等用計算機視覺技術對刨花板施膠效果進行了定量分析[14]。

X射線對木材及木質復合材料的性能檢測已得到了廣泛的應用,目前該技術主要應用于對木材密度、含水率、纖維素相對結晶度和結晶區大小、纖維的化學結構和性質等進行檢測,并對木材內部的各種缺陷進行檢測。

3.1.3數據融合在木材檢測中的應用展望

單一傳感器在木材工業中已得到了一定程度的應用,但各種單項技術在應用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節子,有時會把木板上的臟物或油脂當成節子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術只能檢測部分表面缺陷,而無法檢測到內部缺陷;超聲、微波、核磁共振和X射線技術均能測量密度及內部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統應該集成各種傳感技術,才能準確、可靠地檢測到木材的缺陷[15,16]。

基于多傳感器(機器視覺及X射線等)數據融合技術的木材及木制品表面缺陷檢測,可以集成多個傳統單項技術,更可靠、準確地實時檢測出木材表面的各種缺陷,為實現木材分級自動化、智能化奠定基礎,同時為集裁除鋸、自動調整、自動裁除節子等為一身的新型視頻識別集成材雙面節子數控自動剔除成套設備提供技術支持。

3.2在精確林業中的應用

美國華盛頓大學研究人員開展了樹形自動分析、林業作業規劃等研究工作;Auburn大學的生物系統工程系和USDA南方林業實驗站與有關公司合作開展用GPS和其他傳感器研究林業機器系統的性能和生產效率。

目前單項的GPS、RS、GIS正從“自動化孤島”形式應用于林業生產向集成技術轉變。林業生產系統作為一個多組分的復雜系統,是由能量流動、物質循環、信息流動所推動的具有一定的結構和功能的復合體,各組分間的關系和結合方式影響系統整體的結構和功能。因此應該在計算機集成系統框架下,有效地融合GPS、GIS、RS等數據,解決這些信息在空間和時間上的質的差異及空間數據類型的多樣性,如地理統計數據、柵格數據、點數據等。利用智能DSS(決策支持系統)以及VRT(可變量技術)等,使林業生產成為一個高效、柔性和開放的體系,從而實現林業生產的標準化、規范化、開放性,建立基于信息流融合的精確林業系統。

南京林業大學提出了“精確林業工程系統”[17]。研究包括精確林業工程系統的領域體系結構、隨時空變化的數據采集處理與融合技術、精確控制林業生產的智能決策支持系統、可變量控制技術等,實現基于自然界生物及其所賴以生存的環境資源的時空變異性的客觀現實,以最小資源投入、最小環境危害和最大產出效益為目標,建立關于林業管理系統戰略思想的精確林業微觀管理系統。

[參考文獻]

[1]高翔,王勇.數據融合技術綜述[J].計算機控制與測量,2002,10(11):706-709.

[2]龔元明,蕭德云,王俊杰.多傳感器數據融合技術(上)[J].冶金自動化,2002(4):4-7.

[3]錢永蘭,楊邦杰,雷廷武.數據融合及其在農情遙感監測中的應用與展望[J].農業工程學報,2004,20(4):286-290.

[4]高德平,黃雪梅.多傳感器和數據融合(一)[J].紅外與激光工程,1999,28(1):1-4.

[5]王耀南,李樹濤.多傳感器信息融合及其應用綜述[J].控制與決策,2001,16(5):518-52.

[6]許軍,羅飛路,張耀輝.多傳感器信息融合技術在無損檢測中的應用研究[J].無損檢測,2000,22(8):342-344.

[7]WhiteFE.Datafusionlexicon:DatafusionsubpanelofthejointdirectorsoflaboratoriestechnicalpanelforC3[R].SanDiego,1991.

[8]余啟剛.數據融合技術在“3S”森林防火中的應用[J].森林工程,2003,19(4):5-6.

[9]HampusHolmstrom,biningremotelysensedopticalandradardatainKNN-estimationofforest[J].ForestScience,2003,49(3):409-418.

[10]TrevorJDavis,BrianKlinkenberg,PeterKellerC.Updatinginventory:Usingobliquevideogrammetry&datafusion[J].JournalofForestry,2002,100(2):45-50.

[11]楊春梅,胡萬義,白帆,等.木材缺陷檢測理論及方法的發展[J].林業機械與木工設備,2004,32(3):8-10.

[12]胡英成,顧繼友,王逢瑚.木材及人造板物理力學性能無損檢測技術研究的發展與展望[J].世界林業研究,2002,15(4):39-46.

[13]肖忠平,盧曉寧,陸繼圣.木質材料X射線與超聲檢測技術研究的發展與展望[J].木材加工機械,2004,15(1):25-27.

[14]王金滿,周秀榮.刨花板施膠效果計算機視覺分析方法[J].東北林業大學學報,1994,22(3):25-26.

[15]KlinkhachornP.Prototypinganautomatedlumberprocessingsystem[J].ForestProductsJournal,1993(2):11-18.

篇6

關鍵詞:

俯仰角; 圓形目標; 透視投影; 測量方法

中圖分類號: TP 242.6 文獻標識碼: A

引 言

在計算機視覺領域內,空間目標的位置和姿態是非常關鍵的參數,尤其是在視覺導航、目標識別以及人機交互等方面[1,2]。圓是物體的基本幾何形狀,在許多自然景物和人造物體中大量存在,并且圓形是一種幾何特征明顯且容易識別的形狀,在圖像處理中有著其它幾何形狀無法比擬的優點。圓形特征已經被應用在各種機器視覺相關的領域[3]。例如,使用圓形標志來進行移動機器人位置的精確估計,使用圓形標志物來進行三維物體的識別,以及使用圓形表面輪廓來進行目標的三維姿態估計等[4]。

作為姿態角的一種,俯仰角在許多領域起著重要作用。在火箭發射過程中,火箭的俯仰角等姿態參數是反映火箭飛行狀態的重要參數,對于分析火箭的運動狀態等有著重要的價值[5]。無人機及其它飛行器在飛行及著陸的過程中,也需要實時估計其姿態角等參數[6,7]。在頭盔瞄準具中,射擊目標的位置是依靠頭部的運動來確定的,頭部的俯仰角等姿態角測量,關系到射擊的命中率[8]。而在計算機視覺領域,通過攝像測量獲得距離等參數已經應用于汽車自動測距等,而攝像機的俯仰角參數直接影響著所測距離的精確度[9]。對于空間圓形目標的姿態角,國內外已經開始了相關研究。SafaeeRad等人[4]使用幾何分析的方法,提出了一種圓形目標的三維定位問題的閉合分析解。魏振中[3,10]等人研究了中心畸變誤差及空間圓姿態識別二義性的消除問題。現有的俯仰角測量方法,計算較為復雜。

現作為探索性研究,基于攝像機透視投影原理,對空間圓形目標的俯仰運動及俯仰角的測量進行研究,提出一種測量空間圓形目標俯仰角的方法。

1 圓形目標的俯仰運動及俯仰角測量

俯仰角最早出現在航空航天領域,定義為機體坐標系X軸與水平面的夾角。當X軸的正半軸位于過坐標原點的水平面之上時,俯仰角為正,俯仰角θ的范圍為[-π/2,π/2]。

由于設定攝像機光心與圓形目標之間的距離相對圓形目標的直徑來說非常大,并且圓形目標可在攝像機成像平面上完全成像,成像部位為感光器件中央或靠近中央位置,因此不考慮因攝像機鏡頭畸變等因素而帶來的影響。結合運動分析的方法,現對圓形目標的俯仰運動進行研究。不妨設定圓形目標的初始位置,并根據俯仰運動的旋轉軸是否通過其圓心,將俯仰運動分為以下兩種情況來分別進行分析。

3 結 論

文中研究了空間圓形目標的俯仰運動,提出了一種基于攝像機透視投影原理的空間圓形目標俯仰角的測量方法。根據圓形目標的俯仰運動旋轉軸是否通過其圓心,將俯仰運動分為兩類。通過分析空間圓形目標在不同姿態時的透視投影成像,使用幾何推理的方法,分別推導出了空間圓形目標兩種俯仰運動俯仰角的計算公式,并通過實驗進行了驗證。結果表明,所提出的方法,能夠很好地實現空間圓形目標俯仰角的測量。如何提高現場的測量和計算結果的精度,都將是進一步的研究工作。

參考文獻:

[1] LU Y,LEINONEN T.Solution and simulation of positionorientation for multispatial 3RPS parallel mechanisms in series connection[J].Multibody System Dynamics,2005,14(1):47-60.

[2] FANTONI C.3D surface orientation based on a novel representation of the orientation disparity field[J].Vision Research,2008,48(25):2509-2522.

[3] 魏振忠,張廣軍.視覺檢測中橢圓中心成像畸變誤差模型研究[J].北京航空航天大學學報,2003,29(2):140-143.

[4] SAFAEERAD R,TCHOUKANOV I,SMITH K C,et al.Threedimensional location estimation of circular features for machine vision[J].IEEE Trans Robot Automat,1992,8(2):624-640.

[5] 于起峰,孫祥一,陳國軍.用光測圖像確定空間目標俯仰角和偏航角的中軸線法[J].國防科技大學學報,2000,22(2):15-19.

[6] 潘 翔,馬德強,吳貽軍,等.基于視覺著陸的無人機俯仰角與高度估計[J].浙江大學學報(工學版),2009,43(4):692-696.

[7] 趙世峰,張 海,范耀祖.一種基于計算機視覺的飛行器姿態估計算法[J].北京航空航天大學學報,2006,32(8):885-898.

[8] 王 超,魏生民,周繼紅,等.視頻圖像技術在頭部位置跟蹤上的應用研究[J].現代制造工程,2008(2):111-115.

篇7

關鍵詞:計算機視覺;跟蹤算法;綜述;人數統計

中圖分類號:TP391 文獻標識碼:A DOI:10.3969/j.issn.1003-6970.2013.03.003

0 引言

計算機視覺作為一門多學科的交叉領域,涉及圖像處理、計算機圖形學、模式識別、人工智能、人工神經網絡、計算機、數學、心理學、生理學和物理學等。本文是對視頻人數統計技術的綜述,屬于智能視頻監控范疇。

由于智能視屏監控的挑戰性以及其巨大的應用價值,越來越多的學校、研究所以及公司的研究人員投入到該領域中來。麻省理工學院、卡內基梅隆大學以及其他國外著名大學成立了專門的計算機視覺及多媒體方向的實驗室;Nice和Object video等公司已經針對飛機場、國界線等應用場合開發了一些相應的智能監控系統。國際上的高級視頻和錄像(Advanced Videoand Signal-Based Surveillance)論壇每年都會舉辦PETS(Performance Evaluation of Tracking Systems)會議專門針對于人群行為分析,包括群體人數統計,人流密度估計;對單個人員以及群體中個體進行跟蹤;特殊群體和特殊事件檢測等。本文主要針對視頻人數識別這個研究方向,從基于特征點、顏色與形狀信息、模板匹配三種不同類型識別跟蹤方式分析了近些年來國內外的研究工作及最新進展,通過對各種不同識別方法比較,對當前亟需解決的問題做了詳細的分析。

1 人數識別研究現狀

人數統計算法融合了運動物體檢測、行人檢測與分割、形狀分析、特征提取和目標跟蹤等多個領域的技術。從采用的手段來講可以分為直接法和間接法:直接法(或稱基于檢測的),即首先在場景中檢測出每個行人,再計數。第二種稱為間接法(也稱為基于映射或基于度量的),一般是建立場景特征與行人數量的函數關系來測算人數。在行人高度密集的場景中,間接法比直接法更加可靠,主要因為直接法無法有效分割每個行人,特別是在行人高度密集的場景中,從20世紀90年代起到目前為止這近20年里,出現了眾多的視覺跟蹤算法,1988年,Aggarwal和Nanadhakumar對運動圖像分析算法進行了總結,將算法分為兩類,一類是基于光流法的分析,另一類是基于特征點的分析,此后在視覺跟蹤領域中,又出現了許多新的方法,目前,視頻中人數的跟蹤方法大致分為三類,分別是基于區域的跟蹤、基于特征點的跟蹤、基于模板和模型的跟蹤,這種分類方法概括了目前大多數視覺跟蹤算法,因此下面用這種分類方法對視覺跟蹤算法進行介紹。

1.1 基于特征的人數識別

基于特征的人數跟蹤算法選取目標的某個或某些局部特征作為相關時的對象,這種算法的優點在于即使目標的某一部分被遮擋,只要還有一部分特征可以被看到,就可以完成跟蹤任務,另外,這種方法與卡爾曼濾波器聯合使用,也具有很好的跟蹤效果。這種算法的難點是:對某個運動目標,如何確定它的唯一特征集?這也是一個模式識別問題,若采用特征過多,系統效率將降低,且容易產生錯誤,文獻對這一問題進行了討論,在特征提取時,一般采用Canny算子獲得目標的邊緣特征,而采用SUSAN算子獲得目標的角點信息。有關基于特征的跟蹤算法還可參見文獻。在2009年,Albiol使用角點個數作為場景特征來估測人數,首先通過Harris角檢測器檢測出圖像角點,然后進行角點匹配以區分人身上的角點和背景角點,Albiol認為每幀總人數與人身上角點的個數成正比例關系,以此估測人數,算法雖然簡單,但在PETS 2010“人數統計與密度估計”競賽中取得優勝。2010年,Conte等“”基于Albiol的方法提出改進。采用的SURF(Speed up Ro.bust Feature)特征點以代替角點,同時,Conte等不僅考慮到特征點個數對人數估測的影響,還考慮到透視投影(拍攝距離d)密度人群遮掩(特征點密度p)對于估測的影響,同時對所有SURF點進行分組回歸以提高精度,在這個基礎上張茂軍等相比Conte等的研究成果在處理遠距離人群上精度提高,主要因為使用“非最大抑制聚類”——對不同拍攝距離的人群采取不同的聚類標準,有效解決遠距離人群的類過大問題,提取人身上特征點的方法是在掩模上直接檢測特征點,使得特征點個數更加穩定,有利于SVM預測。

1.2 基于區域的人數識別

基于區域的跟蹤算法基本思想是:首先得包含目標的模板(Template),該模板通過圖像分割獲得或是預先人為確定,模板通常為略大于目標的矩形,也可為不規則形狀;然后在序列圖像中,運用相關算法跟蹤目標,對灰度圖像可以采用基于紋理和特征的相關,對彩色圖像還可利用基于顏色的相關。

McKenna等首先利用色彩和梯度信息建立自適應的背景模型,并且利用背景減除方法提取運動區域,有效地消除了影子的影響;然后,跟蹤過程在區域、人、人群三個抽象級別上執行,區域可以合并和分離,而人是由許多身體部分區域在滿足幾何約束的條件下組成的,同時人群又是由單個的人組成的,因此利用區域跟蹤器并結合人的表面顏色模型,在遮擋情況下也能夠較好地完成多人的跟蹤。Marana等認為低密度人群在圖像上體現出粗糙紋理特征,而高密度人群則體現出精細紋理特征。文獻分別采用自組織理論和Minkowsld不規則維度理論從圖像紋理特征預測人群密度。Lin等則結合Harr小波變換(HWT)和支持向量機(SVM)進行行人頭部輪廓檢測,從而達到人數統計的目的。文獻利用顏色和形狀信息實現人頭的檢測,包含兩個步驟:黑色區域提取和形狀分析。通過對HSV空間V通道的像素設置閾值這種方法有效地檢測出黑色區域,同時可以少受光照變化和陰影的影響。使用一種基于形狀描述的快速弧形結構提取方法實現人頭檢測。姬紅兵等提出了一種基于局部特征的目標跟蹤算法,通過多尺度分析方法,根據顏色和空間上的相似性將目標分割為多個區域,每個區域由一個團塊表示,團塊包含了該區域所有像素的顏色均值、形狀和位置,根據團塊特征構造目標的外觀模型,定義團塊的匹配準則,通過團塊匹配進行目標跟蹤。

1.3 基于模板匹配的人數識別

采用模板匹配識別跟蹤方法首先將圖像序列轉換為一組靜態形狀模式然后在識別過程中和預先存儲的行為標本相比較,

部分學者在運動前景提取的基礎上使用了輪廓匹配方法對目標進行定位,文獻使用了半圓模型搜索前景中人頭肩所在位置,然后使用Snake模型與卡爾曼濾波相結合對目標進行跟蹤目標,但Snake模型比較適合單目標的跟蹤,當行人發生重疊時,定位精度會有一定的下降;在此基礎上文獻提出使用含有人harr特征分類器(使用頭肩部上半身樣本),對行人重疊情況下的檢測精度有一定的提升。文獻提出使用垂直攝像頭降低行人之間的遮擋程度,通過對基于AdaBoost的人頭檢測本方法,建立一個良好的人頭檢測分類器。然后根據運動人頭的特征去除誤檢區域。最后配合過線跟蹤實現出入口人數統計。

2 視頻跟蹤問題中的難點

從上面的闡述可以看出,各種方法都有自己的優點和不足,是在文獻基礎上分析得到的幾種具體識別方法的比較結果,由于各種方法在設定理想情況下都有較好的準確率,所以不對各種方法的準確率做出比較,而是從各種算法的復雜度、魯棒性、先驗知識需求、高密度復雜人群適應性(有遮擋出現)等方面進行相對的比較分析,分析結果如表1。

2.1 視覺跟蹤問題中的難點

從控制的觀點來看,視覺跟蹤問題所面臨的主要難點可以歸結為對視覺跟蹤算法在三個方面的要求,即對算法的魯棒性、準確性和快速性。

魯棒性是指視覺跟蹤算法能夠在各種環境條件下實現對運動目標持續穩定的跟蹤。影響人數跟蹤系統魯棒性的最主要原因在于目標處環境的光照變化以及部分遮擋引起的運動目標不規則變形和全部遮擋引起的目標的暫時消失。當運動目標所處環境的光照發生改變時,采用圖像灰度信息或色彩信息作為跟蹤基礎的視覺跟蹤算法一般都會失效,而基于圖像特征的方法往往不受光照改變的影響,如利用運動目標的邊緣信息能有效避免光照變化對運動目標的影響,但在復雜環境中要將運動目標的邊緣和周圍其它目標邊緣區分開來是非常困難的,遮擋問題是視覺跟蹤算法中又一難點問題,利用單攝像機解決遮擋問題也一直是視覺跟蹤領域中的熱點。而利用多攝像機可以在很大程度上解決這一問題,但正如前所述,多攝像機的應用又會引入新的難題。

在視覺跟蹤研究中,準確性包括兩個方面,一是指對運動目標檢測的準確性,另一個是指對運動目標分割的準確性,對運動目標檢測準確性的目的是盡量避免運動目標虛檢和漏檢,從而提高對真實運動目標的檢測概率。由于實際復雜環境中存在大量噪聲。至今已經出現了上千種各種類型的分割算法,但由于尚無通用的分割理論,目前并沒有一種適合于所有圖像的通用分割算法。

一個實用的視覺跟蹤系統必須能夠實現對運動目標的實時跟蹤,這就要求視覺跟蹤算法必須具有快速性但是,視覺跟蹤算法處理的對象是包含巨大數據量的圖像,這些算法往往需要大量的運算時間,很難達到實時處理的要求,通常,簡單算法能夠實現實時跟蹤,但跟蹤精度卻很差;復雜算法具有很高的跟蹤精度,實時性卻很差,一種通用的減小視覺跟蹤算法運算量的方法是利用金字塔分解或小波變換將圖像分層處理。

3 展望與結束語

3.1 展望

實現一個具有魯棒性、準確性和快速性的視覺跟蹤系統是當前視覺跟蹤技術努力的方向。但視覺跟蹤技術在這幾個方面中每前進一步都是非常困難的,因為該技術的發展與人的感知特性的研究緊密聯系在一起,由于目前對人的感知特性沒有一個主流的理論,其數學模型更是難以建立。同時,在計算機視覺中大多數問題是不確定的,這就更增加了視覺跟蹤技術發展的難度。但是,近幾十年來,數學理論方面取得了巨大的進步,因此合理的使用在數學理論方面的知識提高系統的性能能夠很好的解決視覺跟蹤問題。例如現在已經應用在諸多領域的模糊算法,神經網絡等提高系統性能,簡化計算復雜度。

3.2 結束語

篇8

關鍵詞:圖像分割;閾值分割;Otsu算法

中圖分類號:TP312

在圖像處理、模式識別和計算機視覺領域,圖像分割對于許多圖像分析和處理的任務來說是一個基石。因為人們往往僅對圖像中的某些部分感興趣,所以希望將這些相關區域分離并提取出來以進行進一步的應用,如進行特征提取和測量。圖像分割是解決此類問題的方法。圖像分割是把圖像分成各具特征的區域并提取出感興趣目標的技術和過程。圖像分割技術是一項計算機領域里的經典的研究課題,計算機視覺中的圖像理解包括目標檢測、特征提取和目標識別等,都依賴圖像分割的質量。

因為分割質量的好壞將直接影響圖像處理的后續工作的進行,所以對圖像分割的研究一直是圖像技術研究中的熱點和難點之一。到目前為止已經出現了許多圖像分割技術,如:基于閾值的分割方法、基于區域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等。其中閾值分割算法是應用在圖像分割領域的最流行的技術。閾值分割是最早提出的圖像分割方法之一,具有簡單、快速的優點。閾值分割算法的基本思想是通過處于圖像灰度取值范圍之中的灰度閾值將圖像劃分成不同的區域,從而達到分割的目的,其中最常見的一種方法,是將圖像劃分為兩部分,即前景和背景。閾值分割的關鍵是閾值的選取。閾值分割算法具有悠久的歷史,并廣泛應用于圖像分析與目標識別等方面。常用的閾值分割算法有最小誤差法、最大類間方差法、P-tile法、雙峰法、灰度直方圖凹度分析法、最大熵法與Otsu方法等。

在這些閾值分割算法中,Otsu法是最流行的方法之一。由于Otsu法擁有計算簡單、實時性高、魯棒性強等優點,所以被廣泛使用。Otsu法是由日本人大津首先提出的,也稱“大津閾值法”或“最大類間方差法”。該方法是基于圖像中前景和背景兩類別的可分離性提出的。在一些免費的或是商業的軟件上,如GIMP或是MATLAB,都采用Otsu法來進行圖像的自動閾值分割。在圖像閾值分割中,確定最佳的閾值t*往往是基于估計的位置和散度。像其他的方法一樣,Otsu方法采用取樣的方式和樣本分布的偏差來估計位置和散度。然而,如果這些圖像的分布是非常傾斜的或是有異常數據等情況出現時,Otsu分割算法提供的結果通常不令人滿意。為了解決這一問題,我們提出了一種基于中值的Otsu分割方法,并且它與原來的Otsu方法相比可以得到非常令人滿意的結果。

假設在灰度值為L的灰度圖像中,灰度值為i的像素個數用ni表示,總的像素個數用n表示;pi表示灰度圖像中灰度值i出現的頻率,則pi=ni/n。將圖像中的像素按灰度值用閾值t分成兩類,設為C0和C1,其中C0={0,1,…,t},C1={t+1,t+2,…,L-1}。

則這兩類像素出現的概率分別是:

ω0= pi= ω(t),ω1= pi=1- ω(t)

這兩類像素出現的均值分別是:

μ0= i = ,μ1= i =

圖像總均值表示為:

而且我們可以發現:

設ω0和ω1代表前景和背景的概率。μ0,μ1,μT表示前景,背景和整個圖像的灰度值的平均值。設表示兩類的類間方差,則

最終,最佳閾值t*為

傳統的二維Otsu法是通過均值來確定最佳閾值,對于那些直方圖呈雙峰分布的圖像,該算法具有十分優秀的分割效果。然而,因為均值的魯棒性較差,若直方圖是單峰的或是接近單峰的時候,亦或是有異常數據時會失敗。

我們知道,當直方圖的分布是傾斜的,或當有異常數據等情況出現時,中值比均值具有更強的魯棒性。所以我們用中值來代替原式中的均值,以嘗試獲得更好的閾值和分割結果。

原式中的μ0,μ1,μT可以被中值m0,m1,mT所替代,于是在C0和C1的類間方差可以重寫為

最優的閾值t*為

在驗證本文的實驗中,傳統的Otsu方法和我們改進的Otsu方法都在Visual C++ 2008軟件上進行測試,應用的計算機的CPU型號是AMD Athlon 7750 Dual-Core 2.7GHz,內存是2G RAM,系統是Windows XP platform。通過實驗我們可以發現改進的Otsu方法得到的閾值分割的結果是令人滿意的,而傳統的Otsu方法得到的閾值分割的結果并不理想。

結論:在本文中,我們提出了一種基于中值的Otsu圖像閾值分割算法。傳統的二維Otsu方法對于雙峰分布的直方圖提供了令人滿意的結果,但是,如果直方圖是單峰的或是接近單峰時所得到的結果并不理想。我們知道,當直方圖的分布是傾斜的,或當有異常數據等情況出現時,中值比均值具有更強的魯棒性。在這樣的情況下,我們用中值取代均值來進行背景和前景以及整個圖像的Otsu法分割。與原來的Otsu方法相比,這種方法提供了更優的閾值和令人滿意的閾值分割的結果。

參考文獻:

[1]W Niblack.An Introduction to Digital Image Processing[M].Prentice Hall,Englewood Cliffs,NJ,1986:115-116.

[2]J Sauvola and M Pietikainen.Adaptive Document Image Binarization[J].Pattern Recognition,2000,33(2):225-236.

[3]B Gatos,I Pratikakis and S J Perantonis.Adaptive Degraded Document Image Binarization[J].Pattern Recognition,2006,39(3):317-327.

[4]F Moghaddam and M Cheriet.A Multi-scale Framework for Adaptive Binarization of Degraded Document Images[J].Pattern Recognition,2010,43(6):2186-2198.

[5]C H Chou,W H Lin and F Chang.A Binarization Method with Learning-build Rules for Document Images Produced by Cameras[J].Pattern Recognition,2010,43(4):1518-1530.

[6]Y T Pai,Y F Chang and S J Ruan.Adaptive Thresholding Algorithm:Efficient Computation Technique Based on Intelligent Block Detection for Degraded Document Images[J].Pattern Recognition,2010,43(9):3177-3187.

[7]Chierr Hsing.Chou,Werr Hsiung Lin,Fu Chang.A binarization method with learning build rules for document images produced by cameras[J].Pattern Recognition,2010,43(4):1508-1530.

篇9

關鍵詞:SIFT;相似性度量;圖像匹配

引言

在計算機視覺領域,圖像匹配仍然是當前研究的熱點問題。基于特征的匹配方法[1],因為根據圖像中趨于穩定的少量特征進行匹配,使得運算速度快、匹配效果好,所以成為目前研究最多、應用最廣泛的一種方法。但是,這種方法需要在圖像間進行遍歷性的匹配運算,存在計算量大,且精度不高的問題。

1999年,Lowe提出了SIFT(Scale Invariant Feature Transform)算法[2],該算法利用高斯差分在圖像的多尺度空間中快速求解高斯拉普拉斯空間中的極值點,加快了特征提取的速度,提取的SIFT特征對于圖像平移、縮放、旋轉具有不變性,并且對于仿射變換、視覺變化、光照變化有較強的穩定性和很好的匹配魯棒性,所以被廣泛應用于計算機視覺的圖像匹配、圖像檢索和模式識別等方面[3,5]。雖然SIFT 算法具有上述的優點,但該算法首先要將彩色圖像灰度化,僅利用圖像的灰度信息和特征點的局部鄰域信息,忽略了圖像的顏色信息,導致不能識別圖像內具有相似結構的特征點。

文章提出基于SIFT的多特征相似性度量算法,首先對彩色壁畫圖像提取SIFT特征點與特征向量,然后對每個特征點提取HSI彩色特征,最后按定義的相似性度量公式計算兩個特征點之間的距離,確定二者是否匹配。

1 特征提取

1.1 SIFT特征提取

尺度空間極值點的檢測采用DOG方法,將一個像素點與它相鄰的26個點相比較,如果是最大值或最小值,就作為圖像中的一個特征點。以特征點為中心,在16×16的鄰域內,將采樣點與特征點的相對方向通過高斯加權后,分別歸入8個方向的梯度方向直方圖,最后獲得4×4×8的128維特征向量來描述一個SIFT特征點。

SIFT算法的兩個關鍵步驟是關鍵點檢測和關鍵點描述。在關鍵點檢測階段,大多是利用兩種不同的方法,即尺度不變檢測和致密采樣。文章采用致密采樣進行特征檢測,理由如下。一方面,尺度不變檢測器在描繪均勻信息時是低效的,而壁畫圖像中包含著這樣的信息。另一方面,在特征匹配時,通過致密采樣得到的關鍵點優于隨機抽樣和尺度不變的探測器[6]。

SIFT算法首先將彩色圖像灰度化,提取的特征關注圖像的梯度信息,忽視了圖像的彩色信息。文章對彩色圖像提取特征,實驗發現圖像的誤匹配點中,存在著彩色信息不一致的問題。因此,文章對圖像既提取SIFT特征,又提取顏色特征,對多特征融合設計相似性度量方案,可以減少誤匹配率,提高匹配效果。

1.2 顏色特征提取

為了解決誤匹配中存在的SIFT梯度信息一致,彩色信息不一致的問題,我們在對特征點提取SIFT特征后,再次提取其顏色特征。由于RGB顏色模型只考慮圖像的亮度信息,而HSI顏色模型全面考慮圖像的亮度和顏色信息,因而在開發基于彩色描述的圖像處理算法中,HSI模型更為有用[7],文章提取HSI彩色特征。

HSI顏色模型中,H表示色調,指的是人的感官對不同顏色的感受,描述純色的屬性;S表示飽和度,描述的是顏色的純度;I表示強度,描述的是顏色的明亮程度。

常用的最近鄰方法原理是,對于基準圖像中的每個特征點,在待匹配圖像中尋找距離最近的特征點,然后形成一組匹配對。因為最近鄰獲得的匹配對中存在大量的誤匹配,所以Lowe在論文[8]中對于基準圖像中的每個特征點,在待匹配圖像中尋找距離最近和次近的兩個特征點,當這兩個距離的比值小于預設的閾值時,才認為找到了一組正確的匹配對,這樣消除了大量的誤匹配,取得了不錯的匹配效果。文章設閾值為thr,且0

3 實驗結果及分析

為了觀察算法性能,我們從互聯網上尋找了兩張有重疊部分的壁畫圖片進行了實驗。圖像如圖1所示。采用Matlab7.7.0編程,運行在AMD A6-3400M CPU 1.4GHZ和4G內存的PC機上,Windows 7.0操作系統。

實驗首先尋找圖像的SIFT特征點,然后提取特征點的SIFT特征和HSI特征,再對圖1a和圖1b按公式(9)進行相似性度量,再分別用歐式距離和卡方距離作為相似性度量,并且thr分別選用0.5,0.6,0.7,0.8進行特征對提純。結果表明,匹配過程在使用同樣的閾值時,三種相似性度量方法中,所得到的匹配正確率相同,而匹配時間不同,按公式(9)計算的距離稍快一些。隨著thr值的增大,所得匹配對數減少,當thr取值為0.6時,具有較好的匹配結果。圖2為thr取值為0.6時的匹配結果。

另外,實驗同時表明,對于圖像分別提取SIFT特征和HSI特征,如果僅按SIFT特征或HSI特征計算相似性,所得到的匹配正確率都低于兩個特征按公式(9)計算相似性的情況。

因此,對圖像提取SIFT特征和HSI特征,按我們定義的相似性度量計算方法,確實提高了圖像匹配的效率。

4 結束語

文章采用的算法對彩色壁畫圖像同時提取SIFT特征和HIS彩色特征,有效地去除了梯度信息一致而彩色信息不一致產生的誤匹配。通過定義的相似性度量公式,在計算兩個特征點之間是否匹配時,速度更快一些。由于SIFT 算法計算量大,算法復雜,提高圖像匹配的實時性,將是下一步的研究工作。

參考文獻

[1]ZHU Q,WU B,XU Z.Seed point selection method for triangle constrained image matching propagation[J].IEEE Geoscience and Remote Sensing Letters,2006,3(2):207-211.

[2]LOWE D G.Object recognition from local scale-invariant feature[C]// Proc.the Seventh IEEE International Conference on Computer Vision.Corfu,Greece: IEEE Press,1999:1150-1157.

[3]張書真,宋海龍,向曉燕,等.采用快速SIFT算法實現目標識別[J].計算機系統應用,2010,19(6):82-85.

[4]王瑞瑞,馬建文,陳雪.多傳感器影像配準中基于虛擬匹配窗口的SIFT算法[J].武漢大學學報(信息科學版),2011,36(2):163-166.

[5]鐘金琴,檀結慶,李瑩瑩,等.基于二階矩的SIFT特征匹配算法[J].計算機應用,2011,31(1):29-32.

[6]K.Mikolajczyk,C.Schmid. A performance evaluation of local descriptors [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(10):1615-1630.

[7]何川.高壓輸電線路視頻監控技術研究[D].北京:北京交通大學,2012.

篇10

關鍵詞:機器人視覺;攝像機自標定;三維重建;零空間投影;RQ分解

中圖分類號:TP242.6+2文獻標識碼:A文章編號:1009-3044(2008)17-21529-04

三維形狀重建是計算機視覺中的最重要任務之一[1-2]。從已標定的單視圖或多視圖重建目標三維形狀已相對成熟[1-5],但是,從未標定的單視圖或多視圖重建三維形狀仍是一個值得研究的課題。此時,必須在線完成攝像機自標定。攝像機自標定首先由Hartley[6]和Faurgeras[7]在1992年提出。從此它成為計算機視覺界的一個熱門課題。線性自標定[8-12]因簡單有效而成為流行技術。但它對視圖個數和歷經的三維運動往往有較多的限制,影響了其應用范圍。另外,當模型形狀先驗已知時,如何有效地充分利用該先驗信息提高自標定和三維重建的速度和精度,仍是一個有待回答的問題。本文基于零空間投影和RQ分解,開發從目標單視圖或多視圖同時完成攝像機自標定和目標三維重建的線性算法,該算法原則上對歷經的三維運動沒有限制,算法也較簡捷。實驗演示了噪聲強度、點數和幀數對算法性能的影響。理論分析和實驗數據表明,該算法具有快速高效、簡單實用、抗噪能力較強的優點。

1 理論分析

1.1 成像模型

假設攝像機成像服從針孔成像的透視投影模型,則第i幀(i=1,2,...,q, q為幀數)的第j個(j=1,2,...,N,N為點數)三維點Xi,j在攝像機坐標系中的坐標Pi,j及相應的數字坐標Pi,j(d)與其二維像點的模擬齊次坐標mi,j=[xi,j yi,j l]T(上標T標記轉置運算)及相應的數字齊次坐標mi,j(d)=[xi,j(d) yi,j(d) l]T服從透視投影公式

(1)

其中,深度Zi,j是Pi,j的第3分量,攝像機內參數矩陣

這兒,(xc,yc) 是圖像主點,(fx,fy)是圖像水平軸和垂直軸的尺度因子, s是畸變因子。實際上,該內參數矩陣完成以象素計的數字坐標系與以攝像機焦長f計的圖像坐標系之間的轉換,即

mi,j(d)=Kmi,j (3)

1.2 三維幾何變換和單應性變換

假設從目標從模型到第i幀圖像歷經了三維運動(Ri,Ti) ,其中,Ri為三維旋轉矩陣,Ti為三維平移矢量,則三維點Xi,j的模型位置Pj(0)與其第i幀位置Pi,j滿足三維幾何變換

1.7 討論

顯然,該算法有解且有唯一解的條件是:3(N-3)×N維矩陣Ai的秩等于N-1,考慮到中心化算子P1N是個正交投影算子,它具有降秩1的功能,因此條件變成3(N-4)≥N-1即點數N≥6。這意味著該線性算法至少要6個特征點。節2的實驗表明,N<6時無唯一解和N≥6時有解且有唯一解。另外,點數的增多確實可改進算法性能。

經過比較,不難發現,新算法有五個鮮明的特點。

(1)現有算法往往有8點以上的要求,而新算法的需要點數已達到最小值6。因為5個內參數加上6個三維運動參數有11個自由度,而每個點僅能提供2個自由度。

(2)現有算法往往不能有效地利用先驗模型信息,而新算法能有效地充分利用先驗已知的模型形狀陣信息。這對提高算法性能具有顯著作用。

(3)現有算法往往在自標定之后才完成深度矢量估計,新算法卻是在在自標定之前完成深度矢量估計。這有利于提高深度復原的精度,對重視深度復原的應用場合尤其重要。

(4)現有算法往往對歷經的三維運動有限制,新算法無任何限制。

(5)現有算法往往只能用于多視圖情況,不能用于單視圖情況;而新算法既能用于多視圖情況,也能用于單視圖情況,只需令上述算法中的幀數q=1 即可并未單視圖情況的線性算法。

2 實驗

2.1 實驗步驟

為了定量分析算法的統計性能,用計算機仿真數據進行了蒙特卡洛實驗、每次實驗對仿真生成的多視圖特征點集組成的數據運行所開發的算法,并計算各種誤差性能;然后,用100次實驗的誤差性能的平均值作為相應的誤差性能的數學期望值。

算法輸入數據的生成過程是:首先,用N個均勻分布于立方體{ (-2, 2), (-2, 2), (1, 2) }內三維數據集合組成三維點集,該點集經q個由三維旋轉和三維平移構成的幾何變換生成q幀三維點集,再經透視投影后得到多視圖特征點集的模擬齊次坐標集合,它們用攝像機內參數陣變換后,舍入取整生成相應的多視圖特征點集的數字齊次坐標集合。該集合就是算法的輸入數據。

為考察算法抗噪能力,輸入數據必須加入強度可控的噪聲,考慮到數字坐標已整數化,不宜加噪,我們用每維均勻分布于[-Am, Am]且互相獨立的二維噪聲疊加到多視圖特征點集的二維模擬坐標上,其中,強度Am可程控然后用攝像機內參數陣變換后,舍入取整生成相應的多視圖特征點集的數字齊次坐標集合,其中,強度Am由運行程序控制,它從0.001逐步增加到0.032。多視圖的圖像尺寸是1024×1024。

算法精度用所有估計項目的以百分比計的相對誤差衡量。例如,用||ΔK||/||K||的統計平均值總體度量自標定誤差,其中, ΔK=K-K,K是設定的內參數陣,K是內參數陣K的估計,矩陣范數采用Frobenius范數,矢量范數采用歐幾里得范數。其它各項誤差類似地定義,但是,三維運動要在取幀平均后再取統計平均,建模要在取點平均后再取統計平均,形狀重建要在取點平均和幀平均后再取統計平均。

2.2 單視圖實驗結果

表1示出了單視圖情況下、當點數N=6時,噪聲強度Am對算法性能的影響。可見,即使算法僅使用6點,仍能在所有加噪情況中,三維運動重建和三維形狀重建的相對誤差都小于5.93%, 而在中小強度(不超過0.0012)噪聲情況時,相對誤差都不大于1.50%以下。

表3示出了多視圖情況下,當幀數q=6和點數N=24時,噪聲強度Am對算法性能的影響。可以看出,在所有加噪情況中,攝像機內參數自標定的相對誤差都不大于0.17%,三維重建相對誤差都小于0.17%,而在中小強度(不超過0.0012)噪聲情況時,自標定相對誤差不大于0.06%,三維重建相對誤差都不大于0.29%。

3 結束語和展望

通過對中心化模型形狀陣的RQ分解得到其零空間的標準正交基,然后把中心化后的從模型形狀陣到多視圖數據陣的單應性變換方程投影到該零空間,建立了一個精確求解多幀深度矢量集合的方法,然后用中心化單應性變換方程求取多幀單應性矩陣的最小二乘最小范數估計,最后用RQ分解計算攝像機內參數陣和多幀三維旋轉矩陣,并進而完成目標三維重建。這樣,通過充分利用包含于先驗已知的模型形狀陣和后驗提供的多幀數據陣中的所有信息,開發了一個能同時完成攝像機自標定和目標三維重建的線性算法。

該算法不同于已有線性算法的五個鮮明特點是:1)所需點數達到了可能的最小值6;2)能很有效地利用寶貴的先驗模型信息;3)在自標定之前完成深度矢量估計;4)對歷經的三維運動沒有限制;5)既能用于多視圖情況也能用于單視圖情況。

可以預期,使用零空間投影技術也能推廣應用于模型形狀陣未知時的多視圖自標定和三維重建。該算法正在研究開發中,將另行著文討論。

參考文獻:

[1] 馬頌德,張正友.計算機視覺計算理論與算法基礎[M].科學出版社,1998.

[2] 章毓晉.圖像理解與計算機視覺[M].清華大學出版社,2000.

[3] Oliensis, J., A Multi-frame structure from motion algorithm under perspective projection[C].IEEE Workshop on Perception for Mobile Agents, 1998, pp. 49-577.

[4] Thomas, J. I. and Oliensis J., Dealing with noise in multiframe structure from motion[J], CVIU 76, 1999, pp. 109-124.

[5] Chiuso, A., Brockett, R. and Soatto S., Optimal structure from motion: local ambiguities and global estimates[J], IJCV 39(3), 2000, 195-228.

[6] Hartley, R., Estimation of relative camera positions for uncalibrated camera[C], In: Proc. European Conference on Computer Vision, NLCS 588, Springer-Verlag, 1992, 579~587

[7] Faurgeras, O. D., What can be seen in three dimensions with an uncalibrated stereo rig[C], In: Proc. European Conference on Computer Vision, NLCS 588, Springer-Verlag, 1992, 563~578

[8] 吳朝福,胡占義.攝象機自標定的理論與算法[J].計算機學報,2001, 24(11):1121~1135.

[9] 吳朝福,胡占義.線性確定無窮遠平面的單應性矩陣和攝象機自標定[J].自動化學報,2003,28(4):488~496.

[10] Yang, Z. -G., Ren, L., SVD-based camera self-calibration and 3-D reconstruction from single-view[C],’ Proceedings of 2004 International Conference on Machine Learning and Cybernetics, Vol. 7 of 7, 4090-4095, Aug. 2004.

[11] Yang, Z. -G., Ren, L., A new algorithm for linearly reconstructing the infinite homography matrix and intrincic parameter matrix of a camera[C], 7th International Conference on Signal Processing Proceedings, Vol. II of III, 1247-1251, Aug. 2004.