計算機視覺發展范文

時間:2023-12-19 18:03:55

導語:如何才能寫好一篇計算機視覺發展,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

計算機視覺發展

篇1

關鍵詞:航空運輸;協同決策;多航站樓;實時指派;混合集合規劃;航班波

中圖分類號:U8

文獻標志碼:A

文章編號:1005-2615(2015)01-0071-06

隨著民航運輸的飛速發展,運輸量的快速增長,多航站樓多區域管理已經成為民航發展的一種趨勢,然而這將使得機場運行保障變的更加復雜。機位是機場的核心資源,機位分配是機場日常運行保障中的一個非常重要的工作。高效合理的機位分配方案不僅會給民航運輸帶來巨大的經濟效益,并且在一定程度上可以提高民航運輸的安全性。在機場停機位實時指派的問題上,國內外學者已經進行了很多模型與算法的相關研究。從已有研究來看,在機位實時指派算法中,仍需綜合考慮多航站樓模式、航班波、協同決策、時隙交換公平性以及這4個因素的影響。

由于運輸量增長,許多大型機場都通過擴容的方式來滿足需求。其中.航站樓的改擴建使得一個機場多個航站樓的運行模式應運而生。在多航站樓運行中,有很多公共的資源需要共享,如機位、跑道等外場資源;旅客由于轉機等原因需要在多個航站樓之間活動;飛機也可能因為調配原因而從一個航站樓轉移到另外一個航站樓。因此,機場的運行調度算法必須能夠滿足以上種種運行上的需求。在多航站樓運行模式下進行資源分配時,必須充分考慮各種資源之間的聯動關系才能做到協調運行。此時.值得注意的是應當將航站樓作為資源分配的一個基本判斷依據。首先判斷航班機位是否在不同航站樓之間調整,然后根據預先設定的各種規則再進行其他資源的變更,這樣才能使系統的處理邏輯相對清晰和簡單。

為滿足日益增長的航空運輸需求,航空公司紛紛考慮以航班波的方式進行排班。相應地,樞紐機場針對航班波進行各項航班保障工作,其中就包括停機位的指派。航班波是指,為實現航班有效銜接,在一個時段安排進港航班,在緊接著的另一個時段安排出港航班。當航班波不受延誤影響時,機場資源可以得到高效利用,旅客的中轉等待時間大大縮短。但是,如果航班波受到延誤航班的影響.旅客的中轉時間會大幅度上升。要使航班不受或盡量少受延誤航班的影響,則需要實現機場、航空公司和空管的協同決策。然而,目前機場、空管和航空公司大多單獨完成各自任務,沒有達到協同決策的要求。

在實現航空公司與機場的協同決策時,需要考慮到時隙分配和機位指派的先后關系以及相互影響。當航班延誤之后,航班所獲得的時隙將會改變.但在航空公司不知道后續機位指派方案的前提下.無法判斷延誤航班獲得的時隙方案所對應的最佳機位指派方案是否為所有可能的機位指派方案(時隙交換后)中延誤成本最小的。因此,航空公司需要與機場進行協同決策。首先由航空公司給出不同時隙方案,機場給出不同時隙方案下機位指派的延誤成本,根據最小延誤成本確定最佳時隙交換方案,再將該方案告知航空公司。然而,在總的延誤成本最小時還需考慮航空公司間的利益均衡,所以在進行時隙交換時,還要考慮航空公司問的利益均衡性.進行公平的時隙交換。

本文在協同決策的基礎上綜合多航站樓資源共享性、航班波延誤最小化、時隙交換公平性等因素,建立機場停機位實時指派模型,并在混合集合規劃中實現模型的求解。

l 機位實時分配模型

1.1 模型符號

2 求解方法

混合集介規劃( Mixed set programming,MSP)源自邏輯規劃與約束規劃,是以一階邏輯與集合推理為算法框架的邏輯求解系統。MSP能夠將集合運算、量詞、布爾邏輯、邏輯函數、日期/時間推理、數值約束等集成于一個系統,實現從實數、整數等數值類型擴充到布爾值、日期/時間集合類型的混合域上的全局推理,以及約束滿足問題的建模與求解。此處,集合規劃的概念并非指在問題求解中對集合運算符號、集合變量及集合約束的簡單使用,而是系統地將集合推理與運籌學算法相結合,以集合變量為主進行問題建模,以基于集合推理的算法為核心進行模型求解。本文采用MSP方法求解下列算法。

2.2 停機位實時分配

步驟1 讀取航班的機位預分配結果,航班對應的機位預分配信息,得到每個機位的可利用時間段。從時隙分配方案中得劍航班的時隙分配結果,包括帶有航班波銜接的延誤航班和沒仃航班波銜接的延誤航班。

步驟2對于沒有航班波銜接的延誤航班,根據航站樓{ at1,…,atn}分n次循環。將沒有航班波銜接的延誤航班根據最小延誤費用原則和航站樓資源共享原則進行停機位分配。

步驟3 對于有航班波銜接的航班,考慮時隙公平交換的原則,根據不同的航站樓{ at1,…,atn}分n次循環.得到每個航站樓的延誤航班時隙交換集合。根據有航班波銜接的航班和有時隙交換的延誤航班.得到沒有時隙交換的延誤航班集合。根據最小延誤費用原則和航站樓資源共享原則進行停機位分配。

步驟4 將步驟2.3的結果根據不同的航站樓進行綜合,得到最終的各個航站樓的停機位分配。

在求解策略的設計中,將精確算法和啟發式規則有機地結合在一起,既確保解的可行性,又靈活、個性化地控制搜索過程。啟發式規則為:

(1)假設延誤航班計劃所屬航班波為ωp,則其分配時隙所屬的航班波必須大于等于ωp。

(2)航空公司進行時隙互換時,延誤航班所處的航班波的數值應盡量相同。

(3)航班的停機位在不同航站樓之間調整要滿足以下條件:

①不能是有航班波銜接的航班;

②調整后該航班產生的油耗費用不能大于該航班所屬機型的平均油耗;

③調整后該航班的到達停機位時間不能大于該航班所屬機型的平均滑行時間;

④調整后各航空公司的時隙交換滿足公平性原則。

將上述兩個算法的求解規則,結合不同的α,β值和約束條件.同時植入深度優先搜索算法中,一體化搜索確定延誤航班的時隙分配集合與停機位指派集合.從而優化延誤航班的時隙分配并最終確定滿足多目標的停機位指派方案。

3 實例分析

3.1 實驗數據

大型機場的航站樓比較龐大,分區也較為復雜.因此本文選取兩個航站樓內4個區域9:00~11:00內到達的航班及機位分配情況進行優化,其中區域1和2屬于一個航站樓,區域3和4屬于另一航站樓:小、中、大機型分別用l,2,3表示;國航、東航、南航、海航分別用C.E.S,D表示。最小安全時問間隔T=5 min;旅客中轉等待成本:1元/ min;飛機的油耗成本:7元/kg。飛機油耗:大型飛機46 kg/min,中型28 kg,/min.小型12 kg/min。航班信息見表1,各個區域的機位信息見表

2,延誤信息見表3。

3.2 實驗結果及分析

執行本文算法,根據時隙交換的優先級高于滑行油耗的原則,進行多次運算后,得到α=0.55,β=0.45。在滿足時隙交換公平性的條件下,得到時隙交換結果如表4所示。

在不同的限定條件下,得到機位實時指派方案如表5所示,其中,初始方案表示航班尚未延誤的機位初始分配方案;優化1方案表示航班延誤后,進行合理的時隙交換但航站樓之間與航站樓符各區域之間的機位資源不共享時產生的機位指派方案;優化2方案表示航班延誤后,進行合理的時隙交換且航站樓之間與航站樓各區域之間的機位資源可其享時產生的機位指派方案;優化3方案表示航班延誤后,不進行時隙交換但航站樓之間與航站樓各區域之間的機位資源可共享時產生的機位指派方案。

初始方案中,滑行油耗為7 324 kg,旅客中轉等待時間為369 600 min,因此,總成本為420 868元。優化1方案中,滑行油耗為7 342 kg,旅客中轉等待時間為414 400 min,因此總成本為465 794元。優化2方案中,滑行油耗為6 736 kg,旅客中轉等待時間為414 400 min,因此總成本為461 552元。優化3方案中,滑行油耗為6 844 kg,旅客中轉等待時間為478 000 min,因此總成本為525 908元。各部分成本變化情況如圖1所示。

對比優化方案1與優化方案2 可知,當資源共享時,飛機的滑油成本可以大幅度減小,從而降低最終的總成本。對比優化方案2和優化方案3可知,當時隙可交換時,旅客的中轉等待時間可以大幅度減小,從而控制最終總成本。結果顯示,本文提出的算法在實現了資源共享的同時也實現了時隙的有效交換,達到了控制延誤成本的目標。

篇2

關鍵詞:計算機;視覺技術;應用;分析

中圖分類號:TP37 文獻標識碼:A 文章編號:1009-3044(2016)03-0242-02

計算機人工智能技術中的一項重要技術就是計算機視覺技術,這種技術主要是讓計算機利用圖像來實現認知環境信息的目的,這一目的的實現需要用到多種高尖端技術。近年來隨著計算機技術以及計算機網絡的普及與發展,計算機視覺技術也得到了較快發展,并且在實際生產與生活中的應用也越來越廣泛。

1 計算機視覺技術概述

1.1 基本概念

計算機視覺技術主要研究計算機認知能力的一門技術,其具體主要是通過用攝像機代替人的眼睛,用電腦代替人的大腦,最終使計算機具備類似于人類的識別、判斷以及記憶目標的功能,代替人類進行部分生產作業。人們目前研究的人工智能技術中的一項重要內容就是計算機視覺技術,通過研究計算機視覺技術可以讓計算機擁有利用二維圖像認知三維環境的功能。總的來說,計算機視覺技術是在圖像與信號處理技術、概率分析統計、網絡神經技術以及信息處理技術的基礎上,利用計算機來分析、處理視覺信息的技術,它是現代社會新興起的一門高新技術。

1.2 工作原理

在亮度滿足要求的情況下,首先使用攝像機對具體事物的圖像信息進行采集,利用網絡把采集到的圖像信息向計算機內部輸送,然后在計算機系統內部處理加工圖像信息會把事物的原始圖像得到,隨后利用圖像處理技術進一步處理原始圖像,獲得優化質量效果之后的圖像,分類與整理圖像中有特征價值的信息,通過智能識別技術識別與描述提取到的圖像信息特征,最后把得到的高層次的抽象信息存儲起來,在進行識別事務時分析對比這些儲存信息就可以實現事物的識別,這樣視覺系統的基本任務也就完成了。其具體視覺系統如圖1所示:

1.3理論框架

人類研究視覺技術雖然起步比較早,但取得較大進步是在20世紀80年代初伴隨著視覺計算理論的出現。它的出現把研究視覺理論的策略問題解決了,視覺技術是一項特別復雜的信息處理過程,要想對視覺的本質準確完整的理解,必須從不同角度與層次研究與分析視覺本質。視覺計算理論研究層次大致可分為:計算機理論、算法以及實際執行。站在計算機理論的角度分析視覺技術,我們可知必須用要素圖、維圖、以及三維模型表像來描述視覺信息。

所以,可以把計算機視覺技術當做從三維環境圖像中抽取、描述與解釋信息的過程,其主要分析步驟可分為感覺、處理、描述、識別、解釋等。若依據上述各過程實現需用到的方法與技術的復雜性劃分層次,可大致把計算機視覺技術劃分為:低層視覺處理、中層視覺處理、高層視覺處理三個層次。

2 計算機視覺技術在自動化中的應用

2.1 農業自動化中計算機視覺技術的應用

在農業自動化中應用計算機視覺技術可以全天候實時監測農作物的生長狀況,便于科學管理農作物。還可以應用計算機視覺技術來檢測農產品的質量,例如可以應用計算機監測技術來監測大多數蔬菜的質量,傳統的人工檢測蔬菜質量的方法,不僅費時費力,而且檢測結果的準確性也不能很好的保證,在實際人工檢測過程中還容易傷害蔬菜,可以通過利用計算機視覺技術來感應蔬菜自身釋放的紅外線、紫外線以及其他可見光的能量大小,然后和質量達標蔬菜的光線能量大小進行對比,根據這些對比結果可以把蔬菜質量的好壞準確判斷出來,在蔬菜質量檢測過程中應用計算機視覺技術,把傳統的蔬菜檢測方法完全顛覆了,極大的方便了農產品的質量檢測,由此可見,計算機視覺技術在農業生產中有很高的使用與推廣價值。

2.2 在工業自動化中計算機視覺技術的應用

計算機視覺技術在工業自動化應用的一個重要領域就是可以精密測量零件尺寸,其測量與被測對象的原理如圖2所示。

光學系統、計算機處理系統以及CCD攝像頭,是計算機檢測系統的主要組成,被測物體由光源發出的平行光束進行照射,利用顯微光學鏡把待檢測部位的輪廓圖像呈現在攝像機的面陣CCD上,然后再通過計算機處理這些圖像,進而把被測部位的輪廓位置信息獲取下來,若被測對象是出現位移時,可通過兩次重復測量,利用兩次測量的位置差就可以得出,被測物體的位移量。

此外計算機視覺技術還可以應用于逆向工程中,應用3D數字化測量儀可以快速準確的測出現有工件輪廓的坐標值,同時還能構建曲面,保存成CAD或CAM圖像,把這些圖像送入CNC制作中心加工,便可制作出產品,這也就是所謂的逆向工程。由上述分析我們可知逆向工程要想實現,最關鍵的一環就是如何通過精密測量系統來測量樣品的三圍尺寸,獲得各部位數據,進而做曲面處理進而加工生產。對于這一難題我可以通過利用線結構光測量物體表面輪廓技術來實現,器具體輪廓結構示意圖如下圖3所示。

這種測量方法的工作原理為:利用激光穿越平行、等距的振幅光柵組件,或直接采用干涉儀發出的干涉條紋,形成平面條紋結構光,再向物體表面投射,由于物體各表面的深度與曲率的不同,條紋會自動出現變化,然后再通過使用CCD攝像機對變形條紋進行拍攝。這樣就可以把物體表面輪廓的變化情況分析出來。攝像機在拍攝圖像的過程中,把圖像信號轉化為模擬信號,再轉化為數字信號,然后經過傳送再還原信號到圖形處理系統,就得到三維輪廓圖像。

在工業自動化中計算機視覺技術的深入廣泛應用,不但使工業產品的生產質量得到了保障,而且跨越式的提高了工業產品的生產速度。如計算機視覺技術可以很好的檢測產品包裝質量,封口質量以及印刷質量等等,如我國重點指定的印刷造幣機器的南京造幣廠,由于貨幣制造印刷是由印刷造幣機器來實現的,所以要嚴格要求其生產工藝,一絲一毫的生產差錯都不允許存在,為了保障印刷制造出來的造幣機器質量完全達標,必須嚴格精確檢測生產出來的成品。在印刷造幣機器的過程中要求要有非常高的計算機視覺技術,隨著計算機視覺技術的不斷進步,計算機視覺技術已經對印刷造幣機器的需求完全滿足了,實際的應用效果也非常理想,印刷造幣機器在實際生產的過程中,南京造幣廠把計算機視覺技術應用在了每個應刷造幣機器最后的生產工序上,硬幣受到重力下落的瞬間,計算機視覺技術可以瞬間采集圖像的信息,準確拍攝硬幣在下落過程中的圖像,通過高速光纖傳感器可以把硬幣圖像向計算機系統快速傳輸,利用計算機系統處理信息與識別信息的超強能力,可以及時識別硬幣質量,經大量實踐研究得出,在印刷造幣機器上應用計算機視覺技術已經幾乎沒有檢查差錯現象的發生,由此可知,在工業自動化中計算機視覺技術的應用不但可行,而且發展空間還很大。

2.3 在醫學自動化中計算機視覺技術的應用

在醫學領域計算機視覺技術也得到了廣泛應用,如醫學中經常用到的CT圖像以及X射線圖都用到了計算機視覺技術,這些技術的廣泛應用很大程度上方便了醫生準確判斷病人病情,另外,在生產藥品的過程中,應用計算機視覺技術可以高效檢測藥品包裝的合格與否,其基本流程是:傳送裝置先準確運輸藥品到指定位置,傳送裝置自身又可分為檢測與分離兩個區域,在傳送藥品的過程中藥品的圖像信息會被特定的攝像機采集,采集完成后向計算機系統傳遞采集信息,然后計算機系統會分析與處理這些信息,把沒有包裝好的藥品自動識別出來,并且向分離區傳遞識別信息,分離區的自動裝置會依據傳輸的分離信息,隔離開沒有包裝好的藥品,這樣就可以有效分類包裝好的藥品與沒有包裝好的藥品,在藥品包裝檢測方面應用計算機視覺技術代替傳統人工檢測,不但可以實現藥品準確無誤的檢測,而且還可以大大提高檢測藥品包裝質量的效率,完善了藥品生產的自動化,由此可見,在醫學自動化中應用計算機視覺技術可以積極促進醫學自動化的發展。

3 結束語

總之,計算機視覺技術是一門研究計算機識別能力的高新技術,它涵蓋了很多其他技術,具有一定復雜性。要想使其在自動化生產中得到更好地推廣與應用,我們必須在明白其基本概念、工作原理以及理論框架的基礎上,結合實際生產情況,不斷進行深入研究,只有這樣才能使計算機視覺技術得到更好地推廣與應用,才能使這項現代化的高新技術更好的服務于社會,服務于人類。

參考文獻:

[1] 龔超,羅毅,涂光瑜.計算機視覺技術及其在電力系統自動化中的應用[J].電力系統自動化,2003(1).

[2] 李永奎,劉冬.計算機視覺技術在農業生產中的應用[J].農業科技與裝備,2011(6).

篇3

在我國市場經濟不斷發展的盛況下,我國科技發展水平也緊隨其后,成為世界上的科技強國之一。在計算機水平的不斷提高下,計算機視覺技術應運而生。其中,計算機視覺技術被應用與各個領域,并在各個領域都得到廣泛有效的應用,比如軍事領域、醫療領域、工業領域等。本文針對計算機視覺技術在交通領域中的應用進行分析。

【關鍵詞】計算機視覺 交通領域 探究

近年來,隨著科技水平的提高,計算機視覺技術逐漸被人們熟知并廣泛應用。相較于其他傳感器來說,視覺能獲得更多的信息。因此,在我國交通領域中,也對計算機視覺技術進行研究完善,將計算機視覺技術應用在交通領域各個方面中,并取得了顯著的成效。

1 計算機視覺的概述及基本體系結構

1.1 計算機視覺概述

通過使用計算機和相關設備,對生物視覺進行模擬的方式,就是計算機視覺。對采集到的圖片或視頻進行相應的技術處理,從而獲得相應的三維信息場景,是計算機視覺的主要任務。

計算機視覺是一門學問,它就如何通過計算機和照相機的運用,使人們獲得被拍攝對象的數據與信息所需等問題進行研究。簡單的說,就是讓計算機通過人們給其安裝上的“大腦”和“眼睛”,對周圍環境進行感知。

計算機視覺是一門綜合性學科,在各個領域都有所作為,已經吸引了各個領域的研究者對其研究。同時,計算機視覺也是科學領域中一個具有重要挑戰性的研究。

1.2 計算機視覺領域基本體系結構

提出第一個較為完善的視覺系統框架的是Marr,他從信息處理系統角度出發,結合圖像處理、心理物理學等多領域的研究成果,提出被計算機視覺工作者基本接受的計算機視覺系統框架。在此基礎上,研究者們針對視覺系統框架的各個角度、各個階段、各個功能進行分析研究,得出了計算機視覺系統的基本體系結構,如圖1。

2 計算機視覺在交通領域的應用

2.1 牌照識別

車輛的唯一身份是車輛牌照。在檢測違規車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應用價值。然而在實際應用工作中,雖然車牌識別技術相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術仍需改善。車牌定位技術、車牌字符識別技術和車牌字符分割技術是組成車牌識別技術的重要部分。

2.2 車輛檢測

目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續變化的。此外,對于某些交通區域來說,公共資源的配備,比如交通警察、交通車輛的數量是有限的。如果能根據計算機視覺技術,對交通路口的不同時間、不同位置的交通情況進行分析計算,并對交通流量進行預測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據實際情況設置動態變化等技術提供支持。

2.3 統計公交乘客人數

城市公共交通的核心內容是城市公交調度問題,一個城市如何合理的解決公交調度問題,是緩解城市運力和運量矛盾,緩解城市交通緊張的有效措施。城市公交調度問題,為公交公司與乘客的平衡利益,為公交公司的經濟利益和社會效益的提高做出了巨大的貢獻。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調度不均衡問題,使有限資源浪費嚴重。在計算機視覺智能公交系統中,自動乘客計數技術是其關鍵技術。自動乘客計數技術,是對乘客上下車的時間和地點自動收集的最有效的技術之一。根據其收集到的數據,從時間和地點兩方面對客流分析,為城市公交調度進行合理的安排。

2.4 對車道偏離程度和駕駛員工作狀態判斷

交通事故的發生率隨著車輛數量的增加而增加。引發交通事故的重要因素之一就是駕駛員疲勞駕駛。據相關數據顯示,因車道偏離導致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導致車道偏離的主要原因。針對此種現象,為減少交通事故的發生,計算機視覺中車道偏離預警系統被研究開發并被廣泛應用。針對駕駛員眨眼頻率,利用計算機視覺對駕駛員面部進行圖像處理和分析,再根據疲勞駕駛關注度與眨眼頻率的關系,對駕駛員的工作狀態進行判斷。此外,根據道路識別技術,對車輛行駛狀態進行檢測,也是判斷駕駛員工作狀態的方法之一。這兩種方法,是目前基于計算機視覺的基礎上,檢測駕駛員疲勞狀態的有效方法。

2.5 路面破損檢測

最常見的路面損壞方式就是裂縫。利用計算機視覺,及時發現路面破損情況,并在其裂縫程度嚴重之前進行修補,有利于節省維護成本,也避免出現路面坍塌,車輛凹陷的情況發生。利用計算機視覺進行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。

3 結論

本文從計算機視覺的概述,及計算機視覺基本體系結構,和計算機視覺在交通領域中的應用三面進行分析,可見計算機視覺在交通領域中的廣泛應用,在交通領域中應用的有效性、顯著性,以此可得計算機視覺在現展過程中的重要性。隨著計算機視覺技術的越來越成熟,交通領域的檢測管理一定會加嚴格,更加安全。

參考文獻

[1]段里仁.智能交通系境在我國道路空通管理中的應用[J].北方工業時報,2015(06).

[2]王豐元.計算機視覺在建筑區間的應用實例分析[J].河北電力學報,2015(04).

[3]李釗稱.主動測距技術在計算機數據分析中的作用探析[J].計算機應用,2015(08).

[4]馬良紅.三維物體影像的攝取與分析[J].中國公路學報,2014(05).

[5]朱學君,沈睿.關于計算機視覺在交通領域中的探討[J].信息通信,2013(01):123.

[6]王大勇.關于計算機視覺在交通領域中的應用分析[J].科技與企業,2013(01):115.

作者簡介

夏棟(1988-),男,湖北省孝感市人。現為同濟大學軟件學院在讀碩士。研究方向為計算機視覺。

篇4

[關鍵詞] 物流企業; 自動化; 算法

[中圖分類號] F252; TP39 [文獻標識碼] A [文章編號] 1673 - 0194(2013)06- 0058- 03

0 引 言

隨著物流業被列入我國十大行業振興計劃,物流業已經成為我國經濟發展的不可缺少的重要組成部分。物流業是我國經濟運行的基礎,是推動國民經濟發展的重要支柱性產業之一。隨著國家持續加強和改善宏觀調控政策,物流業發展環境和條件不斷改善,物流業保持了較快的增長速度。但由于中國物流業起步較晚,存在物流成本較高、管理落后等問題,離一體化、信息化的物流業還有一定差距。中國物流業只有應用現代物流的理念,采用先進的信息技術與運作方式,才能應對擁有技術、資金和管理優勢的外國企業的競爭。實現傳統物流業向現代物流業的轉變,也是物流業自身結構調整和產業升級的需要,是整個國民經濟發展的必然要求。我國經濟要集約式發展,必然需要推進現代物流。現代物流的根本宗旨是降低物流成本、提高物流效率、滿足客戶需求,其中信息化是現代物流的核心。隨著信息技術的不斷更新和物流企業自身的發展,使得新興的信息業務與傳統物流業務之間相互介入,模糊了新興信息技術及業務與傳統物流業務的界限,從而模糊了物流業的產業屬性和產業界限, 即發生了產業融合現象。產業融合是由于技術進步和放松管制的原因,發生在產業邊界和交叉處的技術融合,在經過不同產業或行業之間的業務、組織、管理和市場的資源整合后,改變了原有產業產品和市場需求的特征,導致產業的企業之間競爭合作關系發生改變,從而最終造成產業界限的模糊化甚至重劃產業界限。

產業融合促進了傳統產業創新, 進而推進產業結構優化與產業發展,即產生創新性優化效應。物流信息化的重要性已經引起國內很多學者的重視,并紛紛提出相應的觀點和建議。馬健(2005)認為物流企業將在建立呼叫中心、應用系統領域和網絡計算機領域出現信息化融合的趨勢,并提出物流企業應采取的戰略。鄧小瑜(2011)等從技術融合、產品融合、業務融合、產業衍生4個層面闡述了物流業如何進行信息化建設。物流業與信息業的融合包含通過融合信息技術提高來增強企業競爭力和將信息業務增加到物流服務中形成新的業務2個方面。

視頻攝像頭在日常生活中非常普遍,但是利用率較低,大部分監控系統都是提供視頻數據的線性存儲,成為事后證據查找的有效手段。近年來,隨著計算機視覺的發展,很多學者開始研究視頻理解,尤其是針對視頻信息檢測與識別技術,建立有效的算法,實現底層圖像處理技術與高層視頻內容分析之間的關聯,從而推動了計算機視覺在物流領域的應用,提高物流企業的競爭力。

1 計算機視覺的相關知識

1.1 計算機視覺的概念

20世紀80年代初,Marr從信息處理的角度,提出了第一個比較完善的計算機系統視覺框架。計算機視覺是指利用計算機模擬人眼的視覺功能,對圖片或視頻進行采集、加工、處理和識別,從中提取三維景物的形態和運動信息,解決物流、工業、商業等領域產品圖像自動檢測識別問題,提高檢測識別效率和自動化程度。計算機視覺自動識別技術作為一門交叉學科,近年來受到各相關行業的高度重視。計算機視覺的處理流程為:攝像機圖像采集圖像處理計算機幀存儲、圖像識別控制邏輯顯示器顯示。

1.2 亮度要求

基于計算機視覺的硬件環境中,亮度是非常重要的因素。在計算機視覺中亮度的作用是突出物體的重要特征或使物體本身可見,而弱化物體其他不需要的特征或物體所處的背景。如果物體太亮或太暗,都會影響對物體的處理。

彩色物體反射光譜的某些部分,吸收其他部分。因此開發人員可以利用這個特點來提高某些物體的可視度。開發人員可以利用顏色之間的對比增強某種顏色或抑制其相反的顏色。例如,如果一個紅色的物體在一個綠色背景中則應該加強紅色,這時可使用紅色照明。這樣紅色的物體會顯得明亮,同時會變暗綠色的對象。

LED是目前用于計算機視覺的主要照明技術,相比白熾燈、日光燈等使用時間短、亮度逐漸減弱的特點,LED燈的壽命超過100萬小時,而且耗電小,產生熱量少。

1.3 計算機和攝像機的接口

常用的計算機和攝像機接口包括IEEE 1394、Ethernet、USB2.0 and Gigabit Ethernet等。

1.4 RGB介紹

RGB 顏色空間是實際應用最多的一個顏色空間,在使用計算機進行圖像處理時,數字圖像一般用RGB 空間存儲和表示,分3個通道:紅(Red)、綠(Green)和藍(Blue),分別反映了顏色在某個通道的亮度值。3種原色光不同比例混合即使得人得到不同顏色的感知,這就是RGB顏色空間的由來。RGB 空間中每種顏色都能用三維空間中的一個點來表示。

2 計算機視覺在物流領域的優勢

隨著物流業的迅速發展,計算機視覺在條形碼識別、運動物流跟蹤方面逐漸得到應用。與傳統方法相比,計算機視覺應用在物流領域的優勢為以下方面。

2.1 靈活、低成本

物流系統中一般采用傳感器來收集相關信息,但是傳感器的位置是固定的,如果需要多方位的信息,必須同時需要多個傳感器才能完成。利用計算機視覺攝像機和計算機來完成,只需要通過程序的設置和一臺攝像機就可實現多方位信息的收集。

2.2 高效、準確

在一些人眼難以滿足要求的場合,或不適于人工工作的環境下,用計算機視覺來代替人工視覺可以提高生產效率、信息的準確率。

3 計算機視覺在流水線中多方位跟蹤計數的算法

物流企業在流水線產品的計數方法目前主要采用傳感器,而利用攝像機所提供的視頻信息可以實現多方位的跟蹤。計算機視覺是一個集成系統,圖像分析的時間有限,算法必須簡單有效。本文采用的物流流水線視頻圖像如圖1所示。圖中紅色矩形表示流水線中傳輸的物品,綠色區域為流水線中的物品處理區域。

系統會在視頻圖像中設計①、②、③、④四個計數區域,在物品進行相關處理前進行計數。計數方法為將每幀圖像變為黑白圖,圖像中的紅色變為白色,其余都變為黑色。當每幅圖像中的紅線部分中的白色像素超過一定閾值時,認為物體撞線,如圖2所示,這時確定有需要計數的物品通過,可以開始計數。

3.1 主要算法

3.2 算法的運行結果

OpenCV是Intel公司開發的開源計算機視覺庫。它提供了幾百個C/C++函數,實現了計算機視覺領域中大部分最常用的算法。利用Intel開發的開源視覺庫Intel OpenCV和VC6.0將上述算法轉換為對應的源代碼,可實現4個區域的物品計數。

3.3 算法的評價

該算法利用計算機視覺技術實現了物流流水線上的多方位計數,提高物流企業的信息化水平,節約了資金。算法簡單,運行速度快,完全可以滿足物流企業的實際需求。

4 結論與建議

本文所提出的算法實現了計算機視覺技術在物流企業的應用,為信息產業和物流業的融合提供了新的思路。但信息產業與物流產業的融合并不意味著引入信息技術后物流業的競爭力一定能提高。Berry(1995)指出了企業可以從6個方面來利用技術手段來提高競爭力,根據Berry的建議和我國物流業的實際情況,本文認為從以下幾個方面來考慮如何通過與信息技術的融合提高物流企業的競爭力。

4.1 要有一個戰略性的全局行動綱領

技術只是一種手段,使用技術的目的是為了企業發展服務,應符合全局發展的需要。因此物流企業高層管理者應該參與技術戰略的制定,保證技術戰略與全局戰略一致,并有CIO(首席信息官)監控具體執行情況。而不應該盲目使用一些新技術或進行信息改革,造成企業不必要的損失。

4.2 解決主要問題

物流業作為服務行業其最終目的是為客戶服務,使用信息技術的有效性應建立在為客戶解決實際問題的基礎上。因此信息產業與物流業的融合應體現在為客戶提供更多的便利,或提供增值服務的基礎上。

4.3 使用物流公共信息平臺和建立物流信息系統,保證系統有效運轉

通過現代物流公共信息平臺的建設,企業可以及時獲得需求信息,政府可獲得物流業相關的調控和管理的宏觀信息,實現互聯互通。通過企業流程再造,利用含有CRM(客戶關系管理)等模塊的ERP系統,采用EDI(電子數據交換系統)、GPS、條形碼、無線射頻技術等先進技術,建立真正適應企業發展的符合現有服務模式的管理信息系統。

4.4 創新型物流人才的引進和培養

物流企業在自身提高業務流程和信息化水平的同時,還應注重創新型人才的引進和培養,特別是有國際大型物流企業管理和技術經驗的復合型人才。

主要參考文獻

[1] L Leonard,Berry. On Great Service:A Framework for Action[M]. New York NY:The Free Press,1995.

篇5

關鍵詞 疲勞駕駛 人眼、人臉 嘴巴 專利

中圖分號:C18 文獻標識碼:A

0引言

造成交通事故的原因25%-30%產生于疲勞駕駛,因此疲勞駕駛已成為誘發交通事故的重要因素。國內外專家和學者針對疲勞駕駛的檢測開展了大量的研究工作,目前研究的重心主要集中在基于計算機視覺的疲勞駕駛檢測,因此對基于計算機視覺的疲勞駕駛檢測的相關專利進行分析尤為必要。

1基于計算機視覺的疲勞駕駛檢測專利申請數據分析

1.1全球專利申請量趨勢

從圖1可以看出,基于計算機視覺的疲勞駕駛檢測專利申請量從1990-2001年間處于技術研發初期,專利申請量相對較少。從2002年開始該領域的專利申請量逐漸呈現持續增長趨勢,并在2014年達到最大值153件。由此可知,隨著疲勞駕駛的增多,人們對疲勞駕駛的檢測也越來越重視,相應的研究也正不斷增加。基于此,在今后的一段時間內,相關的專利申請量有望繼續保持。

1.2專利申請產出地區分布

目前各領域的專利申請量主要集中在中國、美國、韓國、日本和歐洲,通過對該領域在中國、美國、韓國、日本和歐洲的專利申請量進行統計分析發現,中國的申請量以48%的占比雄居第一,其他幾個地區的申請量相差不大,具體如圖2所示。

1.3在華專利申請量變化趨勢

圖3為1990年至2014年基于計算機視覺的疲勞駕駛檢測在華的申請量變化趨勢圖,由該圖可以看出,1990-2002年是技術的萌芽期,在2003年以后申請量才呈現逐年增長的趨勢,并且在2012年-2014年將均維持在較高的申請量。因此,該領域國內雖然起步較晚,但是最近幾年申請量相對其他地區卻具有壓制性的優勢。

1.4在華主要申請人分析

圖4展示了在華主要申請人的申請量份額,主要以科研院所和大型汽車企業為主,其中吉利汽車公司以領先優勢排名第一。

2主要技術分支的專利申請分析

基于計算機視覺的疲勞駕駛檢測的主要技術分支有:基于人眼的駕駛疲勞檢測、基于人臉的駕駛疲勞檢測、基于嘴巴的疲勞檢測。下面從三個技術分支的發展概況、三個技術分支的主要工作原理及重點專利等方面進行分析。

2.1全球專利申請主要技術分支的申請量趨勢圖

由圖6可知,近年來基于人眼和人臉的駕駛疲勞檢測的申請量呈現較快增長,申請量也較基于嘴巴的疲勞檢測的申請量大,體現了該領域近年來的發展趨勢,并體現出基于人眼和人臉的駕駛疲勞檢測的技術分支發展已較為成熟。三個技術分支在2006年之前,申請量的差別不大且數量均較小,顯示出在2006年以前三個分支的區別并不明顯,發展也較為緩慢,這說明基于計算機視覺的疲勞駕駛檢測也是近10年才興起的一項技術,它依賴于圖像處理技術的發展水平。

2.2在華專利申請主要技術分支的申請量趨勢圖

由圖7可知,三個技術分支在2006年以前均只有零星的申請量,這與該領域在全球的發展情況相符合,基于人眼的疲勞駕駛檢測在華申請量自2006年以來呈現穩步增長,且近年來申請量最大。基于人臉的疲勞駕駛檢測申請量雖小于基于人眼的疲勞駕駛檢測,但近年來的申請量也呈現出穩步增長的勢頭。然而,基于嘴巴的疲勞駕駛檢測雖有增長趨勢,但申請量一直都較小。由此可知,在國內疲勞駕駛的檢測主要是采用人眼檢測和人臉檢測,這兩個分支是國內的研究的熱門,也是今后國內在該領域的發展趨勢。

3結語

通過對基于計算機視覺的疲勞駕駛檢測專利的申請量的總體分析,以及基于人眼、基于人臉、基于嘴巴三個技術分支的申請量趨勢分析可知,基于計算機視覺的疲勞駕駛檢測在近10年取得了較快發展,這與計算機圖像處理技術的發展密不可分;同時,科研院所作為該領域研究的主體,應加強與中小企業的合作。國內疲勞駕駛的檢測研究主要集中在人眼檢測和人臉檢測,這兩個分支是國內的研究的熱門,同時,基于人眼的疲勞檢測其發展方向明確,后續發展將集中在眼睛定位算法的研究上,并且定位精度將越來越高,越來越滿足實際的要求。

參考文獻

[1] 朱淑亮.基于視頻圖像分析與信息融合的駕駛員疲勞檢測技術研究[J].濟南:山東大學,2011.

[2] 劉學.基于人臉圖像分析的疲勞駕駛檢測方法研究[J].南京:南京航空航天大學,2012.

[3] 張靈聰,王正國,朱佩芳,等.汽車駕駛疲勞研究綜述[J].人類工效學,2003.

篇6

關鍵詞:農業機械;新技術;發展

1.農業機械新技術的應用和發展的重要性

我國是一個農業大國,農業是我國國民經濟的基礎,農業機械新技術的應用和發展具有重要的意義。

第一,提高機械的運作效率。目前在農業機械的使用方面,有的機械在使用過程中不能清晰地識別農作物的位置,比如,在收割小麥的過程中,有的小麥受到大風影響產生倒伏,對這些倒伏區域,機械在收割過程中很容易漏掉。所以在農業機械中使用新技術有利于彌補農業機械的漏洞,提高機械的運作效率。

第二,解放勞動力,促進經濟發展。農業是一個需要大量年輕勞動力的行業,農業機械新技術的應用有利于實現農業種植、收割的自動化,解放勞動力。這些年輕的勞動力投入到其他的領域,有利于促進我國經濟的發展。

2.農業機械新技術的應用

21世紀是個科技迅速翻新的時代,目前農業機械領域的新技術也層出不窮,下面介紹幾種最新出現的農業機械新技術。

(1)計算機視覺技術。計算機視覺技術出現于20世紀70年代末,主要利用計算機視覺技術進行農產品品質和農產品等級的檢查。計算機視覺是一種以圖像處理為基礎而興起的學科,主要對視覺信息處理的計算理論、表達與計算方法進行研究。[1]隨著計算機視覺技術應用領域的不斷擴展,目前在農業機械生產方面,計算機視覺技術不僅能夠用于檢查農產品品質和分級,還可以用于播種和收割。但是由于計算機視覺技術在農業機械方面的使用時間比較短,一些技術難題還沒有得到解決,所以計算機視覺技術在農業機械方面的應用還需要繼續研究。

(2)人工智能技術。隨著智能化的發展,智能技術在農業機械方面的應用也得以實現。美國運用人工智能技術發明了激光拖拉機,不僅可以控制拖拉機的行進方向,還能夠對拖拉機進行具體的定位。[2]通過人工智能技術,人們建立了一個龐大的數據庫,通過這個數據庫可以對土地的具體情況進行掌握,以設計出具體的農業生產所需的化肥、種子、農藥、水等原料的用量。

(3)機器人技術。比智能化更進步的就是機器人技術,機器人技術在農業機械中的應用,這是計算機信息網絡和計算機視覺技術以及自動化控制等技術的結合的產物。目前研發出了除草機器人、播種機器人、澆水機器人、施肥機器人等,利用機器人進行農業生產活動,可以節省人工費用,解放勞動力,避免有些農業生產活動,對人體產生危害。

(4)自動控制技術。在農業機械中運用自動控制技術,可以幫助操作者降低操作難度,同時可以根據地勢的高低和秸稈的長短來調節高度,保證機械使用過程中的安全性,提高農業機械使用的可靠性,提高農業生產效率。

3.農業機械新技術的發展

農業機械新技術的應用和發展都是為了提高農業的生產率服務的,所以農業機械新技術的發展主要表現為以下幾點:

第一,加速新技術的使用和推廣。科學技術是第一生產力,加速計算機視覺技術、自動控制技術、智能化技術等新技術在農業機械中的使用,同時引進國外先進的機械新技術,對推動我國農業的發展,提高農業的生產效率具有重大的意義。

第二,政府補貼。新型機械的購買都是生產個體自行組織的,資金壓力大,使得機械新技術難以推廣,所以對于農業機械新技術的推廣使用,政府要在物質上予以補貼,拓展新機械的使用范圍。

第三,提高農業資源利用效率。機械使用的目的就是為了提高農業的生產效率,提高農業資源的利用率。例如,在傳統的農業生產過程中,對農作物秸稈的處理方式,絕大多數情況就是焚燒,不僅浪費資源,而且污染空氣。但是農業機械新技術的使用通過將農作物的秸稈進行粉碎處理,將農作物秸稈轉化為肥料,不僅提高了農作物資源的使用效率,也減小了空氣的污染程度。

4.結語

隨著科技的發展,計算機視覺技術、自動控制技術、智能化技術等新技術在農業機械方面的應用越來越廣,農業機械新技術的應用和推廣將大大提高我國農業的生產效率,提高農業資源的利用率,促進國民經濟的發展。

參考文獻:

[1]田 靜.探討農業機械新技術的應用與發展[J].中國農資,2013(36): 74.

篇7

關鍵詞:計算機;視覺技術;交通工程

中圖分類號:TP391 文獻標識碼:A 文章編號:1674-7712 (2014) 04-0000-01

一、引言

隨著科技的發展,計算機替代人的視覺與思維已經成為現實,這也是計算機視覺的突出顯現。那么在物體圖像中識別物體并作進一步處理,是客觀世界的主觀反應。在數字化圖像中,我們可以探尋出較為固定的數字聯系,在物體特征搜集并處理時做到二次實現。這既是對物體特征的外在顯現與描繪,更是對其定量信息的標定。從交通工程領域的角度來看,該種技術一般應用在交管及安全方面。監控交通流、識別車況及高速收費都是屬于交通管理的范疇;而對交通重大事件的勘察及甄別則是交通安全所屬。在這個基礎上,筆者對計算機視覺系統的組成及原理進行了分析,并形成視覺處理相關技術研究。

二、設計計算機視覺系統構成

計算機視覺處理技術的應用是建立在視覺系統的建立基礎上的。其內部主要的構成是計算機光源、光電轉換相關器件及圖像采集卡等元件。

(一)照明條件的設計。在測量物體的表征時,環境的創設是圖像分析處理的前提,其主要通過光線反射將影像投射到光電傳感器上。故而要想獲得清晰圖像離不開照明條件的選擇。在設計照明條件時,我們通常會視具體而不同處理,不過總的目標是一定的,那就是要利于處理圖像及對其進行提取分析。在照明條件的設定中,主動視覺系統結構光是較為典型的范例。

(二)數據采集的處理。如今電耦合器件(CCD)中,攝像機及光電傳感器較為常見。它們輸出形成的影像均為模擬化的電子信號。在此基礎上,A模式與D模式的相互對接更能夠讓信號進入計算機并達到數字處理標準,最后再量化入計算機系統處理范圍。客觀物體色彩的不同,也就造就了色彩帶給人信息的差異。一般地黑白圖像是單色攝像機輸入的結果;彩色圖像則需要彩色相機來實現。其過程為:彩色模擬信號解碼為RGB單獨信號,并單獨A/D轉換,輸出后借助色彩查找表來顯示相應色彩。每幅圖像一旦經過數字處理就會形成點陣,并將n個信息濃縮于每點中。彩色獲得的圖像在16比特,而黑白所獲黑白灰圖像則僅有8比特。故而從信息采集量上來看,彩色的圖像采集分析更為繁復些。不過黑白跟灰度圖像也基本適應于基礎信息的特征分析。相機數量及研究技法的角度,則有三個分類:“單目視覺”、“雙目”及“三目”立體視覺。

三、研究與應用計算機視覺處理技術

從對圖像進行編輯的過程可以看出,計算機視覺處理技術在物體成像及計算后會在灰度陣列中參雜無效信息群,使得信息存在遺失風險。成像的噪聲在一定程度上也對獲取有效信息造成了干擾。故而,處理圖像必須要有前提地預設分析,還原圖像本相,從而消去噪音。邊緣增強在特定的圖像變化程度中,其起到的是對特征方法的削減。基于二值化,分割圖像才能夠進一步開展。對于物體的檢測多借助某個范圍來達到目的。識別和測算物體一般總是靠對特征的甄別來完成的。

四、分析處理三維物體技術

物體外輪擴線及表面對應位置的限定下,物體性質的外在表現則是其形狀。三維物體從內含性質上來看也有體現,如通過其內含性質所變現出來的表層構造及邊界劃定等等。故而在確定圖像特征方面,物體的三維形態是最常用的處理技術。檢測三維物體形狀及分析距離從計算機視覺技術角度來看,渠道很多,其原理主要是借助光源特性在圖像輸入時的顯現來實現的。其類別有主動與被動兩類。借助自然光照來對圖像獲取并挖掘深入信息的技術叫做被動測距;主動測距的光源條件則是利用人為設置的,其信息也是圖像在經過測算分析時得到的。被動測距的主要用途體現在軍工業保密及限制環境中,而普通建筑行業則主要利用主動測距。特別是較小尺寸物體的測算,以及擁有抗干擾及其他非接觸測距環境。

(一)主動測距技術。主動測距,主要是指光源條件是在人為創設環境中滿足的,且從景物外像得到相關點化信息,可以適當顯示圖像大概并進行初步分析處理,以對計算適應功率及信息測算程度形成水平提高。從技術種類上說,主動測距技術可分為雷達取像、幾何光學聚焦、圖像干擾及衍射等。除了結構光法外的測量方法均為基于物理成像,并搜集所成圖像,并得到特殊物理特征圖像。從不同的研究環境到條件所涉,以結構光法測量作為主要技術的工程需求較為普遍,其原理為:首先在光源的設計上由人為來進行環境考慮測算,再從其中獲取較為全面的離散點化信息。在離散處理后,此類圖像已經形成了較多的物體真是特征表象。在此基礎上,信息需要不斷簡化與甄別、壓縮。如果分析整個物體特征信息鏈,則后期主要體現在對于數據的簡化分析。如今人們已經把研究的目光轉向了結構光測量方法的應用,體現在物體形狀檢測等方面。

(二)被動測距技術。被動測距,對光照條件的選擇具有局限性,其主要通過對于自然光的覆蓋得以實現。它在圖像原始信息處理及分析匹配方面技術指向較為突出。也通過此三維物體之形狀及周圍環境深度均被顯露。在圖像原始信息基礎上的應用計算,其與結構光等相比繁雜程度較高。分析物體三維特性,著重從立體視覺內涵入手,適應物體自身特點而存在。不過相對來說獲得圖像特征才是其適應匹配的條件保障。點、線、區域及結構紋理等是物象特征的主體形式。其中物特較為基礎與原始的特征是前兩個特征,同時它們也是其他相關表征的前提。計算機系統技術測量基本原理為對攝像機進行構建分析,并對其圖像表征進行特征匹配,以得到圖像不同區間的視覺差異。

五、結束語

通過對計算機視覺技術的研究,悉知其主要的應用領域及技術組成。在系統使用的基礎上深入設計,對系統主要構成環節進行分析。從而將三維復雜形態原理、算法及測量理論上升到實際應用。隨著社會對于計算機的倚賴程度增加,相信該技術在建筑或者其他領域會有更加深入的研究及應用。

參考文獻:

[1]段里仁.智能交通系境在我國道路空通管理中的應用[J].北方工業時報,2012(06).

[2]王豐元.計算機視覺在建筑區間的應用實例分析[J].河北電力學報,2011(04).

篇8

關鍵詞:三目攝像機;標定;立體視覺;外部參數

一、緒論

1.1研究的背景及意義

計算機視覺是當今極為重要的學科之一,它在具有很強的挑戰性的同時又擁有廣泛的應用前景和實用價值。計算機視覺以視覺理論為中心,以圖像處理、模式識別、計算機技術和生理學、心理學為基礎,研究內容主要有兩個方面:一是開發從輸入圖像數據自動構造場景描述的圖像處理系統;二是理解人類視覺機理,用機器代替人去做人類難以達到或根本無法達到的工作[1]。

計算機視覺應用的廣泛性體現在其不僅用于文字、指紋、面部、商標以及圖像數據庫、檢測集成電路芯片、多媒體技術這些圖像方面,還應用到機器人導航、工業檢測和產品的自動裝配、CT圖像器官重建和遙感照片解釋等空間物體的定位、識別以及重建上。現如今,計算機視覺已經應用到機器人、地理、醫學、物理、化學、天文等各大的研究領域。

作為多個學科交叉與融合中心的計算機視覺,攝像機是其研究的重要工具,而攝像機標定又是計算機視覺研究的一個關鍵問題,故攝像機的標定越來越受到廣泛的重視。攝像機標定是通過物體空間上的點與圖像中的對應點的幾何關系,來確定攝像機的內外參數的過程。標定結果是否準確影響著三維測量的精度和三維重建的結果,而且實時的標定更能滿足自動導航機器視覺的需要[2]。

伴隨著應用的發展,攝像機廣泛地被應用于三維立體的測量、視覺檢測、運動檢測等領域。由此,對攝像機標定的精度要求也日益增加。攝像機標定結果的優劣影響了計算機視覺在各領域的應用。攝像機標定的準確與否,對能否提高計算機視覺在各領域測量的準確度有重要影響[3]。因此,研究攝像機標定方法具有重要的理論研究意義和實際應用價值。

1.2攝像機標定技術研究的發展及現狀

攝像機有一個圖像平面和提供三維空間到圖像平面轉換的鏡頭。由于鏡頭會產生畸變,不能把這個轉化過程簡單描述為投射變換。所以它表示的是畸變的模型,這些模型近似于真實數據,而其精確性則依靠于建立的模型及模型參數的準確性。

首先進行攝像機標定工作的是加拿大的Deville,他于1910年建立實驗室,使用多個瞄準儀對他的“測量攝像機”(surveying camera)進行標定[4]。上個世紀三十年代后期,美國標準局發明了一種精確鏡頭,用來檢測攝像機,同時將它用在攝像機標定上。四十年代后期,該項工作得到進一步加深,有了更多對高精度的需求和對易操作設備的需求。1955年,Carman出版了 《棋盤平面度的干涉測量和控制》,該書引起了社會各界對攝像機標定的關注。二戰時期,隨著飛機的大規模使用,航空攝影與制圖興起,為得到更加精確的測量結果,對攝像機鏡頭的校正要求也變得更高。五十到七十年代也是鏡頭校正技術發展最為迅速的時間段。在這期間,各種鏡頭像差的表達式逐步被提出并且得到普遍認同與采用,建立了很多的鏡頭像差的模型,D.C.Brown等人作出了比較大的貢獻,他們導出了近焦距情況下給定位置處徑向畸變表達式并證明了近焦距情況下測量出鏡頭兩個位置的徑向畸變就可以求出任何位置的徑向畸變[5]。這些徑向與切向像差表達式成為后來各攝像機的標定非線性模型的基礎。這段時間里,研究的重點是如何校正鏡頭與用何種方法補償鏡頭像差,這些研究對促進各性能鏡頭組的研制起到了重要作用。在1999年,張正友提出了一種簡便的攝像機標定方法,該方法介于傳統標定和自標定之間,操作方便靈活,能夠得到不錯的精度,滿足了眾多擁有桌面視覺系統的用戶在攝像機標定方面的需求。

1.3本文的主要研究內容

本文的主要研究多個攝像機的標定問題。標定主要是對攝像機內外參的測量計算,利用這些參數對多個攝像機識別的物體尺寸進行衡量并建立起多攝像機系統的數字環境。

論文的內容包括:

第一章為緒論,介紹攝像機標定相關的研究背景、國內外研究現狀。

第二章為攝像機標定理論基礎:主要介紹標定的坐標系與待標定的參數。

第三章提出本文的多攝像機標定方法與實驗過程。

第四章進行全文的總結。

二、攝像機標定方法研究

2.1攝像機標定原理

攝像機通過透鏡將三維物體投影到--維圖像平面上,這個成像變換的過程稱為攝像機成像模型。攝像機成像模型有多種,最常用的為小孔成像模型。由于實際的攝像機鏡頭會發生一定的畸變,使得空間點所成的像不在線性模型描述的位置而會發生一定的偏移,為了能準確的標定攝像機參數,標定的過程中要考慮非線性畸變因子。

一般來說,得到標定結果后要對其精度進行評估,然而很難得到準確的攝像機標定參數真值作為參考,其中基于圖像坐標和世界坐標的絕對和相對誤差的評價方法應用廣泛,本文將對這些方法的原理進行探討。

2.2攝像機標定坐標系建立

首先定義了四個坐標系,如圖1所示,圖像坐標系的坐標原點為O0,列與行由坐標軸u和v表示;成像平面坐標系的原點是攝像機光軸與圖像坐標系的交點0l,x、y 軸分別與u、v 軸平行;在攝像機坐標系中,坐標原點0c即為在攝像機的光心,Xc、Yc軸與x、y 軸平行,與圖像平面垂直是攝像機光軸作為Zc軸,0c0l為攝像機焦距f;世界坐標系是假想的參考坐標系,可固定于場景中某物體上,用于描述攝像機的位置,由Xw,Yw,Zw軸組成。

圖(1)

2.3攝像機外部參數構成

主動視覺傳感器從在笛卡爾直角坐標系中的運動表現為相應的旋轉矩陣和平移矩陣,故攝像機外部參數表現為旋轉矩陣R和平移矩陣T,則攝像機坐標系與世界坐標系的轉化關系可以表示成:

上式中(Xc,Yc,Zc)表示空間點在攝像機坐標系下的坐標,(Xw,Yw,Zw)表示空間點在世界坐標系下的坐標。根據靶標點在像空間坐標系和物方空間坐標系中的坐標,通過分解旋轉矩陣線性計算像空間坐標系與物方空間坐標之間的轉換參數,即外方位元素(攝站參數)[6]。

2.4各攝像機相對位置確定

三目攝像機擁有三個視覺傳感器,而三個傳感器之間的相對位置可通過已獲得的外部參數進行確定。將三個攝像機坐標系設置為,Oci xci yci zci(i=1,2,3),由2.3中所介紹的內容可知,這三個攝像機坐標系與世界坐標系的關系為:

i=(1,2,3)

由此我們可以得到任意兩個攝像機i,j的坐標系轉換關系:

其中: = = i,j=1,2,3

三、攝像機標定實驗過程及結果

3.1實驗系統介紹

實驗中被用來標定的是一個多攝像機系統,攝像機標定有關的基本參數、系統組成和開發環境如下:

(1)硬件環境

標定板、三目攝像機和圖像采集卡等。

(2)軟件環境

OpenCV開源視覺庫,它僅由一系列C函數和少量C++類構成,為Python、MATLAB等語言提供了接口,在圖像處理和計算機視覺方面實現了很多通用算法。

3.2實驗過程

本系統以棋盤格模板作為標定模板。采用激光打印機打印棋盤格黑白方塊間隔紙,方塊邊長為3cm,共6行9列,將打印紙固定在一塊平板上,作為標定模板,如圖(2)。安裝三目攝像機系統,調節固定好個攝像機位置,如圖(3)。手持標定板在三目攝像機前方各個位置拍攝5組共15張各姿態的照片,利用Canny算子進行像點灰度中心提取、同名像點匹配并解算出三個攝像機在標定板坐標系中的外部參數值。

3.3標定結果

攝像機1:

R= T=

攝像機2:

R= T=

攝像機3:

R= T=

四、總結

隨著計算機技術的高速發展,計算機視覺成為當今熱門的研究課題,受到了廣泛關注。本文就如何在機器視覺的理論基礎上對三目視覺系統進行標定進行了研究,討論了計算機視覺理論知識,分析攝像機標定原理以及標定坐標系的建立。同時通過計算機視覺知識的分析討論了基于三目視覺系統的攝像機標定技術,完成了三目視覺系統的外部參數標定實驗。三目攝像機測量系統外部參數的標定能夠解決測量作業現場、測量控制場建立難的問題,為快速地建立簡單實用的控制場提供了方案,有一定的實用價值。

參考文獻

[1] 荊麗秋.雙目視覺系統標定與匹配的研究與實現[D].哈爾濱工程大學,2009.DOI:10.7666/d.y1489086.

[2] 馬頌德.計算機視覺―計算理論與算法基礎[M].北京:科學出版社,1998.

[3] 王榮一.攝像機標定及關鍵技術研究[D].哈爾濱理工大學,2011.DOI:10.7666/d.y2012483.

[4] Clarke T A,Fryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66

[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.

[6] 范亞兵,黃桂平,高寶華等.三目立體工業攝影測量系統外部參數的快速標定[J].測繪工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013

篇9

生活中,每個人都問過別人“這件衣服是從哪買的?”“這雙鞋是什么牌子的?”這一問題很快會被AI技術解決,只需要拿出手機對著物品拍照,就會得到商品的各種信息,并且能一鍵買買買。這就是美國著名圖片社交網站Pinterest(拼趣)即將推出的應用圖片識別購買業務。

Pinterest總裁Tim Kendall表示,“Pinterest可以即刻在存儲750多億張圖片的巨大網絡空間內進行搜索,從而為用戶找到與所拍攝照片相似的配對圖片,以及查找到哪些地方能夠買到他們所需的商品。”

目前,Pinterest的估值已經達到了110億美元,該公司的專注點正在向營收增長和創收方面轉變。相比Facebook、Twiter等社交網站,Pinterest已經率先找到了一條清晰的創收道路。

從興趣到產品

亞里士多德曾經說過,古往今來人們開始探索,都應起源于對自然萬物的驚異。科技的進步也是如此,就像微軟研發主管和項目負責人Mitch Goldberg所說:“我們想通過該應用向人們展示識別技術的無限魅力。”

今年2月,微軟旗下的Garage實驗室了一款名為“Fetch!”的應用,它可通過機器學習系統識別照片中寵物狗的品種并用文字對該品種進行簡單的介紹。

隨著計算機視覺領域開始利用深層神經網絡這種模仿人類大腦生物過程的系統來從事機器學習,識別的精確度實現了巨大飛躍。也就是說通過機器學習技術,Fetch!識別的準確度會越來越高,隨著大量圖片的涌入,Fetch! 可以自我修復錯誤,從而更加精確地識別每一只狗的樣貌、形態、動作。除了測試狗類品種以外,你還可以把朋友的照片上傳至平臺,看看他們能夠對應出哪種寵物。

微軟的這款產品基于目前最為熱門的一種圖像識別技術――“深度神經網絡”,同樣基于這種技術,微軟還有另一款有趣的產品:。去年5月,有超過5.75億圖片被提交到,超過8500萬來自世界各地的使用者訪問了這個網站,只為尋找一個簡單問題的答案――顏齡機器人認為我看起來像幾歲?如果是合照,并且顏齡機器人識別出的自己比周圍人年齡小,則更能引發用戶的興趣,這種“損人利己”的識別應用著實在社交媒體上火了一把。

另一讓計算機視覺研究技術人員特別感興趣的領域是生物識別,當下最為火爆的莫過于人臉識別技術了。早期的人臉識別技術多為安防領域,如海關識別走私犯、商店識別小偷等。近年來,深度學習的研究與應用使得人臉識別和人工智能的核心技術得到了極大的提升,攝像頭等圖像硬件的發展為人臉識別提供了很好的圖像基礎,如今人臉識別技術應用更加廣泛,比如公司可以使用刷臉打卡來杜絕代人打卡簽到現象。

其實早在2012年,谷歌就開發出了安卓系統的“刷臉解鎖”技術,但因安全問題未解決,該技術一直未能得到普及。

而今年3月,電商巨頭亞馬遜提交了一項針購物付費的專利技術,即消費者在亞馬遜網站購物時可以通過自拍或者視頻來進行付費,無須再輸入賬號密碼。在消費時系統會提示用戶表現出特定的行為、情緒或手勢來證明消費者就是本人,而不是拿著照片的冒名頂替者。

亞馬遜表示,這項技術能使消費者更加安全地進行網上購物,因為很多用戶為了省事會把所有賬戶都用同一個密碼,或者把密碼記在手機里,一旦遭遇“撞庫”或者手機被盜,后果不堪設想,而刷臉技術則沒有這個風險。

除了識別人臉,在識別其他生物方面也有了突破性進展,比如識別寄生蟲。瘧疾,是一種由瘧原蟲造成的全球性急性寄生蟲傳染病,據統計,2015年有大約有2.14億人受瘧疾的影響。

一直以來,醫療工作者是通過肉眼觀察采樣玻片來確定采樣對象是否被瘧原蟲感染,這不但是對醫療工作者經驗的考驗,而且工作效率也十分低下,而貧困地區一直都缺乏有經驗的醫療工作者。

今年2月,根據MIT Technology Review報道,Intellectual Ventures Laboratory(智能事業實驗室)開發出了能夠檢測和評估瘧疾感染的便攜式顯微鏡。這種顯微鏡采用的是一個名為“Autoscope”的系統,通過計算機視覺和深度神經網絡技術,采用深度學習算法來鑒別瘧原蟲。這款便攜式顯微鏡今年在泰國實地測試,成功鑒別出了 170塊玻片中的瘧原蟲如果這項技術得到普及之后,只要診所有一臺Autoscope顯微鏡和一些載玻片,就可解決瘧疾的診斷問題,這將使瘧疾診斷不再依賴于有限的專業醫療人員。

技術轉化為產品

新技術的出現,讓計算機不但“看見”這個世界,更能“看懂”這個世界,可以代替人眼甚至超越人眼。

人的視野是有限的,并且會受到周邊條件的影響,駕駛員在開車時會有視野盲區,還會受到光線的影響,并且大霧、暴雨等極端天氣也會嚴重影響駕駛員的視線。而計算機視覺技術就不一樣了,視野會更開闊,受限制更小。根據汽車媒體《Leftlane》報道,福特公司最新的無人駕駛汽車研究計劃是由激光感應(LiDAR)和雷達、攝像頭形成一張周圍環境的高清3D地圖,不但讓無人駕駛汽車看到攝像頭視野范圍之外的物體,而且并不受光線限制。在夜間試駕后,福特工程師Wayne Williams說:“坐在汽車里,我能感到它在走,但是我往車外看,只能看到一片漆黑。結果令人驚喜,車輛準確地沿著蜿蜒的道路行駛。”

識別場景這一領域技術的發展,使得計算機不但能當機器的眼睛,還能變成人類的眼睛。

對于雙目失明的人來說,能親自感知這個世界是夢寐以求的事,而微軟2016 Build開發者大會上Seeing AI項目正是要幫助盲人實現這一愿望。

Seeing AI項目是通過計算機視覺和自然語言去形容一個人的周圍環境、朗讀文本、回答問題以及識別人的面部表情,可以在手機上使用,也可以在Pivothead的智能眼鏡上使用。如果投入使用,將有助于為視障人士營造更公平的環境,是一款能夠真正改變人們生活的產品,就像此項目的高級項目經理Anne Taylor所說的,這是“為真正重要的場景尋求解決方案”。也許不久微軟能開發出一種仿生眼,直接發送視覺信號到大腦,讓盲人真正看到這個世界。

篇10

【關鍵字】行人檢測 目標檢測 圖像處理

一、引言

在計算機視覺領域中,行人檢測是目標檢測的一個重要研究熱點,其主要利用各種傳感器獲取行人的數據信息,通過圖像處理及模式識別等算法從圖像數據中檢測出行人。其中傳感器包括激光、雷達等。行人檢測并不是孤立存在的,它與行人跟蹤、行為分析、姿態估計、場景分割等問題息息相關,因此具有極高的科研價值和商業價值。

二、行人檢測技術發展趨勢

如圖1所示,早在2007年開始就已經出現了行人檢測技術的研究。2007至2010年期間,專利申請量雖然呈逐步增長趨勢,然而增長速率較平穩,每年的申請量沒有太大的變動;2011年相比較于2010年增長率達到兩倍以上,此后2012年和2013年相較前一年都有較大的增長量,然而在2014年專利申請量與其前一年2013年相比,呈現減少的趨勢,這可能與發明專利未提前公開有關,但該年的總量在除2013年以外的其它各年中仍占有絕對性的優勢,預計2014年申請量不會低于2013年。

三、行人檢測技術解析

常見的行人檢測方法可分為基于簡單的圖像處理的行人檢測方法和基于計算機視覺的行人檢測方法。

3.1基于簡單圖像處理的行人檢測技術

該類技術主要分為:幀間差分法、光流法和背景差分法等。其與基于計算機視覺的技術相比算法較為簡單,不需要事先準備大量的訓練樣本或模板,處理速度也較快,因此在國內也占據一定的申請量。如上海交通大學的專利CN201210586125采用高斯混合模型對背景建模從而檢測行人,寧波大學的專利CN201210017307采用圖割方法進行行人檢測,奇瑞汽車股份有限公司的專利CN201310382009通過獲取候選區域的至少兩個特征圖進行候選區域是否包含行人的判斷。

3.2基于計算機視覺的行人檢測方法

基于統計學習的方法與其他方法相比占絕對性的優勢,是最近幾年高校和科研院所所研究的重點,同時也是公司企業發展的方向。如北京中星微電子的專利CN200710179786采用積分圖像和平方積分圖像提高分類器的檢測速度,江蘇大學的CN201110447411對特征向量進行稀疏表示并組合成稀疏化的混合特征向量作為分類器的特征進行行人檢測。

特征和分類器是統計學習的兩大關鍵技術。對特征的改進占56%,如中國科學技術大學的專利CN200810101705利用種群優化尋找行人檢測最優特征進行行人檢測,北京博康智能信息技術有限公司的專利CN201210082846利用梯度特征和線性邊緣特征進行行人檢測;

分類器的改進分別占42%,如杭州海康威視數字技術股份有限公司的專利CN201210169536利用多尺度的Adaboost作為分類器進行行人檢測,無錫慧眼電子科技有限公司的專利CN201310076413首先基于Adaboost得到級聯分類器。