計算機視覺開發范文

時間:2023-10-18 17:39:37

導語:如何才能寫好一篇計算機視覺開發,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。

計算機視覺開發

篇1

【關鍵詞】計算機軟件 開發設計 措施

在計算機整體的系統中,最為關鍵的部位就是軟件,計算機軟件的質量將會直接關系到軟件系統的開發水平,以及計算機運行的水平和性能。通常情況下,軟件的生存期主要是可以分為分析、設計和測試以及后期的維護等階段,對于軟件的設計主要是以及客戶的需求和軟件設計的規范和要求對相應的系統成為同一層次的模塊結構。同時,針對我國的存在的軟件方法和支持的軟件設計的工具,這樣對我國的計算機系統造成很大的影響,尤其是在設計中的實時性和在線性和可靠性等方面有著深刻的影響。所以,就必須要加強計算機軟件系統中的開發設計工作研究

1 計算機軟件開發過程中的問題分析

1.1 軟件設計中的需求分析不充分

在我國的計算機軟件系統運用過程中,經常會忽視了對需要設計項目分析不夠徹底,層次分析上不明確和不完整,有時會出現各種籠統的情況,這樣就會造成軟件系統在設計運用過程中出現很大問題。為此,這就需要相應完整和詳細的分析,確定相應的設計內容。

1.2 軟件設計沒有遵循實際情況

在當前的計算機軟件系統設計中,一般都會出現程序和過程上的問題,在軟件開發設計中沒有嚴格按照相應的科學規劃來進行制定相應的計劃,尤其是對龐大的系統工程難以進行完成,對軟件系統的質量也就難以保證,必須要拿出足夠的精力和時間來安排相應的設計工作,切實注重設計和測試以及后期維護等方面的運用。

1.3 軟件系統的測試不夠充分

通常情況下,軟件系統在設計完成之后,往往都會忽視了對軟件系統的測試工程,如果沒有對相應的計算機軟件系統進行測試,這就會在系統運營過程中出現各種問題,造成計算機系統的崩潰。

1.4 計算機軟件開發系統新特性的增加

在軟件開發運用過程中,運營過程都會增加一些新的需求和內容,這樣就會使得軟件運行程序變得更加復雜,在很大程度上將會影響軟件的運行,為此,在軟件系統的運行過程中,若沒有嚴格的系統要求,就必須要添加相應的需求,若需要進行添加新的特性,這就必須要對計算機運行系統的計劃進行修改。

2 計算機軟件開發設計中的對策分析

2.1 模塊式的設計方法

通常情況下,模塊化的設計方法,這是當前計算機軟件開發設計的最為常見的方法,通常此種方法,可以有效地降低軟件設計程序的復雜性,還能夠進一步使用基礎上進行添加,或者是改變相應的程序。同樣的,模塊化的設計方法從本質上看,就是將每個軟件程序分為幾個小的程序,只有這樣,才能更好地進行相應的設計和處理,同時保證每個程序都是獨立設置的。在操作人員方面,模塊化的設計方法需要多人進行協助,才能達到最優化的效果。通過對程序的不斷修訂和改進,才能更好地推動各個程序的穩定運行。從另外一個方面來看,由于不同系統分解設計中的程序設計思想和理念不同,對下屬的程序設計也會有所不同,為此,就必須要對軟件系統設計進行相應的調試,或者是可以增加新特性,對各級的程序必須要進行仔細地進行設計和調試,才能有效地確保模塊設計的相應原則。

2.2 面向對象的設計方法

設計方法上,面向對象設計方法是當前計算機軟件開發設計中的難點設計方式,并且,在現實的生活中, 計算機軟件設計所要能面向大多數都是實體,例如,是功能開關,信號傳輸以及傳感器等方面,在這種設計方法上,就是通過實體和模塊等方面的程序進行相應的軟件開發和設計,每個設計對象都是有所不同的,在相應的計算機軟件設計過程中,能夠對其進行相應的分解方式,之后就可以有效地面向對象進行設計,切實利用非形式化的方式將對象進行功能上的闡述出來,這樣就可以確定相應的對象,確定相應的屬性操作的,進而實現對象來表示相關的現實模型。之后就可以將模型進行映射,這樣就能夠有效地得到對象模型,解決計算機軟件系統中所遇到的困難,從而可以有效地建立各個對象接口,以及相應的可見性,最后才能有效地實行對每個對象的屬性進行科學設計。

2.3 設計中的數據流計算

在計算機軟件系統開發過程中,很多都是面向有結構層次的設計,而且,在很多的領域應用當中,很多只是只有數據,沒有相應的結構層次,如,科技領域和工程領域等方面,對于這些計算機領域設計中可能會技術上的困難,而對于軟件開發過程中的數據流設計,可以針對數據流進行設計的全新方式,這樣就能夠有效地打破結構層次的設計,在很多程度上可以很好地解決各個領域重大軟件的設計難題。

在數據流的設計環節過程中,主要是通過設計對象各個方面的信息進行收集和整理,之后就可以根據所搜集的信息進行軟件設計。在這一過程中,必須要建立階段使用的結構化的數據 流圖特征,之后對這些信息進行詳細分析和準確分析,判斷相應的數據信息流是屬于變換型還是事務型,之后就能夠分別對變換型和事務型進行分析,從而可以很好地得出軟件設計的相應結構。

同樣的,在數據設計方式上,主要是注意耦合度以及內聚兩個方面的影響因素,這是因為可以有效地通過兩個方式進行確定軟件設計是否具備獨立的性質,這也是當前計算機軟件系統開發過程中的難點。

3 結語

現階段,軟件是當前計算機系統中最為重要的組成部位,只有在軟件的測試、設計和后期維護等方面加強設計,切實根據軟件系統的設計規范和要求建立成為一個同一層次的模塊,隨著科學技術的不斷發展,只有不斷優化軟件開發過程中的各個環節,針對以上的問題進行深入分析,并得到有效地的解決,才能更好地促進計算機軟件開發設計共走的順利進行。

參考文獻

[1]夏雪飛,騰達,魏榮凱.基于計算機軟件開發中影響軟件質量的因素探討[J].電子技術與軟件工程,2013(23):1-17.

[2]王浩.探析計算機軟件開發的規范化[J].計算機光盤軟件與應用,2012(18):57-83.

[3]李大鵬.關于計算機軟件開發語言的研究[J].計算機光盤軟件與應用,2012(06):48-82.

作者簡介

張靜(1977-),女, 吉林省九臺市人。山東大學工程碩士學位?,F為德州職業技術學院講師。研究方向為軟件開發。

篇2

1計算機視覺的概述及基本體系結構

1.1計算機視覺概述

通過使用計算機和相關設備,對生物視覺進行模擬的方式,就是計算機視覺。對采集到的圖片或視頻進行相應的技術處理,從而獲得相應的三維信息場景,是計算機視覺的主要任務。計算機視覺是一門學問,它就如何通過計算機和照相機的運用,使人們獲得被拍攝對象的數據與信息所需等問題進行研究。簡單的說,就是讓計算機通過人們給其安裝上的“大腦”和“眼睛”,對周圍環境進行感知。計算機視覺是一門綜合性學科,在各個領域都有所作為,已經吸引了各個領域的研究者對其研究。同時,計算機視覺也是科學領域中一個具有重要挑戰性的研究。

1.2計算機視覺領域基本體系結構

提出第一個較為完善的視覺系統框架的是Marr,他從信息處理系統角度出發,結合圖像處理、心理物理學等多領域的研究成果,提出被計算機視覺工作者基本接受的計算機視覺系統框架。在此基礎上,研究者們針對視覺系統框架的各個角度、各個階段、各個功能進行分析研究,得出了計算機視覺系統的基本體系結構,如圖1。

2計算機視覺在交通領域的應用

2.1牌照識別

車輛的唯一身份是車輛牌照。在檢測違規車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應用價值。然而在實際應用工作中,雖然車牌識別技術相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術仍需改善。車牌定位技術、車牌字符識別技術和車牌字符分割技術是組成車牌識別技術的重要部分。

2.2車輛檢測

目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續變化的。此外,對于某些交通區域來說,公共資源的配備,比如交通警察、交通車輛的數量是有限的。如果能根據計算機視覺技術,對交通路口的不同時間、不同位置的交通情況進行分析計算,并對交通流量進行預測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據實際情況設置動態變化等技術提供支持。

2.3統計公交乘客人數

城市公共交通的核心內容是城市公交調度問題,一個城市如何合理的解決公交調度問題,是緩解城市運力和運量矛盾,緩解城市交通緊張的有效措施。城市公交調度問題,為公交公司與乘客的平衡利益,為公交公司的經濟利益和社會效益的提高做出了巨大的貢獻。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調度不均衡問題,使有限資源浪費嚴重。在計算機視覺智能公交系統中,自動乘客計數技術是其關鍵技術。自動乘客計數技術,是對乘客上下車的時間和地點自動收集的最有效的技術之一。根據其收集到的數據,從時間和地點兩方面對客流分析,為城市公交調度進行合理的安排。

2.4對車道偏離程度和駕駛員工作狀態判斷

交通事故的發生率隨著車輛數量的增加而增加。引發交通事故的重要因素之一就是駕駛員疲勞駕駛。據相關數據顯示,因車道偏離導致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導致車道偏離的主要原因。針對此種現象,為減少交通事故的發生,計算機視覺中車道偏離預警系統被研究開發并被廣泛應用。針對駕駛員眨眼頻率,利用計算機視覺對駕駛員面部進行圖像處理和分析,再根據疲勞駕駛關注度與眨眼頻率的關系,對駕駛員的工作狀態進行判斷。此外,根據道路識別技術,對車輛行駛狀態進行檢測,也是判斷駕駛員工作狀態的方法之一。這兩種方法,是目前基于計算機視覺的基礎上,檢測駕駛員疲勞狀態的有效方法。

2.5路面破損檢測

最常見的路面損壞方式就是裂縫。利用計算機視覺,及時發現路面破損情況,并在其裂縫程度嚴重之前進行修補,有利于節省維護成本,也避免出現路面坍塌,車輛凹陷的情況發生。利用計算機視覺進行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。

3結論

本文從計算機視覺的概述,及計算機視覺基本體系結構,和計算機視覺在交通領域中的應用三面進行分析,可見計算機視覺在交通領域中的廣泛應用,在交通領域中應用的有效性、顯著性,以此可得計算機視覺在現展過程中的重要性。隨著計算機視覺技術的越來越成熟,交通領域的檢測管理一定會加嚴格,更加安全。

作者:夏棟 單位:同濟大學軟件學院

參考文獻:

[1]段里仁.智能交通系境在我國道路空通管理中的應用[J].北方工業時報,2015(06).

[2]王豐元.計算機視覺在建筑區間的應用實例分析[J].河北電力學報,2015(04).

[3]李釗稱.主動測距技術在計算機數據分析中的作用探析[J].計算機應用,2015(08).

[4]馬良紅.三維物體影像的攝取與分析[J].中國公路學報,2014(05).

篇3

計算機視覺是一門研究如何使機器“看”的科學,更進一步地說,就是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,并進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。計算機視覺包括集成的視覺系統與真實世界視覺的應用建設。創建三維模型的過程是相當困難的,需要機械測量攝像機的位置或手動對準一個場景的局部三維視圖。通過使用相應的算法,它可以通過集合中一個場景的立體圖像,然后自動生成一個逼真、幾何精確的三維數字化模型。

全書分為三大部分,共14章:1.引言:立體圖像和深度知覺、三維視覺系統、三維視覺應用的介紹;2.視覺的研究簡史;3.二維和三維視覺的形成;4.圖像匹配中低層次圖像處理:包括卷積濾波、離散平均、離散分化、邊緣檢測、結構張量、角點檢測等內容;5.尺度空間的視覺:包括圖像尺度、高斯尺度空間、微分尺度空間、多分辨率金字塔等內容;6.圖像匹配算法:包括各種匹配措施、計算方面的匹配、立體匹配方法的多樣性、基于區域、彈性、梯度的匹配等內容;空間重構及多視圖集成:一般的三維重建和多視圖集成方面的內容;8.具體案例:臨床和獸醫應用、電影重構等具體實例的分析;9.射影幾何基礎;10.圖像處理的張量微積分基礎:包括線性算子和變坐標系統的基本概念、度量張量、簡單的張量代數等內容;11.圖像中的失真和噪聲:包括噪聲模型、產生噪聲的測試圖片、正態分布生成隨機數;12.圖像變換程序:包括結構的變形系統、坐標變換模塊、像素值的插值、經典實力等內容;13.編程技術,圖像處理和計算機視覺:包括其設計與實現、統一的建模語言、設計模式、處理平臺等內容;14.圖像處理庫。

作者Bogusaw Cyganek于1993年獲得電子計算機科學學位,于1996年獲得了赫爾辛堡科技大學博士學位。近年來,他還與許多科學中心合作,在計算機視覺系統的發展方面做出了貢獻。作為一個軟件開發經理和高級軟件工程師,他有著多年的實際工作經驗。他目前在波蘭克拉科夫AGH科技大學(AGH University of Scien and Technology)電子部任研究員和講師,研究興趣包括計算機視覺、模式識別、以及對可編程器件和嵌入式系統的開發。他還是電子電氣工程師協會(IEEE,Institute of Electrical and Electronics Engineers)、國際模式識別學會(IAPR,International Association for Pattern Recognition)、工業和應用數學學會(SIAM,Society for Industrial and Applied Mathematics)成員。

本書提供了對三維計算機視覺方法,理論和算法的全面的介紹。幾乎每一個理論問題都使用C++和Matlab的偽代碼或完整代碼進行實現,并且提供下載的軟件網站、案例研究和練習。本書是相關學者、程序員的有益參考,也適合對計算機科學、臨床攝影、機器人領域、圖形和數學感興趣的學生或研究人員閱讀。

李亞寧,碩士研究生

篇4

【關鍵詞】OpenCV視覺庫 圖像處理 Android平臺

Opencv全稱:Open Source Computer Vision Library,是一個可以移植到其他開發工具中的一個跨平臺的圖像處理視覺庫,它由C++語言編寫,主要有C++、C語言接口,為了能在手機等移動端更方便的進行圖像處理,我們利用其JAVA接口將opencv視覺庫添加到Android的開發工具中,實現了在移動端的圖像處理功能。

1 opencv的特點

(1)跨平臺,有很好的移植性。Opencv由跨平臺的中高層API構成,可以運行在Linux、Windows和Mac OS操作系y上,該庫有C++、C、Java接口,我們運用Java接口就可以將Opencv視覺庫移植到Android studio開發工具中。

(2)免費、開源,與耗費很高的商業化工具(比如 MATLAB+Simulink)有很大的區別。

(3)高效、快速、使用方便。Opencv視覺庫具有強大的圖像運算功能,API中有比較完善的處理函數,能夠明顯提高開發效率。

2 Opencv在Android studio中的環境搭建流程

2.1 安裝Java JDK

需要完成JDK的下載、安裝和環境配置的流程,安裝完成后,要運行資源管理器輸入 Java Version來驗證是否安裝成功,若顯示Java版本信息,則安裝成功。

2.2 下載Android Studio開發工具并安裝

在Android Studio的中文社區下載最新的Android Studio開發工具(要包含Java SDK),并運行Android Studio,根據安裝提示進行安裝,并運行開發工具。

2.3 配置Opencv Android SDK

在Opencv官網(http://)下載Opencv Android SDK并解壓。在Android Studio中,新建一工程,點擊File并import Module,并選中解壓的Opencv SDK文件夾中的Java文件夾,這樣就將Opencv視覺庫移植到了Android Studio中。然后右鍵App project,打開open Module Settings中的Depencies,點擊Module Dependency,添加OpencvLibrary,這樣就完成了深層配置。最后把Opencv SDK文件夾中的native文件夾中的libs的4個文件夾復制到所建好的工作空間中的project中的libs中。

3 圖像的灰度處理和像素取反處理的應用舉例

本文中是用的移動端為魅族MX3,Android版本號為5.0.1。

3.1 灰度處理

使用OpenCv將一幅圖像轉換為灰度圖像在實際應用中也不少,轉換為灰度圖像比較簡單,關鍵函數: cvCvtColor:cvCvtColor(IplImage* src, IplImage* dst, CV_BRG2GRAY)。值得注意的是:最后一個參數為 CV_BRG2GRAY ,表示將BRG圖片(彩色圖片)轉換為灰度圖片(黑白),參數src、dst必須事先分配好內存空間,使用完之后必須要釋放空間。

3.2 像素操作―取反

OpenCV中圖像取反是將圖像中的像素點變為原來像素點的反色。例如,如果一副灰度圖像的每個像素值由2^8=256個,假設點i點像素值為brga[i] ,則取反后的像素值為 255- brga[i]&oxff。

關鍵代碼為:

int cnum = src.channels();

byte[] bgra = new byte[cnum];

for (int i = 0;i

bgra[i] = (byte) (255 - bgra[i]&0xff);}

然后運用matToBitmap函數將Mat格式的圖像轉換成Bitmap的圖像,并顯示在android手機移動端。

經過編寫代碼并運行得到的處理結果如圖1所示。

4 結束語

OpenCV視覺庫是一套簡單易用且完整的計算機視覺框架,幫助開發人員完成大量的底層工作,減少了工作量,更有效提高了設計出復雜計算機圖形處理的能力。并且我們將OpenCV移植到Android操作系統中去,也是圖像處理領域的一大進步。我們相信,在OpenCVForAndroid的應用不斷拓展中,眾多圖像處理領域會有廣泛的前景。

參考文獻

[1]陳雪嬌.基于Open CV的計算機視覺技術研究[J].電腦知識與技術,2015(30).

[2]張家怡.圖像識別的技術現狀和發展趨勢[J].電腦知識與技術,2010(21).

[3]黎松,平西建,丁益洪.開放源代碼的計算機視覺類庫Open CV的應用[J].計算機應用與軟件,2005.22(08).

[4]何鵬,王連鵬,楚艷紅.基于Open CV 的機器視覺在智能手機中的應用[J].計算機工程與設計,2011(10).

[5]王福斌,李迎燕,劉杰,陳至坤.基于OpenCV的機器視覺圖像處理技術實現[J].機械與電子,2010(06).

作者簡介

劉賢輝(1992-),男,山東省青島市人。現為青島市山東科技大學在讀研究生。主要研究方向為移動端的圖像處理研究

篇5

電力系統是我國國名經濟的基石。電力系統是由發電、變電、輸電、配電和用電等環節組成的電能生產與消費系統?,F代社會需要的是安全可靠經濟的電能。電力系統主要由發電輸電變電配電及用電等5部分組成。電力系統是一個具有復雜的大系統由于用戶的不斷增加的需求,電網對于技術的要求水平也提出了越來越高的要求。

1 電力系統自動化的發展趨勢總的發展趨勢的特點研究

1.1 電力系統自動化的圖形化特點

因為電力系統聯網工程的正式啟動,電力系統的調度管理、數據計算分析呈現出傳輸路徑的交叉性,信息更新越來越高速這樣的幾種特點。在計算機技術和通信技術的快速發展下,電力系統技術整合也在蓬勃發展著。電力系統信息數據處理上已經不再使用傳統的處理方式,而是使用圖形化處理這樣的新技術,這樣看到圖形,電力系統管理者就能了解電力系統的變化發展趨勢,也就能對未來電力系統軟件開發帶來絲絲先機。

1.2 電力系統自動化的遠程化特點

過去電力系統的硬件平臺大部分是計算機,外加使用擴展測控法對接口電路工作開展監測。此類的設計有很多的優勢,這種類型的設計的周期很長,擴展性也很好。但是這樣的設計方式也具有著高成本、大體積、大功耗以及靈動性差的多種缺點?,F在,正是有著網絡技術的不斷更新和電子技術的不斷進步,遠動終端設備已經變為越來越接近最優化、智能化和小型化、協調化。因此,建立在此基礎之上的電力系統也具備了遠程化的特點,使電力系統自動化在控制系統方面的發展更加貼近智能化。

1.3 電力系統自動化的分布化特點

發電率范圍在幾十兆瓦至幾千瓦之間并且模型較小的發電單元,它的地點處于用戶周圍還有有高效和可靠特點的稱為電力系統自動化技術分布化。分布式發電主要包括以液體或氣體為燃料的內燃機、太陽能發電、微型燃氣輪機和風力發電等等的其他一些發電方式。這種發電技術具有很好的靈活性,能夠給與用戶各不相同的感受。還能為邊遠商業區域提供可靠的電力資源,讓他們使用具有再生特點的資源進行多次發電,這樣的電能還具有穩定度高的特點,是具有分度化的特色。極端及技術、新材料技術和電力電子技術都要作為支柱技術被在其中使用。

2 電力系統與新技術的結合

2.1 與智能計算機的結合

計算機視覺技術就是與智能計算機的結合之一。使用計算機視覺技術能夠方便的獲得多種圖像信息。在電力系統中應用計算機視覺技術。目前,計算/!/機視覺技術使用在電力系統中的作用是修改遙控系統在此同時提高它的性能。這主要表現在使用在線監測和開展無人操作或者環境監視,紅外圖像監測是電力設備在線監測常用方法中效果最好的。它既有這使用方便,又有著精準度較高的特點。紅外圖像識別方面主要就是使用計算機視覺技術,這樣能取得較好的效果。計算機視覺技術的工作原理是在科學獲取電力設備實時紅外圖像和電力設備正常工作時圖像后,將兩者開展對比。如果出現不正常。也就因此能夠證明電力設備出現問題。第開展無人操作或者環境監視是使用微波雙鑒探測器進行協助,將差分圖像以及流光法一起使用對移動物體開展監測。如果出現不正常現象,那么系統就可以識別出來,并且警告我們。因為計算機視覺技術還處于起步階段,其存在一定的不足之處。雖然計算機視覺技術發展迅速,但計算機視覺技術發展的并不完善,因為圖像識別自身的復雜性的原因,所以現階段還不能實現完全的無人操作。正是因為有著這些原因,在大多數情況下,計算機視覺技術只能夠作為一種輔助技術。

2.2 與微機保護系統的結合

在電力系統自動化技術發展速度過快并且伴隨著相關微機設備應用范圍越來越普遍的情況下。人們越來越嚴格的要求微機保護系統。更簡單的說,也就是原有的電力系統自動化技術當中的微機保護系統已經無法滿足社會發展的需要。人們需要的微機保護系統應該具備更加牢靠與穩定的可以對通信進行保護的能力。這樣才能夠達到人們希望人機互動的效果。這樣的系統在對硬件提高出高要求的同時也對軟件業產生了更加具體的要求。例如,我國在上世紀末將第一套微機線路保護設備投入使用,并且該設備因為性能占據極大的優勢從而獲得世界各國用戶的普遍認可。

在繼電保護設備中,我們更加需要完善的問題就是設備的實時性。設備的實時性直接關乎電網的安全穩定,它直接受到其影響。假如設備實時性出現缺陷,會給電力系統帶來難以補救損失的可能性。現階段在我國電力系統中應用的嵌入式系統通常來說主要為C/C++語言。這是因為該系統不僅靈活性高并且可移植性也很強。同時該系統還使用了能夠隨時改變的模塊化,目的在于處理好各種存在可能性會產生的問題但是卻又不能夠進行更換的難題。在提供便利的同時也能夠盡最大的努力滿足用戶各種要求。

篇6

國內人工智能產業鏈解構

基礎技術、人工智能技術和人工智能應用構成了人工智能產業鏈的三個核心環節,我們將主要從這三個方面對國內人工智能產業進行梳理,并對其中的人工智能應用進行重點解構。

人工智能的基礎技術主要依賴于大數據管理和云計算技術,經過近幾年的發展,國內大數據管理和云計算技術已從一個嶄新的領域逐步轉變為大眾化服務的基礎平臺。而依據服務性質的不同,這些平臺主要集中于三個服務層面,即基礎設施即服務(IaaS)、平臺即服務(PaaS)和軟件即服務(SaaS)?;A技術提供平臺為人工智能技術的實現和人工智能應用的落地提供基礎的后臺保障,也是一切人工智能技術和應用實現的前提。

對于許多中小型企業來說,SaaS 是采用先進技術的最好途徑,它消除了企業購買、構建和維護基礎設施和應用程序的需要;而 IaaS通過三種不同形態服務的提供(公有云、私有云和混合云)可以更快地開發應用程序和服務,縮短開發和測試周期;作為 SaaS 和 IaaS 中間服務的 PaaS 則為二者的實現提供了云環境中的應用基礎設施服務。

人工智能技術平臺

與基礎技術提供平臺不同,人工智能技術平臺主要專注于機器學習、模式識別和人機交互三項與人工智能應用密切相關的技術,所涉及的領域包括機器視覺、指紋識別、人臉識別、視網膜識別、虹膜識別、掌紋識別、專家系統、自動規劃、智能搜索、定理證明、博弈、自動程序設計、智能控制、機器人學習、語言和圖像理解和遺傳編程等。

機器學習:通俗的說就是讓機器自己去學習,然后通過學習到的知識來指導進一步的判斷。我們用大量的標簽樣本數據來讓計算機進行運算并設計懲罰函數,通過不斷的迭代,機器就學會了怎樣進行分類,使得懲罰最小。這些學到的分類規則可以進行預測等活動,具體應用覆蓋了從通用人工智能應用到專用人工智能應用的大多數領域,如:計算機視覺、自然語言處理、生物特征識別、證券市場分析和DNA 測序等。

模式識別:模式識別就是通過計算機用數學技術方法來研究模式的自動處理和判讀,它偏重于對信號、圖像、語音、文字、指紋等非直觀數據方面的處理,如語音識別,人臉識別等,通過提取出相關的特征來實現一定的目標。文字識別、語音識別、指紋識別和圖像識別等都屬于模式識別的場景應用。

人機交互:人機交互是一門研究系統與用戶之間交互關系的學問。系統可以是各種各樣的機器,也可以是計算機化的系統和軟件。在應用層面,它既包括人與系統的語音交互,也包含了人與機器人實體的物理交互。

而在國內,人工智能技術平臺在應用層面主要聚焦于計算機視覺、語音識別和語言技術處理領域,其中的代表企業包括科大訊飛、格靈深瞳、捷通華聲(靈云)、地平線、SenseTime、永洪科技、曠視科技、云知聲等。

人工智能應用

人工智能應用涉及到專用應用和通用應用兩個方面,這也是機器學習、模式識別和人機交互這三項人工智能技術的落地實現形式。其中,專用領域的應用涵蓋了目前國內人工智能應用的大多數應用,包括各領域的人臉和語音識別以及服務型機器人等方面;而通用型則側重于金融、醫療、智能家居等領域的通用解決方案,目前國內人工智能應用正處于由專業應用向通用應用過度的發展階段。

(1)計算機視覺在國內計算機視覺領域,動靜態圖像識別和人臉識別是主要研究方向

圖像識別:是計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。識別過程包括圖像預處理、圖像分割、特征提取和判斷匹配。

人臉識別:是基于人的臉部特征信息進行身份識別的一種生物識別技術。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部的一系列相關技術,通常也叫做人像識別、面部識別。

目前,由于動態檢測與識別的技術門檻限制,靜態圖像識別與人臉識別的研究暫時處于領先位置,其中既有騰訊、螞蟻金服、百度和搜狗這樣基于社交、搜索大數據整合的互聯網公司,也有三星中國技術研究院、微軟亞洲研究院、Intel中國研究院這類的傳統硬件與技術服務商;同時,類似于 Face++ 和FaceID 這類的新興技術公司也在各自專業技術和識別準確率上取得了不錯的突破。

而在難度最大的動態視覺檢測領域,格靈深瞳、東方網力和 Video++ 等企業的著力點主要在企業和家庭安防,在一些常見的應用場景也與人臉識別技術聯動使用。

(2)語音/語義識別

語音識別的關鍵基于大量樣本數據的識別處理,因此,國內大多數語音識別技術商都在平臺化的方向上發力,希望通過不同平臺以及軟硬件方面的數據和技術積累不斷提高識別準確率。

在通用識別率上,各企業的成績基本維持在 95% 左右,真正的差異化在于對垂直領域的定制化開發。類似百度、科大訊飛這樣的上市公司憑借著深厚的技術、數據積累占據在市場前列的位置,并且通過軟硬件服務的開發不斷進化著自身的服務能力;此外,在科大訊飛之后國內第二家語音識別公有云的云知聲在各項通用語音服務技術的提供上也占據著不小的市場空間。值得注意的是,不少機器人和通用硬件制造商在語音、語義的識別上也取得了不錯的進展,例如智臻智能推出的小 i 機器人的語義識別、圖靈機器人的個性化語音助手機器人和服務、被 Google 投資的出門問問的軟硬件服務。

(3)智能機器人

由于工業發展和智能化生活的需要,目前國內智能機器人行業的研發主要集中于家庭機器人、工業企業服務和智能助手三個方面其中,工業及企業服務類的機器人研發企業依托政策背景和市場需要處于較為發達的發展階段,代表性企業包括依托中科院沈陽自動化研究所的新松機器人、聚焦智能醫療領域的博實股份,以及大疆、優愛寶機器人、Slamtec 這類專注工業生產和企業服務的智能機器人公司。在以上三個分類中,從事家庭機器人和智能助手的企業占據著絕大多數比例,涉及到的國內企業近 300 家。

(4)智能家居

與家庭機器人不同,智能家居和物聯企業的主要著力點在于智能設備和智能中控兩個方面。在這其中,以海爾和美的為代表的傳統家電企業依托自身渠道、技術和配套產品優勢建立起了實體化智能家居產品生態. 而以阿里、騰訊、京東、小米和樂視等互聯網企業為代表的公司則通過各自平臺內的數據和終端資源提供不同的軟硬件服務。

值得關注的是,科沃斯、broadlink、感居物聯、風向標科技、歐瑞博、物聯傳感和華為等技術解決方案商在通用硬件和技術、系統級解決方案上已成為諸多智能家居和物聯企業的合作伙伴。綜合來看,智能家居和物聯企業由于市場分類、技術種類和數據積累的不同各自提供著差異化的解決方案。在既定市場中,沒有絕對意義上的排斥競爭,各企業之間的合作融合度較強。

(5)智能醫療

目前國內智能醫療領域的研究主要集中于醫療機器人、醫療解決方案和生命科學領域。由于起步較晚和技術門檻的限制,目前國內醫用機器人的研發水平和普及率相較于國際一線水平仍存在一定的差距,從事企業主要集中與手術機器人和康復機器人兩大領域,以新松機器人、博實股份、妙手機器人、和技創等企業為代表。

在醫療解決方案方面,以騰訊、阿里巴巴、百度和科大訊飛為代表的公司通過和政府、醫療機構的合作,為腦科學、疾病防治與醫療信息數據等領域提供智能解決方案。而在生命科學領域,研究的著眼點在以基因和細胞檢測為代表的前沿研究領域。

綜合來看,國內人工智能產業鏈的基礎技術鏈條已經構建成熟,人工智能技術和應用則集中在人臉和圖像識別、語音助手、智能生活等專用領域的場景化解決方案上。就趨勢來看,未來國內人工智能領域的差異化競爭和突破將主要集中在人工智能相關技術的突破和應用場景升級兩個層面。

未來國內人工智能行業發展的五大趨勢

(1)機器學習與場景應用將迎來下一輪爆發

根據 Venture Scanner 的統計,截至 2015 年 9 月,全球人工智能領域獲得投資的公司中,按照平均融資額度排名的五大業務依次是:機器學習(應用類)、智能機器人、計算機視覺(研發類)、機器學習(研發類)和視頻內容識別等。

自 2009 年以來,人工智能已經吸引了超過 170 億美元的投資。過去四年間,人工智能領域的民間投資以平均每年 62% 的增長速率增加,這一速率預計還會持續下去。而在 2015 年,全球人工智能領域的投資占到了年度總投資的 5%,盡管高于 2013 年的2% ,但相比其他競爭領域仍處于落后位置。

目前中國地區人工智能領域獲得投資最多的五大細分領域是計算機視覺(研發類)、自然語言處理、私人虛擬助理、智能機器人和語音識別。從投資領域和趨勢來看,未來國內人工智能行業的資本將主要涌向機器學習與場景應用兩大方向。

(2)專用領域的智能化仍是發展核心

基于 GPU(圖形處理器)計算速度(每半年性能增加一倍)和基礎技術平臺的飛速發展,企業對于人工智能神經網絡的構建取得了前所未有的突破。但是,由于人工智能各領域技術和算法的復雜性,未來 20 年內人工智能的應用仍將集中于人臉和圖像識別、語音助手和智能家居等專用領域。

通過上述產業鏈環節構成和投資分類可以看出,優勢企業的核心競爭力主要集中于特定領域的專用技術研發;其中,計算機視覺和語音識別領域的研發和應用已處于國際一流水平,專業應用機器人的研發也有望近 10 年內迎來突破性發展??梢灶A見的是,在由專業領域向通用領域過渡的過程中,自然語言處理與計算機視覺兩個方向將會成為人工智能通用應用最大的兩個突破口。

(3)產業分工日漸明晰,企業合作大于競爭

隨著專用領域應用開發的成熟和差異化技術門檻的存在,國內人工智能產業將逐漸分化為底層基礎構建、通用場景應用和專用應用研發三個方向。

在底層基礎構建方面,騰訊、阿里巴巴、百度、華為等企業依托自身數據、算法、技術和服務器優勢為行業鏈條的各公司提供基礎資源支持的同時,也會將自身優勢轉化為通用和專業應用領域的研究,從而形成自身生態內的人工智能產業鏈閉環。

在通用場景應用方面,以科大訊飛、格靈深瞳和曠視科技為代表的企業將主要以計算機視覺和語音識別為方向,為安防、教育和金融等領域提供通用解決方案。而在專用應用研發方面則集中了大部分硬件和創業企業,這其中既包括以小米和 broadlink 為代表的智能家居解決方案商,也包含了出門問問、linkface 和優必選這類的差異化應用提供商。

總的來說,由通用領域向專業領域的進化離不開產業鏈條各核心環節企業的相互配合,專用領域的競爭盡管存在,但各分工層級間的協作互通已成為多數企業的共識。

(4)系統級開源將成為常態

任何一個人工智能研究分支都涉及到異常龐大的代碼計算,加上漏洞排查與跨領域交叉,任何一家企業都無法做到在封閉環境內取得階段性突破的可能。可以看到的趨勢是,Google、微軟、Facebook 和雅虎等視人工智能為未來核心競爭力的頂級企業都先后開放了自身的人工智能系統。

需要明確的一點是,開源并不代表核心技術和算法的完全出讓,底層系統的開源將會讓更多企業從不同維度參與到人工智能相關領域的研發,這為行業層面新產品的快速迭代和共同試錯提供了一個良性且規范化的共生平臺。于開放企業而言,這也確保了它們與行業最新前沿技術的同步。

(5)算法突破將拉開競爭差距

作為人工智能實現的核心,算法將成為未來國內人工智能行業最大的競爭門檻。以 Google 為例,Google 旗下的搜索算法實驗室每天都要進行超過 200 次的改進,以完成由關鍵字匹配到知識圖譜、語義搜索的算法創新。

在未來競爭的重點機器學習領域,監督學習、非監督學習和增強學習三個方面算法的競爭將進入白熱化階段。而正是算法層面的突破造就了騰訊優圖、科大訊飛和格靈深瞳等企業在圖像識別和計算機視覺領域取得了突破性進展和國際一線的技術水平。

但就目前國內人工智能算法的總體發展而言,工程學算法雖已取得階段性突破,但基于認知層面的算法水平還亟待提高,這也是未來競爭的核心領域。

總的來看,雖然基礎技術的成熟帶來了存儲容量和機器學習等人工智能技術的提升,但由于現階段運算能力以及大規模 CPU 和GPU 并行解決方案的局限,目前國內人工智能的發展主要集中于計算機視覺、語音識別、智能生活等方向上。

雖然專用化領域的場景應用仍是目前研發和投資的核心,但隨著技術、數據的積累演化以及超算平臺的應用,由專用化領域的場景應用向語音、視覺等領域的通用化解決方案應該在未來 20 年內成為發展的主流。

篇7

【關鍵詞】機器視覺;VisionPro;識別定位;

1.引言

自20世紀80年代以來,機器視覺技術開始高速發展,已經從實驗室走向了人們生產生活的各個方面。機器視覺系統的特點是提高生產的柔性和自動化程度。在一些不適合于人工作業的危險工作環境或人工視覺難以滿足要求的場合,常用機器視覺來替代人工視覺;同時在大批量工業生產過程中用機器視覺檢測方法可以大大提高生產效率和生產的自動化程度。而且機器視覺易于實現信息集成,是實現計算機集成制造的基礎技術。現今,在機器視覺領域已經有了一些成熟的視覺開發軟件,其封裝了很多可靠、高效的算法和工具。本文選用美國康耐視公司的VisionPro軟件,這是一套基于PC架構的視覺系統軟件開發包,主要應用于各種復雜的機器視覺領域。它集成了用于定位、檢測、識別和通訊等任務的工具庫,可用C#、VB和VC等語言進行二次開發。本文基于VisionPro利用語言進行視覺定位系統的軟件開發[1]。

2.視覺定位系統

2.1 硬件組成

在圖像處理前首先要得到清晰、有效的圖像,這就需要有一套完整的硬件設備。一般主要包括照明用的光源、調節圖像清晰度的鏡頭、將圖像轉換為數字信號的攝像機和進行圖像處理的計算機。其中攝像機與計算機之間的接口也比很重要的,主要分為IEEE1394和采集卡,USB2.0或Gigabit Ethernet千兆網三種[2]。

本視覺系統采用的是日本FUJINON工業攝像頭,德國BASLER工業像機ACA1600-20GM,GigE千兆網接口。

2.2 基于VisionPro的軟件開發

本視覺定位系統利用編寫適合實驗需要的界面,界面中只包含需要的操作功能和數據,使整個界面看起來更加清楚簡單,操作起來更方便。

(1)圖像采集

本視覺系統通過GigE千兆網作為接口控制相機進行圖像采集。打開軟件并連接相機,設置好參數后,就可以通過可視化工具Image Source直接獲取圖像。

(2)相機的標定

機器視覺的基本任務之一是從攝像機獲取的圖像信息出發計算三維空間中物體的幾何信息,并由此重建和識別物體。空間物體表面某點的三維幾何位置與其在圖像中對應點之間的相互關系是由攝像機成像的幾何模型決定的,這些幾何模型參數就是攝像機參數。在大多數條件下,這些參數必須通過實驗與計算才能得到,這個過程被稱為攝像機標定[3]。

本文利用VisionPro的CalibChecker-boardTool工具進行攝像機標定。首先需要一個棋盤板,棋盤板必須滿足以下條件:必須由大小相同的黑白格子交替組成;格子最好是正方形,如果達不到的話,格子長寬比也要在0.9和1.0之間。本系統采用康耐視公司提供的標準棋盤板進行標定[4,5]。圖1是標定的結果。

(3)目標識別與定位

視覺定位的目的就是找出目標物的坐標位置。本文利用VisionPro的PMAlignTool工具對目標物體進行識別定位。PMAlignTool工具是基于PatMax算法,該算法采用模板定位技術(pattern-location technology),先訓練模板,然后根據模板對采集圖像進行模板匹配,實現定位。在訓練模板和定位過程中,PatMax不是基于像素柵格(Pixel grid)分析圖像,而是采用基于幾何外形(Features based)的定位方法,通過圖像的幾何特征信息和特征之間的空間位置關系進行模板訓練和匹配,使其能夠保證很高的精度和抗干擾性,而且可以高速定位發生旋轉、縮放、甚至拉伸形變的物體[1]。PMAlignTool工具定位的流程如圖2。

通過PMAlignTool工具對目標物體識別定位后,利用VB調用該工具下的Results.Item(i).GetPose().TranslationX和Results.Item(i).GetPose().Transl-ationY。這兩個值就是序號為i的目標物在圖像上的X、Y坐標值,其中i為識別的各個目標物的序號。

3.實驗

3.1 PatMax識別定位

在對攝像機完成標定校正后,運用自己編寫的人機交互界面完成對目標物體進行識別定位,并將所需要的目標位置坐標顯示在界面上。同時又將識別到的所有目標物體的坐標信息保存到了文本文檔中,方便調用。主要操作如下:

(1)模型訓練。實驗以一元硬幣為目標物,圖3為訓練完成的模型。

(2)目標識別定位。圖4是利用編寫的界面,在圖像上能夠清楚的顯示出所識別出的目標輪廓和形心位置,界面右方結果顯示區內可以看到所識別的目標數量和所需要的目標物的坐標。

3.2 對比實驗

視覺定位可以用的軟件和工具包很多,其中應用最廣泛的就是Opencv,它是一個基于(開源)發行的跨平臺計算機視覺庫,可以運行在Linux、Windows和Mac OS操作系統上。它輕量級而且高效——由一系列 C 函數和少量 C++ 類構成,同時提供了Python、Ruby、MATLAB等語言的接口,實現了圖像處理和計算機視覺方面的很多通用算法。為了驗證PatMax算法定位的準確性,本文利用Opencv對相同的圖像進行目標識別定位,對得到的效果圖和坐標進行對比[6]。如圖5所示,其中藍色為輪廓曲線,綠色十字為目標形心。

圖6為VisionPro識別硬幣的效果圖,輪廓和形心均用綠色線標識。對比兩圖可以看出VisionPro對輪廓的識別效果要更好一些。由于形心坐標是由輪廓曲線上的點計算得到的,所以VisionPro獲得的形心坐標值也會比Opencv的更加準確,而且精確度更高。下表是兩種方法得到的形心坐標。

4.結束語

本文基于VisionPro采用對其進行開發,首先利用VisionPro中的工具進行圖像的采集,攝像機的標定,運用PatMax算法進行目標物的識別與定位,然后運用編寫人機交互界面,可以更加方便快捷的得到所需要的目標物坐標值。本文利用Opencv對相同的圖像進行目標的識別定位,與VisionPro得到的結果進行實驗對比。結果證明基于VisionPro的視覺定位系統對目標的識別效果更好,定位的數據更加準確?;谠撥浖箲贸绦虻拈_發更加快速方便,得到的數據結果誤差較小,具有應用價值。

參考文獻

[1]威洛斯,焦宗夏.基于VisionPro的焊膏印刷機視覺定位系統[C].第十二屆中國體視學與圖像分析學術年會論文集,2008.

[2]Carsten Steger,Markus Ulrich,Christean Wiedemann,著.機器視覺算法與應用[M].楊少榮,吳迪靖,段德山,譯.北京:清華大學出版社,2008.

[3]邱茂林,馬頌德,李毅.計算機視覺中攝像機定標綜述[J].自動化學報,2000,26(1):47-59.

[4]Cognex,Cognex MVS-8100D and CDC Cameras Hardware Manual,2006.

[5]Cognex,VisionPro,Net Help,2006.

[6]Bradski G.,Kaehler A.著.學習OpenCV[M].于仁琪,劉瑞禎,譯.北京:清華大學出版社,2009.

作者簡介:

韓慶瑤(1953—),男,華北電力大學教授。

張志遠(1986—),男,華北電力大學能源動力與機械工程學院碩士研究生。

篇8

摘要:針對集成芯片制造中對定位、校準的高精度、實時性要求,提出了用機器視覺技術解決芯片基板定位的方法,通過對幾種模板匹配算法的研究,采用基于OpenCV的圖像分析技術實現了對集成芯片基板的準確定位,解決了傳統機械定位精度低、速度慢的問題。

關鍵詞:機器視覺;開放源代碼計算機視覺類庫;集成芯片基板;模板匹配

中圖分類號:TP39文獻標識碼:A

The Positioning Technology of Intergrated Chip Strip Based on OpenCV

LIU Hun-hai, HU Peng-hao,XIE Hu

(School of Instrument Science and Opto-electronics Engineering ,

HeFei University of Technology ,Hefei 230009 ,China)

Abstract: Because of the high requirement of position and speed in the process of integrated chips, A position method of integrated chip strip based on machine vision was proposed in this paper. By researching several template match algorithms, the accurate positioning of intergrated chip strip is implemented by using image processing technology based on OpenCV, and low precision and slow speed problem of traditional method is solved.

Keywords:machine vision; OpenCV; integrated chip strip; template match

引言

隨著現代半導體器件向微型化、集成化和高可靠性方向的發展,芯片生產和制造設備也朝著高速、高精度、智能化的全自動化的方向發展。機器視覺在芯片生產過程中扮演著越來越重要的角色,其中最為廣泛的應用是定位。

上海技美電子科技有限公司是一家生產集成芯片基板(如圖1)貼膜機的廠家,貼膜工序主要是將芯片貼在一層特殊的膜上,為下一步打斷芯片引線做好準備,而為了提高切割效率,通常將三塊基板一起,但這樣存在相對位置的偏差。針對傳統的光電式傳感器定位精度低、速度慢的缺點,開發了基于OpenCV的視覺定位系統,系統結構如圖2所示。當機械手臂將基板搬運到薄膜上之前,通過該系統,對基板進行定位,然后將結果反饋到控制單元進行調整。

系統使用的CCD相機是型號為XC-ES50CE的SONY相機,有效像素為752×582,圖像采集卡使用圖1集成芯片基板

的是比利時Euresys公司的產品,型號為Picolo Pro2。在整個系統中,最為關鍵的問題就是模板匹配。

1 基于灰度的模板匹配方法

本文主要比較了幾種基于灰度的圖像匹配算法:SSDA算法,金字塔算法,NCC算法等。

模板匹配的基本原理是通過相關函數的計算來找到它和被搜索圖的坐標位置[1-2]。如圖3所示,設模板T(n×m像素點)疊放在搜索圖S上移動,模板覆蓋下的那塊搜索圖為子圖 Sij,i,j為這塊子圖的左上角像點在S圖中的坐標。比較T和Sij的內容,若兩者一致,則T和S之差為零。測度方法:

1.1 SSDA算法

序貫相似性檢測算法(即SSDA算法)是對傳統模板匹配算法的改進。SSDA算法計算子圖像和模板圖像之間的差值,求和時不需要計算所有像素,而是隨機抽取某幾點像素,只要其和超過設定的閾值,則說明當前位置不匹配,進行下個位置的計算。

但是該算法本身沒有抗干擾性,如果在外界有噪聲的情況下,算法的精確度不高[3]。

1.2 金字塔算法

金字塔算法也叫分層算法,是直接基于人眼的視覺特點,先粗后細地觀看事物,步驟如下:

(1) 預處理。首先對模板和搜索圖進行分層預處理。通過每2×2=4個像素平均為一個像素構成二級圖像,然后將此圖像再用同樣的方法處理后得到一個分辨率更低的圖像。如此反復,我們可以得到K個處理后的圖像。

(2) 先粗后細的匹配。先從低分辨率的圖像Sk和TK開始進行匹配運算,找到粗匹配位置(xK,yK),然后在較高分辨率的圖像Sk-1和Tk-1上的粗匹配位置進行搜索,如此下去,一直到最高分辨率的SO和TO上找到匹配位置為止。

1.3 NCC算法

NCC算法就是歸一化互相關匹配算法,是一個經典的匹配算法,它是通過計算模板圖像和待匹配圖像的互相關值來決定匹配的程度,方法如下:

這種算法簡單,適用于尺寸較小的圖像匹配,且具有很強的抗白噪聲能力,在灰度變化及幾何畸變不大的情況下精度很高[3]。

2 基于OpenCV的模板匹配程序的 實現

2.1 程序流程及其實現

程序的流程如圖4所示,實驗采用的算法是NCC算法,函數完成比較后,通過使用cvMinMaxLoc找全局最大值,然后將匹配結果在原圖的對應位置標記出來(如圖5所示)。

程序實現主要利用OpenCV函數庫中的cvMatchTemplate函數[4],通過滑動過整個待匹配圖像,用指定的NCC算法比較模板圖像與待匹配圖像尺寸為 w×h 的重疊區域,并且將比較結果保存起來。

2.2 OpenCV簡介

開放源代碼的計算機視覺類庫OpenCV(Intel Open Source Computer Vision Library)由英特爾公司位于俄羅斯的研究實驗室所基于IPL(Intel Image Processing Library)開發,并與之兼容。具有良好的獨立性、跨平臺性、功能強大、處理速度快等特點[5]。

3 實驗數據

采用的是一張640×484的原圖,以及一張64×74的模板圖,實驗用電腦CPU為IntelCeleron

C PU420 1.6GHz ,內存為1G。經過實驗得出,匹配的平均時間為100.128ms,且能找到準確位置,能夠滿足廠家提出的2,000個/小時的技術要求。

4 結 論

綜上所述,利用OpenCV開發的模板匹配程序,擁有匹配準確、執行效率較高等特點,對于個別處理器還進行了優化,適用于對實時性要求不太高的場合,能夠滿足該企業芯片基板的定位要求,目前該系統已在企業運行。

參考文獻

[1] 張廣軍,機器視覺[M],科技出版社,2005: 7-03-014717-0.

[2] Kenneth R.Castleman,Digital Image Processing,Prentice Hall,1995:0132114674.

[3] 劉錦峰,圖像模板匹配快速算法研究[D].湖南長沙:中南大學,2007.

[4] IntelOpen Source Computer Vision Library Reference Manuals[EB/0L].2001.12.

[5] Intel Open Source Computer Vision Library HTML Reference.2003.2.

[6] 黎松,平西建,丁益洪.開放源代碼的計算機視覺類庫OpenCV的應用[J],計算機應用與軟件. 2005,22(8):134-136.

[7] 呂學剛,于明,劉翠響.數字圖像處理與計算機視覺編程的有力工具-IPL和OpenCV[J].現代計算機,2002,147:69-71.

篇9

關鍵詞:計算機技術;視覺識別技術;交互技術;會議展示;智能辦公環境

在日常的企業辦公管理活動中,有很多時候需要可視化地展示企業市場計劃、新產品設計、數據分析報告等。盡管這些活動所需要的材料在事前可以經由辦公自動化軟件處理,但處理結果卻很大程度上只能由靜態的PPT展示和說明。但很多時候,這些展示和說明往往是多個部門不同專業背景的人員參與,于是展示材料制作的水平和質量就很大程度上影響到了參與者對所展示內容的理解和吸收程度。很多復雜的問題或者設計的展示,如果能采用互動交互的方式展示,在很大程度上能夠幫助問題討論的參與者對所討論問題更好的理解。這一點在常規的教育過程中已經獲得了充分的證實,相關的數據和結果可以從多媒體教學的優勢的相關研究中得到。同樣,企業中很多方案的討論,數據分析報告的說明其實對于企業而言也是一個方案設計者或數據研究分析者對相關人員類似教學的過程。采用現有企業常規會議設備諸如投影儀、普通筆記本電腦、電腦攝像頭配合相應的計算機視覺識別程序,我們可以將交互的投影演示引入到企業日常的展示討論活動中,增強溝通效果,提高工作效率,并且在技術上同樣的識別交互的程序配合上相應的員工面部特征的數據庫,還能擴展延伸到考勤或門禁系統中提供更加智能化的辦公環境。對于以展示溝通為主的教育培訓企業,通過配合一般人臉數據特征,可以通過攝像頭捕捉現場視頻并識別其中人臉識別,記錄現場關注展示內容的人員的數量,作為日后教學效果的自然客觀的評估參考。

1目前辦公信息化中存在的問題

1.1會議演示文稿展示時多人交互型差

目前主流的演示文稿制作及展示軟件主要大多都集成在套裝的辦公軟件中,其中主要常見的種類分別是MicrosoftOffice系列中的PowerPoint、MacOS系統下的KeyNote、基于Linux操作系統的Openoffice中的Impress。它們主要的功能都是對輸入的文字、圖片聲音等多媒體進行編輯制作最后生成電腦上播放的多媒體幻燈片,盡管它們都具有強大的多媒體數據的處理能力,但最終制作的多媒體幻燈片在演示時都是“單向交互”的,即由播放者播放,而其中的內容及動畫按預先設計好的模式顯示。如果使用Adobe公司的Captivate或Authware這樣的多媒體交互制作軟件則會需要有專人進行操作,浪費大量的時間和精力,但如果是配置專門的多點觸摸屏幕,則一來屏幕尺寸有所限制,二來費用相對較高容易造成設備的浪費。

1.2傳統辦公考勤與門禁系統的弱勢

目前企業常規的門禁系統與日常考勤系統往往是分離的,兩個系統使用了各自獨立的軟硬件環境,其中門禁系統使用的是攝像監控設備采集信息并通過專人24小時值班,其主要職能僅僅是監控辦公環境的人員進出并記錄下相應的影像資料。而企業日常的考勤系統則要么采用人工簽到的方式,要么采用人工打卡或者指紋打卡方式。如果采用打卡方式管理則需要添置專門的打卡機,這些打卡機多數是獨立工作,對于員工的考勤則需要人工根據卡片記錄情況統計。無論是員工自身打卡或者是統計考勤都是人工完成,有時還會出現錯誤和疏漏,同時主要的問題還在于容易出現代人打卡等作假的情況。所以,在傳統的辦公考勤與門禁系統獨立的情況下,兩個系統各自記錄各自的相關數據,同時投入兩套不同的軟硬件環境,有時這樣的辦公環境的信息化反而沒有給人員帶來便利,而是增加一項打卡簽到的日常任務。

2對存在的部分問題的分析和討論

2.1傳統演示設備缺乏交互型功能

由于很長一段時間硬件以及軟件的條件約束,電腦的鍵盤、鼠標完成了95%以上的數據輸入工作,單一顯示功能的顯示器投影儀也成了最主要的信息輸出設備。所以常規軟件設計和開發時都是把鍵盤、鼠標、顯示器/投影儀的輸入輸出組合當做幾乎所有使用情況下的模式。但隨著觸摸屏與多點觸控硬件的出現,多點觸控、屏幕的直接交互輸入輸出操作成了未來發展的一個趨勢,并且相對普通鼠標和單一顯示功能的顯示器用戶交互體驗明顯提升,人機交互界面更友好直觀。但是對于普通辦公中使用的投影儀,由于其投影的目標位置情況多樣,如果一體化的設計制造具有交互功能的互動投影儀其成本要比普通投影儀更高,對于解決互動操作的問題經濟上不是最優的。而大面積的多點觸控屏幕由于設備體積和重量的因素無法在需要靈活移動的新產品推廣談判等活動中使用,如果只是企業自身辦公環境中做普通會議展示的效果改進,其投入產出的效率也不理想。

2.2基于傳統輸入輸出設備的開發

由于長期以來人機交互都是以鼠標鍵盤為主,所以絕大多數程序開發設計都只考慮這種單一的輸入方式。但對于目前多媒體數據增多的趨勢,這樣傳統的輸入輸出模式就存在著很多弊端,其中最明顯的是對于多媒體數據的采集就需要單獨使用設備,采集后再人工處理。而為了簡化系統設計的復雜度,很多管理信息系統的數據采集和錄入主要基于鍵盤鼠標的錄入,如果出現非鍵盤鼠標錄入的數據則被要求人工進行數據格式的轉換,所以從一個側面也反映出一些企業排斥信息化,因為原本帶來效率提升與管理便利的信息系統,反而由于一些數據格式的錄入要求增加了人工勞動。如果直接使用現實當中的多媒體類的數據則系統又缺少相應轉換的功能。因為系統在考慮使用鍵盤鼠標錄入采集數據時已經默認了操作者來完成數據錄入前的標準化工作。但是實際上隨著現代計算機視覺以及人工智能、模式識別技術的發展和完善,過去無法識別的原始多媒體數據現在也可以由計算機識別并進行標準化的處理。

3運用計算機視覺技術改善人機交互

3.1低分辨率識別情況下改善會議演示交互效果

采用現代的計算機影像處理技術和方法,可以用普通的圖像采集設備配合程序識別影像當中的特定顏色區域的移動軌跡,并對軌跡做出判斷實現與計算機的交互。由于該識別只是需要識別圖像中的特定顏色的區域的運動,而非具體的形狀與細節,所以識別的難度相對不大,可以運用在會議的展示環境下,通過定位確定普通投影區域與特定顏色區域的位置關系,并通過圖形圖像的投影與變形運算,實現人與普通投影的交互。在環境背景比較清晰,圖像采集設備分辨率與色彩分辨比較靈敏的情況下還能更進一步對人體膚色和手的幾何特征進行識別,實現更加自然良好的人機互動交互,并且還能引入人工智能的模式識別算法,實現多人的互動交互,從而大大改善互動展示效果,實現更加人性化有效的溝通。特別在教育培訓行業,在現有普通硬件條件下能夠實現更加生動的教學講解演示,提高學生的課堂體驗激發更多興趣,改善教學效果。

3.2運用計算機視覺與模式識別技術整合企業門禁與考勤系統

應用計算機視覺技術配合相對高分辨率的識別與人像數據庫,企業可以采用現有的門禁系統的硬件設備配合相應的軟件實現門禁與考勤系統的整合,以此提高企業辦公環境的智能化人性化的效果,并對員工進行更加精細化的管理。重要的是,通過人機接口的改進改變以往服務信息系統的面貌,讓人在自然的環境下工作提高系統的人性化程度。同時整合門禁與考勤系統可以通過識別企業內部員工與外來人員加強辦公環境的管理,而且在硬件上可以利用現有的設備,軟件方面可以與前面提到的交互演示系統共用相同的圖形圖像處理內核,減少代碼的冗余降低系統復雜度提高可靠性。就目前的人像識別技術而言,已經在個人電腦的安全保護上得到了應用,所以在技術上是可行的,并且也有了實際應用的例子。將該技術移植到普通的門禁管理系統與考勤系統中,只需要解決接口的數據交換就能實現,并且隨著現代企業辦公環境的要求,應用該技術能大大提高企業的辦公環境的智能化程度,并且通過門禁系統提取的企業員工考勤信息更加自然和真實,能夠更加準確地掌握和管理企業員工的日常工作情況提高管理精度。

3.3具體實現方法與原理

為了能充分利用企業現有的硬件設備,并使得附加的程序簡單化,這里針對類似會議互動展示這樣不需要細節識別的情況采用的是顏色識別的方法,即統計場景中的圖像直方圖,然后探測直方圖上的變化,由于特定顏色的待識別區域的引入可以對整體直方圖的特定區域產生峰值的變化,并且通過反向的直方圖運算又可以確定特定區域的位置。而直方圖的運算屬于比較簡單的圖像運算處理所以能夠在很多圖像處理的開發工具中直接找到。并且對于細節識別要求比較高的人像的模式識別,采用以上的運算也能縮小待檢測區域的大小,提高識別效率,并且人的面部特征采用色識別也能很快找到特征點(眼睛、鼻孔、嘴唇、頭發以及頭像邊緣)。在前面通過色彩識別找到的檢測區域中,識別出特征點,并測量特征點的位置關系比例,進而在和數據庫中數據對比模式匹配找到最終結果。

4結語

在越南河內的機場,為了使乘客能在等待航班時有比較輕松的環境,在旅客的候機大廳專門安放了一臺具有互動功能的投影儀,并將互動內容投影在地面,乘客可以在候機時與地面上的互動投影交互,緩解候機帶來的單調乏味感。同樣我們可以把它引入到日常企業辦公會議或者是培訓教育類企業的日常教學中,運用現有的投影屏幕和現有的設備實現多人的在投影屏幕上的互動交互討論。而人像識別系統在單機上的應用也在很多商用筆記本電腦上得到了應用,在一些科研院所和高科技企業人像識別的門禁系統也被應用到了辦公環境當中,提高了辦公環境的智能化程度;將人像識別技術結合考勤系統則在教育行業能夠實現更為方便的考勤管理防止目前比較嚴重的代簽逃課等情況的發生。隨著現在對數據挖掘技術的研究,從日常情況采集到的數據積累到一定程度還能為今后分析員工/學生行為做出數據的積累。這里所討論和解決的問題主要只是集中在人機交互界面的一些改進,其實對于IT技術而言這只是一小部分,對于企業而言需要使用IT技術真正提高企業的工作效率還需要其他很多方面的配合和集成。

作者:趙磊 鄧世翔 劉德飛 單位:云南機電職業技術學院

參考文獻:

[1]黎松,平西建,丁益洪.開放源代碼的計算機視覺類庫OpenCv的應用[J].計算機應用與軟件,2005,22(8).

[2]陳雪松.基于圖像勢能理論的特征提取方法研究[D].華中科技大學,2011.

[3]李超,許春耀,潘林,余輪.面向投影環境的計算機視覺交互信息獲取[J].電視技術,2013,37(11).

篇10

在用常見的手勢進行交流時,人們很容易就能互相理解,在經過學習之后,聾啞人或是正常人都可以運用手語進行交流。不過,想象一下,當你對計算機(或機器)做一個手勢,它就能領會你的意圖會是怎樣的情景呢?如果計算機(或機器)看得懂手語,又意味著什么呢?姑且不管實現這樣的人機交流有何深遠的意義,還是先讓我們來探究一下這樣的可行性吧,想想看得懂手語的計算機(或機器)能有什么用途。

人機交互:從呆板到員活

人類之間的交流往往聲情并茂,既采用自然語言(口語、書面語言),還廣泛采用人體語言(表情、體勢、手勢)。與人類之間的交流相比,人機交互就顯得呆板多了。以計算機的輸入方式為例,人要向計算機下達指令,最常見的方式還是通過鍵盤輸入。當然,手寫輸入也正為許多人所接受和喜愛,語音輸入的研究也進行得熱火朝天,最初單一而呆板的輸入方式已經得到了擴展。然而,科學研究是永無止境的,人體語言這種簡單快捷的信息交流方式得到了很多研究者的關注,他們想,能不能把這種靈活的信息交流方式也引進人機交互中呢?

于是研究人員展開了對人體語言理解的研究。人體語言的感知、人體語言與自然語言的信息融合對提高計算機的人類語言理解水平,加強人機接口的可實用性有著積極的意義。手語(手勢)是人體語言的一個非常重要的組成部分,它是包含信息量最多的一種人體語言,它與語言、書面語等自然語言的表達能力相同。因而完全可以把手語作為人機交互的一種手段,它具有很強的視覺效果,生動、形象、直觀??梢?,將手勢運用于計算機能夠很好地改善人機交互的效率。

計算機怎樣識別手勢?

從不同的角度可以對手勢進行不同的分類。分為交互性手勢和操作性手勢,前者手的運動表示特定的信息(如樂隊指揮),靠視覺來感知,后者不表達任何信息(如彈琴);分為自主性手勢和非自主性手勢,后者需要與語音配合用來加強或補充某些信息(如演講者用手勢描述動作、空間結構等信息),分為離心手勢和向心手勢,前者直接針對說話人,有明確的交流意圖,后者只是反應說話人的情緒和內心的愿望。

手勢的各種組合、運動相當復雜,不過簡單來看,手勢主要有如下的特點:手是彈性物體,因此同一手勢之間差別很大,手有大量冗余信息,由于人識別手勢關鍵是識別手指特征,因此手掌特征是冗余的信息:手的位置是在三維空間,很難定位:手的表面是,非平滑的,容易產生陰影。

了解了手勢的這些特點,就可以在手勢研究中對手勢做適當的分割、假設和約束。例如,可以給出如下約束:如果整個手處于運動狀態,那么手指的運動和狀態就不重要,如果手勢主要由各手指之間的相對運動構成,那么手就應該處于靜止狀態。比如鼠標和筆式交互設備就是通過識別手的整體運動來完成人與計算機的交互,但它們不能識別手指的動作,其優點是僅利用軟件算法就能實現,適合于一般桌面系統。只有當用鼠標或筆式交互設備的運動或方向變化來傳達信息時,才可將鼠標或筆式交互設備看作手勢表達工具。筆式交互設備發展很快,它提供了充分的交互信息,如壓力、方向、旋轉和位置信息,但現有交互主要是簡單地替代鼠標。

計算機識別手勢的手段主要有兩種:

1.數據手套。數據手套是虛擬現實系統中廣泛使用的傳感設備,用戶通過數據手套,能做出各種手勢向系統發出命令,與虛擬世界進行各種交互操作:比如通過一只與數據手套對應的在計算機屏幕上顯示的虛擬手,使用戶成為虛擬世界中的一員:抓取物體,如果手套有力反饋,還能讓用戶感覺到物體的重量和材質等。美國在“洞穴”虛擬系統中就是利用數據手套來研制武器。數據手套的主要優點是可以測定手指的姿勢和手勢,但是相對而言代價較為昂貴,并且有時會給用戶帶來不便(如出汗)。

2.計算機視覺。即利用攝像機輸人手勢,其優點是不干擾用戶,這是一種很有前途的技術,目前有許多研究者致力于此項工作。但在技術上存在很多困難,目前的計算機視覺技術還難以勝任手勢識別和理解的任務。

目前較為實用的手勢識別是基于數據手套的,因為數據手套不僅可以輸入包括三維空間運動在內的較為全面的手勢信息,而且比基于計算機視覺的手勢在技術上要容易得多。

更好地為人服務

日本三菱電子研究實驗室的研究人員已經使用低成本的視覺系統,通過手勢就可以控制一臺電視機。由計算機控制的美國航空航天局虛擬太空站也是采用美國Cybernet公司開發的手語識別軟件,通過一部架設在頂部的攝像機來追蹤指揮者的手勢。當系統捕捉到揮手等手勢時,就會做出相應的反應,讓指揮者像航天員一樣在計算機虛擬的阿爾法國際太空站上移動(確切地說是飄動)。

Cybemet公司的軟件還能識別一系列的特定手勢,就像工地上的工人或交通警察經常用的那種手語,通過這些手勢你能夠旋轉在虛擬旅行中看到的三維圖像,還可以向上或是向下改變你的視角。美國航空航天局正在考慮把這套系統用于真正的太空站,因為笨重的航天服和微重力環境使得鼠標和鍵盤都變得難以操縱。也許不久之后,航天員就能用簡單的手語來控制機器人在太空中抓取物體。

手語(手勢)識別系統的研究還有助于改善和提高聾啞人的生活學習和工作條件,為他們提供更好的服務。同時也可以應用于計算機輔助啞語教學、電視節目雙語播放、虛擬人的研究、電影制作中的特技處理、動畫的制作、醫療研究、游戲娛樂等諸多方面。另外,手語識別系統的研究涉及到教學、計算機圖形學、機器人運動學、醫學等多學科。因此,手語識別系統的研究非常有意義。