工程機(jī)械廠家自動(dòng)識(shí)別系統(tǒng)研究
時(shí)間:2022-09-25 11:30:17
導(dǎo)語(yǔ):工程機(jī)械廠家自動(dòng)識(shí)別系統(tǒng)研究一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:工程機(jī)械在施工的過程中,需要加強(qiáng)機(jī)械設(shè)備的統(tǒng)一管理,因而建立和健全機(jī)械設(shè)備的統(tǒng)計(jì)管理制度至關(guān)重要。對(duì)此,本文設(shè)計(jì)研究了一種用于工程機(jī)械廠家的圖像識(shí)別系統(tǒng),該系統(tǒng)使用matlab構(gòu)建alexnet遷移學(xué)習(xí)模型對(duì)工程機(jī)械廠家數(shù)據(jù)集進(jìn)行訓(xùn)練,通過對(duì)工程機(jī)械目標(biāo)的外觀和標(biāo)志為特征進(jìn)行訓(xùn)練,以達(dá)到提高施工現(xiàn)場(chǎng)機(jī)械設(shè)備調(diào)度效率的目的。
關(guān)鍵詞:深度學(xué)習(xí);系統(tǒng)開發(fā);工程機(jī)械
工程機(jī)械行業(yè)的產(chǎn)業(yè)升級(jí)對(duì)國(guó)家基礎(chǔ)建設(shè)的發(fā)展至關(guān)重要。但是,現(xiàn)在存在的問題就是現(xiàn)在有的工程項(xiàng)目在施工時(shí),當(dāng)參與建設(shè)的施工設(shè)備過多時(shí),就會(huì)產(chǎn)生設(shè)備調(diào)度和管理無序的情況。因此,設(shè)計(jì)一套用于工程機(jī)械廠家的圖像識(shí)別系統(tǒng),對(duì)于實(shí)現(xiàn)我國(guó)工程機(jī)械的施工統(tǒng)一管理具有重要的意義。對(duì)此,本文選定alexnet深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過不斷調(diào)試深度學(xué)習(xí)模型的層次、丟失層丟失率、學(xué)習(xí)率、訓(xùn)練步數(shù)等參數(shù),探討不同深度的特征提取網(wǎng)絡(luò)對(duì)識(shí)別效果的影響。
1圖像識(shí)別網(wǎng)絡(luò)模型的選用
合適的識(shí)別網(wǎng)絡(luò)對(duì)于系統(tǒng)的構(gòu)建極為重要,由于本文所使用的工程機(jī)械的圖像數(shù)據(jù)集規(guī)模較小,所以要求網(wǎng)絡(luò)具有良好的特征學(xué)習(xí)能力。對(duì)此針對(duì)實(shí)驗(yàn)的實(shí)際的情況和識(shí)別算法的可行性在經(jīng)過對(duì)現(xiàn)有主流的圖像分類方法分析后,發(fā)現(xiàn)Alexnet和vgg16網(wǎng)絡(luò)在訓(xùn)練速度和精度方面都有著不俗的效果。本文主要以Alexnet作為實(shí)驗(yàn)的基礎(chǔ)框架,并將其與層次較深的vgg16網(wǎng)絡(luò)進(jìn)行了簡(jiǎn)單對(duì)比。
2圖像樣本數(shù)據(jù)集建立
良好的圖像樣本數(shù)據(jù)庫(kù)對(duì)于圖像識(shí)別網(wǎng)絡(luò)的分析極為重要,在進(jìn)行數(shù)據(jù)庫(kù)構(gòu)建時(shí),其中主要有數(shù)據(jù)集的構(gòu)建、圖像數(shù)據(jù)集的標(biāo)簽化處理、圖像數(shù)據(jù)集歸一化、圖像數(shù)據(jù)集擴(kuò)充、圖像數(shù)據(jù)集的劃分。(1)數(shù)據(jù)集構(gòu)建。數(shù)據(jù)集共含有18家工程機(jī)械廠家,共計(jì)900張,基本涵蓋了目前市面上的常見主流工程機(jī)械廠家。為了保證識(shí)別的精度,每個(gè)圖像中僅有一或兩輛工程機(jī)械,并且圖像中的廠家特征沒有重疊或損壞。(2)圖像數(shù)據(jù)集的標(biāo)簽化處理。由于深度學(xué)習(xí)算法需要采用有標(biāo)簽的樣本圖片進(jìn)行訓(xùn)練,而本文采集的工程機(jī)械圖像是無標(biāo)簽的,因此,需要對(duì)樣本圖像進(jìn)行打標(biāo)簽處理。使用matlab內(nèi)置的app“imagelabeler”對(duì)廠家圖像進(jìn)行人工標(biāo)定,將標(biāo)定完的含有標(biāo)簽信息的mat文件保存在特定的文件夾,隨后批量將mat文件導(dǎo)出為.jpg標(biāo)簽圖片,保存訓(xùn)練樣本圖片用于廠家識(shí)別網(wǎng)絡(luò)的訓(xùn)練。(3)圖像數(shù)據(jù)集歸一化。在深度學(xué)習(xí)模型中的輸入樣本來自imagelabeler裁剪出來的圖像,因此,存在裁剪的圖像大小不一致的問題,而因?yàn)锳lexNet模型要求圖像的輸入尺寸為227×227×3,VGG16的要求為224×224×3,所以需要進(jìn)行歸一化處理,將數(shù)據(jù)集的圖像尺寸統(tǒng)一。(4)圖像數(shù)據(jù)集擴(kuò)充。為了獲得更好的訓(xùn)練效果,提高識(shí)別精度,應(yīng)使數(shù)據(jù)集的規(guī)模盡可能地大,這樣網(wǎng)絡(luò)能學(xué)習(xí)到更多的特征,訓(xùn)練出的模型效果更好,因此,數(shù)據(jù)增強(qiáng)成為一種非常便捷的數(shù)據(jù)集擴(kuò)充途徑。本文采取的數(shù)據(jù)增強(qiáng)途徑有旋轉(zhuǎn)、鏡像、添加噪聲,以此通過較小的人工采集工作量獲得大量的數(shù)據(jù)樣本。(5)圖像數(shù)據(jù)集的劃分。按照網(wǎng)絡(luò)的訓(xùn)練步驟,在訓(xùn)練開始前,需要將樣本數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集兩部分,由于樣本數(shù)據(jù)集較小,為了保證訓(xùn)練效果將訓(xùn)練集的比例增大,測(cè)試集的比例減小,將訓(xùn)練集和測(cè)試集按照4:1的比例進(jìn)行劃分,規(guī)定每種廠家的樣本圖片中4/5為訓(xùn)練集,1/5為測(cè)試集。其中,訓(xùn)練集作為網(wǎng)絡(luò)的訓(xùn)練提供數(shù)據(jù)支持,測(cè)試集用于在訓(xùn)練完成后對(duì)模型的識(shí)別精度進(jìn)行檢測(cè)和自我評(píng)估。
3模型訓(xùn)練以及數(shù)據(jù)對(duì)比
(1)模型的訓(xùn)練結(jié)果。對(duì)模型的訓(xùn)練選擇使用遷移學(xué)習(xí),采用ImageNet數(shù)據(jù)集上進(jìn)行過預(yù)訓(xùn)練的AlexNet網(wǎng)絡(luò)模型,將自建的樣本數(shù)據(jù)集輸入網(wǎng)絡(luò)的最后三層,新模型預(yù)訓(xùn)練后其收斂速度得到了極大提升。采用遷移學(xué)習(xí)方法訓(xùn)練得到網(wǎng)絡(luò)模型的識(shí)別精度更高,訓(xùn)練效果更好。通過對(duì)alexnet遷移學(xué)習(xí)后的網(wǎng)絡(luò)進(jìn)行主要參數(shù)的不斷對(duì)比調(diào)試,得到了11組不同參數(shù)下的網(wǎng)絡(luò)模型,第一組為訓(xùn)練網(wǎng)絡(luò)的最佳結(jié)果,準(zhǔn)確率為87.89%。具體如表1所示。(2)使用不同網(wǎng)絡(luò)模型的對(duì)比實(shí)驗(yàn),本節(jié)中分別使用alexnet和vgg16模型進(jìn)行訓(xùn)練,為防止訓(xùn)練參數(shù)變化以及不同數(shù)據(jù)集對(duì)訓(xùn)練結(jié)果的影響,在對(duì)比實(shí)驗(yàn)中,兩次的訓(xùn)練學(xué)習(xí)使用了相同的參數(shù)和數(shù)據(jù)集,訓(xùn)練結(jié)果如圖1所示。圖1由實(shí)驗(yàn)結(jié)果可知,使用相同網(wǎng)絡(luò)和參數(shù)的情況下,使用alexnet模型訓(xùn)練的網(wǎng)絡(luò)識(shí)別精度為87.89%,訓(xùn)練時(shí)間為23min10s,使用vgg16模型訓(xùn)練網(wǎng)絡(luò)的識(shí)別精度為86.11%,訓(xùn)練時(shí)長(zhǎng)為160min53s。alexnet模型的層數(shù)較少,訓(xùn)練速度較快,且識(shí)別效果較好,vgg16模型的層數(shù)較多,訓(xùn)練速度明顯減慢,且識(shí)別精度未有明顯提升。實(shí)驗(yàn)結(jié)果表明,alexnet模型的訓(xùn)練速度更快,且訓(xùn)練效果與更深層次的vgg16相似,因此,本文選用alexnet模型進(jìn)行訓(xùn)練更加合適。(3)樣本集擴(kuò)充效果對(duì)比實(shí)驗(yàn)。本節(jié)中分別在原始數(shù)據(jù)集和擴(kuò)充數(shù)據(jù)集上進(jìn)行網(wǎng)絡(luò)的訓(xùn)練,原始數(shù)據(jù)集為未經(jīng)過數(shù)據(jù)擴(kuò)充的圖像,擴(kuò)充數(shù)據(jù)集為經(jīng)過加噪聲、鏡像、翻轉(zhuǎn)處理后擴(kuò)大五倍的樣本集,使用相同的測(cè)試集比例,驗(yàn)證數(shù)據(jù)集擴(kuò)充對(duì)網(wǎng)絡(luò)模型識(shí)別精度的影響。為防止訓(xùn)練參數(shù)變化對(duì)訓(xùn)練結(jié)果的影響,在對(duì)比實(shí)驗(yàn)中,兩次的訓(xùn)練學(xué)習(xí)使用了相同的參數(shù),由實(shí)驗(yàn)結(jié)果可知,使用相同網(wǎng)絡(luò)和參數(shù)的情況下,使用擴(kuò)充的數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)模型可以得到87.89%的識(shí)別精度,訓(xùn)練時(shí)間為23min10s,使用未擴(kuò)充的數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)得到的識(shí)別效果大打折扣,只有60.56%的準(zhǔn)確率,訓(xùn)練時(shí)長(zhǎng)為2min31s。雖然數(shù)據(jù)集的擴(kuò)充使得訓(xùn)練時(shí)長(zhǎng)有所增加,但是在分類較多而樣本數(shù)據(jù)集較小的情況下,使用數(shù)據(jù)集擴(kuò)充的方法,可以極大地提高網(wǎng)絡(luò)的識(shí)別效果。實(shí)驗(yàn)結(jié)果表明,數(shù)據(jù)集的擴(kuò)充會(huì)增加訓(xùn)練時(shí)長(zhǎng),但可以有效提高網(wǎng)絡(luò)準(zhǔn)確率,彌補(bǔ)樣本數(shù)據(jù)集較小的不足。
4結(jié)語(yǔ)
本文主要介紹了工程機(jī)械識(shí)別系統(tǒng)建立的每個(gè)過程,從數(shù)據(jù)集的收集整理,到工程機(jī)械圖像數(shù)據(jù)集的擴(kuò)充、打標(biāo)簽處理,以及網(wǎng)絡(luò)模型的建立結(jié)果對(duì)比。詳細(xì)地闡述了基于alexnet網(wǎng)絡(luò)實(shí)現(xiàn)工程機(jī)械廠家識(shí)別任務(wù)的整個(gè)流程。從網(wǎng)絡(luò)對(duì)工程機(jī)械廠家的識(shí)別率和實(shí)時(shí)性來看,本算法能滿足實(shí)際工程生產(chǎn)時(shí)的準(zhǔn)確率和實(shí)時(shí)性要求。
參考文獻(xiàn):
[1]李新葉,朱婧,麻麗娜.基于深度學(xué)習(xí)的場(chǎng)景識(shí)別方法綜述[J/OL].計(jì)算機(jī)工程與應(yīng)用:1-14[2020-02-13].
[2].MathWorks2018b版本的MATLAB和Simulink中擴(kuò)展深度學(xué)習(xí)功能[J].單片機(jī)與嵌入式系統(tǒng)應(yīng)用,2018,18(11):95.
[3]楚翔宇.基于深度學(xué)習(xí)的交通視頻檢測(cè)及車型分類研究[D].哈爾濱工業(yè)大學(xué),2017.
[4]趙振興.基于深度學(xué)習(xí)的車牌識(shí)別技術(shù)研究[D].青島科技大學(xué),2017.
作者:魏建昊 靳浩偉 王祥澳 傅雋翰 葉敏 單位:長(zhǎng)安大學(xué)工程機(jī)械學(xué)院