AI在安全播出領(lǐng)域的應(yīng)用
時間:2022-10-09 16:33:38
導(dǎo)語:AI在安全播出領(lǐng)域的應(yīng)用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:隨著互聯(lián)網(wǎng)和大數(shù)據(jù)的發(fā)展,人工智能技術(shù)(ai)得到了高速和深入的發(fā)展。在有線電視安全播出領(lǐng)域運用AI技術(shù),將會顯著提升安全播出工作效果。本文對安全播出中的內(nèi)容安全審播現(xiàn)狀進行了總結(jié),對AI技術(shù)發(fā)展進行了介紹,并對如何將AI應(yīng)用于安全播出領(lǐng)域進行了詳細分析,提出具體技術(shù)部署方案和相關(guān)建議,對AI技術(shù)運用于數(shù)字電視安全播出具有啟示價值。
關(guān)鍵詞:AI;安全播出;大數(shù)據(jù)
1引言
隨著我國經(jīng)濟發(fā)展和社會進步,人民群眾對精神文化生活的需求日益增長。廣播電視播出機構(gòu)通過不斷增加播出頻道數(shù)量和節(jié)目內(nèi)容來滿足用戶這方面需求,這對作為廣播電視產(chǎn)業(yè)發(fā)展的基礎(chǔ)和廣播電視工作生命線的安全播出工作提出了更高要求。在我國,廣播電視承擔了黨、政府和人民宣傳喉舌的特殊功能,是輿論引導(dǎo)的主要工具。安全播出是廣播電視運營商的首要任務(wù),而內(nèi)容安全是安全播出的重點之一,特別是涉及政治、外交、軍事、國計民生大政方針等內(nèi)容時,更加不能有絲毫差錯。
2內(nèi)容安全審核與播出現(xiàn)狀
對于有線電視運營商來說,安全播出包括電視節(jié)目的播出、傳輸與覆蓋等網(wǎng)絡(luò)傳輸環(huán)節(jié),也包括點播形式的媒資和頁面海報等內(nèi)容呈現(xiàn)環(huán)節(jié)。其中,媒資內(nèi)容安全涉及意識形態(tài)和輿論導(dǎo)向,是安全播出重中之重的環(huán)節(jié)。針對媒資內(nèi)容的安全播出措施主要包括播出前審核和播出過程中監(jiān)聽監(jiān)看。目前,對媒資內(nèi)容的審核由審核專家采取人工方式進行,人工審核的特點是審核效率有限。播出過程中對媒資內(nèi)容進行監(jiān)聽監(jiān)看以人工方式為主,但這種方式存在明顯不足:第一,對內(nèi)容安全的認知取決于人員業(yè)務(wù)素質(zhì)、主客觀判斷等因素,不同人員對同樣內(nèi)容的認知結(jié)果存在差異;第二,欄目數(shù)量和點播媒資內(nèi)容日益增多,需要增加具備安全播出業(yè)務(wù)素質(zhì)的人員數(shù)量,相應(yīng)的人力成本也會大幅增加;第三,監(jiān)聽監(jiān)看人員值守期間安播壓力大,精神高度緊張,工作體驗不佳,專業(yè)人員流失嚴重。針對內(nèi)容審核以人工方式為主存在的問題,通過引入AI技術(shù),基于智能算法,輔助內(nèi)容安全審核,可以大幅度減輕目前內(nèi)容安全審核壓力,提升安全播出的工作效果。
3AI技術(shù)發(fā)展現(xiàn)狀
近些年,隨著互聯(lián)網(wǎng)和大數(shù)據(jù)的發(fā)展,AI技術(shù)得到了高速和深入發(fā)展,很多領(lǐng)域的AI技術(shù),如人臉識別、圖像識別、語音識別、OCR文字識別、自然語言處理(NaturalLanguageProcessing,NLP)等,已經(jīng)具備成熟的算法,通過大量數(shù)據(jù)的訓(xùn)練和配備強大的運算能力,其識別精度和處理速度已經(jīng)能夠滿足實際應(yīng)用的需求,也在各種場景中逐步得到應(yīng)用。
3.1人臉識別
人臉識別,基于深度學(xué)習(xí)算法,能夠準確識別視頻中的人臉信息,提供人臉檢測、人臉1:1比對、人臉1:N識別等能力。人臉識別算法應(yīng)用過程是通過建設(shè)敏感人物人臉庫,基于人臉檢測和1:N識別技術(shù)對流數(shù)據(jù)預(yù)處理層分發(fā)的視頻流數(shù)據(jù)進行人臉檢測(找出視頻幀中是否存在人臉)和人臉識別(對于通過人臉檢測找到的人臉,與已有敏感人物人臉庫中的N個人臉進行比對,找出最相似的一張臉或多張臉,并給出相似度排序判斷,從而判別是否有敏感人物出現(xiàn)在節(jié)目中)。
3.2圖像識別
圖像識別,基于深度學(xué)習(xí)算法及大規(guī)模圖像訓(xùn)練,可以準確識別圖片的內(nèi)容分類或圖片中包含的物體類別,從而可以審核圖片是否含有色情、暴恐等不健康內(nèi)容或違規(guī)物品。圖像識別算法應(yīng)用過程是通過提取節(jié)目視頻關(guān)鍵幀后,轉(zhuǎn)換為一張張圖片,然后傳送給圖像識別算法,圖像識別算法會給出其屬于色情、暴恐的概率或圖像中出現(xiàn)違規(guī)物品的概率,相關(guān)違規(guī)分類或違規(guī)物品需要提前定義并進行訓(xùn)練樣本標注。
3.3語音識別
語音識別算法能夠讓計算機自動地識別語音中所攜帶的信息。基于深度學(xué)習(xí)的算法,語音識別和處理技術(shù)可以克服傳統(tǒng)語音識別中采用時間、頻率而導(dǎo)致的不穩(wěn)定問題。語音識別算法應(yīng)用過程先對音頻文件進行識別處理,在我國一般要求能夠識別普通話、粵語、英語,并將結(jié)果轉(zhuǎn)換為中英文文本,再由自然語言處理引擎對文本內(nèi)容是否敏感違規(guī)進行分析識別。現(xiàn)在語音處理技術(shù)在秒級實時語音識別方面仍然不夠成熟而且支持語言有限制。因此,如果應(yīng)用在直播節(jié)目實時監(jiān)管的場景上,語音識別只能作為輔助手段,采用分鐘級延遲;對回放視頻和回放音頻則沒有延遲的問題。
3.4OCR文字識別
對硬字幕的視頻文件,可以進行視頻幀提取并轉(zhuǎn)換為一張張圖片,然后借助OCR文字識別技術(shù)進行處理,獲得視頻幀中出現(xiàn)的字幕文本,再由NLP引擎對文本內(nèi)容是否敏感違規(guī)進行分析識別。
3.5自然語言處理
自然語言處理算法是AI智能深度學(xué)習(xí)的一個重要應(yīng)用領(lǐng)域,經(jīng)過幾十年的發(fā)展,基于統(tǒng)計的模型已經(jīng)成為NLP的主流,同時人工神經(jīng)網(wǎng)絡(luò)在NLP領(lǐng)域也受到了足夠重視。自然語言處理算法提供包括分詞、命名實體識別、文本分類等功能。在我國,通過自然語言處理算法對視頻字幕和音頻轉(zhuǎn)換后的文本以及節(jié)目網(wǎng)站的其他文本進行敏感或違規(guī)內(nèi)容識別,能支持中英文文本識別。
4AI在安全播出領(lǐng)域應(yīng)用需求分析
4.1AI在節(jié)目審核中的應(yīng)用
功能上,AI技術(shù)已支持圖像、文本、視頻、音頻的識別與理解,可提供內(nèi)容敏感、淫穢色情、恐怖暴力及不良圖文信息鑒別過濾等多個維度的審核能力。但在實際情況中,媒資內(nèi)容中往往存在語意不清、界限模糊的內(nèi)容,需要通過專家的人工審核來鑒別,而專家的政治素質(zhì)和業(yè)務(wù)素質(zhì)是審核鑒別的關(guān)鍵因素。在廣播電視行業(yè),對媒資內(nèi)容的審核能力,對不良信息的鑒別能力是需要經(jīng)歷長期培養(yǎng)和實踐方可形成的;同時,審核專家還必須實時更新業(yè)務(wù)知識方可跟上安全播出的需求發(fā)展。因此,在較長時期內(nèi),AI審核無法代替人工審核,媒資內(nèi)容審核必須依靠有經(jīng)驗的審核專家。AI系統(tǒng)對于較確定條件下的情景具有快速判斷和處理的能力,可將AI應(yīng)用于對媒資內(nèi)容的初步審核環(huán)節(jié),利用AI審核鑒別和過濾出媒資中明顯違規(guī)的有害內(nèi)容并提供視頻標簽,在此基礎(chǔ)上進行專家人工二次審核。在待審核節(jié)目數(shù)量較多的情況下,采取這種審核模式,AI可以在較大程度上提升專家審核速度和效率。
4.2AI在監(jiān)聽監(jiān)看中的應(yīng)用
AI技術(shù)可以應(yīng)用于電視節(jié)目的媒資內(nèi)容監(jiān)聽監(jiān)看環(huán)節(jié),在電視節(jié)目播出方面發(fā)揮安全播出輔助作用。從時效性分類,電視臺播出的節(jié)目有兩種類型:非直播節(jié)目和直播節(jié)目。對于電視臺而言,非直播類節(jié)目在節(jié)目播出編排之前對其內(nèi)容進行審核;直播類節(jié)目,尤其是體育賽事、大型國內(nèi)和國際活動的現(xiàn)場直播,則無法實現(xiàn)播出前審核,只能采取在直播過程中對其內(nèi)容進行實時監(jiān)聽監(jiān)看的措施并疊加延時機制。大型活動現(xiàn)場具有人群聚集的特點,現(xiàn)場情景不可控風(fēng)險高,其直播畫面信息量大、背景環(huán)境復(fù)雜,人工監(jiān)聽監(jiān)看難以全面應(yīng)對。這種情況下,可以利用AI技術(shù)輔助人工對現(xiàn)場直播內(nèi)容進行監(jiān)聽監(jiān)看。具體來說,可以利用AI圖像識別技術(shù),對現(xiàn)場直播畫面中的人臉、場景和文字信息進行識別提取,快速判斷是否含有敏感信息。此外,可以利用AI語音識別技術(shù)和自然語言處理技術(shù)對現(xiàn)場的語音進行識別分析,并進行敏感信息檢索過濾。境外頻道由于涉及的語言種類多,對其節(jié)目內(nèi)容進行監(jiān)聽監(jiān)看的難度非常大。隨著支持的語言種類不斷豐富,可以利用AI語種識別和語音識別技術(shù)來輔助人工在境外頻道監(jiān)聽監(jiān)看中發(fā)揮積極作用。
5AI輔助安全播出技術(shù)部署方案
AI輔助安全播出技術(shù)部署方案示意如圖1所示,按功能模塊分為AI平臺、審核平臺、監(jiān)聽監(jiān)看平臺、播控平臺和安全播出知識庫。AI平臺對接收到的音視頻數(shù)據(jù)進行智能分析,提取其特征并與安全播出知識庫比對,發(fā)現(xiàn)問題會返回結(jié)果給審核平臺和監(jiān)看監(jiān)聽平臺;安全播出知識庫存放違反安全播出的一些敏感信息特征;審核平臺主要針對播出內(nèi)容進行合規(guī)性審核;監(jiān)聽監(jiān)看平臺主要對直播播出節(jié)目內(nèi)容再次審核,確保播出節(jié)目萬無一失;播控平臺負責電視傳輸及切換。按實現(xiàn)內(nèi)容分為AI輔助內(nèi)容審核和AI輔助監(jiān)聽監(jiān)看兩個部分。在AI輔助內(nèi)容審核中,審核人員主要是利用AI平臺對內(nèi)容進行初審,通過人臉識別可發(fā)現(xiàn)敏感問題內(nèi)容,場景識別可發(fā)現(xiàn)淫穢色情和恐怖暴力等明顯問題內(nèi)容,通過語音轉(zhuǎn)文本后進行關(guān)鍵詞識別以及語義分析可發(fā)現(xiàn)音頻中的問題內(nèi)容。在AI輔助監(jiān)聽監(jiān)看中,通過監(jiān)聽監(jiān)看平臺統(tǒng)一實施對電視頻道的監(jiān)測,由監(jiān)聽監(jiān)看平臺調(diào)度AI平臺實現(xiàn)輔助監(jiān)聽監(jiān)看,具體工作流程如下。(1)播控平臺傳送電視頻道信號到監(jiān)聽監(jiān)看平臺。(2)監(jiān)聽監(jiān)看平臺將節(jié)目數(shù)據(jù)傳送給AI平臺。(3)AI平臺對節(jié)目數(shù)據(jù)進行識別,根據(jù)安全播出知識庫進行推理和判斷,并將結(jié)果返回給監(jiān)聽監(jiān)看平臺。(4)工作人員從監(jiān)聽監(jiān)看平臺獲取AI平臺運行結(jié)果,用于輔助監(jiān)聽監(jiān)看。
6AI引發(fā)的變化
可以預(yù)見,安全播出領(lǐng)域引入AI技術(shù)后,可引發(fā)如下變化。
6.1監(jiān)聽監(jiān)看工作模式的調(diào)整
引入AI技術(shù)輔助安全播出工作后,一方面,由少數(shù)專業(yè)技術(shù)人員對安全播出知識庫進行日常更新和維護,將內(nèi)容安全審核相關(guān)知識和專家經(jīng)驗實時轉(zhuǎn)化為符合規(guī)則的電子數(shù)據(jù);另一方面,在AI輔助下,更多的推理判斷由AI執(zhí)行,監(jiān)聽監(jiān)看工作人員則可將工作重心放在應(yīng)急操作及技術(shù)處置上。
6.2降低人工監(jiān)聽監(jiān)看難度和復(fù)雜度
AI技術(shù)基于安全播出知識庫對節(jié)目內(nèi)容安全性提供輔助推理判斷,一方面,全體監(jiān)聽監(jiān)看人員能夠共享知識庫中的知識和專家經(jīng)驗,減小因人員業(yè)務(wù)素質(zhì)和主觀判斷能力不同而造成的工作結(jié)果差異;另一方面,AI平臺強大的運算能力使得監(jiān)聽監(jiān)看更加全面和細節(jié)化。AI能夠大大降低監(jiān)聽監(jiān)看人員對內(nèi)容安全進行判斷的難度和復(fù)雜度,提升安全播出工作整體效果。
6.3減輕安播人員值守期間壓力
AI技術(shù)在起到內(nèi)容安全審核輔助作用的同時提高了安播工作的整體效果,減輕了安播人員的審核和監(jiān)聽監(jiān)看工作精神壓力,提升了工作體驗,有利于留住業(yè)務(wù)人才,培養(yǎng)專業(yè)安播團隊。
7結(jié)語
為更好地將AI應(yīng)用于安全播出領(lǐng)域,本文提出如下建議供參考:一是出于安全播出工作重要性,建立AI行業(yè)能力平臺,以滿足利用AI輔助安全播出工作在安全性和運算能力方面的實際需求;二是建立安全播出行業(yè)專家知識庫,以滿足監(jiān)聽監(jiān)看從業(yè)人員對不斷更新的安全播出相關(guān)知識和專家經(jīng)驗的實際需求。互聯(lián)網(wǎng)技術(shù)、通信技術(shù)和編碼技術(shù)的發(fā)展,使得視頻以高清、超高清、AR/VR等多形式進行高質(zhì)量呈現(xiàn),視頻的信息量以幾何級數(shù)暴漲。隨著AI技術(shù)和運算能力持續(xù)發(fā)展與提升,AI必將不斷賦能廣播電視行業(yè),目前媒體內(nèi)容安全審核以“人工為主、AI為輔”人機結(jié)合方式將會發(fā)展到以“AI為主、人工為輔”的機人智慧方式,進一步加強各類情況、各種方式的大數(shù)據(jù)分析、智能處理和機器學(xué)習(xí)能力,進一步優(yōu)化提升AI對內(nèi)容識別、報警和處理的精確度與可信度,最大程度降低監(jiān)播人員的干預(yù)度,實現(xiàn)內(nèi)容安全管控的L5級“自動駕駛”,在安全播出領(lǐng)域發(fā)揮更重要的作用。
參考文獻
[1]王文敏.人工智能原理[M].北京:高等教育出版社,2019.
[2]劉樹春,賀盼,馬建奇,等.深度實踐OCR:基于深度學(xué)習(xí)的文字識別[M].北京:機械工業(yè)出版社,2020.
[3]蔣巍,張健,曾浩.基于智能視頻監(jiān)控系統(tǒng)的運動目標監(jiān)測和跟蹤[J].電視技術(shù),2012,36(5):110-114.
[4]朱明,梁棟,范益政,等.基于普特征的圖像匹配算法[J].華南理工大學(xué)學(xué)報(自然科學(xué)版),2015,43(9):60-66.
[5]馮偉興,唐墨,賀波,等.VisualC++數(shù)字圖像模式識別技術(shù)詳解[M].北京:機械工業(yè)出版社,2010.
[6]王海濤.廣播電視監(jiān)播系統(tǒng)中音頻及語音數(shù)據(jù)處理技術(shù)研究[D].西安:西北工業(yè)大學(xué),2007.
作者:張造生 李世平 陳志強 單位:廣東有線廣播電視網(wǎng)絡(luò)有限公司
相關(guān)文章
1ai