大數(shù)據(jù)下公共政策實(shí)施評(píng)估研究
時(shí)間:2022-01-21 03:18:51
導(dǎo)語:大數(shù)據(jù)下公共政策實(shí)施評(píng)估研究一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:公共政策涉及到對(duì)社會(huì)資源的分配和協(xié)調(diào),與社會(huì)大眾的利益密切相關(guān)。對(duì)公共政策實(shí)施進(jìn)行科學(xué)評(píng)估有利于提升政府施政能力。傳統(tǒng)評(píng)估方式存在一定局限,利益相關(guān)方參與度不夠。本文基于互聯(lián)網(wǎng)大數(shù)據(jù)對(duì)公共政策實(shí)施評(píng)估進(jìn)行了研究。通過對(duì)論壇、微博等互聯(lián)網(wǎng)站點(diǎn)在政策出臺(tái)后一段時(shí)間(如半年)的海量數(shù)據(jù),以及部分用戶行為數(shù)據(jù),進(jìn)行聚類分析,建立公共政策實(shí)施評(píng)估指數(shù)模型。
關(guān)鍵詞:公共政策;互聯(lián)網(wǎng)數(shù)據(jù);聚類分析;指數(shù)模型
公共政策從某種意義上說是公共權(quán)力機(jī)關(guān)經(jīng)由某個(gè)法定的程序所制定的為解決公共問題、達(dá)成公共目標(biāo)、實(shí)現(xiàn)公共利益,以協(xié)調(diào)經(jīng)濟(jì)社會(huì)活動(dòng)及相互關(guān)系的實(shí)施方案。公共政策的評(píng)估主要從兩個(gè)方面著力,一是在公共政策出臺(tái)之前,對(duì)政策的可行性進(jìn)行評(píng)估;二是在政策出臺(tái)之后,對(duì)政策的實(shí)時(shí)效果進(jìn)行評(píng)估,找出與公共政策設(shè)計(jì)目標(biāo)的差距。傳統(tǒng)的評(píng)估方法有兩類,一類是現(xiàn)場(chǎng)調(diào)研考察。選取與公共政策相關(guān)的不同層次的利益相關(guān)方,通過深入座談、問卷調(diào)查、文檔查看、實(shí)地考察、專家打分等方式,形成評(píng)估報(bào)告。另一類是建立統(tǒng)計(jì)分析模型。運(yùn)用數(shù)理經(jīng)濟(jì)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)和統(tǒng)計(jì)學(xué)等多種數(shù)理經(jīng)濟(jì)模型和計(jì)量經(jīng)濟(jì)模型,對(duì)公共政策進(jìn)行量化評(píng)估,通過數(shù)據(jù)分析對(duì)政策實(shí)施進(jìn)行量化評(píng)估。近年來,互聯(lián)網(wǎng)技術(shù)發(fā)展迅速,產(chǎn)生了海量的數(shù)據(jù),為大數(shù)據(jù)的應(yīng)用打下了堅(jiān)實(shí)的基礎(chǔ)。據(jù)有關(guān)文獻(xiàn)報(bào)道[1,4],國(guó)內(nèi)、外利用互聯(lián)網(wǎng)大數(shù)據(jù)對(duì)公共政策實(shí)施進(jìn)行評(píng)估取得了較好的應(yīng)用效果。本文對(duì)基于互聯(lián)網(wǎng)大數(shù)據(jù)的公共政策實(shí)施評(píng)估進(jìn)行了研究,通過對(duì)論壇、微博、微信、貼吧、博客、手機(jī)APP、平媒、政府網(wǎng)站互動(dòng)欄目等互聯(lián)網(wǎng)站點(diǎn)在政策出臺(tái)后一段時(shí)間(如政策出臺(tái)后半年內(nèi))的海量數(shù)據(jù),以及部分用戶行為數(shù)據(jù),進(jìn)行建模分析,將互聯(lián)網(wǎng)上的公眾意見引入到公共政策的實(shí)施效果評(píng)估中。
1公共政策實(shí)施評(píng)估方法簡(jiǎn)述
[2]公共政策評(píng)估,從評(píng)估的范圍看,有對(duì)公共政策實(shí)施效果及價(jià)值進(jìn)行判斷的專項(xiàng)評(píng)估,也有只對(duì)公共政策實(shí)施整個(gè)過程的分析和評(píng)判。從評(píng)估的過程看也有廣義和狹義之分。廣義的政策評(píng)估包含事前評(píng)估、執(zhí)行評(píng)估和事后評(píng)估三種類型,而狹義的政策評(píng)估常常指事后評(píng)估。從評(píng)估的方法看,有定性分析評(píng)估和定量分析評(píng)估,定性評(píng)估在國(guó)內(nèi)現(xiàn)有的評(píng)價(jià)模式中應(yīng)用較為廣泛。1.1定性評(píng)估方式。定性評(píng)估是基于經(jīng)驗(yàn)的實(shí)證研究,常常采用訪問法、觀察法、案例研究法等非數(shù)字技術(shù)方法,依賴于評(píng)估方對(duì)公共政策實(shí)施的了解、調(diào)查和感性認(rèn)識(shí)。如通過相關(guān)會(huì)議上的匯報(bào)交流、實(shí)地調(diào)研座談、上報(bào)材料、媒體報(bào)道、內(nèi)參反映、相關(guān)利益方來信/來訪等,歸納總結(jié)為政策實(shí)施評(píng)估報(bào)告。定性評(píng)估方式相對(duì)簡(jiǎn)單,容易實(shí)施,速度快、方便、直接,比較受到各級(jí)政府的推崇。但定性評(píng)估方式易受各類條件的約束,其科學(xué)性、客觀性難有保障,評(píng)估人員的直覺和經(jīng)驗(yàn)作用明顯,評(píng)估對(duì)象面較窄,利益相關(guān)方參與度不夠。1.2定量評(píng)估方式。定量評(píng)估是相對(duì)定性評(píng)估的另一種評(píng)估方法,通過數(shù)據(jù)歸集建立統(tǒng)計(jì)分析模型,把理論性概念量化成具體數(shù)據(jù),通過科學(xué)計(jì)算,對(duì)公共政策實(shí)施進(jìn)行定量評(píng)估。定量研究在某些方面相比定性研究方法有優(yōu)勢(shì),能夠用數(shù)據(jù)直觀表達(dá)評(píng)估結(jié)果,但也存在不可靠的風(fēng)險(xiǎn),過多地強(qiáng)調(diào)客觀性和普遍性,忽略了人的主觀性和特殊性。定量分析的方法對(duì)于解決常規(guī)性問題效果很好,對(duì)于非常規(guī)性的復(fù)雜問題,往往效果不佳。1.3互聯(lián)網(wǎng)大數(shù)據(jù)評(píng)估。隨著互聯(lián)網(wǎng)和自媒體的高速發(fā)展,互聯(lián)網(wǎng)本身的海量數(shù)據(jù)為基于大數(shù)據(jù)的公共政策評(píng)估帶來便利。盡管在數(shù)據(jù)處理方式上,大數(shù)據(jù)的分析方法與傳統(tǒng)定量分析的建模分析有相通之處,但存在較大差異。大數(shù)據(jù)評(píng)估由于數(shù)據(jù)采集方式、處理方式的變革,將會(huì)帶來評(píng)估模式革命性的變化。一是數(shù)據(jù)采集從樣本數(shù)據(jù)轉(zhuǎn)向全數(shù)據(jù),使評(píng)估更加接近事實(shí)本身;二是分析方法上由重視變量之間的因果性轉(zhuǎn)向更加關(guān)注相關(guān)性,通過分析、揭示公共政策制定、實(shí)施與效果之間的相關(guān)性,使政策評(píng)價(jià)更趨于科學(xué)、民主和客觀;三是參與對(duì)象更加廣泛,通過大量收集互聯(lián)網(wǎng)上利益相關(guān)者的情感、意愿、評(píng)價(jià)等信息,更多的了解公共政策實(shí)施對(duì)象參與的積極性和對(duì)公共政策實(shí)施效果的看法和評(píng)價(jià)。
2互聯(lián)網(wǎng)大數(shù)據(jù)評(píng)估基礎(chǔ)準(zhǔn)備
2.1數(shù)據(jù)準(zhǔn)備。2.1.1數(shù)據(jù)采集。根據(jù)行政區(qū)劃和政策評(píng)估有效時(shí)間和區(qū)間進(jìn)行限定,采用互聯(lián)網(wǎng)爬蟲技術(shù)或以購買服務(wù)的方式從互聯(lián)網(wǎng)爬蟲公司采集數(shù)據(jù),包括新聞、論壇、微博、微信、貼吧、博客、手機(jī)APP、平媒、政府網(wǎng)站互動(dòng)欄目、綜合網(wǎng)站互動(dòng)欄目等互聯(lián)網(wǎng)站點(diǎn)在政策出臺(tái)后一段時(shí)間(如出臺(tái)后半年內(nèi)的數(shù)據(jù))的數(shù)據(jù),構(gòu)建基于輿情內(nèi)容的熱度、重點(diǎn)、焦點(diǎn)、敏感度、高頻詞、粘度等用戶關(guān)注的行為數(shù)據(jù),為多維度的輿情分析打基礎(chǔ)。2.1.2數(shù)據(jù)預(yù)處理。互聯(lián)網(wǎng)采集的數(shù)據(jù)與實(shí)際建模分析的要求相差甚遠(yuǎn),極易受噪聲、重復(fù)數(shù)據(jù)、缺失值和不一致數(shù)據(jù)的侵?jǐn)_,必須進(jìn)行預(yù)處理,數(shù)據(jù)預(yù)處理主要完成采集數(shù)據(jù)中的噪聲清洗,糾正不一致性。一是檢測(cè)、剔除重復(fù)數(shù)據(jù)。主要是記錄去重和特征去重。考慮到中文處理的復(fù)雜性,可以采用特征去重、哈希去重等技術(shù)消除重復(fù)記錄。二是異常數(shù)據(jù)處理。可以采用統(tǒng)計(jì)方法、關(guān)聯(lián)分析、聚類方法進(jìn)行異常數(shù)據(jù)處理,如缺失值處理、異常值(離群點(diǎn))處理、噪音數(shù)據(jù)處理等。三是特定領(lǐng)域的數(shù)據(jù)清洗。這種數(shù)據(jù)清洗方案和算法都是針對(duì)特定領(lǐng)域,通過聚集、刪除冗余、特征聚類來減少無關(guān)數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的規(guī)范化。在公共政策評(píng)估中,可以根據(jù)公共政策的關(guān)鍵描述,建立關(guān)鍵詞知識(shí)庫和清洗模型,進(jìn)行定向采集或定向清洗。四是數(shù)據(jù)集成入庫。完成數(shù)據(jù)清洗后,通過規(guī)范、轉(zhuǎn)換和規(guī)整處理,把采集數(shù)據(jù)規(guī)范到可以進(jìn)行比較分析的某一度量空間,進(jìn)行數(shù)據(jù)入庫。2.1.3評(píng)估模型算法。由于互聯(lián)網(wǎng)漢字文本信息的特點(diǎn),只能通過語義分析找到文本數(shù)據(jù)內(nèi)在的固有屬性。基于互聯(lián)網(wǎng)輿情對(duì)公共政策實(shí)施效果評(píng)估是一種常見的聚類分析評(píng)估,通過對(duì)海量數(shù)據(jù)的采集分析,按照輿情特點(diǎn)對(duì)公共政策評(píng)估進(jìn)行聚類分析,通過關(guān)鍵詞頻度和特征表述并進(jìn)行適度的加權(quán)值,實(shí)現(xiàn)類似滿意、比較滿意、一般、不滿意的聚類分析。聚類算法是一種典型的無監(jiān)督學(xué)習(xí)算法,根據(jù)樣本之間的相似程度,將樣本劃分到不同的類別中。聚類分析的主要算法有劃分聚類、層次聚類、基于密度的聚類、基于模型的聚類、基于網(wǎng)格的聚類和基于模糊的聚類。
3基于聚類分析的公共政策模型結(jié)構(gòu)研究
3.1研究準(zhǔn)備。一是建立大數(shù)據(jù)評(píng)估的相關(guān)知識(shí)庫。對(duì)已的公共政策建立關(guān)鍵詞知識(shí)庫,如公共政策主題(政府文件名稱、文號(hào)、會(huì)議名稱、政策主題),關(guān)鍵詞,主要內(nèi)容描述,利益相關(guān)對(duì)象描述等。二是數(shù)據(jù)抽取和基本清洗。選取公共政策出臺(tái)后一段時(shí)間(如出臺(tái)后半年內(nèi)的數(shù)據(jù)),選取特定的互聯(lián)網(wǎng)渠道作為數(shù)據(jù)采集來源,采用爬蟲技術(shù)或向第三方數(shù)據(jù)爬蟲公司購買相關(guān)數(shù)據(jù),經(jīng)去重、去噪、數(shù)據(jù)歸一化后集成入庫。三是數(shù)據(jù)定向抽取和建模清洗。按照評(píng)價(jià)模型體系評(píng)價(jià)指標(biāo)的要求和聚類分析的數(shù)據(jù)規(guī)范,對(duì)單個(gè)指數(shù)進(jìn)行數(shù)據(jù)抽取和規(guī)范化建模清洗,形成每個(gè)指數(shù)聚類分析所需的數(shù)據(jù)集市。3.2評(píng)價(jià)模型指標(biāo)體系。采用傳統(tǒng)指數(shù)分析與大數(shù)據(jù)聚類分析相結(jié)合的方式建立評(píng)價(jià)模型指標(biāo)體系。評(píng)價(jià)模型為三級(jí)指標(biāo)模型,建立層次化結(jié)構(gòu)的公共政策評(píng)估指標(biāo)體系。一級(jí)指標(biāo)從政策關(guān)注度(A)、政策輿情評(píng)價(jià)(B)、利益相關(guān)者評(píng)價(jià)(C)、網(wǎng)上調(diào)查問卷(D)等四個(gè)層面反映互聯(lián)網(wǎng)大數(shù)據(jù)對(duì)公共政策實(shí)施評(píng)估的主題評(píng)價(jià),二級(jí)指標(biāo)是對(duì)上一級(jí)影響因素的進(jìn)一步細(xì)分,第三級(jí)指標(biāo)通過數(shù)據(jù)處理和聚類分析,采用可量化的數(shù)據(jù)對(duì)前一級(jí)指標(biāo)的每個(gè)方面進(jìn)行描述。三級(jí)指標(biāo)的數(shù)據(jù)處理,主要是在對(duì)定向數(shù)據(jù)集進(jìn)行分詞處理、語義分析的基礎(chǔ)上,通過聚類分析算法,得出量化評(píng)分。計(jì)算公式:P=k1*A+k2*B+k3*C+k4*D;0<P<100;根據(jù)P的計(jì)算值,將評(píng)估結(jié)果定位為非常滿意、滿意、基本滿意、不滿意四個(gè)等級(jí);K1-k4為權(quán)重,取值范圍為0-1,且k1+k2+k3+k4=1;A-D為一級(jí)指標(biāo)取值,通過二級(jí)指標(biāo)加權(quán)計(jì)算得出,取值范圍0-100之間,如A=k11*A1+k12*A2,K11-k12為權(quán)重,取值范圍為0-1,且k11+k12=1。二級(jí)指標(biāo)取值通過三級(jí)指標(biāo)加權(quán)計(jì)算得出,取值范圍0-100之間,如A1=k111*a11+k112*a12+k113*a13+k114*a14,K111-k114為權(quán)重,取值范圍為0-1,且k111+k112+k113+k114=1。三級(jí)指標(biāo)取值通過聚類分析,統(tǒng)計(jì)計(jì)算和歸一化處理得到。3.3評(píng)價(jià)模型與大數(shù)據(jù)聚類分析。3.3.1指標(biāo)模型。⑴關(guān)注度指數(shù)關(guān)注度指數(shù)包括搜索指數(shù)和影響力指數(shù)。搜索指數(shù)和影響力指數(shù)的計(jì)算也有較為復(fù)雜的數(shù)據(jù)處理、分析建模過程。如百度指數(shù)a11的取值計(jì)算,以公共政策的覆蓋范圍為基礎(chǔ),圍繞政策的前后一段時(shí)間區(qū)間,以網(wǎng)民在百度的搜索量為數(shù)據(jù)基礎(chǔ),以建立的公共政策知識(shí)庫關(guān)鍵詞為統(tǒng)計(jì)對(duì)象,分析并計(jì)算出各個(gè)關(guān)鍵詞在百度網(wǎng)頁搜索中搜索頻次,并進(jìn)行加權(quán)求和。360指數(shù)a12、微指數(shù)a13、騰訊指數(shù)a14都可以用類似的方法確定。影響力指數(shù)主要關(guān)注公共政策的、轉(zhuǎn)發(fā)、瀏覽、評(píng)論情況。通過分析公共政策后一段時(shí)間,微博、論壇、微信公眾號(hào)、貼吧、博客、手機(jī)APP等關(guān)注的程度,包括對(duì)關(guān)鍵信息的搜索量、相關(guān)網(wǎng)頁點(diǎn)擊數(shù)、轉(zhuǎn)發(fā)數(shù)、瀏覽數(shù)、評(píng)價(jià)數(shù)、關(guān)注數(shù)等分析,確定影響力指數(shù)[5]。⑵輿情評(píng)價(jià)指數(shù)輿情評(píng)價(jià)指數(shù)[3]是一個(gè)直接反映網(wǎng)民對(duì)政策評(píng)估的指標(biāo),權(quán)重系數(shù)高于關(guān)注度。強(qiáng)相關(guān)主要是采集數(shù)據(jù)與主題相關(guān)程度更加高,如直接對(duì)公共政策進(jìn)行評(píng)價(jià)或有多關(guān)鍵詞同時(shí)出現(xiàn);弱相關(guān)主要是有關(guān)鍵詞出現(xiàn),但頻度、數(shù)量較少,與主題的相關(guān)程度相對(duì)較弱。強(qiáng)相關(guān)的權(quán)重明顯要高于弱相關(guān)權(quán)重。三級(jí)指標(biāo)的處理采用聚類分析和分類分析結(jié)合的方法,以論壇評(píng)價(jià)指數(shù)b12、b22為例,首先是語料選擇,采用前面敘述的方式,建立關(guān)鍵詞知識(shí)庫,依照知識(shí)庫關(guān)鍵詞,對(duì)預(yù)處理后的各類論壇原帖及跟帖進(jìn)行分詞處理、智能過濾,形成供分析的語料數(shù)據(jù)集市。采用基于劃分的Kmeans聚類算法和基于層次的聚類算法對(duì)文本進(jìn)行聚類,形成評(píng)價(jià)話題聚類。由于b12、b22指數(shù)值在0-100之間取值,取值按照正面評(píng)價(jià)*權(quán)重-負(fù)面評(píng)價(jià)*權(quán)重-中性評(píng)價(jià)*權(quán)重得到。其他輿情評(píng)價(jià)指數(shù)的計(jì)算類似。圖2為輿情評(píng)價(jià)指數(shù)聚類、分類處理流程示意圖。⑶利益相關(guān)者評(píng)價(jià)指數(shù)利益相關(guān)者輿情評(píng)價(jià)指數(shù)計(jì)算與輿情評(píng)價(jià)指數(shù)基本相同,只是對(duì)數(shù)據(jù)集市的內(nèi)容進(jìn)行進(jìn)一步定向篩選,根據(jù)利益相關(guān)者知識(shí)庫關(guān)鍵詞,通過IP地址分析、文本分詞和語義分析,在已經(jīng)建立的數(shù)據(jù)集市中建立子集,子集作為利益相關(guān)者輿情分析基本語料數(shù)據(jù),進(jìn)行上述類似建模分析。利益相關(guān)者評(píng)價(jià)指數(shù)權(quán)重取值更高。⑷網(wǎng)上調(diào)查評(píng)價(jià)網(wǎng)上調(diào)查由政策者來組織,通過政府網(wǎng)站或其他綜合網(wǎng)站進(jìn)行數(shù)據(jù)收集。網(wǎng)上調(diào)查的指標(biāo)設(shè)計(jì)可以更加具有針對(duì)性,但參與人數(shù)、填報(bào)數(shù)據(jù)質(zhì)量、不真實(shí)數(shù)據(jù)等也要認(rèn)真考慮。
4結(jié)束語
應(yīng)用互聯(lián)網(wǎng)大數(shù)據(jù)對(duì)公共政策實(shí)施評(píng)估,是新的研究領(lǐng)域,具有直面利益相關(guān)者的優(yōu)點(diǎn)。本文提出的指數(shù)模型對(duì)公共政策實(shí)施大數(shù)據(jù)評(píng)估具有一定參考作用,但是數(shù)據(jù)采集質(zhì)量難以保證,各類權(quán)重的使用具有隨意性。所以,傳統(tǒng)定性分析、傳統(tǒng)定量分析、基于互聯(lián)網(wǎng)的大數(shù)據(jù)分析應(yīng)當(dāng)互相融合,取長(zhǎng)補(bǔ)短,使公共政策實(shí)施的評(píng)估更加科學(xué)合理。
參考文獻(xiàn):
[1]魏航,王建冬,童楠楠.基于大數(shù)據(jù)的公共政策評(píng)估研究:回顧與建議[J].電子政務(wù)E-GOVERNMENT,2016.1:11-17
[2]高峰.政策評(píng)估的通用模型研究[J].科技管理研究,2015.24:35-39
[3]連芷萱,蘭月新,夏一雪,劉茉,張雙獅.面向大數(shù)據(jù)的網(wǎng)絡(luò)輿情多維動(dòng)態(tài)分類與預(yù)測(cè)模型研究[J].情報(bào)雜志,2018.5:123-133
[4]張達(dá)剛,陳海寧,陳華,張光怡.環(huán)境評(píng)估大數(shù)據(jù)管理平臺(tái)初探及技術(shù)綜述[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2019.28(4):205-211
[5]文馨,陳能成,肖長(zhǎng)江.基于SparkGraphX和社交網(wǎng)絡(luò)大數(shù)據(jù)的用戶影響力分析[J].計(jì)算機(jī)應(yīng)用研究,2018.35(3):830-834
作者:楊志新 高翔 張慶 張狄 單位:1.湖南省政府發(fā)展研究中心 2.長(zhǎng)沙市天心閣大數(shù)據(jù)研究院