宏觀經濟統計數據方法與實證
時間:2022-02-22 03:08:01
導語:宏觀經濟統計數據方法與實證一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
隨著我國經濟發展方式的轉變和需求結構的不斷變化,我國經濟體制逐步走向市場經濟體制,利益主體隨之日益多元化,統計工作所面臨的內外部環境都發生了非常大的轉變,統計工作迎來了更大的挑戰。目前實際統計工作中,統計數據不協調是導致統計數據質量不高的重要原因之一,單個指標的數據準確性已經不能作為評估數據質量的唯一標準,不同宏觀經濟統計指標的數據之間也應該處于一種相互協調的關系。為此,學界和政府統計部門均紛紛從數據協調性角度加大了對統計數據質量評估方法的探索力度。Rawski(2001)[1,2]指出自1998年以來中國官方公布的GDP數據有高估嫌疑,并且偏誤遠遠大于統計技術困難帶來的誤差,官方GDP增長率不能反映真實的經濟成果,文中給出了反映中國經濟增長情況的真實評估結果。Sinton(2001)[3]基于能源數據內部不同項目之間應該協調一致的假定,對1990—2000年中國能源統計數據質量進行了評估,認為90年代初的能源數據比較準確、可靠,但自90年代中期以后數據質量有所下降。闕里和鐘笑寒(2005)[4]選取10個宏觀經濟核心指標,利用1984—2001年我國28個地區面板數據構建固定效應變截距模型對GDP數據準確性進行評估。研究發現,各地區在1984—2001年整個研究時期內,并沒有找到國內生產總值數據有長期錯誤的依據。劉洪和黃燕(2009)[5]以C-D生產函數為基礎,選取1978—2004年相關指標數據構建計量模型,通過計算COOK、W-K等傳統統計量對GDP準確性進行評價,經計算得到1978年、1984—1986年、1991年GDP數據值得質疑。盧二坡和黃炳藝(2010)[6]以C-D生產函數為基礎,構建基于穩健MM估計的數據質量診斷方法,對1978—2008年我國GDP數據準確性進行了評估,認為我國的GDP數據是相對可靠的。對國內外文獻進行總結,發現在模型估計方法上,大多學者仍采用普通最小二乘法對模型參數進行估計,然而OLS回歸易受到數據集中少數異常值的影響,從而模型估計結果不準確,根據擬合模型得到的殘差不能檢測出所有異常點。近年來統計學者開始重視穩健估計方法,并建立基于穩健估計方法的數據質量評估模型,該方法能夠有效地解決OLS方法中經常出現的多個異常點掩蓋的弊端。
1宏觀經濟統計數據協調關系模型、估計方法與實證結果
1.1協調關系模型的經濟理論依據——道格拉斯生產函數本文以C-D生產函數即柯布-道格拉斯生產函數為例進行實證分析,并且將財政支出當作經濟增長的內生變量,即包含財政支出要素的經濟增長模型為:Yt=A0eλtKαtLβteεt(1)其中,Yt為總產出量,Kt、Lt分別代表(私人)資本投入量、勞動投入量,eεt表示隨機誤差項,A0為初始的技術水平,λ為技術進步率,a、b分別為勞動和資本的投入產出彈性。將式(1)兩邊取自然對數,得:LnYt=LnA0+λt+αLnKt+βLnLt+εt(2)通常假設規模報酬不變,即有α+β=1,則式(2)可變換為:Ln(Yt/Lt)=LnA0+λt+αLn(Kt/Lt)+εt(3)可以通過對式(3)進行參數估計,來考察資本、勞動對總產出的影響。1.2協調關系的估計1.2.1數據來源及處理樣本數據皆取自1978—2014年《湖南統計年鑒》。其中,總產出量Yt選用地區生產總值數據,資本存量Kt用固定資產投資總額替代;勞動力數量Lt用年平均從業人數代替。為消除物價因素的影響,各個變量在計算時,進行不變價處理,均除以以GDP平減指數換算成真實值,由于年鑒中沒有GDP平減指數,所以采用如下公式進行換算:Deflator=GDPiGDPiindex´GDP1978indexGDP1978(4)其中,GDPi代表第i年的名義GDP值,GDPiindex代表第i年的GDP指數,GDP1978代表1978年GDP名義值,GDP1978index代表1978年GDP指數(1978=100)。1.2.2估計方法建立計量模型,模型形式如式(3),在對式(3)進行參數估計時采用穩健回歸方法,因為相比普通最小二乘估計,穩健回歸能夠提供不受異常值或偏態殘差分布影響的無偏估計,并且能更好地識別異常點。穩健MM估計的基本原理是,首先在迭代的S估計方法的基礎上得出對異常值具有高度耐抗性的回歸系數和對應殘差的初始估計,然后運用M估計方法導出回歸系數。假設被解釋變量y受p個相互獨立的解釋變量x的影響,兩者之間的關系可以由多元線性回歸模型表示為:yt=α0+α1x1t++αpxpt+εtt=12n(5)式(5)中,εt是獨立同分布的誤差項,令xt=(x1txpt),θ=(α0α1αp),定義第t年觀察值的殘差為et(θ ̂)=yt-ŷt=yt-(α0Ù+α1Ùx1t++αpÙxpt)。M估計θ ̂M定義如下:θÙM=argminθåt=1nρìíîüýþet(θ)σ̂(6)式(6)中,ρ(×)是滿足一定條件的損失函數,是對稱、連續、嚴凸或者在正半軸上非降的函數。為了使得式(6)的解具備尺度同變性,殘差et(θ ̂)經由一個離散尺度σ̂標準化。S估計是使得殘差尺度σ̂S最小化的解,S估計θ ̂S的定義為:θ ̂S=argminθσ̂(e1(θ),⋯,en(θ))(7)式(7)中,σ̂S是穩健的尺度估計,其由下式定義:1nåt=1nρ(et(θ)σ̂s)(8)式(8)中,ρ(×)為S估計的損失函數,b是常數,且有b=E[ρ(Z)],Z服從標準正態分布。MM估計θ ̂MM定義形如M估計θ ̂M,不同之處是由σ̂S替代式(6)中的σ̂,定義如下:θ ̂MM=argminθåt=1nρ(et(θ)σ̂S)(9)式(9)中,ρ(×)是滿足一定條件的損失函數,σ̂S是回歸殘差et(θ ̂)的離散性度量。求解式(9)可以采用Salibi-an-Barrera和Yohai(2006)提出的重復加權迭代最小二乘算法得到。而這一迭代程序的初始值如尺度估計σ̂S及回歸估計θ ̂S,則由S估計導出。損失函數ρ(×)的選取對于取得高的穩健性特征和高效率至關重要。通常,初步的S估計以及最終的MM估計都選擇Turkey的雙權型ρ(×)函數,該函數定義如下:ρ(u)=ìíîïïïï1-éëêùû1-úæèöøuk23||uk1||u>k(10)對于S估計,常數k設置為1.547可以保證50%的破壞點。而對于第二步的MM估計,常數k設置為4.685可保證最終估計具有95%的效率。1.2.3估計結果因穩健MM回歸估計的模型形式是線性的,所以需將前述函數形式(3)轉換成線性形式,令Y't=Ln(Yt/Lt),K't=Ln(Kt/Lt),β0=Ln(A0),β1=λ,β2=α,則需要估計的模型轉換為Y't=β0+β1t+β2K't+εt。運用穩健MM估計方法對湖南省地區生產總值與資本投入量、勞動投入量之間的協調關系進行估計,具體采用STATA軟件實現模型參數的估計,結果如表1所示。tÙ=4.328662+0.0320534t+0.4196K't將其轉換回三次函數形式,即協調關系模型為:Ln(Yt/Lt)Ù=4.328662+0.0320534t+0.4196Ln(Kt/Lt)構建了湖南省地區生產總值與資本投入量、勞動投入量之間的協調關系模型,接下來需要在此模型基礎上,對湖南省宏觀經濟統計數據質量進行評估。
2宏觀經濟統計數據質量診斷方法與實例
2.1宏觀經濟統計數據質量診斷方法2.1.1趨勢擬合診斷法現有的趨勢擬合診斷法通過計算第t期被解釋變量的實際統計值與根據模型得到的估計值之間的誤差率來評估數據之間協調性,如果誤差率超出自己設定的允許誤差范圍,則認為該期數據不協調,這一數據的可信度值得懷疑。具體公式如下:δt=yt-ytÙyt(11)通過閱讀大量文獻發現統計學者普遍認為宏觀經濟數據估算值偏離實際值的程度超過5%的時候,則認為這一數據是可疑的。本文在前人研究基礎上,也將最大允許誤差率設置為5%。2.1.2統計診斷法穩健回歸本身是當數據集中存在異常值時,使估計結果能夠對于異常值有較好的抵抗性,減少異常值對估計結果的影響,但它也可以通過穩健殘差—穩健距離診斷圖(RR-RD診斷圖)實現異常點類型的識別與數據質量的診斷。RR-RD診斷圖的縱軸是標準化的穩健殘差RRt=et/σ̂S,橫軸是自變量X空間的穩健馬氏距離RDt。RDt=(xt-μMCD)′åMCD-1(xt-μMCD)RDt2~χ2(p)t=12n(12)式(12)中,均值向量μMCD和協方差矩陣åMCD是根據MCD估計得到的穩健估計量,用來抵抗異常值對估計結果的影響,p指模型中解釋變量的個數。根據RR-RD診斷圖不僅可以診斷出哪些數據點為異常值,還能夠識別異常值的類型。從縱軸上來看,在假設殘差服從正態分布的情況下,如果RRt<-χ210.975或RRt>χ210.975,則可將該數據點看成是Y方面的異常點。RRt的臨界值±2.24,此處2.24是Y方向上允許偏離的最大距離,即后文中的最大允許偏離距離。從橫軸上來看,如果RDt>χ2p0.975(p為模型中解釋變量的個數),則可將這一數據點視為X方面的異常點,該穩健距離被認為有過高的杠桿效應。RR-RD診斷圖將數據點分為四類:||RRt和RDt都小的為正常值;||RRt大而RDt小的為縱向異常點;||RRt和RDt都大的為壞的杠桿點;||RRt小而RDt大的為好的杠桿點。在四類數據點中,正常值和好的杠桿點與數據集整體趨勢一致,不會導致數據質量下降,但是縱向異常點與壞的杠桿點都從X空間或者Y空間遠離數據集整體趨勢,這兩種數據點的存在會增大回歸系數的標準誤差,從而導致數據質量的下降。2.1.3綜合診斷法在前兩種診斷方法中分別運用到誤差率δt與穩健殘差RRt數據質量診斷統計量,這兩個指標分子都為預測值偏離真實值的程度,但是這兩個指標數值協調性臨界值不同,導致兩種診斷方法的評估結果不同。統計診斷法中:RRt=et/σ̂S,||RRt£2.24(各指標數據之間相互協調)趨勢擬合診斷法中:δt=yt-ytÙyt=etyt=σSÙytRRt,||δt£0.05(各指標數據之間相互協調)||||||||||||σSÙytRRt£0.05(各指標數據之間相互協調)||RRt£0.05ytσSÙ(各指標數據之間相互協調)在趨勢擬合診斷法中,RRt的協調性臨界值是0.05ytσSÙ,其大小不恒等于2.24,所以上述兩種診斷方法的臨界值大小不同會造成其評估結果的不同。為了更科學地對數據質量進行診斷,本文建議將兩種方法相結合,構建更合理的數據質量診斷方法——綜合診斷法。在綜合診斷法中需要用到兩個概念:相對誤差率和相對穩健殘差。相對誤差率用δ't來表示,相對穩健殘差用δt來表示。定義如下:δ't=δt最大允許誤差率(13)其中,最大允許誤差率為5%,當||δ't£1時,表示各指標數據之間是協調的。RR't=RRt最大允許偏離距離(14)其中,最大允許偏離距離為2.24,當||RR't£1時,表示各指標數據之間是協調的。Dt=δ't+RR't(15)式(15)中Dt為綜合偏離誤差,也是描述數據真實值與估計值之間的偏離程度。如果||Dt£2,則認為各指標數據之間相互協調,該年數據質量較好;反之,數據質量較差。2.2宏觀經濟統計數據質量的診斷運用趨勢擬合診斷法、統計診斷法及綜合診斷法分別對湖南省地區生產總值與資本投入量、勞動投入量之間的協調性進行診斷,診斷結果如表2所示。1代表不協調,數值0代表協調。(1)通過分析基于趨勢擬合診斷法的誤差率δt數據可知,湖南省地區生產總值真實值與預測值之間的誤差率絕對值均在5%以內,說明各數據之間協調性較好,即整體數據質量較好。但需要注意的是,1978—1982年、1989年、1990年的地區生產總值真實值與預測值之間的誤差率絕對值相對于其他年份來說較大,均在1%之上。(2)通過分析基于統計診斷法的數據質量評估指標可知,1978—1982年、1989年、1990年、2011年的||RRt大于2.24,這些數據點可看作是Y方向上的異常點。1978—1988年、2009—2013年的RDt數據大于χ22,0.975=2.72,這些數據點可看作是X方向上的異常點。為了更直觀地觀測穩健殘差RRt與穩健距離RDt的相對位置,繪制RR-RD診斷圖,如圖1所示。圖1RR-RD診斷圖結合表2、圖1可以看出,1983—1988年、2009年、2010年、2012年、2013年的穩健距離RDt雖然被診斷為異常,即遠離X空間,但是它們并非縱向異常值,所以這些年份的數據為好的杠桿點,它們的存在不會造成數據不協調。1978—1982年、2011年的RDt很大,被診斷為異常,即X方面異常,同時它們都是縱向異常值,這些數據為壞的杠桿點。1989年、1990年的穩健殘差RRt被診斷為異常,但穩健距離RDt正常,即Y方向異常但X方向正常,這兩年數據是縱向異常點。故1978—1982年、1989年、1990年、2011年湖南省地區生產總值與資本投入量、勞動投入量數據不協調,這說明這些年份的數據是可疑的,數據質量較差。與基于趨勢擬合診斷法的數據質量診斷結果相對比,發現兩種方法的診斷結果存在一定的差異,從方法理論上并不能判斷到底哪種方法評估結果更可靠,故最終采用綜合診斷法對湖南省宏觀經濟統計數據質量進行診斷。(3)通過分析基于綜合診斷法的綜合偏離誤差Dt可知,1978—1982年、1990年的綜合偏離誤差Dt絕對值大于2,而其余年份的綜合偏離誤差Dt絕對值小于2,故湖南省地區生產總值與資本投入量、勞動投入量數據之間不協調的年份主要集中在1978—1982年、1990年,即表明這些年份的數據是可疑的,數據質量較差。
3結論
本文構建基于穩健MM估計方法的宏觀經濟統計數據協調關系模型,并在趨勢擬合診斷法和統計診斷法的基礎上提出綜合診斷法,并運用綜合診斷法對湖南省宏觀經濟數據質量進行診斷。對湖南省宏觀經濟統計數據質量進行實證分析,研究表明:1978—1982年、1990年湖南省地區生產總值與資本投入量、勞動投入量數據之間存在不協調問題,這些年份數據質量較差。綜合分析數據質量診斷結果,發現湖南省各年份宏觀經濟統計數據質量水平參差不齊,數據不協調的程度略有差異,但是可以確定的是某些年份確實存在數據不協調問題,這種不協調導致自身數據質量不高。
作者:王晶 單位:陜西秦農農村商業銀行股份有限公司
- 上一篇:鐵路貨車占用時間統計設計與應用
- 下一篇:統計問卷調查心理傾向規律及應用