回歸分析在概率圖紙法中的運用

時間:2022-03-18 08:03:00

導語:回歸分析在概率圖紙法中的運用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

回歸分析在概率圖紙法中的運用

【關鍵詞】線性回歸;概率圖紙;Excel軟件;概率分布;

摘要:概率圖紙法在隨機變量分布的檢驗中有快捷簡便的優點,但精確度不高。結合回歸分析理論,利用Excel軟件能克服這些缺點。

關鍵詞:線性回歸;概率圖紙;Excel軟件;概率分布;

分布參數一般在進行參數假設檢驗之前,需要對母體的分布類型進行推斷。概率圖紙法是一種常用的檢驗方法,目前常用的有正態、對數正態、二項分布、指數分布和威布爾分布概率圖紙等。概率圖紙法使用簡單,但準確性不高。運用回歸分析的方法,結合概率圖紙能對母體的分析類型和參數作出較為準確的推斷。本研究用線性回歸理論在正態概率圖紙法的運用中說明這種方法的過程。

1正態概率圖紙的構造原理及使用

11構造原理

設母體ξ的分布函數F(x)服從正態分布N(μ,θ)

F(x)=12π〖JF(Z〗x-∞e-(t-u)22σ2dt〖JF)〗=12π〖JF(Z〗t-uσ-∞e-z22dt〖JF)〗

=Φ(x-uσ)=Φ(z)

Z(x)服從標準正態分布N(0,1),函數Z(x)=x-uσ(I)是x的線性函數,在(x,z(x))直角坐標平面上是一條直線。

正態概率圖紙上,橫軸的刻度表示x,縱軸上先刻出z的刻度(均勻),然后根據標準正態分布N(0,1)表查出對應的分布函數值Φ(z),刻在z的位置上,然后把z的刻度去掉,留下x與F(x)(即Φ(z))的刻度,就構成一張正態概率圖紙。

12使用方法

若假設的分布類型正確,則母體中抽得子樣數據在該種分布的概率圖紙上繪制的點基本在一條直線上,否則研究的隨機變量就不服從假設的分布類型。這種方法不僅可以檢驗分布類型還可以進行參數估計,但都采用目測,精確度不高。

2線性回歸理論在概率圖紙法中的運用

利用線性回歸理論,結合Excel軟件不僅可計算z與x間的線性相關程度,還可算出隨機變量x的分布參數的點估計什和區間估計。

21實例運用

檢驗某型號玻璃紙的橫向延伸率是否服從正態分布,測得數據如下[1]:

右端點X36.538.540.542.544.546.548.550.5累計頻率%715263544567387概率F(X)0.070.150.260.350.440.560.730.87右端點X52.554.556.558.560.562.564.5累計頻率%929597979999100概率F(X)0.920.950.970.970.990.990.995步驟如下:

①把上表確立的點(x,F(x))標在正態概率圖紙上。觀察點的分布大概在一條直線附近,估計變量的分布服從正態分布。以下計算在Excel軟件中進行。

②編輯函數NORMINV(F(X),0,1)計算出每一個F(X)(即Φ(z)對應的Z值),將正態概率圖紙上的點坐標轉為(X,Z)。X36.538.540.542.544.546.548.550.5Z-1.47579-1.03643-0.64335-0.38532-0.15097-0.1509690.6128131.126391X52.554.556.558.560.562.564.5Z1.4050721.6448541.8807941.8807942.3263482.3263482.575829③ZX有線性相關性的檢驗。用PEARSON相關系數r=SxzSxSz,|r|≤1,|r|的值越接近1則ZX線性相關程度越高。

其中:Sx=∑ni=1(xi-)2n,Sz=∑ni=1(zi-)2n,

Sxz=1n∑ni=1(xi-)(zi-)

編輯函數PEARSON(array1,array2),其中array1為X的集合,array2為Z的集合,r=0.989295,可見ZX之間相關性極高。

④求出回歸方程z=bx+a(II),其中b=∑ni=1(xi-)(zi-)∑ni=1(xi-)2,a=-b

編輯函數SLOPE(array1,array2)計算出b=0.147011的值,其中array1為Z的集合,array2為X的集合,在Excel中編輯函數INTERCEPT(array1,array2)計算出a=-6.60818的值,則ZX間的線性回歸方程為Z=0.147011x-6.60818,根據線性回歸理論可得分布參數的點估計值σ=1b=6.802203,u=-ab=44.95015。

⑤回歸方程的顯著性檢驗:構造統計量F=SSR/1SSE/(n-2)~F(1,n-2)進行檢驗。其中SSR=∑(i-)2,SSE=∑(zi-)2,計算得F=597.4379。取顯著水平α=0.01,編輯函數FINE(0.01,1,n-2)得臨界值F0.01(1,13)=9.073806,則ZX間的線性回歸方程z=0.147011x-6.60818在顯著水平=0.01的水平下有顯著意義。

⑥分布區間的參數估計:回歸方程z=bx+a中的回歸系數b的可信區間為b±tα/2,n-2Sb,其中:Sb=Szxlxx,Szx=SSEn-2,lxx=∑ni=1(xi-)2=1120。編輯函數TINVE(0.05,n-2)得t臨界值。

t(0.025,13)=2.160369,Sb=0.040774,b的0.95的置信區間為(0.058925,0.235097),由a=-b得a的0.95的置信區間為(-11.0565,-2.15984)。

由分布參數的點估計σ=1b,u=-ab,a=-b得σ和u的區間估計。

σ的區間估計為(4.253561,16.97065),u的區間估計為(36.6538,47.0296),置信度均為0.95。3推廣應用

從上述過程中可見對于母體分布能用概率圖紙法檢驗,就可結合回歸理論進行精確計算。同時,對于某些隨機變量的函數,若其分布能用某種概率圖紙法檢驗,也可用上述方法計算。

參考文獻

1魏宗舒.概率論與數理統計教程高等教育出版社,2002

2王曉明Excel2002高級運用―數理統計機械工業出版社,2003

3劉璋溫,戴樹森,方開泰概率紙淺說科學出版社,1980