版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、<p> 基于多元線性回歸模型對我國鋼鐵生產(chǎn)的分析</p><p> 摘要:鋼鐵工業(yè)是國民經(jīng)濟中最重要的基礎(chǔ)原材料產(chǎn)業(yè)和重要支撐產(chǎn)業(yè)。本文根據(jù)我國鋼材產(chǎn)量為研究對象,選取可能影響鋼材產(chǎn)量的粗鋼產(chǎn)量、發(fā)電量、房屋建筑面積、總能源消耗、鐵路運輸量、對建筑工程的投資和汽車生產(chǎn)量七個因素,運用多元線性回歸分析建立模型,先運用普通最小二乘估計求回歸系數(shù)再對方程進行異方差、自相關(guān)、和多重共線性診斷,用迭代法消除
2、了自變量之間的自相關(guān)。對于多重共線性問題,先是用逐步回歸和剔除變量的方法,最終轉(zhuǎn)變?yōu)橛脦X回歸剔除粗鋼產(chǎn)量和發(fā)電量兩個變量解決多重共線性,建立最終的嶺回歸方程:</p><p> 以其探究最后進入回歸方程的幾個變量在影響鋼材生產(chǎn)方面孰輕孰重,達到學習與生活結(jié)合的效果。</p><p> 關(guān)鍵詞:多元線性回歸 異方差 自相關(guān) 多重共線性 逐步回歸 嶺回歸</p>&
3、lt;p><b> 一、引言</b></p><p> 中國的鋼鐵工業(yè)歷經(jīng)50年的發(fā)展,特別是改革開放30年以來有了巨大的進步,取得了舉世矚目的成就。鋼鐵工業(yè)的鋼產(chǎn)量增加速度加快、技術(shù)水平得到明顯提高,產(chǎn)品結(jié)構(gòu)不斷調(diào)整,成為名副其實的鋼鐵大國。1996年我國鋼產(chǎn)量首次超過1億噸大關(guān),躍居世界第一位,此后我國產(chǎn)量一直保持世界排名第一的位置。2002年實現(xiàn)鋼產(chǎn)量1.8億噸,到2003年
4、鋼產(chǎn)量突破2億噸,達到22234萬噸,2004年全國共產(chǎn)鋼27279萬噸,比上年增長22.7%,生鐵、鋼材的產(chǎn)量分別達到創(chuàng)記錄的25185萬噸與29723萬噸(含重復材),同比增長均在20%以上。在鋼材品種和質(zhì)量方面,已經(jīng)逐步形成能冶鐵包括高溫合金、精密合金再內(nèi)的1000多個鋼材品種,軋制和加工包括板、帶、管、型、線等各種形狀的4萬多個品種規(guī)格的鋼材;各項技術(shù)經(jīng)濟指標明顯提高。</p><p> 鋼鐵行業(yè)是國民
5、經(jīng)濟的支柱產(chǎn)業(yè),是加快實現(xiàn)工業(yè)化的先導產(chǎn)業(yè),其在拉動上下游產(chǎn)業(yè)發(fā)展、擴大城鄉(xiāng)勞動力就業(yè)以及推動區(qū)域經(jīng)濟發(fā)展等方面做出了重要的貢獻。雖然整個現(xiàn)代化建設(shè)以傳統(tǒng)原材料為主的狀況已經(jīng)發(fā)生改變,但鋼鐵行業(yè)對我國來說仍然是基礎(chǔ)工業(yè),直接影響著國民經(jīng)濟的健康發(fā)展??梢哉f鋼鐵行業(yè)的穩(wěn)定發(fā)展是實現(xiàn)我國新型工業(yè)化戰(zhàn)略目標的關(guān)鍵一環(huán),其發(fā)展水平的高低是衡量我國工業(yè)化水平和綜合國力高低的重要標志。隨著國際產(chǎn)業(yè)的轉(zhuǎn)移和我國國民經(jīng)濟的快速發(fā)展,我國鋼鐵工業(yè)取得了巨
6、大成就。本文研究了粗鋼產(chǎn)量、發(fā)電量、房屋建筑面積、總能源消耗量、鐵路運輸量、對建筑工程的投資以及汽車生產(chǎn)總量7個變量對鋼材生產(chǎn)量的影響,以及它們之間的關(guān)系;以此可以看出這7個指標中哪些指標對鋼材生產(chǎn)量有著駐足輕重的關(guān)系,哪些指標對鋼鐵產(chǎn)量的影響相對較弱。由此,可以看出怎么樣才能使鋼材產(chǎn)量更上一層樓,讓鋼鐵事業(yè)有著更加長足且輝煌的發(fā)展。</p><p><b> 模型假設(shè)</b></p
7、><p> 假設(shè)選取的自變量指標能基本上全面反映鋼鐵生產(chǎn);</p><p> 假設(shè)選取的年份期間沒有大的金融市場波動;</p><p><b> 假設(shè)隨機誤差。</b></p><p><b> 符號說明</b></p><p> 1、y表示鋼材產(chǎn)量;</p>
8、;<p> 2、x1表示粗鋼產(chǎn)量;</p><p> 3、x2表示發(fā)電量;</p><p> 4、x3表示房屋建筑面積;</p><p> 5、x4表示總能源消耗;</p><p> 6、x5表示鐵路運輸量;</p><p> 7、x6表示對建筑工程投資;</p><
9、;p> 8、x7表示汽車生產(chǎn)總量;</p><p> 9、表示模型的隨機誤差項。</p><p><b> 四、模型分析與建立</b></p><p> 4.1多元線性回歸模型</p><p> 多元線性回歸模型的一般形式 </p><p> 設(shè)隨機變量與一般變量 的線性回歸模型
10、為 </p><p> ?。?.1) </p><p> 其中,是個未知參數(shù),稱為回歸常數(shù),稱為回歸系數(shù)。稱為被解釋變量(因變量),是個可以精確測量并控制的一般變量,稱為解釋變量(自變量)。 是隨機誤差,與一元線性回歸一樣,對隨機誤差項我們常假定</p><p><b> ?。?.2)</b></p>
11、<p><b> 稱</b></p><p><b> (4.3)</b></p><p><b> 為理論回歸方程。</b></p><p> 對一個實際問題,如果我們獲得組觀測數(shù)據(jù),則線性回歸模型(4.1)式可表示為</p><p><b>
12、?。?.4)</b></p><p><b> 寫成矩陣形式為</b></p><p><b> ?。?.5)</b></p><p><b> 其中</b></p><p><b> (4.6)</b></p><p
13、> 是一個階矩陣,稱為回歸設(shè)計矩陣或資料矩陣。</p><p> 多元線性回歸模型的基本假定</p><p> 為了方便地進行模型的參數(shù)估計,對回歸方程(4.4)式有如下一些基本假定:</p><p> 解釋變量是確定性變量,不是隨機變量,且要求。這里的,表明設(shè)計矩陣中的自變量列之間不相關(guān),樣本量的個數(shù)應大于解釋變量的個數(shù),是一滿秩矩陣。</p&
14、gt;<p> 隨機誤差項具有零均值和等方差,即</p><p><b> ?。?.7)</b></p><p> 這個假定常稱為高斯—馬爾柯夫條件。,假設(shè)觀測值沒有系統(tǒng)錯誤,隨機誤差項的平均值為0。隨機誤差項的協(xié)方差為0,表明隨機誤差項在不同的樣本點之間是不相關(guān)的(在正態(tài)假定下即為獨立的),不存在序列相關(guān),并且有相同的精度。</p>
15、<p> (3)正態(tài)分布的假定條件為</p><p><b> ?。?.8)</b></p><p> 對于多元線性回歸的矩陣模型(4.5)式, 這個條件便可表示為</p><p><b> (4.9)</b></p><p> 由上述假定和多元正態(tài)分布的性質(zhì)可知,隨機變量服從維正
16、態(tài)分布,回歸模型(4.5)式的期望向量</p><p><b> ?。?.10) </b></p><p><b> (4.11)</b></p><p><b> 因此</b></p><p><b> ?。?.12)</b></p>
17、<p> 4.2回歸參數(shù)的普通最小二乘估計</p><p> 線性回歸方程確定后的任務是利用已經(jīng)收集到的樣本數(shù)據(jù),根據(jù)一定的統(tǒng)計擬合準則,對方程中的各個參數(shù)進行估計。普通最小二乘就是一種最為常見的統(tǒng)計擬合準則,在該準則下得到的回歸參數(shù)的估計稱為回歸參數(shù)的普通最小二乘估計。</p><p> 對于(4.5)式表示的回歸模型,所謂最小二乘法,就是尋找參數(shù)的估計值,使離差平方和達
18、到極小,即尋找滿足</p><p> ?。?.13) </p><p> 依照(4.13)式求出的就稱為回歸參數(shù)的最小二乘估計。 </p><p><b> (4.14)</b></p>
19、<p><b> 為經(jīng)驗回歸方程。</b></p><p><b> 五、案例分析</b></p><p><b> 5.1數(shù)據(jù)說明</b></p><p> 原始數(shù)據(jù)(見附錄1))選取1990-2010年間鋼材產(chǎn)量()、粗鋼產(chǎn)量()、發(fā)電量()、房屋建筑面積()、總能源消耗()
20、、鐵路運輸量()、對建筑工程投資()和汽車生產(chǎn)總量()八個指標,以鋼材產(chǎn)量為因變量,其余七個為自變量,研究鋼材產(chǎn)量()與粗鋼產(chǎn)量()、發(fā)電量()、房屋建筑面積()、總能源消耗()、鐵路運輸量()、對建筑工程投資()和汽車生產(chǎn)總量()之間的關(guān)系。數(shù)據(jù)來源國家統(tǒng)計局網(wǎng)站統(tǒng)計年鑒。</p><p><b> 5.2求解分析</b></p><p> 5.2.1直接進入法
21、</p><p><b> 表1 模型匯總</b></p><p><b> 模型匯總b</b></p><p> 由表1可以看出調(diào)整后的決定系數(shù),說明回歸方程的擬合優(yōu)度比較好。</p><p><b> 表2 方差分析表</b></p><p>
22、;<b> Anovab</b></p><p> 由表2方差分析表可以看出,F(xiàn)檢驗的檢驗值F=5598.148非常大,再看F檢驗的P值=1.41E-210.000,可知此回歸方程高度顯著,即做出7個自變量整體對因變量y產(chǎn)生顯著線性影響的判斷所犯錯誤的概率僅為1.41E-210.000。</p><p><b> 表3 系數(shù)表</b><
23、;/p><p><b> 系數(shù)a</b></p><p> 此時得到的回歸方程為:</p><p> 首先看t檢驗結(jié)果, 的t統(tǒng)計量及其相應的值就是上表第五列(Sig.)的結(jié)果。我們可以發(fā)現(xiàn)顯著性水平時只有粗鋼產(chǎn)量()和對建筑工程投資()通過了顯著性檢驗。盡管回歸方程的顯著性檢驗高度顯著,但也會出現(xiàn)有某些自變量(甚至每個)對無顯著影響的情況。
24、</p><p> 接著看看回歸系數(shù)的置信區(qū)間除了有粗鋼產(chǎn)量()系數(shù)95%置信區(qū)間[0.669,1.161]和對建筑工程投資()系數(shù)95%置信區(qū)間[0.049,0.175]不包含0,這也反映了回歸系數(shù)的不合理。</p><p> 再看回歸系數(shù)的正負情況,房屋建筑面積()、總能源消耗()和汽車生產(chǎn)總量()的回歸系數(shù)為負,顯然回歸系數(shù)不合理。</p><p> 那
25、么究竟是什么原因?qū)е禄貧w方程出現(xiàn)上述結(jié)果呢,我們猜想可能是下列原因?qū)е碌摹?lt;/p><p><b> 異方差和自相關(guān)</b></p><p> 在回歸模型的基本假設(shè)中,假定隨機誤差性具有相同的方差,獨立或不相關(guān),即對于所有樣本點,有</p><p> 但在建立實際問題的回歸模型時,經(jīng)常存在于此假設(shè)相違背的情況,一種是計量經(jīng)濟建模中常說的異
26、方差性,即,當時另一種是自相關(guān)性,即</p><p> ,當時,異方差帶來的問題:</p><p> 當一個回歸問題存在異方差時,如果仍用普通最小二乘發(fā)估計位置參數(shù),將引起不良后果,特別是最小二乘估計量不再具有最小方差的優(yōu)良性,即最小二乘估計的有效性被破壞了。</p><p> 當存在異方差時,參數(shù)向量的方差大于在同方差條件下的方差,如果用普通最小二乘發(fā)估計參
27、數(shù),將出現(xiàn)低估的真是方差的情況,進一步將導致高估回歸系數(shù)的t檢驗值,可能造成本來不顯著的某些回歸系數(shù)變成顯著。這將給回歸方程的應用效果帶來一定影響。</p><p> 當存在異方差是,普通最小二乘估計存在以下問題:</p><p> 參數(shù)估計值雖然是無偏的,但不是最小方差線性無偏估計。</p><p> 參數(shù)的顯著性檢驗失效。</p><p
28、> 回歸方程的應用效果極不理想。</p><p><b> 自相關(guān)帶來的問題:</b></p><p> 當一個線性回歸模型的隨機誤差項存在序列相關(guān)時,就違背了線性回歸方程的基本假設(shè),如果仍然直接用普通最小二乘法估計未知參數(shù),將會產(chǎn)生嚴重后果,一般情況下,序列自相關(guān)性會帶來下列問題:</p><p> 1、最小二乘估計量仍然是線性
29、的和無偏的。</p><p> 2、最小二乘估計量不是有效的,即OLS估計量的方差不是最小的,估計量不是最優(yōu)線性無偏估計量(BLUE)。</p><p> 3、OLS估計量的方差是有偏的。用來計算方差和OLS估計量標準誤的公式會嚴重的低估真實的方差和標準誤,從而導致t值變大,使得某個系數(shù)表面上顯著不為零,但事實卻相反。</p><p> 4、t檢驗和F檢驗不是
30、可信的。</p><p> 5、計算得到的誤差方差=(殘差平方和/自由度)是真實的有偏估計量,并且很可能低估了真實的。</p><p> 6、計算的也不能真實的反映實際。</p><p> 7、計算的預測方差和標準誤差通常是無效的。</p><p><b> ?。?)多重共線性</b></p><
31、;p> 多元線性回歸有一個基本假設(shè),就是要求設(shè)計矩陣X的秩,即要求中的列向量之間線性無關(guān)。如果存在不全為零的個數(shù),使得</p><p><b> ?。?.1)</b></p><p> 則自變量之間存在完全多重共線性。在實際問題中,完全的多重共線性并不多見,常見的是(5.1)式近似成立的情況,即存在不全為零的個數(shù),使得</p><p>
32、;<b> ?。?.2)</b></p><p> 當自變量存在(5.2)式的關(guān)系時,稱自變量之間存在多重共線性(multi-collinearity),也稱為復共線性。</p><p> 多重共線性到來的影響:</p><p> 完全共線性下參數(shù)估計量不存在 </p><p> 近似共線性下OLS估計量非有效
33、,多重共線性使參數(shù)估計值的方差增大,為方差擴大因子(Variance Inflation Factor, VIF) </p><p> 參數(shù)估計量經(jīng)濟含義不合理 </p><p> 變量的顯著性檢驗失去意義,可能將重要的解釋變量排除在模型之外 </p><p> 模型的預測功能失效。變大的方差容易使區(qū)間預測的“區(qū)間”變大,使預測失去意義。5.3 方程的異
34、方差、自相關(guān)以及多重共線性診斷</p><p> 5.3.1異方差診斷</p><p> 這里使用等級相關(guān)系數(shù)法檢驗,計算殘差絕對值(見附錄2)與自變量的相關(guān)性時采用Spearman等級相關(guān)系數(shù),而不采用Pearson簡單相關(guān)系數(shù),這是由于等級相關(guān)系數(shù)可以反映非線性相關(guān)的情況,而簡單相關(guān)系數(shù)不能如實反映非線性相關(guān)情況。</p><p><b> 表4
35、 異方差檢驗表</b></p><p><b> 相關(guān)性</b></p><p> 由表4可得等級相關(guān)系數(shù)很P值,因為在顯著性水平下,每個值都大于,認為殘差絕對值與自變量不顯著相關(guān),即認為不存在異方差。</p><p> 5.3.2自相關(guān)診斷</p><p> 這里我們采用DW檢驗。可以用SPSS算出
36、的值,結(jié)果如表5。</p><p><b> 表5 自相關(guān)檢驗表</b></p><p><b> 模型匯總b</b></p><p> 由表5我們可以得到DW=2.56,查DW表,n=21,k=8,顯著性水平,得。由,可知不能判定殘差是否有自相關(guān)。下面借助圖示檢驗法來判定自相關(guān)性。</p><p
37、> 繪制的散點圖。用作為散布點繪圖。</p><p><b> 圖1 的殘差散點圖</b></p><p> 從圖1我們不能看出大部分點落在Ⅰ,Ⅲ象限或者是Ⅱ,Ⅳ象限,不能判定隨即擾動項存在自相關(guān)性。</p><p> 繪制按照時間順序回歸殘差項的圖形。</p><p> 圖2 時間序列殘差散點圖<
38、/p><p> 從圖2可以看出隨著t的變化逐次有規(guī)律地變化,呈現(xiàn)鋸齒形,表明存在負相關(guān),隨機擾動項存在負的序列相關(guān)。</p><p> 5.3.3 消除自相關(guān)</p><p> 這里我們用迭代法消除自相關(guān),需要求出和,其中</p><p><b> ?。?.3)</b></p><p> ?。?
39、.3)式中自相關(guān)系數(shù)是未知的,用來估計,計算出后,帶入(5.3)式,計算變換因變量和變換自變量(見附錄3),然后用變換得到自變量和因變量作普通最小二乘回歸,看看自相關(guān)是否消除。</p><p> 表6 迭代后的自相關(guān)檢驗表</p><p><b> 模型匯總b</b></p><p> 由表6我們可以得到DW=2.423,查DW表,n=2
40、0,k=8,顯著性水平,得。由,可知不能判定殘差是否有自相關(guān)。下面仍然借助圖示檢驗法來判定自相關(guān)性。</p><p> 1、繪制的散點圖。用作為散布點繪圖。</p><p><b> 圖3 的殘差散點圖</b></p><p> 從圖3我們不能看出大部分點落在Ⅰ,Ⅲ象限或者是Ⅱ,Ⅳ象限,不能判定隨即擾動項存在自相關(guān)性。</p>
41、<p> 繪制按照時間順序回歸殘差項的圖形。</p><p> 圖4時間序列殘差散點圖</p><p> 從圖4可以看出隨著t的變化并沒有呈現(xiàn)有規(guī)律地變化,不能看出存在自相關(guān)。即認為同歸迭代法變換后消除了自相關(guān)。</p><p> 5.3.4多重共線性診斷</p><p> 這里采用方差擴大因子和條件數(shù)檢驗回歸方程的多
42、重共線性。方差擴大因子法中,當時,就說明自變量與其與自變量之間有嚴重的多重共線性,且這種多重共線性可能會過度地影響最小二乘估計。條件數(shù)法中,當時,沒有多重共線性;時,存在較強的多重共線性;時,存在嚴重的多重共線性。用SPSS可以直接得到上述結(jié)果,見表7和表8。</p><p> 表7 方差擴大因子檢驗表</p><p><b> 系數(shù)a</b></p>
43、<p> 由表7可以看出發(fā)電量(),房屋建筑面積()的方差擴大因子很大,分別為,,遠遠超過10,說鋼材生產(chǎn)回歸方程存在著嚴重的多重共線性。</p><p><b> 表8 條件數(shù)檢驗表</b></p><p><b> 共線性診斷a</b></p><p> 由表8,從條件數(shù)看到,最大的條件數(shù)=329
44、.135,說明自變量間存在嚴重的多重共線性,這與方差擴大因子法的結(jié)果一致。</p><p> 5.3.5消除多重共線性</p><p> 由表7可以看到,變量之間的多重共線性比較嚴重,我們先用逐步回歸的方法剔除一些變量。用普通最小二乘回歸對迭代法得到的數(shù)據(jù)進行分析,輸出結(jié)果如表9。</p><p> 表9 逐步回歸后的多重共線性檢驗表</p>&
45、lt;p><b> 系數(shù)a</b></p><p> 可以看到回歸方程保留了三個自變量,而方差擴大因子均比較大,說明自變量之間仍存在多重共線性。由于最大,剔除粗鋼產(chǎn)量這個變量在用普通最小二乘回歸得到表10。</p><p> 表10 剔除變量后的多重共線性檢驗表</p><p><b> 系數(shù)a</b><
46、;/p><p> 由表10可以看到方差擴大因子,依然存在多重共線性,此時回歸方程只剩下兩個自變量了,再剔除自變量的話就和實際問題不符合了,所以用剔除解釋變量消除多重共線性的方法不可行。鑒于此我們用另外一種變換—嶺回歸,消除多重共線性,重新建立回歸方程。</p><p><b> 5.4嶺回歸法</b></p><p> 5.4.1嶺回歸的定義
47、</p><p> 當自變量間存在多重共線性,||0時,設(shè)想給加上一個正常數(shù)矩陣那么+接近奇異的程度就會比接近奇異的程度小得多。考慮到變量的量綱問題,先要對數(shù)據(jù)標準化,標準化后的設(shè)計矩陣仍用表示,定義稱為的嶺回歸估計,其中,稱為嶺參數(shù)。由于假設(shè)已經(jīng)標準化,所以就是自變量樣本相關(guān)陣??梢詷藴驶部梢晕礃藴驶?,如果也經(jīng)過標準化,那么計算的實際是標準化嶺回歸估計。作為的估計應比最小二乘估計穩(wěn)定,當時的嶺回歸估計就是普
48、通的最小二乘估計。因為嶺參數(shù)不是唯一確定的,所以得到的嶺回歸估計實際是回歸參數(shù)的一個估計族。</p><p><b> 5.4.2嶺跡法</b></p><p> 嶺跡法的直觀考慮是,如果最小二乘估計看來有不合理之外,如估計值以及正負號不符合經(jīng)濟意義,希望能通過采用適當?shù)膸X估計來加以一定程度的改善,嶺參數(shù)值的選擇就是尤為重要。選擇值的一般原則是:</p>
49、;<p> ?。?)各回歸系數(shù)的嶺估計基本穩(wěn)定;</p><p> ?。?)用最小二乘估計時符號不合理的回歸系數(shù),其嶺估計的符號變得合理。</p><p> ?。?)回歸系數(shù)沒有不合乎經(jīng)濟意義的絕對值;</p><p> (4)殘差平方和增大不太多。</p><p> 嶺跡法與傳統(tǒng)的基于殘差方法相比,在概念上來說是完全不同的
50、,嶺跡法對于分析各變量之間的作用和關(guān)系是有幫助的。</p><p> 5.4.3嶺回歸選擇變量的原則:</p><p> 1、在嶺回歸的計算中,假定設(shè)計矩陣X已經(jīng)中心化和標準化了,這樣可以直接比較標準化嶺回歸系數(shù)的大小。可以剔除掉標準化嶺回歸系數(shù)比較穩(wěn)定且絕對值很小的自變量。</p><p> 2、當k值較小時,標準化嶺回歸系數(shù)的絕對值并不是很小,但是不穩(wěn)定,
51、隨著k的增加迅速趨于零,像這樣嶺回歸系數(shù)不穩(wěn)定,震動趨于零的自變量可以予以剔除。</p><p> 3.去掉標準化嶺回歸系數(shù)很不穩(wěn)定的自變量。如果有若干個嶺回歸系數(shù)不穩(wěn)定,究竟去掉幾個,去掉哪幾個,這并無一般原則可循,這需根據(jù)去掉某個變量后重新進行嶺回歸分析的效果來確定。</p><p> 5.4.4 用嶺回歸選擇變量建立回歸方程</p><p> 對迭代法得
52、到的數(shù)據(jù)進行分析,SPSS進行嶺回歸程序如下:</p><p> INCLUDE'E:\SPSS19.0\SPSS\Samples\English\Ridge regression.sps'.</p><p> RIDGEREG DEP=y/ENTER x1 x2 x3 x4 x5 x6 x7.</p><p><b> 得到圖5嶺跡
53、圖。</b></p><p><b> 圖5 嶺跡圖</b></p><p> 可以看到,變量的嶺回歸系數(shù)從負值迅速變成正值,和都迅速減少。從嶺回歸的角度看,與只要保留一個就可以了。其余變量的嶺回歸系數(shù)相對穩(wěn)定。在這里我們決定剔除,用與其余六個自變量作嶺回歸。把領(lǐng)參數(shù)步長改為0.02,范圍減小到0.4。修改后的語句如下:</p><
54、p> INCLUDE'E:\SPSS19.0\SPSS\Samples\English\Ridge regression.sps'.</p><p> RIDGEREG DEP=y/ENTER x2 x3 x4 x5 x6 x7</p><p> /START=0.0/STOP=0.4/INC=0.02.</p><p><b&g
55、t; 得到嶺跡圖6。</b></p><p><b> 嶺跡圖6</b></p><p> 由圖6看,變量和變量的嶺回歸系數(shù)依然不穩(wěn)定,剔除,范圍減小到0.2再分析,語法如下:</p><p> INCLUDE'E:\SPSS19.0\SPSS\Samples\English\Ridge regression.sps
56、'.</p><p> RIDGEREG DEP=y/ENTER x3 x4 x5 x6 x7</p><p> /START=0.0/STOP=0.2/INC=0.02.</p><p><b> 結(jié)果如圖7。</b></p><p><b> 嶺跡圖7</b></p&g
57、t;<p> 從嶺跡圖7看,嶺參數(shù)k在0.040.1之間時,嶺參數(shù)已經(jīng)基本穩(wěn)定,當k=0.08時,仍然很大,因而可以選取嶺參數(shù)k=0.08。重新作嶺回歸,語法如下:</p><p> INCLUDE'E:\SPSS19.0\SPSS\Samples\English\Ridge regression.sps'.</p><p> RIDGEREG DEP=
58、y/ENTER x3 x4 x5 x6 x7</p><p><b> /k=0.08</b></p><p><b> 計算結(jié)果如表11。</b></p><p> 表11 k=0.08的嶺回歸結(jié)果</p><p> Mult R .998045</p>
59、<p> RSquare .996093</p><p> Adj RSqu .994698</p><p> SE 2129.130623</p><p> ANOVA table</p><p> df SS MS F value
60、 Sig F</p><p> Regress 5.000 1.62E+010 3.24E+009 713.8648164 .0000000</p><p> Residual 14.000 63464761 4533197.2</p><p> B SE(B) Beta
61、 B/SE(B)</p><p> X3 .000002198 .000000164 .000018359 .001338742</p><p> X4 .000007388 .000000560 .000023065 .001319257</p><p> X5
62、 .000010632 .000000797 .000023194 .001334201</p><p> X6 .000009249 .000000956 .000018122 .000967485</p><p> X7 .000837960 .000095618 .000016448 .00
63、0876364</p><p> Constant -2.731553041 .216522090 .000000000 -.001261559</p><p> 得到對的標準化嶺回歸方程為</p><p> 未標準化的嶺回歸方程為</p><p> 5.5結(jié)果分析 </p><p>
64、 我們用上述嶺回歸的方法消除了自變量之間的多重共線性,并且得到了嶺回歸方程,各個嶺回歸系數(shù)也都為正值,與實際情況向符合,說明鋼材生產(chǎn)量主要與房屋建筑面積()、總能源消耗()、鐵路運輸量()、對建筑工程投資()和汽車生產(chǎn)總量()五個指標有關(guān)。從最后得到的標準化嶺回歸方程可以用于比較最后進入回歸方程的五個自變量對鋼鐵生產(chǎn)的影響程度大小,嶺回歸系數(shù)越大那么對鋼鐵生產(chǎn)的影響也就越大,可以看出鐵路運輸量對鋼鐵生產(chǎn)的影響比較大。我們還可以從未標準化
65、的嶺回歸方程解釋五個自變量對鋼鐵生產(chǎn)的作用。</p><p><b> 六、模型評價與推廣</b></p><p><b> 6.1 模型評價</b></p><p><b> 6.1.1 優(yōu)點</b></p><p> 本文以多元線性回歸建立模型,分別選用了等級相關(guān)系
66、數(shù)法診斷異方差;圖示檢驗法和DW檢驗法診斷自相關(guān)迭代法消除自相關(guān);方差和擴大因子法診斷多重共線性嶺回歸法消除多重共線性最終建立嶺回歸方程。用多元線性回歸模型得到的回歸方程能很明白的說明問題,容易理解。</p><p><b> 6.1.2 缺點</b></p><p> 為了解決多重共線性問題,選取的七個自變量未能全部進入最后的回歸方程。</p>&
67、lt;p><b> 6.2 模型推廣</b></p><p> 本文建立的多元線性回歸模型很好地決絕了實際問題,并且能夠推廣應用到現(xiàn)實生活中的很多問題,如:</p><p> 分析國家財政收入與選取自變量之間的關(guān)系,并對其作出短期預測;</p><p> 分析股票變動與選取自變量之間的關(guān)系,并對其作出短期預測。</p>
68、<p><b> 七、參考文獻</b></p><p> [1] 薛薇,《SPSS統(tǒng)計分析方法及應用(第二版)》,北京:電子工業(yè)出版社,2009年</p><p> [2] 茆詩松,《概率論與數(shù)理統(tǒng)計》,北京:高等教育出版社,2011年</p><p> [3] 何曉群,《應用回歸分析(第三版)》,北京:中國人民大學出版社
69、,2011年</p><p> [4] 賈俊平,《統(tǒng)計學》,北京:清華大學出版社,2004年</p><p><b> 八、附錄</b></p><p><b> 附錄1</b></p><p><b> 附錄2</b></p><p><
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論