版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第六章 典型相關(guān)分析,,第六章 典型相關(guān)分析,第一節(jié) 典型相關(guān)分析的基本原理第二節(jié) 典型變量與典型相關(guān)系數(shù)的求法第三節(jié) 典型相關(guān)系數(shù)的檢驗第四節(jié) 典型相關(guān)分析的計算步驟第五節(jié) 典型相關(guān)分析的SPSS實現(xiàn),第一節(jié) 典型相關(guān)分析的基本原理,一、什么是典型相關(guān)分析在對經(jīng)濟問題的研究和管理研究中,不僅經(jīng)常需要考察兩個變量之間的相關(guān)程度,而且還經(jīng)常需要考察多個變量與多個變量之間即兩組變量之間的相關(guān)性。典型相關(guān)分析就是測度兩組
2、變量之間相關(guān)程度的一種多元統(tǒng)計方法。,通常情況下,為了研究兩組變量 的相關(guān)關(guān)系,可以用最原始的方法,分別計算兩組變量之間的全部相關(guān)系數(shù),一共有pq個簡單相關(guān)系數(shù),這樣又煩瑣又不能抓住問題的本質(zhì)。如果能夠采用類似于主成分的思想,分別找出兩組變量的各自的某個線性組合,討論線性組合之間的相關(guān)關(guān)系,則更簡捷。,二、典型相關(guān)分析的基本思想,三、典型相關(guān)分析的數(shù)學(xué)描述,四、典型相關(guān)分析的應(yīng)用,典型相關(guān)分析的用途很廣。在實際分析問題中,當(dāng)我們面
3、臨兩組多變量數(shù)據(jù),并希望研究兩組變量之間的關(guān)系時,就要用到典型相關(guān)分析。例如,為了研究擴張性財政政策實施以后對宏觀經(jīng)濟發(fā)展的影響,就需要考察有關(guān)財政政策的一系列指標(biāo)如財政支出總額的增長率、財政赤字增長率、國債發(fā)行額的增長率、稅率降低率等與經(jīng)濟發(fā)展的一系列指標(biāo),如國內(nèi)生產(chǎn)總值增長率、就業(yè)增長率、物價上漲率等兩組變量之間的相關(guān)程度。又如,為了研究宏觀經(jīng)濟走勢與股票市場走勢之間的關(guān)系,就需要考察各種宏觀經(jīng)濟指標(biāo)如經(jīng)濟增長率、失業(yè)率、物價指
4、數(shù)、進出口增長率等與各種反映股票市場狀況的指標(biāo)如股票價格指數(shù)、股票市場融資金額等兩組變量之間的相關(guān)關(guān)系。再如,工廠要考察所使用的原料的質(zhì)量對所生產(chǎn)的產(chǎn)品的質(zhì)量的影響,就需要對所生產(chǎn)產(chǎn)品的各種質(zhì)量指標(biāo)與所使用的原料的各種質(zhì)量指標(biāo)之間的相關(guān)關(guān)系進行測度。,第二節(jié) 典型變量與典型相關(guān)系數(shù)的求法,一、總體典型變量和典型相關(guān)系數(shù),二、原始變理與變型變量之間的相關(guān)系數(shù),三、樣本典型相關(guān)變量和樣本典型相關(guān)系數(shù),,第三節(jié) 典型相關(guān)系數(shù)的檢驗,典型相
5、關(guān)分析是否恰當(dāng),應(yīng)該取決于兩組原變量之間是否相關(guān),如果兩組變量之間毫無相關(guān)性而言,則不應(yīng)該作典型相關(guān)分析。用樣本來估計總體的典型相關(guān)系數(shù)是否有誤,需要進行檢驗。,(一)整體檢驗,檢驗的統(tǒng)計量:,所以,兩邊同時求行列式,有,事實上,由于 所以若M的特征根為? ,則(l-M)的特征根為(1-?)。根據(jù)矩陣行列式與特征根的關(guān)系,可得:,在原假設(shè)為真的情況下,檢驗的統(tǒng)計量,近似服從自由度為pq的?2分布。在給定的顯著性水平?下
6、,如果?2??2 (pq),則拒絕原假設(shè),認(rèn)為至少第一對典型變量之間的相關(guān)性顯著。,依此類推,再檢驗下一對典型變量之間的相關(guān)性。直至相關(guān)性不顯著為止。對兩組變量x和y進行典型相關(guān)分析,采用的也是一種降維技術(shù)。我們希望使用盡可能少的典型變量對數(shù),為此需要對一些較小的典型相關(guān)系數(shù)是否為零進行假設(shè)檢驗。H0經(jīng)檢驗被拒絕,則應(yīng)進一步檢驗假設(shè)。,若原假設(shè)H0被接受,則認(rèn)為只有第二對典型變量是有用的;若原假設(shè)H0被拒絕,則認(rèn)為第二對典型變量也是有用
7、的,并進一步檢驗假設(shè)。,(二)部分總體典型相關(guān)系數(shù)為零的檢驗,如此進行下去.直至對某個k,檢驗的統(tǒng)計量,近似服從自由度為(p-k)(q-k)的?2分布。在給定的顯著性水平?下,如果?2??2 [(p-k)(q-k)],則拒絕原假設(shè),認(rèn)為至少第k+1對典型變量之間的相關(guān)性顯著。,第四節(jié) 典型相關(guān)分析的計算步驟,在實際應(yīng)用中,總體的協(xié)方差矩陣常常是未知的,類似于其他的統(tǒng)計分析方法,需要從總體中抽出一個樣本,根據(jù)樣本對總體的協(xié)方差或相關(guān)系數(shù)
8、矩陣進行估計,然后利用估計得到的協(xié)方差或相關(guān)系數(shù)矩陣進行分析。由于估計中抽樣誤差的存在,所以估計以后還需要進行有關(guān)的假設(shè)檢驗。,1、假設(shè)有X組和Y組變量,樣本容量為n。假設(shè)( X1, Y1), ( X2, Y2),…, ( Xn, Yn),觀測值矩陣為:,2、計算特征根和特征向量 求M1和 M2的特征根 ,對應(yīng)的特征向量 。則特征向
9、量構(gòu)成典型變量的系數(shù),特征根為典型變量相關(guān)系數(shù)的平方。,第五節(jié) 郵電業(yè)與國民經(jīng)濟的典型相關(guān)分析,二、數(shù)據(jù)分析 我們將基于1995年到2007年我國國民經(jīng)濟數(shù)據(jù)(數(shù)據(jù)來自于中國統(tǒng)計年鑒),利用Stata軟件來做郵電業(yè)和國民經(jīng)濟之間的典型相關(guān)分析。數(shù)據(jù)具體見表1.,我們將采用如下指標(biāo)來衡量我國各年份的郵電業(yè):,采用下面的指標(biāo)來衡量我國各年份的經(jīng)濟(單位都是萬億),,,,,,,,,. canon (x1-x4) (y1-y4),.
10、canon (x1-x4) (y1-y4), test(1 2 3 4),用似然比法檢驗典型相關(guān)系數(shù)與零的差別是否顯著,檢驗r1時,其零假設(shè)為r1以及小于r1的所有典型相關(guān)系數(shù)都為零;檢驗時r2,其零假設(shè)為r2以及小于r2的所有典型相關(guān)系數(shù)都為零,依此類推。所求的似然比統(tǒng)計量近似服從F,其P值說明第1和第2典型相關(guān)系數(shù)分別具有非常顯著和顯著的意義。,. canon (x1-x4) (y1-y4), stdcoef,從標(biāo)準(zhǔn)化變量出發(fā)的典型
11、系數(shù) ,對分析結(jié)果進行整理。樣本資料是從1995到2007年,即樣本數(shù)是13,第一組變量數(shù)p=4,第二組變量數(shù)q=4。從Stata分析結(jié)果看,4個典型相關(guān)系數(shù)分別為:r1=0.9984,r2=0.9512,r3=0.4436,r4=0.3556. 經(jīng)似然比檢驗的結(jié)果,前兩對典型變量在0.05顯著水平下顯著相關(guān)。前兩對標(biāo)準(zhǔn)化的典型變量的線性組合是:,對結(jié)果進行經(jīng)濟意義解釋。,. estat loading,. findit canr
12、ed,. canred 1Canonical redundancy analysis for canonical correlation1Canonical correlation coefficient 0.9984Squared canonical correlation coefficient 0.9968own oppositeProportion of standardized va
13、riance variate variate of u variables with ... 0.6294 0.6274of v variables with ... 0.9901 0.9869,. canred 2Canonical redundancy analysis for canonical correlation2Canonical correlation coefficient
14、 0.9512Squared canonical correlation coefficient 0.9048own oppositeProportion of standardized variance variate variate of u variables with ... 0.1745 0.1579of v variables with ... 0.0067
15、0.0061,. predict u1, u corr(1) . predict u2, u corr(2). predict v1, v corr(1) . predict v2, v corr(2),第五節(jié) 利用SPSS進行典型相關(guān)分析,例:研究人口出生與受教育程度、生活水平等的相關(guān),如表所示:X1 X2 X3 X4 X5 分別代表多孩率、綜合節(jié)育率、初中及以上受教育程度的人口比例、人均國民收入和城鎮(zhèn)人口比例。,數(shù)據(jù)準(zhǔn)備
16、,SPSS中沒有現(xiàn)成的菜單可以做典型相關(guān)分析,需要使用語法窗口:,,,點擊運行按紐,include 'c:\program files\spss\canonical correlation.sps'.cancorr set1=x1 x2/set2=x3 x4 x5.,兩組變量內(nèi)部的相關(guān)系數(shù):,,輸出結(jié)果:,典型相關(guān)系數(shù)及其顯著性檢驗:,基本可以認(rèn)為第一典型相關(guān)系數(shù)在10%水平上顯著。第二典型相關(guān)系數(shù)不顯著。故只分
17、析第一典型相關(guān)系數(shù)。,典型變量的系數(shù),,典型結(jié)構(gòu)分析:,Canonical loadings 表示一組原始變量與其相應(yīng)的典型變量間的相關(guān)關(guān)系。,Cross loadings 表示一組原始變量與其對立的典型變量間的相關(guān)關(guān)系。,典型冗余分析:表示各典型變量對原始變量組整體的變差解釋程度。,來自出生指標(biāo)的第一典型變量U1可解釋相應(yīng)的出生變量組的58.4%的組內(nèi)方差,第二典型變量U2可以解釋41.6%的組內(nèi)方差。,來自受教育和生活水平
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論