版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、多元統(tǒng)計分析,第六章 因子分析 第二節(jié) 公共因子的導出 及因子旋轉,第三節(jié) 因子得分 因子分析綜合案例,5、因子得分因子得分的概念 前面我們主要解決了用公共因子的線性組合來表示一組觀測變量的有關問題。如果我們要使用這些因子做其他的研究,比如把得到的因子作為自變量來做回歸分析,對樣本進行分類或評價,這就需要我們對公共因子進行測度,即給出公共因子的值。,,例:人均要素變量因子分
2、析。對我國32個省市自治區(qū)的要素狀況作因子分析。指標體系中有如下指標:X1 :人口(萬人) X2 :面積(萬平方公里)X3 :GDP(億元) X4 :人均水資源(立方米/人)X5:人均生物量(噸/人) X6:萬人擁有的大學生數(人)X7:萬人擁有科學家、工程師數(人),Rotated Factor Pattern FACTOR1 FACTOR2 FACTOR3 X1
3、-0.21522 -0.27397 0.89092 X2 0.63973 -0.28739 -0.28755 X3 -0.15791 0.06334 0.94855 X4 0.95898 -0.01501 -0.07556 X5 0.97224 -0.06778 -0.17535 X6 -0.11416 0.98328 -0.08300 X7
4、 -0.11041 0.97851 -0.07246,,X1=-0.21522F1-0.27397F2+0.89092F3 X2=0.63973F1-0.28739F2-0.28755F3 X3=-0.15791F1+0.06334F2+0.94855F3 X4=0.95898F1-0.01501F2-0.07556F3 X5=0.97224F1-0.06778F2-0.17535F3 X6=-0.
5、11416F1+0.98328F2-0.08300F3 X7=-0.11041F1+0.97851F2-0.07246F3,,,,Standardized Scoring Coefficients FACTOR1 FACTOR2 FACTOR3 X1 0.05764 -0.06098 0.50391 X2 0.22724 -0.09901 -0.07713 X3 0.
6、14635 0.12957 0.59715 X4 0.47920 0.11228 0.17062 X5 0.45583 0.07419 0.10129 X6 0.05416 0.48629 0.04099 X7 0.05790 0.48562 0.04822,F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583
7、X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X7,,前三個因子得分,,因子分析的數學模型為: 原變量被表示為公共因子的線性組合,當
8、載荷矩陣旋轉之后,公共因子可以做出解釋,通常的情況下,我們還想反過來把公共因子表示為原變量的線性組合。因子得分函數:,,可見,要求得每個因子的得分,必須求得分函數的系數,而由于p>m,所以不能得到精確的得分,只能通過估計。因子得分的計算方法:(1)運用回歸分析思想求解(2) Bartlett(3)Anderson-rubin,,(1)運用回歸分析思想求解,則,我們有如下的方程組:,j=1,2,…,m,注:共需要解m次才
9、能解出 所有的得分函數的系數。,,(2) Bartlett法(即:加權最小二乘法)把一個個體的p個變量的取值X*當作因變量,把求因子解中得到的A作為自變量數據陣,對于這個個體在公因子上的取值f,當作未知參數,而特殊因子的取值看作誤差e,于是得到如下的線性回歸模型: x*=Af+e,則稱未知參數f為取值為X*的因子得分。,,最小二乘法,案例分析:,國民生活質量的因素分析 國家發(fā)展的最終目標,是為了全面提高全體國民的生活質量,
10、滿足廣大國民日益增長的物質和文化的合理需求。在可持續(xù)發(fā)展消費的統(tǒng)一理念下,增加社會財富,創(chuàng)造更多的物質文明和精神文明,保持人類的健康延續(xù)和生生不息,在人類與自然協(xié)同進化的基礎上,維系人類與自然的平衡,達到完整的代際公平和區(qū)際公平(即時間過程的最大合理性與空間分布的最大合理化)。 從1990年開始,聯(lián)合國開發(fā)計劃署(UYNP)首次采用“人文發(fā)展系數”指標對于國民生活質量進行測度。人文發(fā)展系數利用三類內涵豐富的指標組合,即人的健
11、康狀況(使用出生時的人均預期壽命表達)、人的智力程度(使用組合的教育成就表達)、人的福利水平(使用人均國民收入或人均GDP表達)。,,在這個指標體系中有如下的指標:X1——預期壽命X2——成人識字率X3——綜合入學率X4——人均GDP(美圓)X5——預期壽命指數X6——教育成就指數X7——人均GDP指數,,旋轉后的因子結構 Rotated Factor Pattern
12、 FACTOR1 FACTOR2 FACTOR3 X1 0.38129 0.41765 0.81714 X2 0.12166 0.84828 0.45981 X3 0.64803 0.61822 0.22398
13、 X4 0.90410 0.20531 0.34100 X5 0.38854 0.43295 0.80848 X6 0.28207 0.85325 0.43289 X7 0.90091 0.20612 0.35052 FACTOR1為
14、經濟發(fā)展因子 FACTOR2為教育成就因子 FACTOR3為健康水平因子,,被每個因子解釋的方差和共同度: Variance explained by each factor FACTOR1 FACTOR2 FACTOR3 2.439700 2.276317 2.009490 Final Commu
15、nality Estimates: Total = 6.725507 X1 X2 X3 X4 X5 0.987530 0.945796 0.852306 0.975830 0.992050 X6 X7 0.994995 0.976999,,Standardized Scoring Coefficients標準化得分系數
16、 FACTOR1 FACTOR2 FACTOR3 X1 -0.18875 -0.34397 0.85077 X2 -0.24109 0.60335 -0.10234 X3 0.35462 0.50232 -0.59895 X4 0.53990 -0.17336 -0.10355 X5
17、 -0.17918 -0.31604 0.81490 X6 -0.09230 0.62258 -0.24876,,生育率的影響因素分析 生育率受社會、經濟、文化、計劃生育政策等很多因素影響,但這些因素對生育率的影響并不是完全獨立的,而是交織在一起,如果直接用選定的變量對生育率進行多元回歸分析,最終結果往往只能保留兩三個變量,其他變量的信息就損失了。因此,考慮用因子分
18、析的方法,找出變量間的數據結構,在信息損失最少的情況下用新生成的因子對生育率進行分析。 選擇的變量有:多子率、綜合節(jié)育率、初中以上文化程度比例、城鎮(zhèn)人口比例、人均國民收入。下表是1990年中國30個省、自治區(qū)、直轄市的數據。,特征根與各因子的貢獻,沒有旋轉的因子結構,,,在這個例子中我們得到了兩個因子,第一個因子是社會經濟發(fā)展水平因子,第二個是計劃生育因子。有了因子得分值后,則可以利用因子得分為變量,進行其他的統(tǒng)計分析
19、。,方差最大旋轉后的因子結構,標準化得分函數,6.3 因子分析的上機操作,,,,(01)建立數據文件,,,(02)選擇分析變量 ——選SPSS [Analyze]菜單中的(Data Reduction)→(Factor),出現(xiàn)【 Factor Analysis】對話框;——在【 Factor Analysis】對話框中左邊的原始變量中,選擇將進行因子分析的變量選入(Variables)欄。,,,,(03)設置描述性統(tǒng)計量——在【
20、 Factor Analysis】框中選【 Descriptives】按鈕,出現(xiàn)【 Descriptives 】對話框;——選擇 Initial solution (未轉軸的統(tǒng)計量)選項——選擇KMO 選項——點擊(Contiue)按鈕確定。,,,,SPSS 主要計算結果,,,(04)設置對因子的抽取選項 ——在【 Factor Analysis】框中點擊【Extraction】按鈕,出現(xiàn)【 Factor Analysis:E
21、xtraction】對話框;——在Method 欄中選擇(Principal components)選項;——在Analyze 欄中選擇Correlation matrix選項;——在Display 欄中選擇Unrotated factor solution選項;——在Extract 欄中選擇Eigenvalues over 并填上 1 ;——點擊(Contiue)按鈕確定,回到【 Factor Analysis】對話框中。
22、,,,,,,,,,(05)設置因子轉軸—— 在【 Factor Analysis】對話框中,點擊【Rotation】按鈕,出現(xiàn) 【 Factor Analysis:Rotation 】(因子分析:旋轉)對話框。 —— 在Method 欄中選擇 Varimax(最大變異法) —— 在Display欄中選擇 Rotated solution(轉軸后的解) —— 點擊(Contiue)按鈕確定,回到【 Factor Analysi
23、s】對話框中。,,,,,,(06)設置因素分數—— 在【 Factor Analysis】對話框中,點擊【Scores】按鈕,出現(xiàn) 【 Factor Analysis: Scores 】(因素分析:分數)對話框。 —— 一般取默認值。 —— 點擊(Contiue)按鈕確定,回到【 Factor Analysis】對話框。,,,,,,,(07)設置因子分析的選項——在【 Factor Analysis】對話框中,單擊【Optio
24、ns】按鈕,出現(xiàn) 【 Factor Analysis:Options 】(因素分析:選項)對話框。——在Missing Values 欄中選擇Exclude cases listwise(完全排除缺失值)——在Coefficient Display Format(系數顯示格式)欄中選擇Sorted by size(依據因素負荷量排序)項;——在Coefficient Display Format(系數顯示格式)勾選“Suppres
25、s absolute values less than”,其后空格內的數字不用修改,默認為0.1?!绻芯空咭尸F(xiàn)所有因素負荷量,就不用選取“Suppress absolute values less than”選項。在例題中為了讓研究者明白此項的意義,才勾選了此項,正式的研究中應呈現(xiàn)題項完整的因素負荷量較為適宜?!獑螕簟癈ontinue”按鈕確定。,,,,,,對SPSS因子分析結果的解釋,取樣適當性(KMO)檢驗—— KM
26、O值越大,表示變量間的共同因素越多,越適合進行因素分析,要求KMO>0.5—— 要求Barlett’s的卡方值達到顯著程度,,,2.共同度檢查,,,3.因子陡坡檢查,除去坡線平坦部分的因子圖中第三個因子以后較為平坦,故保留3個因子,,,4.方差貢獻率檢驗 ——取特征值大于 1 的因子,共有3 個,分別(6.358)(1.547)(1.032); ——變異量分別為(63.58%)(15.467%)(10.32%),,,
27、5.顯示未轉軸的因子矩陣,,,6. 分析轉軸后的因子矩陣----根據因子負荷量形成3個公共因子,,,形成綜合分析結果,,例1:對美國洛杉磯12個人口調查區(qū)的5個經濟學變量的數據進行因子分析(12個地區(qū)調查表.sav)菜單:Analyze-Data Reduction-FactorVariables :pop,School,employ,Services, house其他使用默認值(主成分分析法Principal componen
28、ts,選取特征值>1,不旋轉),,輸出結果:,,比較有用的結果:兩個主成分(因子)f1,f2及因子載荷矩陣(Component Matrix),根據該表可以寫出每個原始變量(標準化值)的因子表達式: Pop?0.581f1 + 0.806f2 School ? 0.767f1 - 0.545f2 employ ? 0.672f1 + 0.726f2 Services ? 0.932f1
29、- 0.104f2 house ? 0.791f1 - 0.558f2每個原始變量都可以是5個因子的線性組合,提取兩個因子f1和f2,可以概括原始變量所包含信息的93.4%。 f1和f2前的系數表示該因子對變量的影響程度,也稱為變量在因子上的載荷。但每個因子(主成分)的系數(載荷)沒有很明顯的差別,所以不好命名。因此為了對因子進行命名,可以進行旋轉,使系數向0和1兩極分化。,,由于系數沒有很明顯的差別,所以要進行旋轉(Ro
30、tation:method一般用Varimax方差最大旋轉),使系數向0和1兩極分化菜單:Analyze-Data Reduction-FactorVariables :pop,School,employ,Services, houseExtraction:使用默認值( method:Principal components,選取特征值>1)Rotation:method選VarimaxScore:Save as var
31、iables 和Display factor score Coefficient matrix,輸出結果: (表1-3同前),旋轉后的因子載荷矩陣:,因子旋轉中的正交矩陣:,因子得分系數矩陣:,因子得分協(xié)方差矩陣:,,比較有用的結果:兩個主成分(因子)f1,f2及旋轉后的因子載荷矩陣(Rotated Component Matrix) ,根據該表可以寫出每個原始變量(標準化值)的因子表達式: Pop? 0.01602 f1 +
32、 0.9946f2 School ? 0 .941f1 - 0.00882f2 employ ? 0.137f1 + 0.98f2 Services ? 0.825f1 +0.447f2 house ? 0.968f1 - 0.00605f2F1= 0.01602 Pop+ 0 .941 School+ 0.137 employ+ 0.825 Services+ 0.968 houseF2=
33、 0.9946 Pop-0.00882 School+ 0.98 employ+ 0.447 Services-0.00605 house第一主因子對中等學校平均校齡,專業(yè)服務項目,中等房價有絕對值較大的載荷(代表一般社會福利-福利條件因子); 而第二主因子對總人口和總雇員數有較大的載荷(代表人口-人口因子).,比較有用的結果:因子得分fac1_1, fac2_1。其計算公式:因子得分系數和原始變量的標準化值的乘積之和。fac1_
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- spss因子分析案例
- 因子分析
- 因子分析原理
- 因子分析出現(xiàn)非正定矩陣案例
- 探索性因子分析與驗證性因子分析
- [學習]多元統(tǒng)計分析-因子分析案例
- 多元統(tǒng)計因子分析
- (13)因子分析.pdf
- 代謝綜合征ms的因子分析
- 企業(yè)信貸能力的因子分析模糊綜合評價
- 因子分析的思想解讀
- 基于因子分析的企業(yè)科技創(chuàng)新能力綜合評價
- 基于因子分析的企業(yè)科技創(chuàng)新能力綜合評價
- 數學建模-聚類分析因子分析實例
- 因子分析方法——多變量分析
- 我國森林健康影響因子分析
- [教育]因子分析,共分散構造分析
- 創(chuàng)業(yè)板上市公司綜合績效的因子分析
- 應用多元統(tǒng)計分析因子分析
- 基于因子分析的區(qū)域物流規(guī)劃
評論
0/150
提交評論