主成分分析法總結(jié)_第1頁
已閱讀1頁,還剩20頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、主成分分析法總結(jié)主成分分析法總結(jié)在實際問題研究中,多變量問題是經(jīng)常會遇到的。變量太多,無疑會增加分析問題的難度與復(fù)雜性,而且在許多實際問題中,多個變量之間是具有一定的相關(guān)關(guān)系的。因此,人們會很自然地想到,能否在相關(guān)分析的基礎(chǔ)上,用較少的新變量代替原來較多的舊變量,而且使這些較少的新變量盡可能多地保留原來變量所反映的信息?一、概述在處理信息時,當(dāng)兩個變量之間有一定相關(guān)關(guān)系時,可以解釋為這兩個變量反映此課題的信息有一定的重疊,例如,高??蒲?/p>

2、狀況評價中的立項課題數(shù)例如,高校科研狀況評價中的立項課題數(shù)與項目經(jīng)費、經(jīng)費支出等之間會存在較高的相關(guān)性;學(xué)生綜合評價研究中的專與項目經(jīng)費、經(jīng)費支出等之間會存在較高的相關(guān)性;學(xué)生綜合評價研究中的專業(yè)基礎(chǔ)課成績與專業(yè)課成績、獲獎學(xué)金次數(shù)等之間也會存在較高的相關(guān)性。而業(yè)基礎(chǔ)課成績與專業(yè)課成績、獲獎學(xué)金次數(shù)等之間也會存在較高的相關(guān)性。而變量之間信息的高度重疊和高度相關(guān)會給統(tǒng)計方法的應(yīng)用帶來許多障礙。變量之間信息的高度重疊和高度相關(guān)會給統(tǒng)計方法的

3、應(yīng)用帶來許多障礙。為了解決這些問題,最簡單和最直接的解決方案是削減變量的個數(shù),但這為了解決這些問題,最簡單和最直接的解決方案是削減變量的個數(shù),但這必然又會導(dǎo)致信息丟失和信息不完整等問題的產(chǎn)生。為此,人們希望探索一種必然又會導(dǎo)致信息丟失和信息不完整等問題的產(chǎn)生。為此,人們希望探索一種更為有效的解決方法,它既能大大減少參與數(shù)據(jù)建模的變量個數(shù),同時也不會更為有效的解決方法,它既能大大減少參與數(shù)據(jù)建模的變量個數(shù),同時也不會造成信息的大量丟失。主

4、成分分析正式這樣一種能夠有效降低變量維數(shù),并已造成信息的大量丟失。主成分分析正式這樣一種能夠有效降低變量維數(shù),并已得到廣泛應(yīng)用的分析方法。得到廣泛應(yīng)用的分析方法。主成分分析以最少的信息丟失為前提,將眾多的原有變量綜合成較少幾個綜合指標,通常綜合指標(主成分)有以下幾個特點:?主成分個數(shù)遠遠少于原有變量的個數(shù)主成分個數(shù)遠遠少于原有變量的個數(shù)原有變量綜合成少數(shù)幾個因子之后,因子將可以替代原有變量參與數(shù)據(jù)建模,這將大大減少分析過程中的計算工作

5、量。?主成分能夠反映原有變量的絕大部分信息主成分能夠反映原有變量的絕大部分信息因子并不是原有變量的簡單取舍,而是原有變量重組后的結(jié)果,因此不會造成原有變量信息的大量丟失,并能夠代表原有變量的絕大部分信息。?主成分之間應(yīng)該互不相關(guān)主成分之間應(yīng)該互不相關(guān)通過主成分分析得出的新的綜合指標(主成分)之間互不相關(guān),因子參與數(shù)據(jù)建模能夠有效地解決變量信息重疊、多重共線性等給分析應(yīng)用帶來的諸多問題。?主成分具有命名解釋性主成分具有命名解釋性總之,主成

6、分分析法是研究如何以最少的信息丟失將眾多原有變量濃縮成總之,主成分分析法是研究如何以最少的信息丟失將眾多原有變量濃縮成少數(shù)幾個因子,如何使因子具有一定的命名解釋性的多元統(tǒng)計分析方法少數(shù)幾個因子,如何使因子具有一定的命名解釋性的多元統(tǒng)計分析方法。主成分分析的具體步驟如下:(1)計算協(xié)方差矩陣計算樣品數(shù)據(jù)的協(xié)方差矩陣:Σ=(sij)p?p,其中i,j=1,2,…,p11()()1nijkiikjjksxxxxn??????(2)求出Σ的特征

7、值及相應(yīng)的正交化單位特征向量i?iaΣ的前m個較大的特征值?1??2?…?m0就是前m個主成分對應(yīng)的方差,對應(yīng)的i?單位特征向量就是主成分Fi的關(guān)于原變量的系數(shù),則原變量的第i個主成分Fi為:ia☆選擇主成分☆計算主成分得分總結(jié):原指標相關(guān)系數(shù)矩陣相應(yīng)的特征值?i為主成分方差的貢獻,方差的貢獻率為,越大,說明相應(yīng)的主成分反映綜合信息的能力越強,可根據(jù)?i的大小1piiii??????i?來提取主成分。每一個主成分的組合系數(shù)(原變量在該主

8、成分上的載荷)就是相應(yīng)特征ia值?i所對應(yīng)的單位特征向量。主成分分析法的計算步驟主成分分析法的計算步驟1、原始指標數(shù)據(jù)的標準化采集p維隨機向量x=(x1X2...Xp)T)n個樣品xi=(xi1xi2...xip)T,i=12…n,n>p,構(gòu)造樣本陣,對樣本陣元進行如下標準化變換:其中,得標準化陣Z。2、對標準化陣Z求相關(guān)系數(shù)矩陣其中。3、解樣本相關(guān)矩陣R的特征方程得p個特征根確定主成分按確定m值,使信息的利用率達85%以上,對每個λj

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論