多指標(biāo)面板數(shù)據(jù)的系統(tǒng)聚類分析及其應(yīng)用.pdf_第1頁(yè)
已閱讀1頁(yè),還剩75頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、本論文主要研究了多指標(biāo)面板數(shù)據(jù)系統(tǒng)聚類分析的兩大核心問題:一個(gè)是采用何種統(tǒng)計(jì)量來(lái)測(cè)定橫截面?zhèn)€體之間的相似程度或者說采用何種相似性指標(biāo),即聚類算法的問題;另一個(gè)是采用何種具體的系統(tǒng)聚類方法或者說采用何種準(zhǔn)則確定類與類之間的相似性,即聚類過程的問題。Bonzo和Hermosilla(2002)提出了用“概率連接函數(shù)”來(lái)代替一般的平面距離作為橫截面?zhèn)€體間相似性指標(biāo),提出了新的聚類算法。與主成分分析法和指標(biāo)距離進(jìn)行求和作為橫截面?zhèn)€體間相似性指標(biāo)

2、相比,這種概率連接函數(shù)的方法能夠保留面板數(shù)據(jù)的“概率性結(jié)構(gòu)”。本論文考慮概率連接函數(shù)作為多指標(biāo)面板數(shù)據(jù)系統(tǒng)聚類的算法,并研究了基于概率連接函數(shù)的系統(tǒng)聚類分析。
   本論文首先回顧了Bonzo和Hermosilla(2002)提出的“概率連接函數(shù)”,介紹了概率連接函數(shù)的定義,以及其作為度量多指標(biāo)面板數(shù)據(jù)中橫截面?zhèn)€體間相似性指標(biāo)所具有的優(yōu)良性質(zhì)。但是,Bonzo和Hermosilla(2002)僅考慮了在同一個(gè)類中不同橫截面?zhèn)€體間

3、的協(xié)方差矩陣等于其自身的方差矩陣。但是在實(shí)際情況中,在同一類中不同橫截面?zhèn)€體間的協(xié)方差矩陣不一定就等于其自身的方差矩陣。Zhao和Hang(2010)研究了在整個(gè)面板數(shù)據(jù)中橫截面?zhèn)€體互不相關(guān)情況下,概率連接函數(shù)的定義及其性質(zhì)。因此,本論文同時(shí)也介紹了Zhao和Hang(2010)提出的概率連接函數(shù)。
   本論文從更加合理且更加符合實(shí)際的一般情況出發(fā)。本論文主要在Bonzo和Hermosilla(2002)以及Zhao和Hang

4、(2010)的研究基礎(chǔ)上,進(jìn)一步考慮了更加一般情況下的概率連接函數(shù),即在同一類中橫截面?zhèn)€體間協(xié)方差矩陣不等于它們自身方差矩陣且橫截面?zhèn)€體相關(guān)的情況。本論文主要研究了在該情況下概率連接函數(shù)的定義及其估計(jì),并且進(jìn)一步分析了在該情況下概率連接函數(shù)的性質(zhì)。在本論文中,研究發(fā)現(xiàn)Zhao和Hang(2010)所研究的橫截面?zhèn)€體互不相關(guān)情況只是上述該情況的一個(gè)特例而已。
   Bonzo和Hermosilla(2002)僅研究了多指標(biāo)面板聚類

5、的算法即概率連接函數(shù),并沒有進(jìn)一步研究在該算法基礎(chǔ)上的聚類過程。在研究面板數(shù)據(jù)中橫截面?zhèn)€體的分類時(shí),他們沒有結(jié)合多元統(tǒng)計(jì)中的系統(tǒng)聚類方法,沒有在已有基礎(chǔ)上提出基于概率連接函數(shù)的多指標(biāo)面板數(shù)據(jù)系統(tǒng)聚類方法。Zhao和Hang(2010)在研究橫截面?zhèn)€體互不相關(guān)情況下的概率連接函數(shù)時(shí),提出了在該情況下基于概率連接函數(shù)的多指標(biāo)面數(shù)據(jù)重心系統(tǒng)聚類法(簡(jiǎn)稱為“重心法”)。因此,本論文也考慮了在橫截面?zhèn)€體相關(guān)情況下如何應(yīng)用概率連接函數(shù)進(jìn)行系統(tǒng)聚類的

6、問題。本論文將橫截面?zhèn)€體相關(guān)的概率連接函數(shù)作為聚類算法,進(jìn)一步研究了基于該算法的聚類過程。除了“重心法”外,本論文還提出了在基于概率連接函數(shù)的其他三種系統(tǒng)聚類方法:最短距離法、最長(zhǎng)距離法和類平均法。
   本論文還對(duì)上述基于概率連接函數(shù)的四種系統(tǒng)聚類方法,進(jìn)行了Monte Carlo模擬研究,比較這四種方法的聚類效果。通過大量的模擬實(shí)驗(yàn)發(fā)現(xiàn):重心法和類平均法在聚類時(shí)類的代表性較好,這兩種系統(tǒng)聚類方法在各種情況下聚類效果是穩(wěn)健且有

7、效的,而最短距離法和最長(zhǎng)距離法由于在聚類時(shí)沒有考慮類中橫截面?zhèn)€體數(shù),類的代表性較差,聚類效果不太理想。
   本論文最后對(duì)2000-2009年我國(guó)31個(gè)省市城鎮(zhèn)居民家庭平均每人全年消費(fèi)性支出的面板數(shù)據(jù)進(jìn)行了實(shí)證分析。本論文按照我國(guó)城鎮(zhèn)居民消費(fèi)支出水平的不同,采用重心法對(duì)全國(guó)31個(gè)省市地區(qū)進(jìn)行了系統(tǒng)聚類分析,聚類的結(jié)果較為滿意,基本與實(shí)際情況相符合。本論文同時(shí)還考慮了將全國(guó)31個(gè)省市地區(qū)分為了3個(gè)類,而且對(duì)這3類地區(qū)的各項(xiàng)目進(jìn)行一

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論