數(shù)據(jù)分析課程設(shè)計(jì)---有關(guān)據(jù)居民消費(fèi)水平分析_第1頁(yè)
已閱讀1頁(yè),還剩19頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p><b>  目錄</b></p><p><b>  1.設(shè)計(jì)目的1</b></p><p>  1.1 設(shè)計(jì)問(wèn)題1</p><p>  1,2 問(wèn)題分析1</p><p><b>  2.設(shè)計(jì)原理1</b></p><p>&

2、lt;b>  3 設(shè)計(jì)程序3</b></p><p>  3.1 設(shè)計(jì)步驟3</p><p>  3.1.1聚類中的步驟3</p><p>  3.1.2因子分析步驟4</p><p><b>  4 結(jié)果分析5</b></p><p>  4.1聚類中得到的結(jié)果5

3、</p><p>  4.2在因子分析中得到結(jié)果8</p><p><b>  5.設(shè)計(jì)總結(jié)13</b></p><p><b>  參考文獻(xiàn)14</b></p><p><b>  摘 要</b></p><p>  數(shù)據(jù)分析課程在自然科學(xué)、社會(huì)

4、科學(xué)、工農(nóng)業(yè)生產(chǎn)、金融、經(jīng)濟(jì)等各方面有著廣泛的應(yīng)用。各行各業(yè)的各個(gè)領(lǐng)域無(wú)處不有數(shù)據(jù)的存在,而如何處理大量雜亂無(wú)章的數(shù)據(jù)從而從中得到其內(nèi)在規(guī)律、發(fā)掘有用的信息以指導(dǎo)人們進(jìn)行科學(xué)的推斷與決策,就需要進(jìn)行數(shù)據(jù)分析。</p><p>  現(xiàn)實(shí)居民消費(fèi)支出結(jié)構(gòu)決定了一個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展情況,生產(chǎn)力發(fā)展、居民收入、價(jià)格波動(dòng)、消費(fèi)政策取向、消費(fèi)者的消費(fèi)觀念、消費(fèi)心理等許多因素的對(duì)及各地區(qū)有著很強(qiáng)的制約,在現(xiàn)實(shí)生活中,影響消費(fèi)支出

5、結(jié)構(gòu)的各種因素很難形成絕對(duì)合理、絕對(duì)均衡的配置,不僅任何一種因素的不合理,會(huì)影響居民消費(fèi)支出比例合理配置,而且,反過(guò)來(lái),居民消費(fèi)支出結(jié)構(gòu)的不合理性也會(huì)通過(guò)需求結(jié)構(gòu)的錯(cuò)誤信息傳導(dǎo),影響消費(fèi)政策的選擇及生產(chǎn)力的協(xié)調(diào)發(fā)展。因此,研究居民消費(fèi)支出結(jié)構(gòu),自覺(jué)地按照消費(fèi)結(jié)構(gòu)的變化規(guī)律進(jìn)行適當(dāng)?shù)恼{(diào)整,促進(jìn)國(guó)民經(jīng)濟(jì)的協(xié)調(diào)發(fā)展,就成為國(guó)民經(jīng)濟(jì)研究系統(tǒng)中不可缺少的一部分。本論文對(duì)各省市的消費(fèi)支出運(yùn)用均值聚類,因子分析對(duì)數(shù)據(jù)進(jìn)行處理把各省市進(jìn)行分類。<

6、/p><p>  關(guān)鍵詞:消費(fèi)支出 因子分析 均值聚類</p><p>  中國(guó)城鎮(zhèn)居民消費(fèi)結(jié)構(gòu)的分析</p><p><b>  1 .設(shè)計(jì)目的</b></p><p>  為了更好的了解數(shù)據(jù)分析方法的知識(shí),熟練掌握數(shù)據(jù)分析方法在實(shí)際問(wèn)題上的應(yīng)用,并將所學(xué)的知識(shí)結(jié)spss對(duì)數(shù)據(jù)的處理解決實(shí)際問(wèn)題。本設(shè)計(jì)是利用spss的快

7、速聚類和主成分分析對(duì)問(wèn)題建立數(shù)學(xué)模型,并用spss軟件進(jìn)行解算。</p><p><b>  1.1 設(shè)計(jì)問(wèn)題</b></p><p>  改革開(kāi)放以來(lái),中國(guó)經(jīng)濟(jì)高漲,,對(duì)居民消費(fèi)支出影響最大的當(dāng)屬交通通信,住房、醫(yī)療保健和教育文化的支出。其中被稱為“三高”的教育、醫(yī)療、住房支出占居民總消費(fèi)支出的比重不斷擴(kuò)大,導(dǎo)致居民用于其他方面的消費(fèi)受到一定抑制。同時(shí),隨著人們生活

8、水平的日漸提高以及各項(xiàng)交通通信技術(shù)的進(jìn)步,城鎮(zhèn)居民的消費(fèi)重點(diǎn)已從基本生活消費(fèi)品轉(zhuǎn)向了以住、行為代表的新型消費(fèi)領(lǐng)域,而交通通信費(fèi)用的增長(zhǎng)速度尤為突出!在科技的不斷進(jìn)步下,隨著居民收入水平的提高及電子通訊、家用汽車價(jià)格的下調(diào),移動(dòng)電話及家用汽車己成為我國(guó)近幾年形成的新消費(fèi)熱點(diǎn)之一。從趨勢(shì)上看,這方面的消費(fèi)需求將會(huì)持續(xù)旺盛。近年來(lái),很多學(xué)者在分別對(duì)教育、住房、醫(yī)療對(duì)消費(fèi)的擠出方面做出了深入的研究。本文在中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局的數(shù)據(jù)庫(kù)中找到2

9、010年的以下數(shù)據(jù)。并對(duì)其分析,其中,行表示各方面的支出,列表示各地區(qū)。數(shù)據(jù)見(jiàn)附錄1</p><p>  對(duì)各省市的消費(fèi)情況進(jìn)行分類。</p><p>  對(duì)消費(fèi)支出類型進(jìn)行主成分分析。</p><p><b>  1,2 問(wèn)題分析</b></p><p>  通過(guò)查找,在中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局的數(shù)據(jù)庫(kù)找到數(shù)據(jù),根據(jù)數(shù)

10、據(jù)聚類方法的意義,我們可以通過(guò)軟件對(duì)數(shù)據(jù)進(jìn)行處理,進(jìn)行分類。達(dá)到要求,根據(jù)各省市的消費(fèi)支出水平對(duì)各省市進(jìn)行分類,之后本文通過(guò)對(duì)數(shù)據(jù)進(jìn)行因子分析,可以清楚地知道哪些因子起主要作用。</p><p><b>  2.設(shè)計(jì)原理</b></p><p><b>  聚類分析:</b></p><p>  K-均值聚類算法的工作原理

11、: K-means算法的工作原理:算法首先隨機(jī)從數(shù)據(jù)集中選取 K個(gè)點(diǎn)作為初始聚類中心,然后計(jì)算各個(gè)樣本到聚類中的距離,把樣本歸到離它最近的那個(gè)聚類中心所在的類。計(jì)算新形成的每一個(gè)聚類的數(shù)據(jù)對(duì)象的平均值來(lái)得到新的聚類中心,如果相鄰兩次的聚類中心沒(méi)有任何變化,說(shuō)明樣本調(diào)整結(jié)束,聚類準(zhǔn)則函數(shù) 已經(jīng)收斂。本算法的一個(gè)特點(diǎn)是在每次迭代中都要考察每個(gè)樣本的分類是否正確。若不正確,就要調(diào)整,在全部樣本調(diào)整完后,再修改聚類中心,進(jìn)入下一次迭代。如果在一

12、次迭代算法中,所有的樣本被正確分類,則不會(huì)有調(diào)整,聚類中心也不會(huì)有任何變化,這標(biāo)志著 已經(jīng)收斂,因此算法結(jié)束。 2.K-means聚類算法的一般步驟: </p><p>  (1) 從 n個(gè)數(shù)據(jù)對(duì)象任意選擇 k 個(gè)對(duì)象作為初始聚類中心; </p><p> ?。?) 根據(jù)每個(gè)聚類對(duì)象的均值(中心對(duì)象),計(jì)算每個(gè)對(duì)象與這些中心對(duì)象的距離;并根據(jù)最小距離重新對(duì)相應(yīng)對(duì)象進(jìn)行劃分;</p&g

13、t;<p> ?。?) 重新計(jì)算每個(gè)(有變化)聚類的均值(中心對(duì)象); </p><p> ?。?) 循環(huán)(2)到(3)直到每個(gè)聚類不再發(fā)生變化為止</p><p><b>  因子分析:</b></p><p>  因子分析法是從研究變量?jī)?nèi)部相關(guān)的依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多變量統(tǒng)計(jì)分

14、析方法。它的基本思想是將觀測(cè)變量進(jìn)行分類,將相關(guān)性較高,即聯(lián)系比較緊密的分在同一類中,而不同類變量之間的相關(guān)性則較低,那么每一類變量實(shí)際上就代表了一個(gè)基本結(jié)構(gòu),即公共因子。對(duì)于所研究的問(wèn)題就是試圖用最少個(gè)數(shù)的不可測(cè)的所謂公共因子的線性函數(shù)與特殊因子之和來(lái)描述原來(lái)觀測(cè)的每一分量。   因子分析模型描述如下:  </p><p> ?、臱 = (x1,x2,…,xp)是可觀測(cè)隨機(jī)向量,均值向量E(X)=0,協(xié)方差陣C

15、ov(X)=∑,且協(xié)方差陣∑與相關(guān)矩陣R相等(只要將變量標(biāo)準(zhǔn)化即可實(shí)現(xiàn))。   </p><p> ?、艶 = (F1,F(xiàn)2,…,F(xiàn)m)(m<p)是不可測(cè)的向量,其均值向量E(F)=0,協(xié)方差矩陣Cov(F) =I,即向量的各分量是相互獨(dú)立的。   </p><p> ?、莈 = (e1,e2,…,ep)與F相互獨(dú)立,且E(e)=0, e的協(xié)方差陣∑是對(duì)角陣,即各分量e之間是相互獨(dú)立

16、的,則模型:   </p><p>  x1 = a11F1+ a12F2 +…+a1mFm + e1</p><p>  x2 = a21F1+a22F2 +…+a2mFm + e2</p><p><b>  ………</b></p><p>  xp = ap1F1+ ap2F2 +…+apmFm + ep</

17、p><p>  稱為因子分析模型,由于該模型是針對(duì)變量進(jìn)行的,各因子又是正交的,所以也稱為R型正交因子模型。   其矩陣形式為:x =AF + e .   其中:   x=,A=,F(xiàn)=,e=   這里,   </p><p> ?、舖 £ p;   </p><p> ?、艭ov(F,e)=0,即F和e是不相關(guān)的;   </p><p>  ⑶D

18、(F) = Im ,即F1,F(xiàn)2,…,F(xiàn)m不相關(guān)且方差均為1;   D(e)=,即e1,e2,…,ep不相關(guān),且方差不同。   我們把F稱為X的公共因子或潛因子,矩陣A稱為因子載荷矩陣,e 稱為X的特殊因子。   A = (aij),aij為因子載荷。數(shù)學(xué)上可以證明,因子載荷aij就是第i變量與第j因子的相關(guān)系數(shù),反映了第i變量在第j因子上的重要性。</p><p><b>  3 設(shè)計(jì)程序</b

19、></p><p><b>  3.1 設(shè)計(jì)步驟</b></p><p>  3.1.1聚類中的步驟</p><p> ?。?)打開(kāi)spss軟件,打開(kāi)數(shù)據(jù),選擇“分析”,“分類”,“K均值聚類”命令。</p><p> ?。?)選擇進(jìn)行聚類分析的變量。選擇“地區(qū)”進(jìn)入“個(gè)案標(biāo)記依據(jù)”的列表框,選擇其他變量進(jìn)入“變量

20、”列表框;在編輯框“聚類數(shù)”中,輸入聚類分析的類別數(shù),本題中選3,如圖1</p><p><b>  圖1</b></p><p> ?。?)設(shè)置輸出及缺失值處理方法。按“選項(xiàng)”按鈕,彈出對(duì)話框,在“統(tǒng)計(jì)量”選項(xiàng)組中,選擇全部三個(gè)選擇項(xiàng);選擇其他默認(rèn)值。設(shè)置完畢。如圖2</p><p><b>  圖2</b></p

21、><p> ?。?)其他設(shè)置采用系統(tǒng)默認(rèn)設(shè)置即可。</p><p> ?。?)設(shè)置完畢,單擊“確定”按鈕,等待輸出結(jié)果。如圖3</p><p><b>  圖3</b></p><p>  3.1.2因子分析步驟</p><p>  (1) 打開(kāi)spss軟件,打開(kāi)數(shù)據(jù),選擇“分析”,“降維”,“因子分

22、析”。</p><p>  (2) 將變量列表中選擇變量進(jìn)入變量框中。</p><p>  (3) 在“描述”中,在統(tǒng)計(jì)量只選擇“原始分析結(jié)果”。在相關(guān)矩陣中選“系數(shù)”,“顯著性水平”“KMO和BARTLETT的球形度檢驗(yàn)”,按繼續(xù)。如圖4</p><p><b>  圖4</b></p><p> ?。?)在“抽取”中

23、,分析中選擇“相關(guān)性矩陣”,在輸出中選“未旋轉(zhuǎn)的因子解”,在因子的固定數(shù)量種子中 填寫3,按繼續(xù)。.如圖5</p><p><b>  圖5</b></p><p> ?。?)在方法中選擇“最大方差法”,輸出中都選,按繼續(xù)。</p><p> ?。?)按確定輸出結(jié)果。</p><p><b>  4 結(jié)果分析

24、</b></p><p>  4.1聚類中得到的結(jié)果</p><p> ?。?)根據(jù)我們通過(guò)spss軟件中均值聚類方法得到的結(jié)果,根據(jù)表1,我們根據(jù)消費(fèi)支出來(lái)把所有的省市分為了三類,天津,遼寧,江蘇,福建,重慶為第一類。北京,上海,浙江,廣東為第二類,其余地區(qū)為第三類。</p><p><b>  表1</b></p>

25、<p> ?。?)根據(jù)表2,我們可以看到,,第一類在各方面消費(fèi)都比較適中,第二類在各方面都比較高,第三類在各方面消費(fèi)偏低。說(shuō)明了各省市在消費(fèi)支出方面還是存在差異。</p><p><b>  表2</b></p><p> ?。?)結(jié)論:綜合以上的表和下面幾個(gè)表我們可以看出,在第一類中的省市為發(fā)展水平比較高的省市,在第二類中的各省市為首都直轄市等地區(qū)發(fā)展速

26、度很快,第三類省市大部分為發(fā)展中的省市.說(shuō)明聚類的結(jié)果還是比較符合現(xiàn)實(shí)的情況的。</p><p><b>  表3</b></p><p><b>  表4</b></p><p><b>  表5</b></p><p>  4.2在因子分析中得到結(jié)果</p>

27、<p> ?。?)附錄2是原有變量的相關(guān)系數(shù)矩陣及其檢驗(yàn)??梢钥吹?,大部分大的相關(guān)系數(shù)都比較高,各變量呈較強(qiáng)的線性關(guān)系,能夠從中提取公共因子,適合進(jìn)行分析。</p><p> ?。?)根據(jù)表6可知,巴特利特球度檢驗(yàn)統(tǒng)計(jì)量為241.900,相應(yīng)的概率Sig為0.000,因此可認(rèn)為相關(guān)系數(shù)矩陣與單位陣有顯著差異,同時(shí),KM,O值為0.827,根據(jù)Kaiser給出的KMO度量標(biāo)準(zhǔn)可知原有變量適合進(jìn)行分析。&l

28、t;/p><p><b>  表6</b></p><p> ?。?)根據(jù)圖6可知,橫坐標(biāo)為因子數(shù)目,縱坐標(biāo)為特征值,可見(jiàn),第一個(gè)因子的特征值很高,對(duì)解釋原有變量的貢獻(xiàn)很大,第四個(gè)以后的因子特征值都比較小,對(duì)解釋原有變量的貢獻(xiàn)很小,已經(jīng)成為可被忽略的“高山腳下的碎石”,因此提取三個(gè)因子是合適的。</p><p><b>  圖6</

29、b></p><p>  ( 4 ) 根據(jù)表9中,第一列是因子編號(hào),以后三列一組,每組的含義依次是特征根值,方差貢獻(xiàn)率和累積方差貢獻(xiàn)率,第一組數(shù)據(jù)項(xiàng)(第二列到第四列)描述了因子初始解的情況??梢钥吹剑?個(gè)因子的特征值為5.640,解釋原有的8個(gè)變量總,累積方差貢獻(xiàn)率為70.494%,第二組數(shù)據(jù)項(xiàng)(第五至第七列)描述了因子解的情況,可以看到,由于指定提取三個(gè)因子,三個(gè)因子共解釋了原有變量總方差的90.176

30、%,總體上,三個(gè)因子反映了原有變量的大部分信息,因子分析效果較明顯。</p><p><b>  表7</b></p><p> ?。?)根據(jù)表8可知,,是因子分析的和核心內(nèi)容。根據(jù)該表可寫出本題的因子分析模型:</p><p>  食品=0.842F1-0.454F2-0.069F3</p><p>  衣著=0.63

31、0F1+0.676F2-0.298F3</p><p><b>  ……..</b></p><p>  醫(yī)療保健=0.672F1+0.626F2+0.295F3</p><p>  可以看出8個(gè)變量在第1個(gè)因子上的負(fù)荷都很高,意味著它們與第1個(gè)因子的相關(guān)度高,其余2個(gè)因子與8個(gè)變量的相關(guān)性相對(duì)較小。另外還可以看到,這三個(gè)因子的實(shí)際含義比較模糊

32、。</p><p><b>  表8</b></p><p> ?。?)根據(jù)表9可知,用主成分分析進(jìn)行方差極大法旋轉(zhuǎn)后,家庭設(shè)備、其他商品、教育文化、交通和通信、食品在第1個(gè)因子上有較高的負(fù)荷,第一個(gè)因子主要解釋以上幾個(gè)變量,衣著在第2個(gè)因子上有較高的負(fù)荷,第2個(gè)因子主要解釋以上一個(gè)變量,第3個(gè)主要解釋居住、醫(yī)療保健這個(gè)原有變量。</p><p&g

33、t;<b>  表9 </b></p><p> ?。?)根據(jù)表10可知,表是根據(jù)回歸算法計(jì)算出來(lái)的因子得分函數(shù)的系數(shù),根據(jù)表可以得到下面的因子得分函數(shù):</p><p>  F1=0.364食品-0.077衣著-0.052居住+0.237家庭設(shè)備+0.213其他商品+0.222教育文化+0.239交通和通信-0.327醫(yī)療保健</p><p>

34、;  F2=-0.193食品+0.801衣著-0.359居住+0.155家庭設(shè)備+0.225其他商品+0.071教育文化-0.181交通和通信+0.220醫(yī)療保健</p><p>  F3=-0.186食品-0.461衣著+0.954居住-0.289家庭設(shè)備-0.302其他商品-0.122教育文化+0.109交通和通信+0.804醫(yī)療保健</p><p><b>  表10<

35、;/b></p><p>  將根據(jù)這三個(gè)因子得分函數(shù)自用計(jì)算到樣本中三個(gè)因子得分,并將因子得分作為新變量,保存到數(shù)據(jù)編輯窗口中,如如圖7所示;</p><p><b>  圖7</b></p><p> ?。?)根據(jù)表11可知,該表顯示了3個(gè)因子的協(xié)方差矩陣。可知,3個(gè)因子沒(méi)有線性相關(guān)性,實(shí)現(xiàn)了因子分析的設(shè)計(jì)目標(biāo)。</p>

36、<p><b>  表11</b></p><p> ?。?)根據(jù)上述分析的結(jié)果,對(duì)中國(guó)各省市居民消費(fèi)水平進(jìn)行評(píng)估,首先,根據(jù)三個(gè)因子方差貢獻(xiàn)率確定權(quán)重,由于三個(gè)因子在較大程度上反映了原有變量的大部分信息,其累計(jì)貢獻(xiàn)率達(dá)90.176%,因此可用三個(gè)因子的方差貢獻(xiàn)率作為評(píng)估的權(quán)重,于是三個(gè)因子按各自的方差貢獻(xiàn)率加權(quán)相加為評(píng)估得分,其計(jì)算公式為,由綜合評(píng)估</p>&l

37、t;p>  得分值達(dá)大小確定各省市的消費(fèi)水平。其次,根據(jù)F值的大小進(jìn)行分類,F(xiàn)值圖如下,可見(jiàn)分類的結(jié)果與我們聚類分析的結(jié)果是一樣的,說(shuō)明結(jié)果還是很可靠的。</p><p><b>  5.設(shè)計(jì)總結(jié)</b></p><p>  通過(guò)對(duì)數(shù)據(jù)分析這道實(shí)際問(wèn)題的解決,不僅使我更加深刻的理解了數(shù)據(jù)分析的基礎(chǔ)知識(shí),對(duì)均值聚類和因子分析有了更深刻的了解,而且使我對(duì)這些知識(shí)在實(shí)

38、際中的應(yīng)用產(chǎn)生了濃厚的興趣,同時(shí)對(duì)我學(xué)習(xí)好數(shù)據(jù)分析這門課有很大幫助。在實(shí)現(xiàn)這道題的過(guò)程中我應(yīng)用了SPSS數(shù)據(jù)分析軟件,學(xué)會(huì)了這個(gè)軟件的一些新的應(yīng)用,更加熟練的操作該軟件進(jìn)行一些數(shù)據(jù)上的處理。在以后的學(xué)習(xí)中,例如。數(shù)學(xué)建模比賽中會(huì)有很大的幫助</p><p><b>  參考文獻(xiàn)</b></p><p>  [1] 譚榮波.梅曉仁,SPSS統(tǒng)計(jì)分析實(shí)用教程..科學(xué)出版社

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論