2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩51頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章 描述性統(tǒng)計(jì)分 析實(shí)例,當(dāng)研究者得到的數(shù)據(jù)量很小的時(shí)候,其可以通過(guò)直接觀察原始數(shù)據(jù)來(lái)獲得所有的信息。但是當(dāng)?shù)玫降臄?shù)據(jù)量很大的時(shí)候,就必須借助各種描述指標(biāo)來(lái)完成對(duì)數(shù)據(jù)的描述工作。,EX. Chart Junk vs. Plain Graphs,用少量的描述指標(biāo)來(lái)概括大量的原始數(shù)據(jù),對(duì)數(shù)據(jù)展開(kāi)描述的統(tǒng)計(jì)分析方法被稱(chēng)為描述性統(tǒng)計(jì)分析。描述性統(tǒng)計(jì)分析常用的有:頻數(shù)分析、描述性分析、探索分析、列聯(lián)表分析。下面

2、我們一一介紹這幾種方法的功能和意義。,2.1.1 頻數(shù)分析的功能與意義,頻數(shù)分析過(guò)程(Frequencies)是描述性分析中最基本也是最常用的方法之一??梢缘玫皆敿?xì)的頻數(shù)表以及平均值、最大值、最小值、方差、標(biāo)準(zhǔn)差、極差、平均數(shù)標(biāo)準(zhǔn)誤、偏度系數(shù)和峰度系數(shù)等重要的描述統(tǒng)計(jì)量,還可以通過(guò)分析得到合適的統(tǒng)計(jì)圖。不僅可以方便的對(duì)數(shù)據(jù)按組進(jìn)行歸類(lèi)整理,還可以對(duì)數(shù)據(jù)的分布特征形成初步的認(rèn)識(shí)。,2.1.2 頻數(shù)分析實(shí)例,【例2.1】下面的資料給出了

3、山東省某學(xué)校50名高二學(xué)生的身高。試分析該50名學(xué)生的身高分布特征,繪制頻數(shù)表、直方圖,計(jì)算平均值、最大值、最小值、標(biāo)準(zhǔn)差、變異系數(shù)等統(tǒng)計(jì)量。配書(shū)資料\源文件\2\正文\原始數(shù)據(jù)文件\案例2.1.sav,EX. 中位數(shù) (median),排序后處于中間位置上的值,不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類(lèi)數(shù)據(jù)各變量值與中位數(shù)的離差絕對(duì)值之和最小,即,EX.中位數(shù)(位置和數(shù)值的確定),位置確定,數(shù)值確定,

4、EX. 四分位數(shù)(quartile),排序后處于25%和75%位置上的值,不受極端值的影響計(jì)算公式,EX. 數(shù)值型數(shù)據(jù)的四分位數(shù) (9個(gè)數(shù)據(jù)的算例),【例】:9個(gè)家庭的人均月收入數(shù)據(jù)(4種方法計(jì)算)原始數(shù)據(jù): 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630

5、2000位 置: 1 2 3 4 5 6 7 8 9,?,?,EX. 偏態(tài)(skewness),統(tǒng)計(jì)學(xué)家Pearson于1895年首次提出 數(shù)據(jù)分布偏斜程度的測(cè)度(相對(duì)于對(duì)稱(chēng)分布)2.偏態(tài)系數(shù)=0為對(duì)稱(chēng)分布3.偏態(tài)系數(shù)> 0為右偏分布偏態(tài)系數(shù)< 0為左偏分布偏態(tài)系數(shù)大于1或小于-1,被稱(chēng)為高度偏態(tài)分布;偏態(tài)系數(shù)在0.5~

6、1或-1~-0.5之間,被認(rèn)為是中等偏態(tài)分布;偏態(tài)系數(shù)越接近0,偏斜程度就越低,EX. 峰態(tài)(kurtosis),統(tǒng)計(jì)學(xué)家Pearson于1905年首次提出數(shù)據(jù)分布扁平程度的測(cè)度(相對(duì)于正態(tài)分布)峰態(tài)系數(shù)=0扁平峰度適中峰態(tài)系數(shù)0為尖峰分布,,偏態(tài)與峰態(tài)圖,偏態(tài),峰態(tài),,頻數(shù)分析-I,,頻數(shù)分析-II,,,,頻數(shù)分析-III,,頻數(shù)分析-IV,,,頻數(shù)分析-V,,2.2.1 描述性分析的功能與意義,SPSS的描述性分析過(guò)程(De

7、scriptive)本質(zhì)就是計(jì)算并輸出各類(lèi)相關(guān)的描述性統(tǒng)計(jì)指標(biāo)。得到由原始數(shù)據(jù)轉(zhuǎn)化成的標(biāo)準(zhǔn)化的取值,并且可以將標(biāo)準(zhǔn)化值以變量的形式存入數(shù)據(jù)庫(kù)以便進(jìn)一步分析。相關(guān)描述統(tǒng)計(jì)量主要有平均值、最大值、最小值、方差、標(biāo)準(zhǔn)差、極差、平均數(shù)標(biāo)準(zhǔn)誤、偏度系數(shù)和峰度系數(shù)等。,2.2.2 描述性分析實(shí)例,【例2.2】下面的資料給出了山東省某高校50名大一入學(xué)新生的體重。試對(duì)該50名學(xué)生的體重進(jìn)行描述性分析,了解這50名學(xué)生體重的基本特征。配書(shū)資料\源

8、文件\2\正文\原始數(shù)據(jù)文件\案例2.2.sav,描述性分析-I,,描述性分析-II,,描述性分析-III,,,描述性分析-IV,,2.3.1探索分析的功能與意義,探索分析過(guò)程(Explore)是在對(duì)資料的性質(zhì)、分布特點(diǎn)等完全不清楚的時(shí)候,對(duì)變量進(jìn)行更加深入研究的一種描述性統(tǒng)計(jì)方法。除了具備一般描述性統(tǒng)計(jì)指標(biāo),還增加了有關(guān)數(shù)據(jù)文字與圖形描述,從而有助于對(duì)數(shù)據(jù)進(jìn)行更深入的研究分析。還可以根據(jù)一定的方式分組進(jìn)行統(tǒng)計(jì)。,EX. 未分組數(shù)據(jù)

9、—莖葉圖(stem-and-leaf display),用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹(shù)莖,低位數(shù)字作樹(shù)葉樹(shù)葉上只保留最后一位數(shù)字6. 莖葉圖類(lèi)似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒(méi)有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息直方圖適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù),E

10、X. 未分組數(shù)據(jù)—莖葉圖,VAR00004 Stem-and-Leaf Plot Frequency Stem & Leaf 6.00 0 . 223334 2.00 0 . 58 3.00 1 . 113 8.00 1 . 56677888 4.00 2 . 0223 4.0

11、0 2 . 7899 4.00 3 . 0113 7.00 3 . 5568999 9.00 4 . 112223344 6.00 4 . 556889 3.00 5 . 334 6.00 5 . 666899 5.00 6 . 12233

12、 6.00 6 . 566799 4.00 7 . 1223 8.00 7 . 56677899 3.00 8 . 002 6.00 8 . 566788 3.00 9 . 223 3.00 9 . 579 Stem width: 10.00 E

13、ach leaf: 1 case(s),EX. 未分組數(shù)據(jù)—箱線(xiàn)圖(box plot),用于顯示未分組的原始數(shù)據(jù)的分布由一組數(shù)據(jù)的5個(gè)特征值繪制而成,它由一個(gè)箱子和兩條線(xiàn)段組成繪制方法首先找出一組數(shù)據(jù)的5個(gè)特征值,即最大值、最小值、中位數(shù)Me和兩個(gè)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個(gè)四分位數(shù)畫(huà)出箱子,再將兩個(gè)極值點(diǎn)與箱子相連接該箱線(xiàn)圖也稱(chēng)為Median/Quart./Range箱線(xiàn)圖,,EX. 分布

14、的形狀與箱線(xiàn)圖,,不同分布的箱線(xiàn)圖,2.3.2 探索分析實(shí)例,【例2.3】下面的資料給出了天津、濟(jì)南兩個(gè)城市07年各月份的平均氣溫。試據(jù)此對(duì)天津平均氣溫和濟(jì)南平均氣溫進(jìn)行探索性統(tǒng)計(jì)分析,研究天津平均氣溫和濟(jì)南平均氣溫的基本特征。 配書(shū)資料\源文件\2\正文\原始數(shù)據(jù)文件\案例2.3.sav,探索分析-I,探索分析-II,探索分析-III,探索分析-IV,,,探索分析-V,,,探索分析-VI,,,2.4.1列聯(lián)表分析的功能與意義,SPS

15、S的列聯(lián)表分析過(guò)程(Crosstabs)是通過(guò)分析多個(gè)變量在不同取值情況下的數(shù)據(jù)分布情況,從而進(jìn)一步分析多個(gè)變量之間相互關(guān)系的一種描述性分析方法。至少指定兩個(gè)變量,分別為行變量和列變量,如果要進(jìn)行分層分析,則我們還要規(guī)定層變量。不僅可以得到交叉分組下的頻數(shù)分布,還可以通過(guò)分析得到變量之間的相關(guān)關(guān)系。,2.4.2 列聯(lián)表分析實(shí)例,【例2.4】下面的資料給出了山東省的兩所高中學(xué)校的高三畢業(yè)生的升學(xué)情況。試據(jù)此對(duì)兩所學(xué)校學(xué)生的升學(xué)情況進(jìn)行

16、列聯(lián)表分析,研究?jī)伤鶎W(xué)校學(xué)生的升學(xué)率之間有無(wú)明顯的差別。配書(shū)資料\源文件\2\正文\原始數(shù)據(jù)文件\案例2.4.sav,列聯(lián)表分析-數(shù)據(jù)預(yù)處理-I,列聯(lián)表分析-數(shù)據(jù)預(yù)處理-II,,列聯(lián)表分析-數(shù)據(jù)預(yù)處理-III,,列聯(lián)表分析-I,列聯(lián)表分析-II,列聯(lián)表分析-III,,列聯(lián)表分析-IV,,列聯(lián)表分析-V,,,列聯(lián)表分析-VI,,列聯(lián)表分析-VII,,,課堂作業(yè)-HW1,文件名:姓名-HW#-日期 (例如:王大剛-HW1-150926)

17、以下作業(yè)請(qǐng)?zhí)峤灰环軼ord文件(HW1)至MYSTU即可。,HW 1 描述統(tǒng)計(jì),悠活與西華是兩家位于臺(tái)灣墾丁著名的度假酒店。臺(tái)灣酒店房客的來(lái)源有兩種: 1.事先預(yù)定 2.當(dāng)天walk in 兩家公司老板想了解, 是否酒店不同會(huì)影響其住宿情況。,HW1.1- 探索分析,請(qǐng)將下列統(tǒng)計(jì)量表復(fù)制到Word上:請(qǐng)做出悠活與西華兩家酒店預(yù)定數(shù)描述統(tǒng)計(jì)量 正態(tài)分布檢驗(yàn)直方圖莖葉圖正態(tài)概率圖請(qǐng)由正態(tài)性檢驗(yàn)表及正態(tài)概率圖

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論