版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第二章 描述性統計分 析實例,當研究者得到的數據量很小的時候,其可以通過直接觀察原始數據來獲得所有的信息。但是當得到的數據量很大的時候,就必須借助各種描述指標來完成對數據的描述工作。,EX. Chart Junk vs. Plain Graphs,用少量的描述指標來概括大量的原始數據,對數據展開描述的統計分析方法被稱為描述性統計分析。描述性統計分析常用的有:頻數分析、描述性分析、探索分析、列聯表分析。下面
2、我們一一介紹這幾種方法的功能和意義。,2.1.1 頻數分析的功能與意義,頻數分析過程(Frequencies)是描述性分析中最基本也是最常用的方法之一。可以得到詳細的頻數表以及平均值、最大值、最小值、方差、標準差、極差、平均數標準誤、偏度系數和峰度系數等重要的描述統計量,還可以通過分析得到合適的統計圖。不僅可以方便的對數據按組進行歸類整理,還可以對數據的分布特征形成初步的認識。,2.1.2 頻數分析實例,【例2.1】下面的資料給出了
3、山東省某學校50名高二學生的身高。試分析該50名學生的身高分布特征,繪制頻數表、直方圖,計算平均值、最大值、最小值、標準差、變異系數等統計量。配書資料\源文件\2\正文\原始數據文件\案例2.1.sav,EX. 中位數 (median),排序后處于中間位置上的值,不受極端值的影響主要用于順序數據,也可用數值型數據,但不能用于分類數據各變量值與中位數的離差絕對值之和最小,即,EX.中位數(位置和數值的確定),位置確定,數值確定,
4、EX. 四分位數(quartile),排序后處于25%和75%位置上的值,不受極端值的影響計算公式,EX. 數值型數據的四分位數 (9個數據的算例),【例】:9個家庭的人均月收入數據(4種方法計算)原始數據: 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630
5、2000位 置: 1 2 3 4 5 6 7 8 9,?,?,EX. 偏態(tài)(skewness),統計學家Pearson于1895年首次提出 數據分布偏斜程度的測度(相對于對稱分布)2.偏態(tài)系數=0為對稱分布3.偏態(tài)系數> 0為右偏分布偏態(tài)系數< 0為左偏分布偏態(tài)系數大于1或小于-1,被稱為高度偏態(tài)分布;偏態(tài)系數在0.5~
6、1或-1~-0.5之間,被認為是中等偏態(tài)分布;偏態(tài)系數越接近0,偏斜程度就越低,EX. 峰態(tài)(kurtosis),統計學家Pearson于1905年首次提出數據分布扁平程度的測度(相對于正態(tài)分布)峰態(tài)系數=0扁平峰度適中峰態(tài)系數0為尖峰分布,,偏態(tài)與峰態(tài)圖,偏態(tài),峰態(tài),,頻數分析-I,,頻數分析-II,,,,頻數分析-III,,頻數分析-IV,,,頻數分析-V,,2.2.1 描述性分析的功能與意義,SPSS的描述性分析過程(De
7、scriptive)本質就是計算并輸出各類相關的描述性統計指標。得到由原始數據轉化成的標準化的取值,并且可以將標準化值以變量的形式存入數據庫以便進一步分析。相關描述統計量主要有平均值、最大值、最小值、方差、標準差、極差、平均數標準誤、偏度系數和峰度系數等。,2.2.2 描述性分析實例,【例2.2】下面的資料給出了山東省某高校50名大一入學新生的體重。試對該50名學生的體重進行描述性分析,了解這50名學生體重的基本特征。配書資料\源
8、文件\2\正文\原始數據文件\案例2.2.sav,描述性分析-I,,描述性分析-II,,描述性分析-III,,,描述性分析-IV,,2.3.1探索分析的功能與意義,探索分析過程(Explore)是在對資料的性質、分布特點等完全不清楚的時候,對變量進行更加深入研究的一種描述性統計方法。除了具備一般描述性統計指標,還增加了有關數據文字與圖形描述,從而有助于對數據進行更深入的研究分析。還可以根據一定的方式分組進行統計。,EX. 未分組數據
9、—莖葉圖(stem-and-leaf display),用于顯示未分組的原始數據的分布由“莖”和“葉”兩部分構成,其圖形是由數字組成的以該組數據的高位數值作樹莖,低位數字作樹葉樹葉上只保留最后一位數字6. 莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數據的分布狀況,但沒有給出具體的數值莖葉圖既能給出數據的分布狀況,又能給出每一個原始數值,保留了原始數據的信息直方圖適用于大批量數據,莖葉圖適用于小批量數據,E
10、X. 未分組數據—莖葉圖,VAR00004 Stem-and-Leaf Plot Frequency Stem & Leaf 6.00 0 . 223334 2.00 0 . 58 3.00 1 . 113 8.00 1 . 56677888 4.00 2 . 0223 4.0
11、0 2 . 7899 4.00 3 . 0113 7.00 3 . 5568999 9.00 4 . 112223344 6.00 4 . 556889 3.00 5 . 334 6.00 5 . 666899 5.00 6 . 12233
12、 6.00 6 . 566799 4.00 7 . 1223 8.00 7 . 56677899 3.00 8 . 002 6.00 8 . 566788 3.00 9 . 223 3.00 9 . 579 Stem width: 10.00 E
13、ach leaf: 1 case(s),EX. 未分組數據—箱線圖(box plot),用于顯示未分組的原始數據的分布由一組數據的5個特征值繪制而成,它由一個箱子和兩條線段組成繪制方法首先找出一組數據的5個特征值,即最大值、最小值、中位數Me和兩個四分位數(下四分位數QL和上四分位數QU)連接兩個四分位數畫出箱子,再將兩個極值點與箱子相連接該箱線圖也稱為Median/Quart./Range箱線圖,,EX. 分布
14、的形狀與箱線圖,,不同分布的箱線圖,2.3.2 探索分析實例,【例2.3】下面的資料給出了天津、濟南兩個城市07年各月份的平均氣溫。試據此對天津平均氣溫和濟南平均氣溫進行探索性統計分析,研究天津平均氣溫和濟南平均氣溫的基本特征。 配書資料\源文件\2\正文\原始數據文件\案例2.3.sav,探索分析-I,探索分析-II,探索分析-III,探索分析-IV,,,探索分析-V,,,探索分析-VI,,,2.4.1列聯表分析的功能與意義,SPS
15、S的列聯表分析過程(Crosstabs)是通過分析多個變量在不同取值情況下的數據分布情況,從而進一步分析多個變量之間相互關系的一種描述性分析方法。至少指定兩個變量,分別為行變量和列變量,如果要進行分層分析,則我們還要規(guī)定層變量。不僅可以得到交叉分組下的頻數分布,還可以通過分析得到變量之間的相關關系。,2.4.2 列聯表分析實例,【例2.4】下面的資料給出了山東省的兩所高中學校的高三畢業(yè)生的升學情況。試據此對兩所學校學生的升學情況進行
16、列聯表分析,研究兩所學校學生的升學率之間有無明顯的差別。配書資料\源文件\2\正文\原始數據文件\案例2.4.sav,列聯表分析-數據預處理-I,列聯表分析-數據預處理-II,,列聯表分析-數據預處理-III,,列聯表分析-I,列聯表分析-II,列聯表分析-III,,列聯表分析-IV,,列聯表分析-V,,,列聯表分析-VI,,列聯表分析-VII,,,課堂作業(yè)-HW1,文件名:姓名-HW#-日期 (例如:王大剛-HW1-150926)
17、以下作業(yè)請?zhí)峤灰环軼ord文件(HW1)至MYSTU即可。,HW 1 描述統計,悠活與西華是兩家位于臺灣墾丁著名的度假酒店。臺灣酒店房客的來源有兩種: 1.事先預定 2.當天walk in 兩家公司老板想了解, 是否酒店不同會影響其住宿情況。,HW1.1- 探索分析,請將下列統計量表復制到Word上:請做出悠活與西華兩家酒店預定數描述統計量 正態(tài)分布檢驗直方圖莖葉圖正態(tài)概率圖請由正態(tài)性檢驗表及正態(tài)概率圖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 描述性統計學-universityofpittsburgh
- 描述性統計分析
- 描述性統計學公式
- 描述性研究
- descriptive statistics numerical methods:描述性統計數值方法
- 描述性英語作文
- 第二部分描述性統計
- 統計學第二章描述性統計分析
- 六西格瑪系列之統計學-第2章描述性統計
- 基于描述性統計方法在質量管理中的應用
- 流病03描述性研究
- 第三講 描述性統計量計算的spss過程
- 數列極限的描述性定義 對于數列
- 胡適詩歌翻譯的描述性研究.pdf
- 第三章 描述性研究
- 蘇曼殊翻譯的描述性研究.pdf
- 流行病學描述性研究
- 公允價值變動對上市公司盈余管理影響的描述性統計分
- 青島市居民死因描述性研究.pdf
- 九年級化學描述性用語規(guī)范
評論
0/150
提交評論