2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩69頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、定量資料的統(tǒng)計(jì)描述,賈 睿:成都中醫(yī)藥大學(xué)公共衛(wèi)生學(xué)院,學(xué)習(xí)要求,掌握內(nèi)容,頻數(shù)分布表的編制和應(yīng)用描述數(shù)據(jù)分布平均水平的指標(biāo)掌握算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)的意義、用途及計(jì)算方法。描述數(shù)據(jù)分布變異程度的指標(biāo)掌握極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)的意義、用途及計(jì)算方法。,熟悉內(nèi)容,描述數(shù)據(jù)分布平均水平的指標(biāo)熟悉百分位數(shù)、眾數(shù)、調(diào)和均數(shù)的意義、用途及計(jì)算方法。了解內(nèi)容描述分布形態(tài)的指標(biāo)偏度系數(shù)峰度系數(shù),2,3,

2、1.頻數(shù)表的繪制,4,從上表可以看出:“某市某年8歲男孩”—— 同質(zhì)觀察對象這些男孩的身高并不完全相等 —— 同質(zhì)的基礎(chǔ)上存在變異“120名”—— 樣本,5,頻數(shù)(frequency)觀察數(shù)據(jù)的個(gè)數(shù)頻數(shù)分布(frequency distribution) 觀察數(shù)據(jù)在其取值范圍內(nèi)的分布情況定量資料的頻數(shù)分布情況可以用頻數(shù)表(frequency distribution table)或直方圖表示。,6,步驟:計(jì)算極差134

3、.5-112.3=22.2cm確定組數(shù)、組距和組段通常8~15組組距:極差/組數(shù)(可調(diào)整)組段的起點(diǎn)叫“下限”,終點(diǎn)叫“上限”。首尾組段分別包含最小值和最大值列表劃記計(jì)算頻數(shù)、頻率、累計(jì)頻數(shù)和累計(jì)頻率,7,同一組資料,不同的人編制的頻數(shù)表,結(jié)果不盡相同,允許幾個(gè)合理的結(jié)果并存。,2.頻數(shù)表的應(yīng)用,描述分布類型描述分布特征發(fā)現(xiàn)離群值簡化計(jì)算陳述資料,9,10,2.1描述分布類型,對稱分布——強(qiáng)調(diào):近似正態(tài)分布(中間高

4、、兩邊低,左右對稱,近似鐘型) 本例為近似正態(tài)分布,11,12,不對稱分布——強(qiáng)調(diào):偏態(tài)分布正偏態(tài)分布:頻數(shù)集中在數(shù)據(jù)小側(cè)負(fù)偏態(tài)分布:數(shù)據(jù)集中在數(shù)據(jù)大側(cè)本例為正偏態(tài)分布醫(yī)學(xué)資料常見偏態(tài)分布。,13,2.2描述分布特征,平均水平(集中趨勢):描述頻數(shù)分布集中的位置,本例數(shù)據(jù)集中在122~124cm之間變異程度(離散程度):描述數(shù)據(jù)分散狀況,本例數(shù)據(jù)分布在112~136cm之間,18,19,2.3發(fā)現(xiàn)離群值,離群值為資料的特

5、大值或特小值。,20,3.描述平均水平,定量資料的平均水平指資料的集中位置,其大小用平均數(shù)表示。平均數(shù)(average)是一個(gè)指標(biāo)體系,包括:算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、第x百分位數(shù)、眾數(shù)、調(diào)和均數(shù)等。平均數(shù)的計(jì)算必須以同質(zhì)為基礎(chǔ)。,21,3.1算術(shù)均數(shù)(簡稱均數(shù)mean),22,總體均數(shù) ;樣本均數(shù) 代表每組觀察值的平衡點(diǎn),也就是重心。適用于單峰對稱分布資料,直接法:適用于樣本含量較小的未分組資料說明

6、:x表示變量值,∑表示求和,n表示樣本含量,23,加權(quán)法:適用于樣本含量較大的頻數(shù)表資料 說明:此處x表示組中值,f表示頻數(shù),∑表示求和例:120名8歲男孩的身高資料,24,3.2中位數(shù)(median,M),例:4 4 5 5 6 6 4 4 5 5 6 6 70 x1 x2 x3 x4 x5 x6

7、 x7定義: 將一組觀察值按從小到大的順序進(jìn)行排列,位置居中的數(shù)就是中位數(shù)。,25,直接法:樣本含量較小的未分組資料。n為奇數(shù)時(shí):n為偶數(shù)時(shí):4 4 5 5 6 6 1704 4 5 5 6 6 ?,26,加權(quán)法:適用于樣本含量較大的頻數(shù)表資料公式:說明:L表示M所在組段的下限;i表示該組段的組距;f表示該組段的頻數(shù);n表示樣本含量;∑fL表

8、示小于該組段的累計(jì)頻數(shù)。例:M=12+12/56(150/2-23) =23.14(小時(shí)),27,適用情況:任何分布類型,尤其適用于下列情況偏態(tài)分布開口資料分布不清,28,3.3百分位數(shù)(percentile,PX),定義公式例:P50 =12+12/56(150×50%-23) =23.14(小時(shí))P25 =12+12/56(150×25%-23)

9、 =15.11(小時(shí))P75=24+12/38(150×75%-79) =34.58(小時(shí)),29,3.4幾何均數(shù)(geometric mean,G),資料A: 2 4 6 8 10資料B: 2 4 8 16 32適用情況:標(biāo)準(zhǔn)情況:等比級數(shù)資料擴(kuò)展情況:正偏態(tài)分布,變量值跨越多個(gè)數(shù)量級,30,直接

10、法 加權(quán)法,31,,,,注意事項(xiàng)幾何均數(shù)常用于等比級資料或?qū)?shù)正態(tài)分布資料。觀察值中若有0或負(fù)值,則不宜直接使用幾何均數(shù)。觀察值一般同時(shí)不能有正值和負(fù)值。若全是負(fù)值,計(jì)算時(shí)可先將負(fù)號(hào)去掉,得出結(jié)果后再加上負(fù)號(hào)。,32,變量變換2 4 8 16 32lg2 lg4 lg8 lg16 lg320.30 0.60 0.90 1.20 1.51等

11、比級數(shù)資料可以通過對數(shù)變換,轉(zhuǎn)化為正態(tài)分布,33,3.5眾數(shù)(mode),指總體中出現(xiàn)機(jī)會(huì)最高的數(shù)值,樣本中出現(xiàn)次數(shù)最高的數(shù)字。,34,眾數(shù)、均數(shù)、中位數(shù)之間的關(guān)系,對稱分布三者相等正偏態(tài)分布眾數(shù)<中位數(shù)<均數(shù),35,3.6調(diào)和均數(shù)(harmonica mean,H),先求原始數(shù)據(jù)的倒數(shù)的算術(shù)均數(shù),該算術(shù)均數(shù)的倒數(shù)即稱為原始數(shù)據(jù)的調(diào)和均數(shù)。適用于變異程度較大的資料,36,,你還知道哪些描述平均水平的指標(biāo)?,37,,4

12、.描述變異程度,例:兩個(gè)資料如下:A:1 3 5 7 9 11 13B:6 6 6 7 8 8 8兩資料均為對稱分布,可選用均數(shù)描述平均水平,且均為7,但資料A的數(shù)據(jù)分布較資料B分散,7對資料的代表性相對較差。,38,4.1平均數(shù)與變異度的關(guān)系,平均數(shù)表示的集中性與變異度表示的離散性,是從兩個(gè)不同的角度闡明計(jì)量資料的特征 變異度越小,平均數(shù)對各變量值的代表性越好 變異度越大,平均數(shù)對各變量值的代表性

13、越差,變異程度是指各觀察值之間參差不齊的程度,反映資料的變異程度。常用指標(biāo):極差、四分位間距、離均差平方和、方差、標(biāo)準(zhǔn)差、變異系數(shù)等。反映平均水平和變異程度的指標(biāo)結(jié)合起來,全面認(rèn)識(shí)事物。,40,4.2極差(range,R,又稱全距),一組觀察值中最大值與最小值之差,單位與觀察值相同。極差越大,變異程度越大。如上例:A:1 3 5 7 9 11 13 R=12B:6 6 6 7 8 8 8

14、 R=2,41,適用情況:描述單峰對稱分布小樣本資料的變異程度;初步了解資料的變異程度。,42,不足之處:只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度;樣本含量越大,抽到較大或較小觀察值的可能性越大,則全距可能越大,因此樣本含量懸殊時(shí)不宜用全距比較。如上例資料B改為:B:1 6 6 7 8 8 13 R=12,則無法區(qū)分與資料A的變異程度誰大。,43,4.3方差、標(biāo)準(zhǔn)差,A:1 3 5

15、 7 9 11 13B:1 6 6 7 8 8 13由于極差不能反映每個(gè)觀察值對數(shù)據(jù)變異程度的影響,擬改用離均差之和(每個(gè)觀察值與均數(shù)的差稱為離均差):由于離均差有正有負(fù),離均差之和肯定為0。,44,改用離均差平方和:A資料:(1-7)2+(3-7)2+……+(13-7)2=112B資料:(1-7)2+(6-7)2+……+(13-7)2=72,45,離均差平方和的優(yōu)點(diǎn):能反映每一個(gè)觀察值對變異程度的影響。

16、把資料B作如下修改:B:1 6…6 7 8…8 13(共40個(gè)6和40個(gè)8)計(jì)算得:(1-7)2+…+(13-7)2=152離均差平方和的缺點(diǎn):離均差平方和不能消除觀察值個(gè)數(shù)對指標(biāo)的影響。,46,將離均差平方和進(jìn)一步修改,考慮觀察值個(gè)數(shù)對指標(biāo)的影響,得方差(varianc):總體方差:樣本方差: 資料A:s2=18.66,資料B:s2=1.85,47,方差

17、的優(yōu)點(diǎn):可以反映每個(gè)觀察值對變異程度的影響;考慮了觀察值個(gè)數(shù)對指標(biāo)的影響。方差的不足:單位是原觀察值單位的平方。,48,進(jìn)一步修改,得標(biāo)準(zhǔn)差(standard deviation):總體標(biāo)準(zhǔn)差:樣本標(biāo)準(zhǔn)差: 資料A:s=4.32,資料B:s=1.36,49,標(biāo)準(zhǔn)差越大,變異程度越大,數(shù)據(jù)越分散。標(biāo)準(zhǔn)差的優(yōu)點(diǎn):可以反映每個(gè)觀察值對變異程度的影響考慮了觀察值

18、個(gè)數(shù)對指標(biāo)的影響單位與觀察值相同標(biāo)準(zhǔn)差適用于對稱分布的資料,通常與均數(shù)結(jié)合使用。,50,4.4四分位數(shù)間距(quartile range,Q),公式 Q=P75-P25 (例:)適用條件:(同中位數(shù)),51,4.5變異系數(shù)(coefficient of variations,CV),公式:應(yīng)用條件:兩組資料單位不同兩組資料均數(shù)差異較大,52,例:觀察某地100名8歲男孩身高 =123.4cm,s=4

19、.79cm;體重 =23.46Kg,s=2.68Kg。試比較兩組資料的變異程度。身高: =3.89%體重: =11.42%體重變異較大。,53,絕對變異受平均水平的影響相對變異排除了平均水平的影響,注意:,55,☆ 重要提示,對稱分布平均水平:均數(shù)變異程度:標(biāo)準(zhǔn)差不對稱分

20、布平均水平:中位數(shù)變異程度:四分位數(shù)間距等比級數(shù)或?qū)?shù)正態(tài)分布的資料: 平均水平:幾何均數(shù) 變異程度:???,56,5.描述分布類型,偏度系數(shù)(coefficient of skewness,SKEW)峰度系數(shù)(coefficient of kurtosis,KURT),57,6. SPSS下進(jìn)行統(tǒng)計(jì)描述,58,6.1 統(tǒng)計(jì)描述的模塊,Frequencies過程計(jì)算各種常用的描述指標(biāo)特色是產(chǎn)生頻數(shù)表對分類資料和定量

21、資料都適用Descriptive 過程一般性的統(tǒng)計(jì)描述適用于服從正態(tài)分布的定量資料,@文彤老師,59,6.1 統(tǒng)計(jì)描述的模塊,Explore 過程用于對數(shù)據(jù)分布狀況不清時(shí)的探索性分析功能極為強(qiáng)大Crosstabs過程完成分類資料和等級資料的統(tǒng)計(jì)描述完成分類資料各種各樣“常規(guī)”的統(tǒng)計(jì)檢驗(yàn)Ratio過程用于兩個(gè)連續(xù)變量計(jì)算相對比指標(biāo),很少用PP圖和QQ圖,@文彤老師,60,6.2 Frequencies(頻率)過程,計(jì)

22、算各種常用的描述指標(biāo)特色是產(chǎn)生頻數(shù)表對分類資料和定量資料都適用,61,6.2 Frequencies(頻率)過程,Statistics 子對話框,@文彤老師,62,,6.2 Frequencies(頻率)過程,圖表子對話框,2013年8月15日,@文彤老師,63,,6.3 Descriptive(描述) 過程,一般性的統(tǒng)計(jì)描述適用于服從正態(tài)分布的定量資料可直接計(jì)算標(biāo)準(zhǔn)化Z值,2013年8月15日,@文彤老師,64,6.3 Des

23、criptive(描述) 過程,65,,6.4 Explore (探索)過程,可對變量進(jìn)行更為深入詳盡的描述性分析主要用于對資料的性質(zhì)、分布特點(diǎn)等完全不清楚時(shí)可分組進(jìn)行描述,2013年8月15日,@文彤老師,66,6.4 Explore (探索)過程,Statistics 子對話框,2013年8月15日,@文彤老師,67,,6.4 Explore (探索)過程,plot子對話框,2013年8月15日,@文彤老師,68,,作業(yè),教材3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論