版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第 三節(jié),資料的統(tǒng)計描述,一 計量資料的統(tǒng)計描述,頻數(shù)分布集中趨勢指標(biāo)離散趨勢指標(biāo),(一) 頻數(shù)分布,一、頻數(shù)分布表簡稱頻數(shù)表(frequency table),例9-7 (P187),1. 頻數(shù)表的編制,(1)計算極差(range):即最大值與最小值之差,又稱為全距。 本例極差: R=5.91-3.86=2.05(×1012/L)(2) 確定組數(shù)、組距和組限:根據(jù)研究目的和樣本含量n
2、確定。組數(shù)通常分8-15個組,為方便計,組距參考極差的十分之一, 再略加調(diào)整。本例:i= R /10=2.05/10=0.205≈0.20。 組距=極差/擬分組數(shù) 組限:每個組段的起點為上限,終點為下限;第一組段要包括最小值,最后一個組段必須包含最大值。(3) 列表劃記:用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。,2、頻數(shù)分布圖(graph of frequency distribution),3 頻數(shù)分布
3、的兩個特征,集中趨勢,central tendency指變量值的中心數(shù)值或中心位置所在。離散趨勢,tendency of dispersion指變量值圍繞中心數(shù)值或中心位置的分布情況。,4 頻數(shù)分布的類型,對稱分布:集中位置居中,左右兩邊對稱 (特例:正態(tài)分布)偏態(tài)分布:正偏態(tài)分布(峰偏左) 負偏態(tài)分布,5、頻數(shù)表的用途,揭示頻數(shù)
4、的分布特征和分布類型;可以代替原始資料,便于計算和分析;便于發(fā)現(xiàn)某些特大或特小的可疑值。,(二) 集中趨勢的描述,平均數(shù)(average):用于觀察一組同質(zhì)變量值的平均水平/集中位置。亦稱中心位置指標(biāo)。它不但給人一個簡明概括的印象,而且便于事物間的分析比較。常用的平均數(shù)算術(shù)均數(shù) (arithmetic mean/mean) 幾何均數(shù) (geometric mean)中位數(shù) (median),1、算術(shù)均數(shù),簡稱均數(shù)(arit
5、hmetic mean/mean),均數(shù)是算術(shù)均數(shù)的簡稱??傮w均數(shù)用希臘字母μ(繆,mu)表示樣本均數(shù) (X bar)表示。,均數(shù)的應(yīng)用條件,主要用于對稱性或近似對稱性分布的資料;尤其是在正態(tài)分布或近似正態(tài)分布上的應(yīng)用。,計算方法 1.直接法,Σ:希臘字母(sigma),求和符號例9.2 有8名正常人的空腹血糖值(mmol/L): 6.2,5.4,5.7,5.3,6.1,6.0,5.8,5.9
6、 6.2+5.4+5.7+5.3+6.1+6.0+5.8+5.9 = =5.8 8,,2.加權(quán)法,加權(quán)法計算均數(shù):,Xj 為各組的組中值。組中值等于該組的上
7、限加下限之和除以2。 fj 為各組的頻數(shù)。101名正常成年女子的血清總膽固醇均值為: = 409.75/101 =4.06( mmol/L ),(二)幾何均數(shù) Geometric mean,G,描述一組呈倍數(shù)(等比)關(guān)系的觀察值的平均水平。適用:數(shù)據(jù)呈正偏態(tài)分布,經(jīng)對數(shù)轉(zhuǎn)換后呈正態(tài)分布。多用于觀察值之間呈倍數(shù)關(guān)系,如抗體滴度計算方法直接法 加權(quán)法,1.直接法,例:有8份血清的抗體效價為1:
8、5,1:10,1:20,1:40,1:80, 1:160 ,1:320,1:640。求平均效價。,用直接法計算G,將各效價的倒數(shù)代入公式,得該8份血清的平均抗體效價為1:56.57,近似為1:57注意:變量值不能有0,2.加權(quán)法,式中f為頻數(shù)。,用加權(quán)法計算G,例 30名麻疹易感兒童接種麻疹疫苗一個月后,血凝抑制抗體滴度如下表所示,試求其平均抗體滴度。,30名麻疹易感兒童血凝抑制抗體滴度,∑flgX=50.58,30名麻疹易感兒童
9、接種麻疹疫苗一個月后血凝抑制抗體滴度為1:48.5,同一組資料求得的幾何均數(shù)小于均數(shù)。,將一組觀察值從小到大按順序排列,位次居中的觀察值,即為中位數(shù)。一半的值比M小,一半的值比M大。,(三)中位數(shù) Median, M,例:1,3,5,7,18 (奇數(shù)) 1,3,5,7,18,20 ( 偶數(shù)) 計算n為奇數(shù)時n為偶數(shù)時,M計算方法,例: 9人某病潛伏期(天
10、)分別為3,4,4,5,6,7,7,19,19,求中位數(shù)。 例: 6名新生兒身長(cm)分別為50.1,52.0,53.0,55.0,55.0,56.0,求中位數(shù)。,,中位數(shù)的應(yīng)用條件,偏態(tài)分布或分布狀態(tài)不明的資料;觀察值中有個別過小或過大值的資料分布的一端或兩端無確定的數(shù)值; (如:>50, 或 <10)注意:在完全對稱的單峰曲線分布中,同一組資料的均數(shù)與中位數(shù)相同, Mean = Median,
11、中位數(shù)的優(yōu)缺點,優(yōu)點:不受個別特大或特小的觀察值影響;其它平均數(shù)不宜使用時,中位數(shù)就顯示出它的優(yōu)越性。缺點:掉失了大量信息,其敏感性不夠。,(三) 離散趨勢指標(biāo),例 有3組同齡男孩體重(kg)如下,其體重均數(shù) 都是30 (kg),試分析離散程度。甲組 26 28 30 32 34乙組 24 27 30 33 36丙組 26 29 30 31 34,離散程度(或變異程度),指
12、數(shù)據(jù)參差不齊的程度,反映資料的離散趨勢。將反映平均水平與離散程度的指標(biāo)結(jié)合起來使用,可全面地描述數(shù)據(jù)的分布規(guī)律。,1 極差( Range ),極差= 最大值 – 最小值優(yōu)點:簡單明了缺點:不能反映組內(nèi)其他數(shù)據(jù)的變異,樣本含量相差較大時,不宜用極差比較分布的離散程度。,2 四分位數(shù)間距 inter-quartile range,百分位數(shù):指把數(shù)據(jù)從小到大排列后處于第X百分位置的數(shù)值。它將全部數(shù)據(jù)分為兩部分,在不包括PX的全部數(shù)據(jù)
13、中有X%數(shù)據(jù)小于PX,有1-X%的數(shù)據(jù)大于PX%。中位數(shù)是一個特定的百分位數(shù)P50。四分位數(shù):下四分位數(shù)P25;上四分位數(shù)P75 P0 —— P25 —— P50 —— P75 —— P100 四分位數(shù)間距: P75 - P25 或 QU - QL 比極差穩(wěn)定,但仍未考慮每個數(shù)據(jù)的大小。常和中位數(shù)結(jié)合使用描述數(shù)據(jù)的分布規(guī)律。,3 方差和標(biāo)準差,離均差平方和:
14、 考慮每個觀察值,但受N的影響。對離均差平方和求均數(shù),得總體方差?2 ,開根號得標(biāo)準差? 。,一般?未知,常常用 來估計,數(shù)理統(tǒng)計證明,如用樣本的變量個數(shù)n來代替N,計算出的樣本方差比實際?2低,需要用n-1校正,得樣本方差S2。開根號得樣本標(biāo)準差s。,自由度,degree of freedom,方差計算公式中的n-1被稱為自由度,它描述了當(dāng) 選定時,n個X中能自由變動的X(變量值)的個數(shù)。例:某樣本含有5個數(shù)
15、據(jù),要求∑X=15。則在自由確定了四個數(shù)據(jù)后,第5個數(shù)據(jù)只能是15-(x1+x2+x3+x4)。 即有4個數(shù)據(jù)可以自由變動,其自由度=4 。推而廣之,任何統(tǒng)計量的自由度?=n-k,k為限制條件的個數(shù)。 自由度:是隨機變量可以“自由”取值的個數(shù)。,總體標(biāo)準差樣本標(biāo)準差,標(biāo)準差 standard deviation,,,標(biāo)準差的計算,甲組 26 28 30 32 34 標(biāo)準差 3.16乙組 24
16、27 30 33 36 4.74丙組 26 29 30 31 34 2.92甲組:∑X=26+28+30+32+34=150∑X2=262+282+302+322+342=4540,用頻數(shù)表法計算標(biāo)準差,標(biāo)準差的應(yīng)用:,反映一組觀察值的變異程度;衡量均數(shù)的代表性;結(jié)合樣本均數(shù)描述頻數(shù)分布特征;計算變異系數(shù)和標(biāo)準誤;,標(biāo)準
17、差與算術(shù)均數(shù)之比,反映了相對離散程度常用于比較度量衡單位不同的多組資料的變異度均數(shù)相差懸殊的多組資料的變異度,5 變異系數(shù) CV,例:度量衡單位不同的變異度,某地20歲男子110名身高 =172.73cm, s=4.09cm;體重 =55.04kg, s=4.10kg,試比較兩組資料的變異程度,即身高、體重的變異程度哪個大?,例:均數(shù)相差懸殊的變異度,
18、二 計數(shù)資料的統(tǒng)計描述,,常見的數(shù)據(jù)形式:,絕對數(shù),,相對數(shù),但絕對數(shù)通常不具有可比性。,例:甲地 麻疹發(fā)病人數(shù)30人 乙地 麻疹發(fā)病人數(shù)25人 地區(qū) 麻疹發(fā)病人數(shù) 易感兒童數(shù) 麻疹發(fā)病(%) 甲地 30 3000 1 乙地 25
19、 1000 2.5,,,,構(gòu)成比 率 相對比,常用的相對數(shù)指標(biāo):,1 構(gòu)成比,,表示事物內(nèi)部各組成部分的比重或分布,常以百分數(shù)表示。,例1 本班有學(xué)生40名,其中男生15名,女生25名。性別構(gòu)成比:男生性別構(gòu)成比:15/40×100%=37.5%;女生性別構(gòu)成比:25/40×100%=62.5%,白細胞分類計數(shù),,構(gòu)成比的
20、特點,(1)各部分構(gòu)成比的合計為100%。(2)事物內(nèi)部某一部分的構(gòu)成比發(fā)生變化, 其他部分構(gòu)成也發(fā)生變化。,說明某現(xiàn)象或某事物發(fā)生的頻率或強度。常用百分率(%)、千分率(‰)、萬分率( )、十萬分率( )來表示。,2 率,比例基數(shù)的選用一般依據(jù)習(xí)慣,使計算出來的率的結(jié)果保留1-2位整數(shù)。,例1 某醫(yī)院1998年在某城區(qū)隨機調(diào)查了8589例60歲及以上老人,體檢發(fā)現(xiàn)高血壓患者為2823
21、例,求高血壓的患病率。,例2 1999年某幼兒園有36名兒童患了腮腺炎,該幼兒園共有200名兒童(其中25名兒童以前患過),求該幼兒園1999年腮腺炎的發(fā)病率。,3 相對比(relative ratio) 是兩個相關(guān)聯(lián)的指標(biāo)之比。說明:(1)式中甲乙兩指標(biāo)可以是絕對數(shù)、平均數(shù)或相對數(shù);(2)式中甲乙兩指標(biāo)的性質(zhì)可以相同,也可以是性質(zhì)不同。,例1 某地某年出生的嬰兒中,男性嬰兒為484人,女性嬰兒為460人,求出生
22、嬰兒的性別比。 出生嬰兒的性別比例為484/460=1.052(或105:100),(二)應(yīng)用相對數(shù)的注意事項,1 計算相對數(shù)時樣本含量應(yīng)足夠多,2 不能用構(gòu)成比代替率,3 注意資料的可比性,4 要考慮存在抽樣誤差,,,,習(xí)題1:,有人說50~歲組患者的比重最高,該組患病最嚴重,60~歲后患病下降。此說法對嗎?為什么?,下列因素可能影響對比組之間的可比性: (1)觀察對象是否同質(zhì),研究方法是否相同,觀察時間是否相等,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人群健康研究的統(tǒng)計學(xué)方法
- 醫(yī)學(xué)統(tǒng)計學(xué)定量資料的統(tǒng)計描述
- 醫(yī)學(xué)統(tǒng)計學(xué)-計數(shù)資料的統(tǒng)計描述
- 醫(yī)學(xué)統(tǒng)計學(xué)第4章-計數(shù)資料的統(tǒng)計描述
- 統(tǒng)計學(xué)教案習(xí)題06分類資料統(tǒng)計描述
- 統(tǒng)計學(xué)教案習(xí)題06分類資料統(tǒng)計描述
- [學(xué)習(xí)]統(tǒng)計學(xué)-分布數(shù)量特征的統(tǒng)計描述
- 統(tǒng)計學(xué)教案習(xí)題06分類資料統(tǒng)計描述x
- 統(tǒng)計學(xué)教案習(xí)題06分類資料統(tǒng)計描述x
- 第九篇_家庭禮儀
- 12_第九篇
- 統(tǒng)計學(xué)-計量資料
- 醫(yī)學(xué)統(tǒng)計學(xué)分類的統(tǒng)計描述
- 描述性統(tǒng)計學(xué)-universityofpittsburgh
- 描述性統(tǒng)計學(xué)公式
- 統(tǒng)計學(xué)--第九章直線回歸與相關(guān)
- 第九篇油漆涂料
- 第九篇 家庭禮儀
- 醫(yī)學(xué)統(tǒng)計學(xué)方法
- 描述統(tǒng)計學(xué)chap04
評論
0/150
提交評論