版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、,,,衛(wèi)生統(tǒng)計(jì)學(xué) 主講人 李宏革 衛(wèi)生統(tǒng)計(jì)學(xué)教研室,,第一章 緒論一.什么是統(tǒng)計(jì)學(xué) ?二.什么是衛(wèi)生統(tǒng)計(jì)學(xué) ?三.統(tǒng)計(jì)學(xué)的基本概念。四.統(tǒng)計(jì)分析資料的基本類(lèi)型。五.統(tǒng)計(jì)工作的基本步驟。,,一.什么是統(tǒng)計(jì)學(xué)?統(tǒng)計(jì)學(xué)(statistics)是運(yùn)用概率論和數(shù)理統(tǒng)計(jì)的原理、方法,研究數(shù)據(jù)資料的搜集、整理、分析和推斷的一門(mén)學(xué)科 。理論基礎(chǔ):
2、數(shù)理統(tǒng)計(jì)、概率論。目的:透過(guò)現(xiàn)象看本質(zhì)。,,統(tǒng)計(jì)學(xué)statistics,,二.什么是衛(wèi)生統(tǒng)計(jì)學(xué) ?運(yùn)用概率論和數(shù)理統(tǒng)計(jì)的原理、方法,結(jié)合公共衛(wèi)生實(shí)際,研究數(shù)據(jù)資料的搜集、整理、分析和推斷的一門(mén)學(xué)科 。,,三.統(tǒng)計(jì)學(xué)的基本概念1.變量:觀察對(duì)象的某項(xiàng)特征定義為變量。變量的觀測(cè)結(jié)果 變量值。根據(jù)變量值的特征,變量分為:(1)數(shù)值變量 (2)分類(lèi)變量,,,(1)數(shù)值變量(定量變量)變量
3、值既有大小又有度量衡單位。 連續(xù)型數(shù)值變量:如身高、體重等 。 離散型數(shù)值變量:,,(2)分類(lèi)變量(定性變量)變量值表現(xiàn)為互不相容的類(lèi)別或?qū)傩浴8鶕?jù)類(lèi)別或?qū)傩灾g有無(wú)程度性差別,分類(lèi)變量分為: 無(wú)序分類(lèi)變量 有序分類(lèi)變量,,無(wú)序分類(lèi)變量: 兩分類(lèi)變量 多分類(lèi)變量,,有序分類(lèi)變量: 尿糖化驗(yàn)結(jié)果按-、±、+、++、+++分類(lèi);療效按治
4、愈、顯效、好轉(zhuǎn)、無(wú)效分類(lèi)。,,連續(xù)型數(shù)值變量 數(shù)值變量 離散型數(shù)值變量變量 兩分類(lèi)變量 無(wú)序分類(lèi)變量 分類(lèi)變量
5、 多分類(lèi)變量 有序分類(lèi)變量,,,,,,(3)變量間的轉(zhuǎn)化數(shù)值變量 兩分類(lèi)變量 有序分類(lèi)變量 分類(lèi)變量數(shù)值化,,,,2.同質(zhì):根據(jù)研究目的,觀察單位或個(gè)體對(duì)所研究指標(biāo)有影響的非實(shí)驗(yàn)性因素相同。 如:調(diào)查皇姑區(qū)5歲男孩身高情況。3.變異:同質(zhì)基礎(chǔ)之上個(gè)體被研究指標(biāo)之間的差異。,,4.總體:根據(jù)研究目的所確定的同
6、質(zhì)觀察單位全體。如:調(diào)查皇姑區(qū)5歲男孩身高情況。根據(jù)有無(wú)明確的時(shí)空,總體分為: (1)有限總體 (2)無(wú)限總體,,統(tǒng)計(jì)學(xué)的任務(wù):(1)了解事物或現(xiàn)象的總體情況。(2)了解事物或現(xiàn)象之間的關(guān)系。,,5.樣本:按照隨機(jī)化原則從總體中抽取部分個(gè)體組成的集合。樣本容量樣本的代表性,,6.參數(shù):根據(jù)總體個(gè)體值計(jì)算出來(lái)的描述總體特征的指標(biāo)稱(chēng)為參數(shù)。7.統(tǒng)計(jì)量:根據(jù)樣本個(gè)體值計(jì)算出來(lái)的描
7、述樣本特征的指標(biāo)稱(chēng)為統(tǒng)計(jì)量。統(tǒng)計(jì)量 參數(shù)?。?,,8.抽樣誤差:由于個(gè)體變異的存在,在隨機(jī)抽樣的過(guò)程中,出現(xiàn)的統(tǒng)計(jì)量與參數(shù)、統(tǒng)計(jì)量間的差異稱(chēng)為抽樣誤差。9.概率: 某隨機(jī)事件發(fā)生可能性大小的量。用P表示P≤0.05 或P≤0.01 小概率事件,,四.統(tǒng)計(jì)分析資料的基本類(lèi)型 1.數(shù)值變量資料(計(jì)量資料) 2.分類(lèi)變量資料(計(jì)數(shù)資料 無(wú)序分類(lèi)變量資料) 3.等級(jí)資料(半定量資料
8、有序分類(lèi)變量資料),,,五.統(tǒng)計(jì)工作的基本步驟 1.設(shè)計(jì) 2.搜集資料 3.整理資料 4.分析資料,,統(tǒng)計(jì)描述資料統(tǒng)計(jì)分析 參數(shù)估計(jì) 統(tǒng)計(jì)推斷 假設(shè)檢
9、驗(yàn),,,,第二章 數(shù)值變量資料的統(tǒng)計(jì)描述,測(cè)得130名健康成年男子脈搏資料(次/分)如下:,(1)求極差(R):即最大值與最小值之差,又稱(chēng)為全距。R=84 – 57 =27(次/分)(2)確定分組組數(shù)(n)、組距(i):n通常為10~15組。組距=極差/組數(shù),為方便計(jì),組距為極差的十分之一, 再略加調(diào)整。 27/10=2.7 ≈3 (3)確定組限(L):第一組的
10、下限略小于最小值,最后一個(gè)組上限必須包含最大值。 56~ 59~ …… 80~ 83~85(4) 劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組,得到各組段的頻數(shù)。,一.頻數(shù)表的編制,130名健康成年男子脈搏(次/分)的頻數(shù)分布表,二、頻數(shù)分布圖---直方圖,,三.描述集中趨勢(shì)的指標(biāo)----平均數(shù)平均數(shù):描述一組同質(zhì)觀察值的平均水平,作為其代表值。
11、 均數(shù) 幾何均數(shù)平均數(shù) 中位數(shù) 眾數(shù) 調(diào)和平均數(shù),,,1. 均數(shù)(算術(shù)均數(shù)): 樣本均數(shù), 總體均數(shù) (1)適用條件:變量值呈對(duì)稱(chēng)分布,尤其呈正態(tài)或近似正態(tài)分布。,,,,,,(2)
12、計(jì)算:直接法:用于樣本含量較少時(shí),其公式為:加權(quán)法:用于頻數(shù)表資料或樣本中相同觀察值較多時(shí),其公式為:,,,,,130名健康成年男子脈搏(次/分)的頻數(shù)分布表,測(cè)得130健康成年男子脈搏資料(次/分)如下:,130名健康成年男子脈搏(次/分)的頻數(shù)分布表,,2.幾何均數(shù)(geometric mean)用G表示 (1)適用條件:變量值之間呈倍數(shù)或近似倍數(shù)關(guān)系;變量值呈對(duì)數(shù)正態(tài)分布,即數(shù)據(jù)經(jīng)過(guò)對(duì)數(shù)變換后呈正態(tài)分布。,
13、,,,(2)計(jì)算:直接法:加權(quán)法:(3)注意事項(xiàng):觀察值中不能有0,因0不能取對(duì)數(shù);一組觀察值中不能同時(shí)有正或負(fù)值。,,,,,,,,測(cè)定10名傷寒病人血清 抗體滴度分別為1:4, 1:4, 1:4,1:4,1:4,1:16, 1:16,1:16,1:64, 1:128,求其平均抗體滴度。以其滴度的倒數(shù)為原變量值,代入公式有:,,,平均抗體滴度為: 1:11,69例類(lèi)風(fēng)濕關(guān)節(jié)炎(RA)患者血清EBV-VCA-lgG
14、抗體滴度的分布見(jiàn)表2-4第(1)、(2)欄,求其平均抗體滴度。,,3.中位數(shù)(median) 用M表示。(1)定義:一組由小到大按順序排列的觀察值中位次居中的數(shù)值。(2)適用條件:變量值呈非正態(tài)分布資料(對(duì)數(shù)正態(tài)分布除外);頻數(shù)分布的一端或兩端無(wú)確切數(shù)據(jù)的資料;總體分布不清楚的資料。,,,是否為對(duì)稱(chēng)分布?,是否為對(duì)稱(chēng)分布?,115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布,正偏態(tài)分布 :,101名正常人的血清肌紅蛋白含量
15、分布,負(fù)偏態(tài)分布:,,,(3)計(jì)算:直接法:n為奇數(shù) ,n為偶數(shù),,,,例 9名中學(xué)生甲型肝炎的潛伏期分別為12,13,14, 14, 15, 15, 15, 17, 天,求其中位數(shù)。,19,,頻數(shù)表法:用于頻數(shù)表資料。 百分位數(shù)(percentile)用Px表示。 中位數(shù)是一個(gè)特定的百分位數(shù),即M=P50。Px計(jì)算公式:,,,,,,Px,xmin,xmax,,,,百分位數(shù)示意圖,百分位數(shù)(perc
16、entile),頻數(shù)表中位數(shù)的計(jì)算,中位數(shù)=71+3x[(130x50%-59)/26]=71.69,試分別求頻數(shù)表的第25、第75百分位數(shù)。,P25=65+3x[(130x25%-19)/15]=65.90P75=74+3x[(130x75%-85)/19]=74.66,,例:199名食物中毒患者潛伏期的M和PX的計(jì)算M=P50=
17、 =12+12/71(199×50%-30)=23.75(小時(shí)),,,四.描述離散趨勢(shì)的指標(biāo) 極差(全距) 四分位數(shù)間距變異指標(biāo):方差 標(biāo)準(zhǔn)差 變異系數(shù),,,1.極差(range,簡(jiǎn)記為R):同質(zhì)觀察值中最大值與最小值之差。
18、用全距描述定量資料的變異度大小,雖然計(jì)算簡(jiǎn)單,但不足之處有:①只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度;②樣本含量越大,抽到較大或較小觀察值的可能性越大,則全距可能越大。因此樣本含量相差懸殊時(shí)不宜用全距比較。,,2.四分位數(shù)間距(quartile,簡(jiǎn)記為Q):上四分位數(shù)QU(即P75)與下四分位數(shù)QL(即P25)之差。由于四分位數(shù)間距不受兩端個(gè)別極大值或極小值的影響,因而四分位數(shù)間距較全距穩(wěn)定,但仍未
19、考慮全部觀察值的變異度,常用于描述偏態(tài)頻數(shù)分布以及分布的一端或兩端無(wú)確切數(shù)值資料的離散程度。,,3.方差(variance):σ2 s2離均差 :每個(gè)觀察值X與總體均數(shù)的差值(X-μ)。離均差和:Σ(X-μ)=0 離均差平方和:Σ(X-μ)2 ≠0 n-1稱(chēng)為自由度( degree of freedom)。,,,,y,x,0,,,,x1,x2,·,·,,4.標(biāo)準(zhǔn)差(standar
20、d deviation):σ s,,,,,直接法: 加權(quán)法:,,,,標(biāo)準(zhǔn)差的應(yīng)用:(1)結(jié)合均數(shù)描述變量值的分布特征:X±S。(2)計(jì)算標(biāo)準(zhǔn)誤。(3)計(jì)算變異系數(shù)(CV)。,,,5. 變異系數(shù)(CV): 應(yīng)用于兩種情況:(1)比較度量單位不同;(2)均數(shù)相差懸殊的兩組或多組資料的變 異度 。,,某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71cm;體重均數(shù)為22.59kg,標(biāo)準(zhǔn)差為2
21、.26kg,比較其變異度?,,描述分布形態(tài)的統(tǒng)計(jì)指標(biāo)1.偏度系數(shù) SKEW2.峰度系數(shù) KURT,,例:,,一.頻數(shù)表(frequency table)的編制1.求全距(range):找出觀察值中的最大值與最小值,其差值即為全距(或極差),用R表示。2.確定組數(shù)(n):一般設(shè)10-15個(gè)組。3.確定組距(i): i=R/n 4.確定組限(L):第一組段應(yīng)包括全部觀察值中的最小值,最末組段應(yīng)包括全部觀察值中的最大值,
22、并且同時(shí)寫(xiě)出其下限與上限。5.列表劃記:,,某地110名8歲男孩身高(cm)的頻數(shù)表,,二.直方圖 頻 率 密 度 身高(cm),,,,,三
23、.描述集中趨勢(shì)的指標(biāo)--------平均數(shù)平均數(shù):描述一組同質(zhì)觀察值的平均水平,處于中心位置的指標(biāo)體系。 均數(shù) 幾何均數(shù)平均數(shù) 中位數(shù) 眾數(shù) 調(diào)和平均數(shù),,,1. 均數(shù)(算術(shù)均數(shù)): 樣本均數(shù), 總體均數(shù) (1)
24、適用條件:變量值呈對(duì)稱(chēng)分布,尤其呈正態(tài)或近似正態(tài)分布。(2)計(jì)算:直接法:用于樣本含量較少時(shí),其公式為:加權(quán)法:用于頻數(shù)表資料或樣本中相同觀察值較多時(shí),其公式為:,,,,,,2.幾何均數(shù)(geometric mean)用G表示 (1)適用條件:變量值呈對(duì)數(shù)正態(tài)分布,即數(shù)據(jù)經(jīng)過(guò)對(duì)數(shù)變換后呈正態(tài)分布;呈等比級(jí)數(shù)資料,即觀察值之間呈倍數(shù)或近似倍數(shù)變化。(2)計(jì)算:直接法:加權(quán)法:(3)注意事項(xiàng):觀察值中
25、不能有0,因0不能取對(duì)數(shù);一組觀察值中不能同時(shí)有正或負(fù)值。,,,,,,,,例3.6 測(cè)定10名傷寒病人血清 抗體滴度分別為1:4, 1:4, 1:4,1:4,1:4,1:16, 1:16,1:16,1:64, 1:128,求其平均抗體滴度。以其滴度的倒數(shù)為原變量值,代入公式有:,,,平均抗體滴度為: 1:11,例2-6 69例類(lèi)風(fēng)濕關(guān)節(jié)炎(RA)患者血清EBV-VCA-lgG抗體滴度的分布見(jiàn)表2-4第(1)、(2)欄,求其平均抗
26、體滴度。,,3.中位數(shù)(median) 用M表示。(1)定義:一組由小到大按順序排列的觀察值中位次居中的數(shù)值。 在全部觀察中,小于和大于中位數(shù)的觀察值個(gè)數(shù)相等。 (2)適用條件:變量值呈非正態(tài)分布資料(對(duì)數(shù)正態(tài)分布除外);頻數(shù)分布的一端或兩端無(wú)確切數(shù)據(jù)的資料;總體分布不清楚的資料。(3)計(jì)算:直接法:將觀察值由小到大排列 n為奇數(shù) ,n為偶數(shù),,,,例 9名中學(xué)生甲
27、型肝炎的潛伏期分別為12,13,14, 14, 15, 15, 15, 17, 天,求其中位數(shù)。,19,,頻數(shù)表法:用于頻數(shù)表資料。 百分位數(shù)(percentile)用Px表示。 一個(gè)百分位數(shù)Px將一組觀察值分為兩部分,理論上有X%的觀察值比它小,有(100-X)%的觀察值比它大,是一種位置指標(biāo)。中位數(shù)是一個(gè)特定的百分位數(shù),即M=P50。Px計(jì)算公式:首先要確定Px所在的組段。 如何確定,根據(jù)累計(jì)頻數(shù)或
28、累計(jì)頻率。,,,,,百分位數(shù)示意圖,百分位數(shù)(percentile),,例:199名食物中毒患者潛伏期的M和PX的計(jì)算M=P50= =12+12/71(199×50%-30)=23.75(小時(shí)),,,四.描述離散趨勢(shì)的指標(biāo) 全距
29、 四分位數(shù)間距變異指標(biāo):方差 標(biāo)準(zhǔn)差 變異系數(shù),,,1.全距(range,簡(jiǎn)記為R):亦稱(chēng)極差,是一組同質(zhì)觀察值中最大值與最小值之差。它反映了個(gè)體差異的范圍,全距大,說(shuō)明變異度大;反之,全距小,說(shuō)明變異度小。用全距描述定量資料的變異度大小,雖然計(jì)算簡(jiǎn)單,但不足之處有:①只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度
30、;②樣本含量越大,抽到較大或較小觀察值的可能性越大,則全距可能越大。因此樣本含量相差懸殊時(shí)不宜用全距比較。,,2.四分位數(shù)間距(quartile,簡(jiǎn)記為Q):為上四分位數(shù)QU(即P75)與下四分位數(shù)QL(即P25)之差。四分位數(shù)間距可看成是中間50%觀察值的極差,其數(shù)值越大,變異度越大,反之,變異度越小。由于四分位數(shù)間距不受兩端個(gè)別極大值或極小值的影響,因而四分位數(shù)間距較全距穩(wěn)定,但仍未考慮全部觀察值的變異度,常用于描述偏態(tài)
31、頻數(shù)分布以及分布的一端或兩端無(wú)確切數(shù)值資料的離散程度。,,3.方差(variance):σ2 s2離均差 :每個(gè)觀察值X與總體均數(shù)的差值(X-μ)。離均差和:Σ(X-μ)=0 離均差平方和:Σ(X-μ)2 ≠0 n-1稱(chēng)為自由度( degree of freedom)。,,,,,4.標(biāo)準(zhǔn)差(standard deviation):σ s,,,,,直接法: 加權(quán)法:,,,,標(biāo)準(zhǔn)差的應(yīng)用:
32、(1)結(jié)合均數(shù)描述變量值的分布特征:X±S。(2)計(jì)算標(biāo)準(zhǔn)誤。(3)計(jì)算變異系數(shù)(CV)。,,,5. 變異系數(shù)(coefficient of variation,簡(jiǎn)記為CV): 應(yīng)用于兩種情況:(1)比較度量單位不同;(2)均數(shù)相差懸殊的兩組或多組資料的變 異度 。,,某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71;體重均數(shù)為22.59kg,標(biāo)準(zhǔn)差為2.26kg,比較其變異度?,,第三章 分類(lèi)
33、變量資料的統(tǒng)計(jì)描述,,一.頻數(shù)表某地區(qū)1000人血型構(gòu)成分布表 血型 例數(shù) A 200 B 350 AB 150 O 300 合計(jì)
34、 1000,,,,,,二.相對(duì)數(shù) 率(rate) 構(gòu)成比(proportion) 相對(duì)數(shù) 比(ratio) 動(dòng)態(tài)數(shù)列,,,1.率(rate) P π率是一頻度指標(biāo),用
35、以反映某現(xiàn)象發(fā)生的頻度或強(qiáng)度。常以百分率(%)、千分率(‰)、萬(wàn)分率(1/萬(wàn))和十萬(wàn)分率(1/十萬(wàn))等表示,計(jì)算公式為:,,,2.構(gòu)成比(proportion) 說(shuō)明某事物內(nèi)部各組成部分所占的比重或比例。常以百分?jǐn)?shù)表示,計(jì)算公式為:,,,3.比(ratio) 又稱(chēng)為相對(duì)比,比較兩個(gè)指標(biāo)時(shí)用以反映兩個(gè)有關(guān)指標(biāo)間數(shù)量上的比值,如A指標(biāo)是B指標(biāo)的若干倍,或A指標(biāo)是B指標(biāo)的百分之幾,通常用倍數(shù)或分?jǐn)?shù)表示。計(jì)算公式為:,,,4.動(dòng)態(tài)數(shù)列
36、絕對(duì)增長(zhǎng)量發(fā)展速度增長(zhǎng)速度平均發(fā)展速度平均增長(zhǎng)速度,,三.應(yīng)用相對(duì)數(shù)的注意事項(xiàng)1.計(jì)算相對(duì)數(shù)時(shí)分母過(guò)小。 2.以構(gòu)成比代替率。 3.求幾個(gè)相對(duì)數(shù)的平均數(shù)時(shí),簡(jiǎn)單地將幾個(gè)相對(duì)數(shù)相加后除以相對(duì)數(shù)的個(gè)數(shù)。 4.忽視資料的可比性,各相對(duì)數(shù)直接相比較。 5.抽樣所得的樣本相對(duì)數(shù)有抽樣誤差,相對(duì)數(shù)間的比較應(yīng)做假設(shè)檢驗(yàn)。,,某工廠(chǎng)在《職工健康狀況報(bào)告》中寫(xiě)道:“在946名工人中,患慢性病的有274人,其中女性219人,占80
37、%;男性55人,占20%;所以女性易患慢性病”,你認(rèn)為是否正確?為什么?,,四.率的標(biāo)準(zhǔn)化法1.為什么進(jìn)行率的標(biāo)準(zhǔn)化?,,Crude incidence rate of city A=28.96 Crude incidence rate of city B=35.03,Table Incidence rates of infectious diseases, children of two cities,,2.率的標(biāo)準(zhǔn)化法的
38、基本思想采用一個(gè)共同的構(gòu)成標(biāo)準(zhǔn),消除被比較的總體或樣本各構(gòu)成部分不同對(duì)平均率的影響。,,3.率的標(biāo)準(zhǔn)化方法 直接法率的標(biāo)準(zhǔn)化方法 間接法,,,直接法:被比較的總體或樣本各構(gòu)成部分的率已知。(1)確定構(gòu)成標(biāo)準(zhǔn):三種途徑:選擇有代表性的、較穩(wěn)定的、數(shù)量較大的人群作為構(gòu)成標(biāo)準(zhǔn)(如人
39、口普查后的資料);將被比較的總體或樣本各相應(yīng)構(gòu)成部分合并;選擇其中容量大的總體或樣本作為構(gòu)成標(biāo)準(zhǔn)。,,(2)計(jì)算預(yù)期發(fā)生數(shù):N’ =∑Ni×Pi(3)計(jì)算標(biāo)準(zhǔn)化率:P’ = N’ / ∑Ni,Standardized incidence rate of city A = 793/24767 = 32.02 ‰Standardized incidence rate of city B = 523/24767 = 21
40、.12 ‰,,4.標(biāo)準(zhǔn)化時(shí)應(yīng)注意的問(wèn)題(1)標(biāo)準(zhǔn)化率已不能反映率的實(shí)際水平。(2)選定的標(biāo)準(zhǔn)不同,所得的標(biāo)準(zhǔn)化率也不 同,但結(jié)論是一致的。(3)兩樣本標(biāo)準(zhǔn)化率的比較也應(yīng)作假設(shè)檢驗(yàn)。(4)如果不計(jì)算標(biāo)準(zhǔn)化率,而分層比較率時(shí),也可得出正確結(jié)論,但不能直接比較總體率的大小。(5)注意“交叉”的問(wèn)題。,,五.醫(yī)學(xué)中常用的相對(duì)數(shù)指標(biāo),,一.頻數(shù)表二.相對(duì)數(shù) 率(r
41、ate) 構(gòu)成比(proportion) 相對(duì)數(shù) 比(ratio) 動(dòng)態(tài)數(shù)列,,,1.率(rate) π P 率是一頻度指標(biāo),用以反映某現(xiàn)象發(fā)生的頻度或強(qiáng)度。常以百分率(%)、千分率(‰)、萬(wàn)分率(1/萬(wàn))和十萬(wàn)分率(1/十萬(wàn))等表示,計(jì)算
42、公式為:,,,2.構(gòu)成比(proportion) 說(shuō)明某事物內(nèi)部各組成部分所占的比重或比例。常以百分?jǐn)?shù)表示,計(jì)算公式為:,,,3.比(ratio) 又稱(chēng)為相對(duì)比,比較兩個(gè)指標(biāo)時(shí)用以反映兩個(gè)有關(guān)指標(biāo)間數(shù)量上的比值,如A指標(biāo)是B指標(biāo)的若干倍,或A指標(biāo)是B指標(biāo)的百分之幾,通常用倍數(shù)或分?jǐn)?shù)表示。計(jì)算公式為:,,,4.動(dòng)態(tài)數(shù)列絕對(duì)增長(zhǎng)量發(fā)展速度增長(zhǎng)速度平均發(fā)展速度平均增長(zhǎng)速度,,三.應(yīng)用相對(duì)數(shù)時(shí)應(yīng)注意的事項(xiàng)1.計(jì)算相對(duì)
43、數(shù)時(shí)分母過(guò)小。 2.以構(gòu)成比代替率。 3.求幾個(gè)相對(duì)數(shù)的平均數(shù)時(shí),簡(jiǎn)單地將幾個(gè)相對(duì)數(shù)相加后除以相對(duì)數(shù)的個(gè)數(shù)。 4.忽視資料的可比性,各相對(duì)數(shù)直接相比較。 5.如數(shù)值型變量一樣,抽樣所得的樣本相對(duì)數(shù)也有抽樣誤差,因此相對(duì)數(shù)間的比較也應(yīng)做假設(shè)檢驗(yàn)。,,某工廠(chǎng)在《職工健康狀況報(bào)告》中寫(xiě)道:“在946名工人中,患慢性病的有274人,其中女性219人,占80%;男性55人,占20%;所以女性易患慢性病”,你認(rèn)為是否正確?為什么?,,四.率
44、的標(biāo)準(zhǔn)化法1.為什么進(jìn)行率的標(biāo)準(zhǔn)化?,,Crude incidence rate of city A=28.96; Crude incidence rate of city B=35.03 -- Strange!?,Table Incidence rates of infectious diseases, children of two cities,,2.率的標(biāo)準(zhǔn)化法的基本思想采用一個(gè)共同的構(gòu)成標(biāo)準(zhǔn),消除被比較的
45、總體或樣本各構(gòu)成部分不同對(duì)平均率的影響。,,3.率的標(biāo)準(zhǔn)化方法 直接法率的標(biāo)準(zhǔn)化方法 間接法,,,直接法條件:被比較的總體或樣本各構(gòu)成部分的率已知。(1)確定構(gòu)成標(biāo)準(zhǔn):三種途徑:人口普查后的資料;將被比較的總體或樣本各相應(yīng)構(gòu)成部分合并;選擇其中容量大的總體或樣本作為構(gòu)成標(biāo)準(zhǔn)。(2)計(jì)
46、算預(yù)期發(fā)生數(shù):N’ =∑Ni×Pi(3)計(jì)算標(biāo)準(zhǔn)化率:P’ = N’ / ∑Ni,Standardized incidence rate of city A = 793/24767 = 32.02 ‰Standardized incidence rate of city B = 523/24767 = 21.12 ‰,,間接法條件:被比較的總體或樣本各構(gòu)成部分的率未知。,,4.標(biāo)準(zhǔn)化時(shí)應(yīng)注意的問(wèn)題,,第四章
47、 常用概率分布,,二項(xiàng)分布(離散型隨機(jī)變量概率分布)1.二項(xiàng)實(shí)驗(yàn)(貝努里實(shí)驗(yàn) Bernoulli實(shí)驗(yàn))條件:(1)該實(shí)驗(yàn)由n次重復(fù)試驗(yàn)構(gòu)成。(2)每次試驗(yàn)只有兩個(gè)結(jié)果:一個(gè)成功,一個(gè)失敗。(3)每次試驗(yàn)成功的概率都是π,失敗的概率自然是1-π。(4)n次重復(fù)試驗(yàn)間是獨(dú)立的,即各次試驗(yàn)結(jié)果間互不影響。n重二項(xiàng)試驗(yàn)成功數(shù)(X),稱(chēng)為二項(xiàng)分布隨機(jī)變量。二項(xiàng)隨機(jī)變量(X)
48、的概率分布,稱(chēng)為二項(xiàng)分布。,,,,,2.二項(xiàng)分布概率函數(shù)X—B(x;n,π),,,例: 由經(jīng)驗(yàn)得知某藥治療某病,治愈率為0.6,未愈率為0.4,現(xiàn)用該藥治療同種病人3位,求治愈人數(shù)對(duì)應(yīng)的概率?,,3.二項(xiàng)分布的特征(1)二項(xiàng)分布的圖形特征,,,,,,,,,,,(2)二項(xiàng)分布的特征數(shù)(期望值,方差) E(X)=μ=nπ σ= ?。校剑兀痭 E(P)=μp=π σp= sp=
49、,,,,,4.二項(xiàng)分布的應(yīng)用(1)概率估計(jì)(2)單側(cè)累積概率(cumulative probability)計(jì)算最多有k例陽(yáng)性的概率 最少有k例陽(yáng)性的概率 其中,X=0,1,2,…,k,…,n。,,,,Poisson分布 Poisson分布更多地專(zhuān)用于研究單位時(shí)間、單位人群、單位空間內(nèi),某罕見(jiàn)事件發(fā)生次數(shù)的分布。Poi
50、sson分布在π很小,樣本含量n 趨向于無(wú)窮大時(shí),二項(xiàng)分布的極限形式。 Poisson分布發(fā)展成為描述小概率事件出現(xiàn)規(guī)律性的一種重要的離散型分布。,,Poisson分布主要用于描述在單位時(shí)間(空間)中稀有事件的發(fā)生數(shù)例如:1. 放射性物質(zhì)在單位時(shí)間內(nèi)的放射次數(shù);2. 在單位容積充分搖勻的水中的細(xì)菌數(shù);3. 野外單位空間中的某種昆蟲(chóng)數(shù)等。,,1.Poisson分布的概率函數(shù)X=0,1,2,3… X—P
51、(λ),,,2 .Poisson分布的特征(1) Poisson分布的圖形特征,,,,,取不同值時(shí)的Poisson分布圖,,(2) Poisson分布的特征值E(X)=λVar(X)= λσ(X)=(3) Poisson分布的可加性,,3. Poisson分布的應(yīng)用(1)概率估計(jì)(2)單側(cè)累積概率(cumulative probability)計(jì)算,,一.二項(xiàng)分布(離散型隨機(jī)變量概率分布)1.二項(xiàng)實(shí)驗(yàn)(貝努里實(shí)驗(yàn)
52、 Bernoulli實(shí)驗(yàn))條件:(1)該實(shí)驗(yàn)由n次重復(fù)試驗(yàn)構(gòu)成。(2)每次試驗(yàn)只有兩個(gè)結(jié)果:一個(gè)成功,一個(gè)失 敗。(3)每次試驗(yàn)成功的概率都是π,失敗的概率自 然是1-π。(4)n次重復(fù)試驗(yàn)間是獨(dú)立的,即各次試驗(yàn)結(jié)果間互不影響。n重試驗(yàn)成功數(shù)(X),稱(chēng)為二項(xiàng)隨機(jī)變量。二項(xiàng)隨機(jī)變量(X)的概率分布,稱(chēng)為二項(xiàng)分布。,,例: 由經(jīng)驗(yàn)得知某藥治療某病,治愈率為0.6,未治愈率為0.4,現(xiàn)用該藥治療同種
53、病人3位,求治愈人數(shù)對(duì)應(yīng)的概率?,,2.二項(xiàng)分布概率函數(shù)X—B(n,π),,,,,,3.二項(xiàng)分布的特征(1)二項(xiàng)分布的圖形特征,,,,,,,,,,,(2)二項(xiàng)分布的特征數(shù)(期望值,方差) E(X)=μ=nπ σ= P=X/n E(P)=μp=π σp= sp=,,,,,4.二項(xiàng)分布的應(yīng)用(1)概率估計(jì)(2)單側(cè)累積概率(cumulative probability)計(jì)算最多有
54、k例陽(yáng)性的概率 最少有k例陽(yáng)性的概率 其中,X=0,1,2,…,k,…,n。,,,,二.Poisson分布 Poisson分布更多地專(zhuān)用于研究單位時(shí)間、單位人群、單位空間內(nèi),某罕見(jiàn)事件發(fā)生次數(shù)的分布。Poisson分布在π很小,樣本含量n 趨向于無(wú)窮大時(shí),二項(xiàng)分布的極限形式。 Poisson分布發(fā)展成為描述小概率事件出現(xiàn)規(guī)律性
55、的一種重要的離散型分布。,,Poisson分布主要用于描述在單位時(shí)間(空間)中稀有事件的發(fā)生數(shù)例如:1. 放射性物質(zhì)在單位時(shí)間內(nèi)的放射次數(shù);2. 在單位容積充分搖勻的水中的細(xì)菌數(shù);3. 野外單位空間中的某種昆蟲(chóng)數(shù)等。,,1.Poisson分布的概率函數(shù)X=0,1,2,3…,,,2 .Poisson分布的特征(1) Poisson分布的圖形特征,,,,,取不同值時(shí)的Poisson分布圖,,(2) Poisson分
56、布的特征值E(X)=λVar(X)= λσ(X)=(3) Poisson分布的可加性,,3. Poisson分布的應(yīng)用(1)概率估計(jì)(2)單側(cè)累積概率(cumulative probability)計(jì)算,,正態(tài)分布 (normal distribution),,(Carl Friedrich Gauss, 1777~1855),,一.正態(tài)分布對(duì)應(yīng)的幾何圖形。,,,,,鐘型曲線(xiàn)對(duì)應(yīng)的f(x)---正態(tài)分布概率密度函數(shù)
57、 定義域: -∞<x<∞,,,二.正態(tài)分布的特征: 1.正態(tài)分布曲線(xiàn)(normal curve)在橫軸上方,且均數(shù)處最高。(非負(fù)性),,,y,0,x,·,,2. 正態(tài)分布以均數(shù)為中心,左右對(duì)稱(chēng)。 (對(duì)稱(chēng)性),,x,0,y,·,,3.正態(tài)分布有兩個(gè)參數(shù),即均數(shù)和標(biāo)準(zhǔn)差。 是位置參數(shù) 是形狀參數(shù)
58、通常用 表示正態(tài)分布。,,,,,,4.正態(tài)分布曲線(xiàn)下面積分布有規(guī)律。,,,y,0,x,x1,x2,·,·,,三.正態(tài)分布曲線(xiàn)下面積分布規(guī)律。正態(tài)分布曲線(xiàn)與橫軸上任一區(qū)間圍成的面積可通過(guò)函數(shù)積分來(lái)得到。,,正態(tài)分布 標(biāo)準(zhǔn)正態(tài)分布u被稱(chēng)為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)離差。 u 服從總體均數(shù)為0、總體標(biāo)準(zhǔn)差為1的正態(tài)分布,我們將此分布稱(chēng)為標(biāo)準(zhǔn)正態(tài)分布。
59、用N(0,1)表示。,,,,,,,標(biāo)準(zhǔn)正態(tài)分布曲線(xiàn)下面積規(guī)律:1.整個(gè)曲線(xiàn)下面積為1。2.u:[-1.96,1.96]與標(biāo)準(zhǔn)正態(tài)分布曲線(xiàn)圍成的面積為: 0.95或95%。 3.u:[-2.58,2.58]與標(biāo)準(zhǔn)正態(tài)分布曲線(xiàn)圍成的面積為:0.99或99%。,,,,,,四.正態(tài)分布的應(yīng)用1.估計(jì)正態(tài)分布資料的頻數(shù)分布某地1993年抽樣調(diào)查了100名18歲男大學(xué)生身高(cm),其均數(shù)=172.7
60、0cm,標(biāo)準(zhǔn)差s=4.01cm,實(shí)際分布與理論分布的比較。 100名18歲男大學(xué)生身高的實(shí)際分布與理論分布,,,,,,2.制定醫(yī)學(xué)參考值范圍:亦稱(chēng)醫(yī)學(xué)正常值范圍(1)首先要確定一批樣本含量足夠大的“正常人”,所謂 “正常人”不是指“健康人”,而是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群; (2)其次需根據(jù)研究目的和使用要求選定適當(dāng)?shù)陌俜纸缰担?0%,9
61、0%,95%和99%,常用95%; (3)根據(jù)指標(biāo)的實(shí)際用途確定單側(cè)或雙側(cè)界值;,,(4)根據(jù)資料的分布特點(diǎn),選用恰當(dāng)?shù)挠?jì)算方法。正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布的資料。 對(duì)數(shù)正態(tài)分布法:適用于對(duì)數(shù)正態(tài)分布資料。百分位數(shù)法:常用于偏態(tài)分布資料以及資料中一端或兩端無(wú)確切數(shù)值的資料。,,,3.質(zhì)量控制圖4.二項(xiàng)分布、Poisson分布的正態(tài)分布的逼近(1)二項(xiàng)分布的正態(tài)逼近 nπ,n(1-π)≥5(2) Po
62、isson分布的正態(tài)逼近 λ≥20,,第五章 參數(shù)估計(jì)基礎(chǔ),,一.總體均數(shù)的估計(jì)1.均數(shù)的抽樣誤差抽樣誤差:由于個(gè)體變異的存在,在隨機(jī)抽樣的過(guò)程中,出現(xiàn)的統(tǒng)計(jì)量與參數(shù)、統(tǒng)計(jì)量間的差異稱(chēng)為抽樣誤差。,,由于個(gè)體變異的存在,在抽樣研究中產(chǎn)生的樣本均數(shù)與相應(yīng)的總體均數(shù)間的差異,樣本均數(shù)與樣本均數(shù)間的差異稱(chēng)為均數(shù)抽樣誤差(sampling error)。均數(shù)的抽樣誤差是不可避免的,但均數(shù)的抽樣誤
63、差是可控制的。,,2.衡量均數(shù)的抽樣誤差大小的指標(biāo)------標(biāo)準(zhǔn)誤樣本均數(shù)的標(biāo)準(zhǔn)差----均數(shù)的標(biāo)準(zhǔn)誤,,,抽樣試驗(yàn),,從正態(tài)分布總體N(5.00,0.502)中,每次隨機(jī)抽取樣本含量n=5,并計(jì)算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取1000次,獲得1000份樣本;計(jì)算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對(duì)1000份樣本的均數(shù)作直方圖。 按上述方法再做樣本含量n=10、樣本含量n=30的抽樣實(shí)驗(yàn);比較計(jì)算結(jié)果。,抽樣試驗(yàn)(n=5),,抽
64、樣試驗(yàn)(n=10),,抽樣試驗(yàn)(n=30),,,,均數(shù)標(biāo)準(zhǔn)誤的用途:(1)衡量樣本均數(shù)的可靠性 由于均數(shù)標(biāo)準(zhǔn)誤越小,均數(shù) 的抽樣誤差越小,樣本均數(shù)就越可靠。(2)估計(jì)總體均數(shù)的可信區(qū)間。(3)用于均數(shù)的假設(shè)檢驗(yàn)。,,3. t分布統(tǒng)計(jì)量t 值的分布稱(chēng)為t分布。統(tǒng)計(jì)量t 值?t=,,隨機(jī)變量XN(m,s2),標(biāo)準(zhǔn)正態(tài)分布N(0,12),,Z變換,均數(shù),標(biāo)準(zhǔn)正態(tài)分布N(0,12),,Student t分布
65、自由度:n-1,,,t分布有如下特征:(1)以0為中心,左右對(duì)稱(chēng)的單峰分布;(2)t分布是一簇曲線(xiàn),其形態(tài)變化與n(確切地說(shuō)與自由度υ)大小有關(guān)。自由度υ越小,t分布曲線(xiàn)越低平;自由度υ越大,t分布曲線(xiàn)越接近標(biāo)準(zhǔn)正態(tài)分布(u分布)曲線(xiàn)。,,自由度為1、5、∞的t分布,,,t界值表,,,,υ=9的t分布圖,,4.總體均數(shù)的估計(jì) μ? 點(diǎn)估計(jì)(point estimation) 方法:
66、 區(qū)間估計(jì)(interval estimation),,,點(diǎn)估計(jì)(point estimation) μ=,,區(qū)間估計(jì)(interval estimation)按一定的概率(可信度)估計(jì)未知的總體參數(shù)可能所在的范圍(或稱(chēng)可信區(qū)間)??尚哦龋?5%(或99%)。以求總體均數(shù)的95%可信區(qū)間為例,介紹其計(jì)算方法。,,(1)σ已知時(shí) u分布法由u分布可知
67、,正態(tài)曲線(xiàn)下有95%的u值在±1.96之間,即:P(-1.96≤u≤+1.96)=0.95P(-1.96≤ ≤+1.96)=0.95移項(xiàng)后整理得,故總體均數(shù)μ的95%可信區(qū)間為: ( ),,,,(2)σ未知,但n足夠大(如n>100)時(shí), u分布法。由t分布可知,
68、當(dāng)自由度越大,t分布越逼近u分布,此時(shí)t曲線(xiàn)下有95%的t值在±1.96之間,即:P(-1.96≤t≤+1.96)=0.95P(-1.96≤ ≤+1.96)=0.95 P( ≤ ≤ )=0.95 故總體均數(shù)μ的95%可信區(qū)間為: (
69、 , ),,,,,,,,(3)σ未知且n小時(shí),t分布法。 某自由度的t曲線(xiàn)下有95%的t值在± 之間,即: 故總體均數(shù)μ的95%可信區(qū)間為 (
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 衛(wèi)生統(tǒng)計(jì)學(xué)衛(wèi)生統(tǒng)計(jì)學(xué) (35)
- 衛(wèi)生統(tǒng)計(jì)學(xué)衛(wèi)生統(tǒng)計(jì)學(xué) (10)
- 衛(wèi)生統(tǒng)計(jì)學(xué)衛(wèi)生統(tǒng)計(jì)學(xué) (37)
- 衛(wèi)生統(tǒng)計(jì)學(xué)
- 衛(wèi)生統(tǒng)計(jì)學(xué)
- 衛(wèi)生統(tǒng)計(jì)學(xué)
- 衛(wèi)生統(tǒng)計(jì)學(xué) 醫(yī)學(xué)統(tǒng)計(jì)學(xué) 習(xí)題
- 衛(wèi)生統(tǒng)計(jì)學(xué)題庫(kù)
- 衛(wèi)生統(tǒng)計(jì)學(xué)課件
- 衛(wèi)生統(tǒng)計(jì)學(xué)題庫(kù)
- 衛(wèi)生統(tǒng)計(jì)學(xué)題庫(kù)
- 衛(wèi)生統(tǒng)計(jì)學(xué)復(fù)習(xí)20161225
- 實(shí)用衛(wèi)生統(tǒng)計(jì)學(xué)作業(yè)
- 衛(wèi)生統(tǒng)計(jì)學(xué)課程簡(jiǎn)介
- 衛(wèi)生統(tǒng)計(jì)學(xué)潘海燕衛(wèi)生統(tǒng)計(jì)學(xué)第章卡方檢驗(yàn)
- 衛(wèi)生統(tǒng)計(jì)學(xué)答案三
- 衛(wèi)生統(tǒng)計(jì)學(xué)作業(yè)答案
- 衛(wèi)生統(tǒng)計(jì)學(xué)重點(diǎn)筆記
- 流行病與衛(wèi)生統(tǒng)計(jì)學(xué)考研流行病與衛(wèi)生統(tǒng)計(jì)學(xué)考研院校考研專(zhuān)業(yè)信息
- 《衛(wèi)生統(tǒng)計(jì)學(xué)》練習(xí)題
評(píng)論
0/150
提交評(píng)論