第5章-概率分布-醫(yī)學(xué)統(tǒng)計學(xué)_第1頁
已閱讀1頁,還剩74頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、醫(yī)學(xué)統(tǒng)計學(xué),余小金xiaojinyu@seu.edu.cn東南大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計學(xué)教研室,內(nèi)容復(fù)習(xí),基本概念研究設(shè)計基礎(chǔ)統(tǒng)計描述,2,,,3,基本概念匯總,總體個體、個體變異,總體參數(shù)未知,樣本代表性、抽樣誤差,,隨機(jī)抽樣,樣本統(tǒng)計量已知,,,,統(tǒng)計推斷,風(fēng) 險,研究設(shè)計基礎(chǔ),抽樣研究的科學(xué)性如何保障抽樣研究的合理性?隨機(jī)原則(randomization)重復(fù)原則 (replication)比較

2、原則( contrast),4,,統(tǒng)計學(xué)分支,統(tǒng)計描述 statistical description統(tǒng)計推斷 statistical inference,5,,統(tǒng)計描述,圖表方法指標(biāo)方法,6,,5 常用概率分布,你想怎樣?,中國成年男子的身高范圍? 中國成年男子的平均身高? 哪個范圍的可能性最大? 哪個范圍的可能性最小?,8,,9,主要內(nèi)容(Contents),5.0 隨機(jī)變量的概率分布5.1 正態(tài)分布5.2

3、 二項分布5.3 Poisson分布,,,10,隨機(jī)變量,假如一個變量的取值依賴于隨機(jī)現(xiàn)象的基本結(jié)果,則稱此變量為隨機(jī)變量,用大寫字母表示,其取值用小寫字母表示.相對頻率說明了具有某個性質(zhì)的觀察對象的出現(xiàn)的可能性。隨機(jī)變量的類型離散型:性別、血型、子女?dāng)?shù)、事故數(shù)、菌落數(shù)連續(xù)型:身高、體重,,5.1 正態(tài)分布,正態(tài)分布的特征標(biāo)準(zhǔn)正態(tài)分布正態(tài)分布曲線下面積的規(guī)律正態(tài)分布的應(yīng)用,11,,12,例:密度函數(shù)和分布函數(shù),拋兩枚硬

4、幣,,,,密度函數(shù),,,分布函數(shù),,13,例:密度函數(shù)和分布函數(shù),,,,14,隨機(jī)變量的概率分布,概率函數(shù)(Probability Function),或者說概率密度函數(shù)(Probability Density Function) 、密度函數(shù)。在統(tǒng)計學(xué)中,分布函數(shù)(Distribution Function)。說明變量取某些值的可能性。當(dāng)變量的取值包括了所有可能的取值時,分布函數(shù)為1。密度函數(shù)和分布函數(shù)構(gòu)成某種分布(Distrib

5、ution),,,15,正態(tài)分布的概念及圖形,,16,正態(tài)分布的概念及圖形,Normal distributionGauss發(fā)現(xiàn)最早用于物理學(xué)、天文學(xué)Gaussian distribution,,17,正態(tài)分布的概率密度函數(shù),如果隨機(jī)變量X的概率密度函數(shù) 則稱X服從正態(tài)分布,記作X~N(?,?2),其中, ?為分布的均數(shù), ? 為分布的標(biāo)準(zhǔn)差。,,(-∞< X <+∞),,18,正態(tài)分布圖示,,,x,,,,

6、,,,,,,0,,.1,,.2,,.3,,.4,,,,,f(x),,19,方差相等、均數(shù)不等的正態(tài)分布圖示,,,,20,均數(shù)相等、方差不等的正態(tài)分布圖示,,,,?,?1,,,21,正態(tài)分布的特征,單峰分布且峰在均數(shù)處;以均數(shù)為中心,均數(shù)兩側(cè)完全對稱。正態(tài)分布有兩個參數(shù)(parameter),即位置參數(shù)(均數(shù))和變異度參數(shù)(標(biāo)準(zhǔn)差)。有些指標(biāo)服從正態(tài)分布; 有些指標(biāo)本身不服從正態(tài)分布,但經(jīng)過數(shù)值變換之后服從正態(tài)分布。正態(tài)曲線下的面

7、積分布有一定的規(guī)律。,,,22,標(biāo)準(zhǔn)正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution)是均數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布。記為N(0,1)。標(biāo)準(zhǔn)正態(tài)分布是一條曲線。概率密度函數(shù):,,,,,(-∞< u <+∞),,23,圖5.4 一般正態(tài)分布變換成標(biāo)準(zhǔn)正態(tài)分布示意圖,,24,正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布,若 X~N(?,?2),作變換: 則Z服從標(biāo)準(zhǔn)正態(tài)分布。Z稱為標(biāo)準(zhǔn)正態(tài)離差(sta

8、ndard normal deviation),,25,標(biāo)準(zhǔn)正態(tài)分布曲線下面積?(Z),Z 0.00 0.02 0.04 0.06 0.08-3.00.0013 0.0013 0.0012 0.0011 0.0010-2.50.0062 0.0059 0.0055 0.0052 0.0049-2.00.0228 0.0217 0.0207 0.0197 0.

9、0188-1.90.0287 0.0274 0.0262 0.0250 0.0239-1.60.0548 0.0526 0.0505 0.0485 0.0465-1.00.1587 0.1539 0.1492 0.1446 0.1401-0.50.3085 0.3015 0.2946 0.2877 0.2810 00.5000 0.4920 0.4840 0.4761

10、 0.4681,,0,Z,,26,,,正態(tài)曲線下的面積規(guī)律,X軸與正態(tài)曲線所夾面積恒等于1 。對稱區(qū)域面積相等。,,,,,,,,S(-?, ? -X),S(? +X,?)=S(-?, ? -X),?,,27,,,正態(tài)曲線下的面積規(guī)律,對稱區(qū)域面積相等。,,,,S(? -x1, ? -x2),,?-x1 ?-x2 ?+x2 ?+ x1,S(? -x1, ? -x2)= S(? +x1, ? +x2),?,,28,,,,,,

11、,,,正態(tài)曲線下的面積規(guī)律,-4 -3 -2 -1 0 1 2 3 4,?-3? ?-2? ?-? ? ?+? ?+2? ?+3?,S(-?, ?-3?)=0.0013,S(-?, ?-2?)=0.0228,S(-?, ?-1?)=0.1587,S(-?, ?)=0.5,S(-?,

12、?+3?)=0.9987,S(-?, ?+2?)=0.9772,S(-?, ?+1?)=0.8413,S(-?, ?)=1,,29,正態(tài)曲線下的面積規(guī)律,-4 -3 -2 -1 0 1 2 3 4,?-3? ?-2? ?-? ? ?+? ?+2? ?+3?,1-S(?-3? , ?+

13、3?)=0.0026,1-S(?-2? , ?+2?)=0.0456,1-S(?-? , ?+?)=0.3174,,30,,,,,,,,,正態(tài)曲線下的面積規(guī)律,-4 -3 -2 -1 0 1 2 3 4,?-3? ?-2? ?-? ? ?+? ?+2? ?+3?,S(-?, ?-3?)=0.0013,S(-?, ?-2?)=

14、0.0228,S(-?, ?-1?)=0.1587,S(-?, ?)=0.5,S(-?, ?+3?)=0.9987,S(-?, ?+2?)=0.9772,S(-?, ?+1?)=0.8413,S(-?, ?)=1,,31,正態(tài)曲線下的面積規(guī)律,正態(tài)分布的一個顯著特點(diǎn) 曲線下面積完全決定于以標(biāo)準(zhǔn)差為單位從點(diǎn)x到µ的離差。,,32,,,?,,?1,,,,,33,正態(tài)曲線下的面積規(guī)律,例5.1 求標(biāo)準(zhǔn)正態(tài)分布曲

15、線下區(qū)間(-∞,1.96)的面積,(1) 先求區(qū)間(-∞,-1.96)的面積,查附表1 ,得標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間(-∞,-1.96)的面積是0.0250,(2) 區(qū)間(-∞,1.96)的面積為1-(1.96,∞)的面積,即1-0.025=0.975,,34,例5.2 求標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間(-∞,-2.58)的面積與區(qū)間(2.58,∞)的面積,(-∞,-2.58)的面積是0.0049,約為0.5%。區(qū)間(2.58,∞)的面積亦

16、為0.5%,正態(tài)曲線下的面積規(guī)律,,35,例5.3 求標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間(-1,1)的面積,區(qū)間(-1,1)的面積 =1-2×(-∞,-1)的面積 =1-2×0.1587 =0.6826,正態(tài)曲線下的面積規(guī)律,,36,例5.4 求正態(tài)分布N(119.41,4.382)曲線下區(qū)間(110.

17、83,127.99)內(nèi)的面積,⑴ 先用求對應(yīng)的u值,uL = (110.83-119.41)/4.38 = -1.96 uU = (127.99-119.41)/4.38 = 1.96,⑵查u界值表,得面積,(-1.96,1.96)的面積 = 1-2×標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間(-∞,1.96)的面積 =1-2×0.025

18、 =0.95,常用正態(tài)曲線下的面積規(guī)律,37,,,常用正態(tài)曲線下的面積規(guī)律,,,?-1.96?,?+1.96?,2.5%,2.5%,,,95%,,38,,,常用正態(tài)曲線下的面積規(guī)律,,,39,,,常用正態(tài)曲線下的面積規(guī)律,?-2.58?,?+2.58?,0.5%,0.5%,,,99%,,,,40,正態(tài)曲線下的面積規(guī)律,正態(tài)曲線下面積總和為1;正態(tài)曲線關(guān)于均數(shù)對稱;對稱的區(qū)域內(nèi)面積相等;對任意正態(tài)曲線

19、,按標(biāo)準(zhǔn)差為單位,對應(yīng)的面積相等; ?-1.64?~ ?+1.64?內(nèi)面積為90%;?-1.96?~ ?+1.96?內(nèi)面積為95%;?-2.58?~ ?+2.58?內(nèi)面積為99%。,,,41,5.1.4 正態(tài)分布的應(yīng)用,正態(tài)分布是許多統(tǒng)計方法的理論基礎(chǔ)估計頻數(shù)分布( frequency distribution) (自學(xué))確定臨床參考值范圍(reference interval) (自學(xué)),,,42,作 業(yè),閱讀內(nèi)容:(

20、P51-54) 查閱文獻(xiàn),介紹某項參考值范圍(reference interval)的制定過程(最新進(jìn)展) 每人準(zhǔn)備5-10張ppt (中英文均可), 我會給你10-20分鐘時間.,,,5.2 二項分布,二項生或死,這是個問題生男生女一個樣硬幣的正面和反面陰陽隔昏曉,43,,什么樣的結(jié)局用二項分布來描述?,1. 對立的結(jié)果2. 觀察單位的結(jié)果獨(dú)立3. 發(fā)生某一結(jié)果的總體概率不變,44,,伯努利試驗(Bernoulli

21、trial)是只有兩種可能結(jié)果的單次隨機(jī)試驗,即對于一個隨機(jī)變量X而言, Pr(x=1)=p,Pr(x=0)=1-p .,5.2 主要內(nèi)容,5.2.1 二項分布的概率及定義5.2.2 二項分布的性質(zhì)5.2.3 二項分布的應(yīng)用條件,45,,5.2.1 二項分布的概念,,,,,三只小白鼠存亡的排列和組合方式及其概率的計算,46,,二項分布的概率,設(shè)事件A出現(xiàn)的概率為?。則在n次獨(dú)立試驗中,事件A恰好出現(xiàn) k 次的概率為:對應(yīng)于

22、二項展開式:,47,二項展開,( 0.2 +0.8 )3 = 0.23 + 3×0.22×0.8 + 3×0.2×0.82 + 0.83,,,,,,,48,,累計概率,P(X≤k) = P(X=0)+P(X=1)+…+P(X=k)  P(X≥k) = P(X=k)+P(X=k+1)+…+P(X=n) P(X≤k) = 1- P(X≥k+1),49,,5.2.2 二項

23、分布的性質(zhì),如果X~B(n,p),則:X的均數(shù):X的方差:X的標(biāo)準(zhǔn)差:,50,,二項分布的圖形,,X,,51,,二項分布的應(yīng)用條件,各觀察單位的觀察結(jié)果只能是相互對立的兩種結(jié)果之一;某事件出現(xiàn)的概率不變;n次試驗條件相同, n個觀察對象同質(zhì),且相互之間不影響(例如,無傳染性、聚集性等)。,52,,二項分布的應(yīng)用,53,計算二項結(jié)局事件的概率質(zhì)量控制疾病的家族聚集性,二項分布與伯努利分布,伯努利分布(

24、the Bernoulli distribution,又名兩點(diǎn)分布或者0-1分布,是一個離散型概率分布,為紀(jì)念瑞士科學(xué)家雅各布·伯努利而命名。)若伯努利試驗成功,則伯努利隨機(jī)變量取值為1。若伯努利試驗失敗,則伯努利隨機(jī)變量取值為0。記其成功概率為批p,失敗概率為1-p。,54,5.3 Poisson 分布,Life is good for only two things: to study mathematics

25、and to teach it.,Siméon Denis Poisson1781~1840,55,何種結(jié)局需要poisson分布?,二項分布的極限分布不同地區(qū)的某慢性病比例數(shù)單位時間放射源釋放的原子數(shù)細(xì)菌培養(yǎng)中單位面積的菌落數(shù)單位時間你接到的電話或信息足球比賽的進(jìn)球數(shù),,56,5.3 主要內(nèi)容,Poisson分布的定義Poisson分布的性質(zhì)Poisson分布的應(yīng)用,57,,1 Poisson分布的概率,如果

26、一個隨機(jī)變量X的取值為0,1,2,…,且:則稱X服從參數(shù)為 ? 的Poisson分布。記為 X ~ Poisson(?)。,58,,累計概率,P(X≤k) = P(X=0)+P(X=1)+…+P(X=k)  P(X≥k) = P(X=k)+P(X=k+1)+… P(X≥k) = 1- P(X< k),59,,Poisson分布例1,單位容積內(nèi)細(xì)菌數(shù)服從Poisson分布。?=2.49。,60,,Poisson分布

27、的遞推公式,,,61,,單位容積內(nèi)細(xì)菌數(shù)的分布,62,,Poisson分布例2,2002年韓日世界杯64場比賽中,各隊進(jìn)球數(shù)有多有少。大部分是0,1,2個進(jìn)球,個別隊是5個以上進(jìn)球,最多的是8個進(jìn)球,平均是1.2578個/場/隊。雖然強(qiáng)隊大都能進(jìn)球、贏球(如巴西隊),弱隊大都不能進(jìn)球(如中國隊)。但宏觀上來說,各隊進(jìn)球數(shù)服從Poisson分布!,63,,平均計數(shù)為1.2578的Poisson分布,每場各隊進(jìn)球數(shù)  場次 理論數(shù)

28、03736.3914745.7722728.7831312.074 2 3.795 1 0.95 ≥6 1 0.25 128128.00,64,,2.1 Poisson分布的均數(shù)和方差,如果X~Poisson(?),則:X的均數(shù):X的方差:X的標(biāo)準(zhǔn)差:,6

29、5,,Poisson分布的兩個實例的均數(shù)和標(biāo)準(zhǔn)差,例1資料的均數(shù)和方差:   均數(shù)=2.490, 方差=2.257例2資料的均數(shù)和方差:   均數(shù)=1.2578, 方差=1.2247,66,,2.2 Poisson分布的圖形,,,67,,Poisson分布中均數(shù)的  抽樣分布及其性質(zhì),在?足夠大時,Poisson分布的平均計數(shù)近似正態(tài)分布。平均計數(shù)的標(biāo)準(zhǔn)誤n=1時(1個單位),,68,,Poisso

30、n分布的可加性,如果X1服從Poisson(?1),    X2服從Poisson(?2), 則X1+X2服從Poisson(?1+ ?2)?!〖?,Poisson分布具有可加性。,69,Poisson分布的應(yīng)用條件(1),主要用于研究單位時間、單位空間內(nèi)某事件的發(fā)生數(shù),理論上X可為無窮大。平穩(wěn)性:X與觀察單位的位置、狀態(tài)無關(guān);獨(dú)立性:無傳染性、聚集性的事件。普遍性:在充分小的觀察單位中,X最多只發(fā)生1次。,70,Poi

31、sson分布的應(yīng)用條件(2),單位人群: 人數(shù)要求多。比如以500人,1000人或更多人作為單位人群,發(fā)病率越低,要求單位人群的人數(shù)越多。分析中特別注意:觀察單位數(shù)!,71,,二項分布、Poisson分布、正態(tài)分布間的關(guān)系,n?較大時,二項分布B(n,?)中樣本率的分布近似正態(tài)分布;? 較大時,Poisson分布中平均計數(shù)近似正態(tài)分布;Xi~B(ni,?i),若C=ni?i不變,則ni? ?時,  二項分布近似Poiss

32、on分布,72,,73,總 結(jié),正態(tài)分布是描述個體變異的重要分布之一,也是統(tǒng)計學(xué)理論中的重要分布之一;正態(tài)分布是由兩個參數(shù)決定:均數(shù)和標(biāo)準(zhǔn)差;正態(tài)分布曲線下的面積是有規(guī)律的,且與標(biāo)準(zhǔn)正態(tài)分布曲線下的面積對應(yīng)(以標(biāo)準(zhǔn)正態(tài)離差為單位)。,總結(jié),二項分布是描述分類變量最常用的分布;Poisson分布可以看作說觀察單位大,總體概率小時二項分布的極限分布一定條件下,二者均可近似正態(tài)分布,,74,75,Thank you for you

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論