2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩58頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、常用概率分布,第一節(jié) 二項(xiàng)分布,一、二項(xiàng)分布的概念與特征(一)摸球模型與二項(xiàng)分布 一個袋子里有5個乒乓球,其中2個黃球,3個白球,我們進(jìn)行摸球游戲,每一次摸到黃球的概率是0.4,摸到白球的概率是0.6,這個實(shí)驗(yàn)有三個特點(diǎn):一是各次摸球是彼此獨(dú)立的;二是每次摸球只有二種可能的結(jié)果,或黃球或白球;三是每次摸到黃球(或摸到白球)的概率是固定的。具備這三點(diǎn), n次中有X次摸到黃球(或白球)的概率分布就是二項(xiàng)分布。,例

2、題,例5-1:用針灸治療頭痛,假定結(jié)果不是有效就是無效,每一例有效的概率為π。某醫(yī)生用此方法治療頭痛患者5例,3例有效的概率是多少? 因?yàn)槊坷行У母怕氏嗤腋骼闹委熃Y(jié)果彼此獨(dú)立,5例患者中可以是其中的任意3例有效。,概念: 醫(yī)學(xué)研究中很多現(xiàn)象觀察結(jié)果是以兩分類變量來表示的,如陽性與陰性、治愈與未愈、生存與死亡等等。如果每個觀察對象陽性結(jié)果的發(fā)生概率均為?,陰性結(jié)果

3、的發(fā)生概率均為(1-?);而且各個觀察對象的結(jié)果是相互獨(dú)立的,那么,重復(fù)觀察n個人,發(fā)生陽性結(jié)果的人次數(shù)X的概率分布為二項(xiàng)分布,記作B(X;n,π)。,二項(xiàng)分布應(yīng)用的先決條件: (1)一個實(shí)驗(yàn)有兩種對立的可能結(jié)果,如“陽性”與“陰性” ; (2)n次獨(dú)立的實(shí)驗(yàn); (3)產(chǎn)生一種結(jié)果(如陽性)的概率不變; (4)求在n次實(shí)驗(yàn)中有X陽性的概率.,(二)二項(xiàng)分布的概率

4、函數(shù),二項(xiàng)分布的概率函數(shù)P(X)可用公式(5-1)來計(jì)算。,例 題,例5-2:臨床上用針灸治療某型頭痛,有效的概率為60%,現(xiàn)以該法治療3例,其中兩例有效的概率是多大?,表5-1 治療3例可能的有效例數(shù)及其概率,,由表4-1可知,各種可能結(jié)果出現(xiàn)的概率合計(jì)為1,即?P(X)=1(X=0,1,…,n)。因此,如果欲求1例以上有效的概率可以是:P(x≥1)=P(1)+P(2)+P(3)=0.288+0.432+0.216=0.93

5、6也可以是P(x≥1)=1-P(0)=1-0.064=0.936,(三)二項(xiàng)分布的特征,1、二項(xiàng)分布的圖形特征 ?接近0.5時,圖形是對稱的,如圖4-1。 ?離0.5愈遠(yuǎn),對稱性愈差,但隨著n的增大,分布趨于對稱,如圖4-2 。 當(dāng)n→∞時,只要?不太靠近0或1, 當(dāng)nP和n(1-P)都大于5時,二項(xiàng)分布近似于正態(tài)分布。 二項(xiàng)分布圖形取決于?與n,高峰?=n?處。,圖5

6、-1 π=0.5時,不同n值對應(yīng)的二項(xiàng)分布,,,圖5-2 π=0.3時,不同n值對應(yīng)的二項(xiàng)分布,,,,,2、二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差,總體均數(shù):,方差:,標(biāo)準(zhǔn)差:,如果將出現(xiàn)陽性結(jié)果的頻率記為:P的總體均數(shù):P的總體標(biāo)準(zhǔn)差:,例 題,例5-4 研究者隨機(jī)抽查某地150人,其中有10人感染了鉤蟲,鉤蟲感染率為6.7%,求此率的抽樣誤差。,二、二項(xiàng)分布的應(yīng)用,(一)概率估計(jì)例5-5  如果某地鉤蟲感染率為13%,

7、隨機(jī)觀察當(dāng)?shù)?50人,其中有10人感染鉤蟲的概率有多大? 從n=150,π=0.13的二項(xiàng)分布,由公式(5-1)和(5-2)可以得出150人中有10人感染鉤蟲的概率為:,(二)單側(cè)累積概率計(jì)算 二項(xiàng)分布出現(xiàn)陽性的次數(shù)至多為k次的概率為: 出現(xiàn)陽性的次數(shù)至少為k次的概率為:,例 題,例5-6 例4-5中某地鉤蟲感染率為13%,隨機(jī)抽查當(dāng)?shù)?50人,其中至多有2名感染鉤蟲的概率有多大?至少有2名感染

8、鉤蟲的概率有多大?至少有20名感染鉤蟲的概率有多大?,根據(jù)公式(5-10)至多有2名感染鉤蟲的概率為:至少有2名感染鉤蟲的概率為:,至少有20名感染鉤蟲的概率為:,第二節(jié) Poisson分布,一、Poisson分布的概念 Poisson分布也是一種離散型分布,用以描述罕見事件發(fā)生次數(shù)的概率分布。常用于研究單位時間內(nèi)(或單位空間內(nèi))某事件發(fā)生不同次數(shù)的分布。醫(yī)學(xué)上人群中出生缺陷、多胞胎、染色體異常等事件等都是罕見的

9、,可能發(fā)生這些事件的觀察例數(shù)n常常很大 ,但實(shí)際上發(fā)生類似事件的數(shù)目卻很小很小。 Poisson分布可以看作是發(fā)生的概率?(或未發(fā)生的概率1-?)很小,而觀察例數(shù)n很大時的二項(xiàng)分布。除二項(xiàng)分布的三個基本條以外,Poisson分布還要求?或(1-?)接近于0或1(例如0.999)。,二、Poisson分布的特征,Poisson分布的概率函數(shù)為: 式中 為Poisson分布的總

10、體均數(shù),X為觀察單位內(nèi)某稀有事件的發(fā)生次數(shù);e為自然對數(shù)的底,為常數(shù),約等于2.71828。,由圖5-3可以看到Poisson分布當(dāng)總體均數(shù)λ值小于5時為偏峰,λ愈小分布愈偏,隨著λ增大,分布趨向?qū)ΨQ。Poisson分布有以下特性:(1)Poisson分布的總體均數(shù)與總體方差相等,均為λ。 (2)Poisson分布的觀察結(jié)果有可加性。 當(dāng)λ增大時, Poisson分布逐漸逼近正態(tài)分布。一般來說λ≥20時, Poiss

11、on分布的資料可按正態(tài)分布處理。 當(dāng)n很大,p很小,np=λ為一常數(shù)時,二項(xiàng)分布近似Poisson分布,p越小,近似程度越好。,Poisson分布圖,,,圖5-3 λ取不同值時的Poisson分布圖,(一)概率估計(jì) 例5-7 實(shí)驗(yàn)顯示某100cm2的培養(yǎng)皿平均菌落數(shù)為6個,試估計(jì)該培養(yǎng)皿菌落數(shù)等于3個的概率。 該培養(yǎng)皿菌落數(shù)等于3個的概率:,三、Poisson分布的應(yīng)用,例5-8 如果某地居民腦

12、血管疾病的患病率為150/10萬,那么調(diào)查該地1000名居民中有2人患腦血管疾病的概率有多大? λ=n?=1000×0.0015=1.5 即調(diào)查該地1000名居民中有2人患腦血管疾病的概率為25.1%。,例5-9 實(shí)驗(yàn)顯示某100cm2的培養(yǎng)皿平均菌落數(shù)為6個,試估計(jì)該培養(yǎng)皿菌落數(shù)等于3個的概率。 該培養(yǎng)皿菌落數(shù)小于3個的概率:,(二)單側(cè)累計(jì)概率計(jì)算

13、 如果稀有事件發(fā)生次數(shù)的總體均數(shù)為λ,那么該稀有事件發(fā)生次數(shù)至多為k次的概率 發(fā)生次數(shù)至少為k次的概率:,例5-9 實(shí)驗(yàn)顯示某100cm2的培養(yǎng)皿平均菌落數(shù)為6個,試估計(jì)該培養(yǎng)皿菌落數(shù)小于3個的概率,大于1個的概率。 該培養(yǎng)皿菌落數(shù)小于3個的概率: 菌落數(shù)大于1個的概率為:,例 題,例5-10 例5-8中,至多有2人患腦血管疾病的概率有多大?至少有3人患腦血管疾病的概率有多大? 至多有

14、2人患腦血管疾病的概率: 至少有3人患腦血管疾病的概率:,第三節(jié) 正態(tài)分布,一、正態(tài)分布的概念 正態(tài)曲線(normal curve)是一條高峰位于中央,兩側(cè)逐漸下降并完全對稱,曲線兩端永遠(yuǎn)不與橫軸相交的“鐘型”曲線,該曲線表現(xiàn)為中間高,兩邊低,左右對稱。因?yàn)轭l率的總和等于1,故橫軸上曲線下的面積等于1。 正態(tài)分布是一種重要的連續(xù)型分布。醫(yī)學(xué)研究中許多正常人生理、生化指標(biāo)變量的分布呈正態(tài)或近似

15、正態(tài)分布。正態(tài)分布是數(shù)理統(tǒng)計(jì)中發(fā)展得最為完善的一種分布,很多統(tǒng)計(jì)推斷都是在正態(tài)分布條件下進(jìn)行的。許多非正態(tài)分布的資料,當(dāng)觀察例數(shù)足夠多時,也可以用正態(tài)分布作為它的極限分布形式。有時也將一些非正態(tài)分布資料轉(zhuǎn)化為正態(tài)分布來處理。,表5-4 骨密度測量值的頻數(shù)分布,正態(tài)分布,,圖5-4 體?!肮敲芏取睖y量值的分布接近正態(tài)分布示意圖(頻率密度=頻率/組距),正態(tài)分布,正態(tài)概率密度曲線的位置與形狀具有如下特點(diǎn): (1)關(guān)于x=μ

16、對稱。 (2)在x=μ處取得該概率密度函數(shù)的最大值,在 處有拐點(diǎn),表現(xiàn)為鐘形曲線。 (3)曲線下面積為1。 (4)μ決定曲線在橫軸上的位置,μ增大,曲線沿橫軸向右移;反之,μ減小,曲線沿橫軸向左移。 (5)σ決定曲線的形狀,當(dāng)μ恒定時,σ越大,數(shù)據(jù)越分散,曲線越“矮胖”;σ越小, 數(shù)據(jù)越集中,曲線越“瘦高”。見圖4-5。,正態(tài)分布,u1 u2 u3,,不

17、同均數(shù),正態(tài)分布,,不同標(biāo)準(zhǔn)差,正態(tài)分布,對任意一個服從正態(tài)分布 的隨機(jī)變量,可作如下的標(biāo)準(zhǔn)化變換,也稱Z變換:Z服從總體均數(shù)為0、總體標(biāo)準(zhǔn)差為1的正態(tài)分布。我們稱此正態(tài)分布為標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution),用N(0,1)表示。,正態(tài)分布,統(tǒng)計(jì)學(xué)家編制了標(biāo)準(zhǔn)正態(tài)分布曲線下面積分布表(附表1),因?yàn)檎龖B(tài)分布兩邊對稱,所以只給出Z取負(fù)值的情況。 表內(nèi)所列數(shù)據(jù)表示Z取不同

18、值時標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)值,此值大小相當(dāng)于Z值左側(cè)標(biāo)準(zhǔn)正態(tài)曲線下面積,記作Φ(z)。,正態(tài)分布,例5-9 已知X服從均數(shù)為μ、標(biāo)準(zhǔn)差為σ的正態(tài)分布,試估計(jì): X取值在區(qū)間 上的概率; X取值在區(qū)間 上的概率。,正態(tài)分布,查附表1, ,因?yàn)榍€下兩側(cè)面積對稱,區(qū)間(1.96,∞)相應(yīng)面積也是0.025,故Z取值于(-1

19、.96,1.96)的概率為1-2×0.025=0.95,即取值在區(qū)間上的概率為0.95。 同理,我們可以求出X取值在 區(qū)間上的概率為0.99。,二、正態(tài)曲線下面積的分布規(guī)律,正態(tài)分布曲線下面積分布有一定規(guī)律:µ±σ 包含面積占曲線下總面積的68.27%µ±1.96σ 包含面積占曲線下總面積的95.00%µ&#

20、177;2.58σ 包含面積占曲線下總面積的99.00%,正態(tài)分布,正態(tài)分布,正態(tài)分布,正態(tài)分布,例5-11 某地1986年120名8歲男孩身高均數(shù)為 =123.02cm ,標(biāo)準(zhǔn)差為S=4.79cm,試估計(jì):(1)該地8歲男孩身高在130cm以上者占該地8歲男孩總數(shù)的百分比;(2)身高在120cm~128cm者占該地8歲男孩總數(shù)的百分比;(3)該地80%的男孩身高集中在哪個范圍?,求Z值:查表:

21、理論上該地8歲男孩身高在130cm以上者占該地8歲男孩總數(shù)的7.21%。,正態(tài)分布,先計(jì)算120 和128所對應(yīng)的Z值:正態(tài)曲線下區(qū)間(-0.63,1.04)上的面積等于:,查附表1,標(biāo)準(zhǔn)正態(tài)分布曲線下左側(cè)面積為0.10所對應(yīng)的Z值為-1.28,80%的8歲男孩身高集中在 區(qū)間內(nèi),即116.9cm與129.2cm之間。,三、正態(tài)分布的應(yīng)用,(一)估計(jì)頻數(shù)分布(二)確定醫(yī)學(xué)參考值范

22、圍1、醫(yī)學(xué)參考值范圍(reference ranges)意義:指特定健康人群的解剖、生理、生化等各種數(shù)據(jù)的波動范圍。是 “正常”人群數(shù)據(jù)中大多數(shù)個體的取值所在的范圍。人們習(xí)慣用該人群95%的個體某項(xiàng)醫(yī)學(xué)指標(biāo)的取值范圍作為該指標(biāo)的醫(yī)學(xué)參考值范圍。,2.制定參考值的基本步驟 (1)從正常人總體中抽樣 所謂正常人,是指排除了影響被研究指標(biāo)的疾病或因素的人。具體抽樣時要注意: 1)隨機(jī)化原則和方法進(jìn)行抽樣研究。 2)取樣本含

23、量要足夠大。(2)控制測量誤差 測量的方法、儀器、試劑、精密度、操作熟練程度都要統(tǒng)一,以便將測量誤差控制在一定的范圍內(nèi)。,(3)判定是否需要分組確定參考值范圍原則上組間差別明顯,且差別有實(shí)際意義則應(yīng)分開,否則應(yīng)當(dāng)合并確定。 (4)決定取單側(cè)還是雙側(cè)單側(cè)或雙側(cè)是根據(jù)指標(biāo)的實(shí)際用途而定,指標(biāo)(如紅細(xì)胞、白細(xì)胞)過高與過低均為異常則取雙側(cè),正常值范圍要分別確定下限和上限;指標(biāo)僅過高或過低為異常,則取單側(cè)。,雙側(cè)---過高、過

24、低均異常,單側(cè)上限---過高異常,單側(cè)下限---過低異常,(5)選定合適的百分界限 參考值范圍是指絕大多數(shù)正常人的測定值應(yīng)該所在的范圍。這個“絕大多數(shù)”習(xí)慣上95%或99%。(6)對資料的分布進(jìn)行正態(tài)性檢驗(yàn)。 (7)根據(jù)資料的分布類型選定適當(dāng)?shù)姆椒ㄟM(jìn)行參考值范圍的估計(jì)。3.參考值范圍的估計(jì)方法 估計(jì)參考值范圍的方法很多,在此以制定95%的參考值范圍為例,介紹正態(tài)分布法(適用正態(tài)分布資料或能夠轉(zhuǎn)化為正態(tài)分布的資料)

25、、百分位數(shù)法(適用于任何分布型的資料)的適用對象和界限值的計(jì)算公式,見下表。,參考值范圍所對應(yīng)的正態(tài)分布區(qū)間,參考值范圍所對應(yīng)的百分位數(shù),例5-11 調(diào)查某地120名健康女性血紅蛋白,直方圖顯示,其分布近似于正態(tài)分布, (g/L), (g/L),試估計(jì)該地健康女性血紅蛋白的95%參考值范圍。 因血紅蛋白過高、過低均為異常,所以按雙側(cè)估計(jì)95%醫(yī)學(xué)參考值范圍:,例

26、 題,即該地健康女性血紅蛋白的95%的參考值范圍為97.41 g/L ~ 137.39 g/L 。,例題:見下表資料,為該地區(qū)50歲~60歲的女性高血脂診斷與治療提供參考依據(jù),試估計(jì)其血清甘油三酯的95%的參考值范圍。,血清甘油三酯呈偏態(tài)分布,宜用百分位數(shù)法求其參考值范圍。,即該地該地區(qū)50歲~60歲的女性血清甘油三酯的95%的參考值范圍為小于209.8mg/dl。,某地630名正常女性檢查了血清甘油三酯含量的頻數(shù)表,注意:,(1)若資

27、料不服從正態(tài)分布,經(jīng)對數(shù)轉(zhuǎn)換后若呈正態(tài)分布,用對數(shù)正態(tài)分布法,首先計(jì)算對數(shù)值的參考值范圍,再求反對數(shù)。,(2)若資料呈偏態(tài)分布或分布不明,則用求百分位數(shù)的公式求參考值范圍。,(三)質(zhì)量控制圖 控制圖共有7條水平線:中心線位于總體均數(shù)μ處,警戒限位于μ±2σ處,控制限位于μ±3σ處,此外還有兩條位于μ±σ處。(四)二項(xiàng)分布、泊松分布的正態(tài)近似1、二項(xiàng)分布的正態(tài)近似:當(dāng)n→∞時,只要?不太靠

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論