隨機變量的數值特征_第1頁
已閱讀1頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1,第三章 假設檢驗,§1 假設檢驗問題 §2 正態(tài)總體均值的假設檢驗§3 正態(tài)總體方差的假設檢驗§4 p值檢驗法§5非參數檢驗,2,,由于θ是未知的,上式只是一個假設(假想),它可能是真,也可能是假,是真是假,有待于用樣本進行驗證(檢驗)。,參數的點估計方法建立了參數θ的估計公式,并利用樣本值確定了一個估計值,認為參數的真值,3,§1 假設檢驗問題,1 統(tǒng)計假設

2、 2 假設檢驗的思想方法3 數假設檢驗問題的步驟,4,1. 統(tǒng)計假設,問題 1 一臺機器加工某零件,零件尺寸X服從正態(tài)分布N(μ,σ2)其中 σ2反映加工精度,為已知,圖紙標定零件尺寸為50(毫米),如果μ=50則機器工作正常,否則為不正常,但是μ未知參數.今從機器生產的一批零件中任取10件,并測得其尺寸,如何根據這10個樣本值判斷“機器工作是正常的”這個命題是否成立?,請看以下幾個問題,若用H0表示”μ=50”,用H1表示其對立面

3、,即”μ ≠50”,則問題等價于檢驗H0 μ=50是否成立,若H0不成立,則H1 μ ≠50成立.,5,,問題2 某種疾病,不用藥時其康復率為θ0,現發(fā)明一種新藥(無不良反應),為此抽查n位病人用新藥的治療效果,設其中有s人康復,根據這些信息,能否斷定“該新藥有效”?,問題3 有一顆骰子,如何知道它是否均勻?這里均勻的含義是指擲出各點的概率相等.,記 H0 : θ=θ0 , H1 : θ>θ0,記 H0 : p1 = p

4、2 =…= p6=1/6, H1 : p1 p2 … p6 不全相等,其中 pi 是骰子擲出i點的概率,6,,統(tǒng)計假設:數理統(tǒng)計學中有待驗證的陳述或命題.,假設檢驗:利用樣本對假設的真假進行判斷.,參數假設檢驗:在總體的概率分布已知情形下,對分布中的未知參數作假設并進行檢驗.,非參數假設檢驗:若總體的分布未知,對總體的分布形成或參數作假設并進行檢驗.,7,,在假設檢驗問題中,常把一個被檢驗的假設稱為原假設或零假設,而其對立面就

5、稱為對立假設.上述各問題中, H0 為原假設,H1為對立假設.當H0不成立時,就拒絕接受H0而接受其對立假設H1.對立假設往往也稱為備選假設,不論是原假設還是對立假設,若其中只含有一個參數值,則稱為簡單假設,否則稱為復合假設.,8,2. 假設檢驗的思想方法,小概率原理 概率很小的事件在一次試驗中不會發(fā)生.如果小概率事件在一次試驗中竟然發(fā)生了,則事屬反常,定有導致反常的特別原因,有理由懷疑試驗的原定條件不成立,概率反證法 欲判斷假設H0的

6、真假,先假定H0真,在此前提下構造一個能說明問題的小概率事件A.試驗取樣,由樣本信息確定A是否發(fā)生,若A發(fā)生,這與小概率原理相違背,說明試驗的前定條件H0 不成立,拒絕H0 ,接受H1;若小概率事件A沒有發(fā)生,沒有理由拒絕H0 ,只好接受H0.,9,,反證法的關鍵是通過推理,得到一個與常理(定理、公式、原理)相違背的結論.“概率反證法”依據的是“小概率原理”.那么多小的概率才算小概率呢?這要由實際問題的不同需要來決定.以后用符合α記小概

7、率,一般取α=0.1,0.05等.在假設檢驗中,若小概率事件的概率不超過α,則α稱 α為檢驗水平或顯著性水平.,10,通常反證法與概率反證法的區(qū)別,假設命題H0為真,H0為假,某一定理.定律.公理,H0真假待定,假設命題H0為真,H0為假,小概率原理,H0為真,11,例1 設總體X~ N( μ, σ2 ), σ=0.06,現從總體中抽取容量為10的樣本,算得樣本均值50.02 ,問總體的均值μ是否等于50?(取=0.05),解

8、 由問題提出假設 H0 μ =50 , H1 μ ≠50 . 在H0成立的前提下,,統(tǒng)計量,,,,因此接受假設H0,即認為總體均值μ等于50,說明小概率事件A未發(fā)生,12,,錯誤在于:在H0成立的前提下,這樣取小概率事件A不合理.,注:本例中若取小概率事件為,最后的檢驗將出現這樣一種傾向: μ越與50接近,越要拒絕H0 μ = 50.這樣的檢驗方法顯然不合理.,13,3 數假設檢驗問題的步驟,總結上述處理問題的思想與方法,可得

9、檢驗參數假設檢驗問題的步驟如下:,(1)提出假設:根據問題的要求,提出原假設H0與對立假設H1,給定顯著水平及樣本容量n.,(2)確定拒絕域:用參數θ 的無偏估計來代替θ ,分析拒絕域D的形式,構造檢驗統(tǒng)計量g(x),在H0成立的前提下確定g(x)的概率分布,通過等式,確定D,(3)執(zhí)行統(tǒng)計判決:求統(tǒng)計量的值,并查表求出有關數據,判斷小概率事件是否發(fā)生,由此作出判決.,14,用概率反證法檢驗一個假設的推理依據是小概率原理.在一次抽樣中,

10、若小概率事件發(fā)生了,則拒絕原假設;若小概率事件沒有發(fā)生,拒絕原假設的理由不充分,因而只好接受原假設.這樣的檢驗結果可能出現以下兩種類型的錯誤,4 假設檢驗問題的錯誤,15,,一個優(yōu)良的檢驗法,應使兩種錯誤的概率盡可能小.這兩方面的要示是矛盾的。,16,在區(qū)間估計問題中,“置信度高”與“估計精確”是矛盾的,那里,我們采用在保證一定的置信度下使區(qū)間長度盡可能小的原則.選擇一種優(yōu)良檢驗的策略思想與此類似,即先保證棄真的概率不超過指定值,再

11、設法控制取偽概率.,17,第三章 假設檢驗,§1 假設檢驗問題 §2 正態(tài)總體均值的假設檢驗§3 正態(tài)總體方差的假設檢驗§4 p值檢驗法§5 非參數檢驗,18,§2 正態(tài)總體均值的假設檢驗,1.單正態(tài)總體均值的檢驗 2.兩正態(tài)總體均值差的檢驗,19,1. 單正態(tài)總體均值的檢驗,設總體X ~N(?, ?2),樣本為X1, X2 , ? , Xn,樣本均值,樣本方差

12、,20,雙側檢驗 H0: ? = ?0,H1: ? ? ?0,(1)方差?2已知-U檢驗,小概率事件 |U|>d,在H0 成立的前提下,選檢驗統(tǒng)計量,拒絕域為 |u| > u?/2,由 P { |U| > u?/2 } = ?, 得 d = u?/2,此檢驗法稱為U檢驗法(檢驗統(tǒng)計量服從正態(tài)分布).,,,21,單側檢驗 H0: ? = ?0,H1: ? >?0,而應取為小概率事件 U>d

13、,在H0 成立的前提下,選檢驗統(tǒng)計量,拒絕域為 u > u?,由 P { U > u?/2 } = ?, 得 d = u?,,u?,,小概率事件不能取 |U|>d,同理可給出 H0: ? = ?0,H1: ? >?0 的拒絕域為u <- u?,22,(2)方差?2未知,H0:?=?0,對立假設H1: ???0,用S2代替?2 ,即選檢驗統(tǒng)計量,小概率事件 |T|>d,拒絕域為 |t| &

14、gt; t?/2 (n-1),由 P { |T| > t?/2 (n-1) } = ?, 得 d = t?/2 (n-1),,,此檢驗法稱為T檢驗法,23,2.兩正態(tài)總體均值差的檢驗,X~N(?1,?12),Y~N(?2,?22), X,Y相互獨立,X的樣本為X1,X2,?,Xn1,Y的樣本為Y1,Y2,?,Yn2,檢驗H0:?1-?2=?0, H1:?1-?2??0,(?0為常數),X, Y的聯合樣本方差為,24,,,,(1)

15、方差?12 ,?22已知,H0: ?1-?2 = ?0, H1: ?1-?2 ? ?0,(?0為常數),選統(tǒng)計量,25,,H0: ?1-?2 = ?0, H1: ?1-?2 ? ?0,(?0為常數),(2)方差?12 ,?22未知, 但?12 =?22 =?2,選統(tǒng)計量,其中,小概率事件 |T|>d,拒絕域為 |t| > t?/2 (n1+ n2- 2),由 P { |T| > t?/2 (n1+ n2- 2) }

16、= ?, 得 d = t?/2 (n1+ n2- 2),26,,,,H0: ?1-?2 = ?0, H1: ?1-?2 ? ?0,(?0為常數),(3)方差?12 ,?22未知,但n1,n2 都很大,選統(tǒng)計量,則當n1,n2 都很大時,近似地有,27,第三章 假設檢驗,§1 假設檢驗問題 §2 正態(tài)總體均值的假設檢驗§3 正態(tài)總體方差的假設檢驗§4 p值檢驗法§5 非參數檢

17、驗,28,§3 正態(tài)總體方差的假設檢驗,1.單正態(tài)總體方差的檢驗 2.兩正態(tài)總體方差比的檢驗,29,1.單正態(tài)總體方差的檢驗,原假設H0:?2=?02,對立假設H1: ?2? ?02,小概率事件,由,拒絕域為,選統(tǒng)計量,30,2.兩正態(tài)總體方差比的檢驗,X~N(?1,?12),Y~N(?2,?22), X,Y相互獨立,?12 / ?22為方差比,H0: ?12 / ?22 =1,即?12=?22 , H1: ?12? ?

18、22 ,,拒絕域,選統(tǒng)計量,31,第三章 假設檢驗,§1 假設檢驗問題 §2 正態(tài)總體均值的假設檢驗§3 正態(tài)總體方差的假設檢驗§4 p值檢驗法§5 非參數檢驗,32,前面討論的假設檢驗方法稱為臨界值法,此法得到的結論是簡單的,在給定的顯著性水平下,不是拒絕原假設,就是接受原假設。,但應用中可能會出現這樣的情況:在一個較大的顯著性水平(如α=0.05)下得到拒絕原假設的結論,

19、而在一個較小的顯著性水平(如α=0.01)下卻得到接受原假設的結論. 這種情況在理論上很容易解釋:因為顯著性水平變小后會導致檢驗的拒絕域變小,于是原來落在拒絕域內的觀測值就可能落在拒絕域之外(即落入接受域內)。,33,,,34,,對于給定的樣本,即已知的事件,確定了一個拒絕域,此區(qū)域對應的α是多少呢?,,此α只與樣本有關,稱為該檢驗對應于這組樣本的p值,n維隨機樣本落在此虛線圍城的區(qū)域內的概率.,35,例1 一支香煙中的尼古丁含量 ,

20、質量標準規(guī)定 不能超過1.5mg,現從某廠生產的香煙中隨機地抽取20支,測得平均每支香煙尼古丁含量為1.97 mg,該廠生產的香煙尼古丁含量是否符合標準的規(guī)定?,按題意,需要檢驗假設,這是一個有關正態(tài)總體下方差已知時對總體均值的單邊假設檢驗問題,采用u檢驗法得拒絕域為,36,在以下表中列出了顯著性水平α取不同值時相應的拒絕域和檢驗結論,由已知數據可算得,由此可以看出,對同一個假設檢驗問題,不同的α可能有不同的檢驗結論,37,假設檢驗依據

21、的是樣本信息,樣本信息中包含了支持或反對原假設的證據,因此需要我們探求一種定量表述樣本信息中證據支持或反對原假設的強度.,現在我們換一個角度分析例1,則,注意:u? 是α的減函數,給定α,拒絕域為,38,當α以0.0179為基準做比較時,則上述檢驗問題的結論如下表所示,39,一般在一個假設檢驗中,利用觀測值能夠做出的拒絕原假設的最小顯著性水平稱為該檢驗的p值. 按p值的定義,對于任意指定的顯著性水平α,有以下結論,有了這兩條結論就能方便

22、地確定H 0的拒絕域. 這種利用p值來檢驗假設的方法稱為p值檢驗法,40,p值反映了樣本信息中所包含的接受原假設H 0的依據的強度,p值實際上是我們已經觀測到的一個小概率事件的概率,顯然,p值越小, H 0越有可能不成立,說明樣本信息中反對 H 0的依據的強度越強、越充分. 引進p值的概念有明顯的好處,一方面,p值比較直觀,它避免了在檢驗之前需要主觀地確定顯著性水平;另一方面,p值包含了更多的拒絕域的信息。,一般:p≤0.01,拒絕H

23、 0 ,稱檢驗是高度顯著的;0.01 0.1,一般來說,沒有理由拒絕,接受H 0,41,在現代計算機統(tǒng)計軟件中,一般都給出檢驗問題的p值. 在科學研究以及一些產品的數據分析報告中,研究者在講述假設檢驗的結果時,往往并不明顯給出檢驗的顯著性水平以及臨界值,而是直接引用檢驗的p值,利用或者是讓讀者利用它來評價已獲得的數據反對原假設的依據的強度,從而對原假設成立與否做出自己的判斷。,42,第三章 假設檢驗,§1 假設檢驗問題

24、§2 正態(tài)總體均值的假設檢驗§3 正態(tài)總體方差的假設檢驗§4 兩種類型的錯誤§5 p值檢驗法§6 非參數檢驗,43,前面有關章節(jié)討論的參數檢驗都要求總體服從一定的分布,對總體參數的檢驗是建立在這種分布基礎上的.非參數檢驗是一種與總體分布狀況無關的檢驗方法,它不依賴于總體分布的形式,應用時可以不考慮被研究的對象為何種分布以及分布是否已知。,實際應用中所遇到的統(tǒng)計問題往往并不知總體

25、的分布,我們想要根據一組樣本的信息來推斷總體是否屬于某種理論分布,或者判斷某種現象的出現是否是隨機的,或者是兩種及兩種以上的現象之間是否有聯系,及聯系的緊密程度如何等等。,44,§6 非參數檢驗,1 分布擬合檢驗 2 列聯表的獨立性檢驗,45,1 分布擬合檢驗,,利用統(tǒng)計資料做出推斷,常常必須選擇某種已知的概率分布來近似所研究的頻率分布,或者說檢驗某一實際的隨機變量與某一理論分布之間的差異是否顯著。這樣就可以用來確定某種具體

26、的概率分布究竟是否符合某種理論分布,如二項分布,泊松分布或正態(tài)分布,但是我們需要分析這種近似存在多大程度的誤差。,46,1 )分布擬合檢驗問題,檢驗 H0: F ( x ) = F *( x ) ,H1: F ( x ) ? F *( x ),設總體的真實的分布函數為F ( x ) ,但它是未知的。需要檢驗總體是否與某種已知的理論分布 F *( x )相一致.,非參數檢驗的程序和前面介紹的參數假設檢驗一樣,首先也建立假設,然后

27、構造檢驗統(tǒng)計量,分布擬合檢驗采用χ2 (卡方) 檢驗法 …,47,區(qū)間,2) χ2 檢驗法,樣本分組與計算:取m -1個實數,將數軸分為m 個區(qū)間,pk表示服從于已知的分布函數 F *( x )的總體X在每個區(qū)間 上的取值概率。,概率,記,48,描述了F *( x )與樣本描述的分布之間的差異。,構造檢驗統(tǒng)計量:,49,2 列聯表的獨立性檢驗,,統(tǒng)計上經常會遇到判斷兩個變量之間是否有聯系的問題。如果兩個變量之間沒有聯系則稱作是獨立的。

28、如,吸煙與患慢性氣管炎病是否有關?,色盲與性別是否有關?,求職中是否存在學歷歧視?,人們對一些社會熱點問題的看法是否隨時間流逝有所改變?,50,檢驗 H0: X, Y 獨立,H1: X, Y 不獨立,設X ~ F1( x ), Y ~ F2( y ), (X,Y) ~ F ( x , y ),事件的概率用頻率代替,采用χ2 (卡方) 檢驗法 …,若獨立,則有 F ( x , y ) =F1( x ) F2( y ),但

29、這些概率函數均未知 …,記 A = X ∈( a , b ], B =Y ∈( c , d ],若 P( AB) = P( A)P(B) 對任意a , b ,c , d成立,則X, Y 獨立。,51,例1 隨機抽取1000人按性別(男,女),色覺(正常,色盲)兩個屬性分類,得到如下二維列聯表,性別男女,問色覺是否與性別有關?,色覺 正常 色盲

30、 535 65 382 18,,,,,,檢驗 H0: X, Y 獨立,H1: X, Y 不獨立,性別 X,X = 1 表示男性, X = 0表示女性;色覺Y ,Y = 1 表示正常, Y = 0表示色盲。,52,將研究對象的觀察數據按兩個變量X, Y分別進行分類。,1) 列聯表,將nij排成一個二維表格,按這種方法得到的表稱為

31、列聯表。,記nij為:X取值屬于i類,Y取值屬于j類的數據的個數,53,,,54,2) χ2 檢驗法,描述了X, Y 之間的不獨立性程度。,構造檢驗統(tǒng)計量:,拒絕域,55,例2 為研究兒童智力發(fā)展與營養(yǎng)的關系,某研究機構調查了1436名兒童,得到如下數據,問兒童智力發(fā)展與營養(yǎng)是否有關?(α= 0.05),56,拒絕域,檢驗 H0: X, Y 獨立,H1: X, Y 不獨立,營養(yǎng) X,X = 1 表示良好, X = 0表示不良;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論