版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、概率論與數(shù)理分析第六章 樣本及抽樣分布,§1 隨機樣本§2 直線圖和箱線圖§3 抽樣分布,引言,隨機變量及其所伴隨的概率分布全面描述了隨機現(xiàn)象的統(tǒng)計性規(guī)律。,概率論的許多問題中,隨機變量的概率分布通常是已知的,或者假設(shè)是已知的,而一切計算與推理都是在這已知是基礎(chǔ)上得出來的。,但實際中,情況往往并非如此,一個隨機現(xiàn)象所服從的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些參數(shù)是
2、未知的。,§1 隨機樣本,例如:,某公路上行駛車輛的速度服從什么分布是未知的;,電視機的使用壽命服從什么分布是未知的;,產(chǎn)品是否合格服從兩點分布,但參數(shù)——合格率p是未知的;,數(shù)理統(tǒng)計的任務(wù)則是以概率論為基礎(chǔ),根據(jù)試驗所得到的數(shù)據(jù),對研究對象的客觀統(tǒng)計規(guī)律性做出合理的推斷。,§1 隨機樣本,一、總體與個體,1.總體,試驗的全部可能的觀察值稱為總體.,2.個體,總體中的每個可能觀察值稱為個體.,例1 在研究2
3、000名學(xué)生的年齡時,這些學(xué)生的年齡的全體就構(gòu)成一個總體,每個學(xué)生的年齡就是個體.,§1 隨機樣本,3.容量,總體中所包含的個體的個數(shù)稱為總體的容量.,4.有限總體和無限總體,容量為有限的稱為有限總體.,容量為無限的稱為無限總體.,產(chǎn)的燈泡壽命.,某工廠10月份生產(chǎn)的燈泡壽命所組成的總,個體的總數(shù)就是10月份生產(chǎn)的燈泡數(shù),,個有限總體;,例2,體中,,這是,而該工廠生產(chǎn)的所有燈泡壽命所組成,的總體是一個無限總體,,它包括以往生
4、產(chǎn)和今后生,§1 隨機樣本,所形成的總體中共含2 000個,例3,在考察某大學(xué)一年級男生的身高這一試,試驗中,,若一年級男生共2 000人,,每個男生的身高,是一個可能觀察值,,可能觀察值,,是一個有限總體.,總體也是有限總體.,例4 考察某一湖泊中某種魚的含汞量,,所得,§1 隨機樣本,我們可以認為,有些有限總體,,它的容量很大,,它是一個無限總體.,例5,考察全國正在使用的某種型號燈泡的壽,可以認為是無限總體.
5、,命所形成的總體,,由于可能觀察值的個數(shù)很多,就,§1 隨機樣本,因此在理論上可以把總體與概率分布等同起來.,我們關(guān)心的是總體中的個體的某項指標(如人的身高、燈泡的壽命,汽車的耗油量…) .,由于每個個體的出現(xiàn)是隨機的,所以相應(yīng)的數(shù)量指標的出現(xiàn)也帶有隨機性 . 從而可以把這種數(shù)量指標看作一個隨機變量X ,因此隨機變量X的分布就是該數(shù)量指標在總體中的分布.,總體就可以用一個隨機變量及其分布來描述.,§1 隨機樣本
6、,5. 總體分布,例如:研究某批燈泡的壽命時,關(guān)心的數(shù)量指標就是壽命,那么,此總體就可以用隨機變量X表示,或用其分布函數(shù)F(x)表示.,某批燈泡的壽命,總體,,壽命 X 可用一概率(指數(shù))分布來刻劃,鑒于此,常用隨機變量的記號或用其分布函數(shù)表示總體. 如說總體X或總體F(x) .,§1 隨機樣本,類似地,在研究某地區(qū)中學(xué)生的營養(yǎng)狀況時 ,若關(guān)心的數(shù)量指標是身高和體重,我們用X 和Y 分別表示身高和體重,那么此總體就可
7、用二維隨機變量(X,Y)或其聯(lián)合分布函數(shù) F(x,y)來表示.,統(tǒng)計中,總體這個概念的要旨是:總體就是一個隨機變量(向量)或一個概率分布.,§1 隨機樣本,X 的分布函數(shù)和數(shù)字特征就稱為總體的分布,函數(shù)和數(shù)字特征.,今后將不區(qū)分總體與相應(yīng)的隨機,變量.,參數(shù)為p的(0-1)分布:,例如,,我們檢驗自生產(chǎn)線出來的零件是次品還,是正品,,以0表示產(chǎn)品是正品,,以1表示產(chǎn)品為次品.,的隨機變量.,設(shè)出現(xiàn)次品的頻率為 p(常數(shù)),,
8、那么總體是由一,些“0”和一些“1”所組成,,這一總體對應(yīng)于一個具有,§1 隨機樣本,根據(jù)獲得的數(shù)據(jù)來對總體分布得出,在數(shù)理統(tǒng)計中,人們都是通過從總體中抽取,一部分個體,,被抽出的部分個體叫做總體的一個樣本.,判斷的.,所謂從總體抽取一個個體,,就是對總體X 進行,一次觀察并記錄其結(jié)果.,§1 隨機樣本,二、隨機樣本的定義,1.樣本的定義,§1 隨機樣本,2. 簡單隨機抽樣的定義,獲得簡單隨機樣本的抽樣方法
9、稱為簡單隨機抽樣.,§1 隨機樣本,解,例7,§1 隨機樣本,解,例8,§1 隨機樣本,§1 隨機樣本,三、小結(jié),個體 總體,有限總體,無限總體,基本概念:,統(tǒng)稱為總體X.,說明2,隨機樣本,一個總體對應(yīng)一個隨機變量X,,說明1,我們將不區(qū),分總體和相應(yīng)的隨機變量,,在實際中遇到的總體往往是有限總體,,它,個數(shù)很大時,,在理論上可認為它是一個無限總體.,對應(yīng)一個離散型隨機變量;,當(dāng)總體中包含的個
10、體的,§1 隨機樣本,男子的頭顱的最大寬度(mm),,一、直方圖,例1,下面給出了84個伊特拉斯坎(Etruscan)人,數(shù)據(jù)的“頻率直方圖”.,現(xiàn)在來畫這些,§2 直方圖和箱線圖,步驟:,1. 找出最小值126,,最大值158,,現(xiàn)取區(qū)間,[124.5,159.5];,2. 將區(qū)間[124.5,159.5]等分為7個小區(qū)間,,3. 小區(qū)間的端點稱為組限,,數(shù)出落在每個小區(qū),§2 直方圖和箱線圖,列表
11、如下:,這樣的圖形叫頻率直方圖.,§2 直方圖和箱線圖,§2 直方圖和箱線圖,頻率直方圖,二、箱線圖,定義,§2 直方圖和箱線圖,綜上,,§2 直方圖和箱線圖,§2 直方圖和箱線圖,例2,設(shè)有一組容量為18的樣本如下(已經(jīng)排過序),122 126 133 140 145 145 149 150 157,解,162 166 175 177 177 183 188
12、 199 212,§2 直方圖和箱線圖,§2 直方圖和箱線圖,數(shù)據(jù)集的箱線圖是由箱子和直線組成的圖形,,它是基于以下五個數(shù)的圖形概括:,§2 直方圖和箱線圖,在同一水平,高度自箱子右側(cè)引一條水平線直至最大值.,§2 直方圖和箱線圖,以下是8個病人的血壓(收縮壓,mmHg)數(shù),解,故,例3,試作出箱線圖.,據(jù)(已經(jīng)過排序 ),,102 110 117 118 122 123
13、 132 150,§2 直方圖和箱線圖,故,故,作出箱線圖如圖所示.,§2 直方圖和箱線圖,例4,量(以升計.數(shù)據(jù)應(yīng)經(jīng)過排序),女子組,2.7 2.8 2.9 3.1 3.1 3.1 3.2 3.4 3.4,男子組,4.1 4.1 4.3 4.3 4.5 4.6 4.7 4.8 4.8,試分別畫出這兩組數(shù)據(jù)的箱線圖.,下面分別給出了25個男子和25個女子的肺活,3.4 3.4
14、 3.4 3.5 3.5 3.5 3.6 3.7 3.7,3.7 3.8 3.8 4.0 4.1 4.2 4.2,5.1 5.3 5.3 5.3 5.4 5.4 5.5 5.6 5.7,5.8 5.8 6.0 6.1 6.3 6.7 6.7,§2 直方圖和箱線圖,解,女子組,男子組,作出箱線圖如(教材P134)圖6-4所示.,§2 直方圖和箱線圖,在數(shù)據(jù)集中,,稱為四
15、分位數(shù)間距.,某一個觀察值不尋常地大于或,小于該數(shù)據(jù)集中的其他數(shù)據(jù),,稱為疑似異常值.,疑似異常值,§2 直方圖和箱線圖,修正箱線圖,自箱子左側(cè)引一水平線段直至數(shù)據(jù)集中,又自箱子右側(cè)引一,除去疑似異常值后的最小值,,水平線直至數(shù)據(jù)集中除去疑似異常值后的最大值.,§2 直方圖和箱線圖,例5,下面給出了某醫(yī)院21個病人的住院時間(以,1 2 3 3 4 4 5 6 6 7 7
16、9 9,解,試畫出修正箱線圖(數(shù)據(jù)已經(jīng)過排序).,天計),,10 12 12 13 15 18 23 55,,§2 直方圖和箱線圖,故55 是疑似異常值,,且僅此一個疑,疑似異常值.,作出修正箱線圖如(教材P135)圖6-5所示.,§2 直方圖和箱線圖,1.頻率直方圖作圖步驟,(1) 找出最小值和最大值,,(2) 將選定區(qū)間分為k個小區(qū)間;,三、小結(jié),§2 直方圖和箱線圖,高
17、度自箱子右側(cè)引一條水平線直至最大值.,2.箱線圖作圖步驟,§2 直方圖和箱線圖,一、基本概念,1. 統(tǒng)計量的定義,§3 抽樣分布,,,是,不是,實例1,§3 抽樣分布,2. 幾個常用統(tǒng)計量的定義,(1) 樣本平均值,(2) 樣本方差,其觀察值,§3 抽樣分布,其觀察值,(3) 樣本標準差,其觀察值,§3 抽樣分布,(4) 樣本k 階(原點)矩,其觀察值,(5) 樣本k 階中心矩,其觀察值
18、,§3 抽樣分布,證明,再根據(jù)第五章辛欽定理知,由以上定義得下述結(jié)論:,§3 抽樣分布,由第五章關(guān)于依概率收斂的序列的性質(zhì)知,由第五章關(guān)于依概率收斂的序列的性質(zhì)知,以上結(jié)論是下一章所要介紹的矩估計法的理,論根據(jù).,§3 抽樣分布,3. 經(jīng)驗分布函數(shù),經(jīng)驗分布函數(shù)的做法如下:,§3 抽樣分布,實例,§3 抽樣分布,實例,§3 抽樣分布,一般地,,§3 抽樣分布,格里汶科
19、定理,§3 抽樣分布,二、常見分布,統(tǒng)計量的分布稱為抽樣分布.,自由度是指上式右端包含的獨立變量的個數(shù).,§3 抽樣分布,證明,§3 抽樣分布,§3 抽樣分布,性質(zhì)1,( 此性質(zhì)可以推廣到多個隨機變量的情形. ),§3 抽樣分布,性質(zhì)2,證明,§3 抽樣分布,§3 抽樣分布,根據(jù)正態(tài)分布的對稱性知,例1,§3 抽樣分布,附表5只詳列到n=40為止.,例2,&
20、#167;3 抽樣分布,例如,利用上面公式,,而查詳表可得,費舍爾(R.A.Fisher)證明:,§3 抽樣分布,例3,解,根據(jù)正態(tài)分布的性質(zhì),,§3 抽樣分布,§3 抽樣分布,§3 抽樣分布,t 分布又稱學(xué)生氏(Student)分布.,2.,§3 抽樣分布,形.,當(dāng)n充分大時,,其圖,形類似于標準正態(tài),變量概率密度的圖,§3 抽樣分布,由分布的對稱性知,§3 抽樣分
21、布,例4,§3 抽樣分布,3.,§3 抽樣分布,§3 抽樣分布,根據(jù)定義可知,,§3 抽樣分布,,例5,§3 抽樣分布,證明,§3 抽樣分布,§3 抽樣分布,4. 正態(tài)總體的樣本均值與樣本方差的分布,定理一,§3 抽樣分布,定理二,§3 抽樣分布,證明,由 t 分布的定義知,定理三,且兩者獨立,,§3 抽樣分布,定理四,§3 抽
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 概率論與數(shù)理統(tǒng)計講義第六章樣本與抽樣分布
- 第2章概率論
- 概率論第4-6章課后習(xí)題答案
- 概率論和概率分布
- [學(xué)習(xí)]概率論與數(shù)理統(tǒng)計課件第6章
- [學(xué)習(xí)]概率論-抽樣原理與方法
- 概率論第8章-假設(shè)檢驗
- 大學(xué)概率論第7章習(xí)題答案
- 概率論課件-第1章第1講事件與概率
- 華農(nóng)概率論第7章答案
- [學(xué)習(xí)]概率論第8章假設(shè)檢驗
- 概率論與數(shù)理統(tǒng)計第章題庫
- 概率論第1講
- [學(xué)習(xí)]概率論完整ppt課件第6講
- 概率論與數(shù)理統(tǒng)計第9章題庫
- 《應(yīng)用統(tǒng)計學(xué)》第4章概率論基礎(chǔ)
- 應(yīng)用數(shù)學(xué)基礎(chǔ)下冊第20章-概率論初步
- 《概率論》第1章§1隨機試驗
- 概率論第7-10章課后習(xí)題答案
- 概率論與數(shù)理統(tǒng)計第8章題庫
評論
0/150
提交評論