版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、概率論與數(shù)理分析第六章 樣本及抽樣分布,§1 隨機樣本§2 直線圖和箱線圖§3 抽樣分布,引言,隨機變量及其所伴隨的概率分布全面描述了隨機現(xiàn)象的統(tǒng)計性規(guī)律。,概率論的許多問題中,隨機變量的概率分布通常是已知的,或者假設是已知的,而一切計算與推理都是在這已知是基礎上得出來的。,但實際中,情況往往并非如此,一個隨機現(xiàn)象所服從的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些參數(shù)是
2、未知的。,§1 隨機樣本,例如:,某公路上行駛車輛的速度服從什么分布是未知的;,電視機的使用壽命服從什么分布是未知的;,產(chǎn)品是否合格服從兩點分布,但參數(shù)——合格率p是未知的;,數(shù)理統(tǒng)計的任務則是以概率論為基礎,根據(jù)試驗所得到的數(shù)據(jù),對研究對象的客觀統(tǒng)計規(guī)律性做出合理的推斷。,§1 隨機樣本,一、總體與個體,1.總體,試驗的全部可能的觀察值稱為總體.,2.個體,總體中的每個可能觀察值稱為個體.,例1 在研究2
3、000名學生的年齡時,這些學生的年齡的全體就構(gòu)成一個總體,每個學生的年齡就是個體.,§1 隨機樣本,3.容量,總體中所包含的個體的個數(shù)稱為總體的容量.,4.有限總體和無限總體,容量為有限的稱為有限總體.,容量為無限的稱為無限總體.,產(chǎn)的燈泡壽命.,某工廠10月份生產(chǎn)的燈泡壽命所組成的總,個體的總數(shù)就是10月份生產(chǎn)的燈泡數(shù),,個有限總體;,例2,體中,,這是,而該工廠生產(chǎn)的所有燈泡壽命所組成,的總體是一個無限總體,,它包括以往生
4、產(chǎn)和今后生,§1 隨機樣本,所形成的總體中共含2 000個,例3,在考察某大學一年級男生的身高這一試,試驗中,,若一年級男生共2 000人,,每個男生的身高,是一個可能觀察值,,可能觀察值,,是一個有限總體.,總體也是有限總體.,例4 考察某一湖泊中某種魚的含汞量,,所得,§1 隨機樣本,我們可以認為,有些有限總體,,它的容量很大,,它是一個無限總體.,例5,考察全國正在使用的某種型號燈泡的壽,可以認為是無限總體.
5、,命所形成的總體,,由于可能觀察值的個數(shù)很多,就,§1 隨機樣本,因此在理論上可以把總體與概率分布等同起來.,我們關心的是總體中的個體的某項指標(如人的身高、燈泡的壽命,汽車的耗油量…) .,由于每個個體的出現(xiàn)是隨機的,所以相應的數(shù)量指標的出現(xiàn)也帶有隨機性 . 從而可以把這種數(shù)量指標看作一個隨機變量X ,因此隨機變量X的分布就是該數(shù)量指標在總體中的分布.,總體就可以用一個隨機變量及其分布來描述.,§1 隨機樣本
6、,5. 總體分布,例如:研究某批燈泡的壽命時,關心的數(shù)量指標就是壽命,那么,此總體就可以用隨機變量X表示,或用其分布函數(shù)F(x)表示.,某批燈泡的壽命,總體,,壽命 X 可用一概率(指數(shù))分布來刻劃,鑒于此,常用隨機變量的記號或用其分布函數(shù)表示總體. 如說總體X或總體F(x) .,§1 隨機樣本,類似地,在研究某地區(qū)中學生的營養(yǎng)狀況時 ,若關心的數(shù)量指標是身高和體重,我們用X 和Y 分別表示身高和體重,那么此總體就可
7、用二維隨機變量(X,Y)或其聯(lián)合分布函數(shù) F(x,y)來表示.,統(tǒng)計中,總體這個概念的要旨是:總體就是一個隨機變量(向量)或一個概率分布.,§1 隨機樣本,X 的分布函數(shù)和數(shù)字特征就稱為總體的分布,函數(shù)和數(shù)字特征.,今后將不區(qū)分總體與相應的隨機,變量.,參數(shù)為p的(0-1)分布:,例如,,我們檢驗自生產(chǎn)線出來的零件是次品還,是正品,,以0表示產(chǎn)品是正品,,以1表示產(chǎn)品為次品.,的隨機變量.,設出現(xiàn)次品的頻率為 p(常數(shù)),,
8、那么總體是由一,些“0”和一些“1”所組成,,這一總體對應于一個具有,§1 隨機樣本,根據(jù)獲得的數(shù)據(jù)來對總體分布得出,在數(shù)理統(tǒng)計中,人們都是通過從總體中抽取,一部分個體,,被抽出的部分個體叫做總體的一個樣本.,判斷的.,所謂從總體抽取一個個體,,就是對總體X 進行,一次觀察并記錄其結(jié)果.,§1 隨機樣本,二、隨機樣本的定義,1.樣本的定義,§1 隨機樣本,2. 簡單隨機抽樣的定義,獲得簡單隨機樣本的抽樣方法
9、稱為簡單隨機抽樣.,§1 隨機樣本,解,例7,§1 隨機樣本,解,例8,§1 隨機樣本,§1 隨機樣本,三、小結(jié),個體 總體,有限總體,無限總體,基本概念:,統(tǒng)稱為總體X.,說明2,隨機樣本,一個總體對應一個隨機變量X,,說明1,我們將不區(qū),分總體和相應的隨機變量,,在實際中遇到的總體往往是有限總體,,它,個數(shù)很大時,,在理論上可認為它是一個無限總體.,對應一個離散型隨機變量;,當總體中包含的個
10、體的,§1 隨機樣本,男子的頭顱的最大寬度(mm),,一、直方圖,例1,下面給出了84個伊特拉斯坎(Etruscan)人,數(shù)據(jù)的“頻率直方圖”.,現(xiàn)在來畫這些,§2 直方圖和箱線圖,步驟:,1. 找出最小值126,,最大值158,,現(xiàn)取區(qū)間,[124.5,159.5];,2. 將區(qū)間[124.5,159.5]等分為7個小區(qū)間,,3. 小區(qū)間的端點稱為組限,,數(shù)出落在每個小區(qū),§2 直方圖和箱線圖,列表
11、如下:,這樣的圖形叫頻率直方圖.,§2 直方圖和箱線圖,§2 直方圖和箱線圖,頻率直方圖,二、箱線圖,定義,§2 直方圖和箱線圖,綜上,,§2 直方圖和箱線圖,§2 直方圖和箱線圖,例2,設有一組容量為18的樣本如下(已經(jīng)排過序),122 126 133 140 145 145 149 150 157,解,162 166 175 177 177 183 188
12、 199 212,§2 直方圖和箱線圖,§2 直方圖和箱線圖,數(shù)據(jù)集的箱線圖是由箱子和直線組成的圖形,,它是基于以下五個數(shù)的圖形概括:,§2 直方圖和箱線圖,在同一水平,高度自箱子右側(cè)引一條水平線直至最大值.,§2 直方圖和箱線圖,以下是8個病人的血壓(收縮壓,mmHg)數(shù),解,故,例3,試作出箱線圖.,據(jù)(已經(jīng)過排序 ),,102 110 117 118 122 123
13、 132 150,§2 直方圖和箱線圖,故,故,作出箱線圖如圖所示.,§2 直方圖和箱線圖,例4,量(以升計.數(shù)據(jù)應經(jīng)過排序),女子組,2.7 2.8 2.9 3.1 3.1 3.1 3.2 3.4 3.4,男子組,4.1 4.1 4.3 4.3 4.5 4.6 4.7 4.8 4.8,試分別畫出這兩組數(shù)據(jù)的箱線圖.,下面分別給出了25個男子和25個女子的肺活,3.4 3.4
14、 3.4 3.5 3.5 3.5 3.6 3.7 3.7,3.7 3.8 3.8 4.0 4.1 4.2 4.2,5.1 5.3 5.3 5.3 5.4 5.4 5.5 5.6 5.7,5.8 5.8 6.0 6.1 6.3 6.7 6.7,§2 直方圖和箱線圖,解,女子組,男子組,作出箱線圖如(教材P134)圖6-4所示.,§2 直方圖和箱線圖,在數(shù)據(jù)集中,,稱為四
15、分位數(shù)間距.,某一個觀察值不尋常地大于或,小于該數(shù)據(jù)集中的其他數(shù)據(jù),,稱為疑似異常值.,疑似異常值,§2 直方圖和箱線圖,修正箱線圖,自箱子左側(cè)引一水平線段直至數(shù)據(jù)集中,又自箱子右側(cè)引一,除去疑似異常值后的最小值,,水平線直至數(shù)據(jù)集中除去疑似異常值后的最大值.,§2 直方圖和箱線圖,例5,下面給出了某醫(yī)院21個病人的住院時間(以,1 2 3 3 4 4 5 6 6 7 7
16、9 9,解,試畫出修正箱線圖(數(shù)據(jù)已經(jīng)過排序).,天計),,10 12 12 13 15 18 23 55,,§2 直方圖和箱線圖,故55 是疑似異常值,,且僅此一個疑,疑似異常值.,作出修正箱線圖如(教材P135)圖6-5所示.,§2 直方圖和箱線圖,1.頻率直方圖作圖步驟,(1) 找出最小值和最大值,,(2) 將選定區(qū)間分為k個小區(qū)間;,三、小結(jié),§2 直方圖和箱線圖,高
17、度自箱子右側(cè)引一條水平線直至最大值.,2.箱線圖作圖步驟,§2 直方圖和箱線圖,一、基本概念,1. 統(tǒng)計量的定義,§3 抽樣分布,,,是,不是,實例1,§3 抽樣分布,2. 幾個常用統(tǒng)計量的定義,(1) 樣本平均值,(2) 樣本方差,其觀察值,§3 抽樣分布,其觀察值,(3) 樣本標準差,其觀察值,§3 抽樣分布,(4) 樣本k 階(原點)矩,其觀察值,(5) 樣本k 階中心矩,其觀察值
18、,§3 抽樣分布,證明,再根據(jù)第五章辛欽定理知,由以上定義得下述結(jié)論:,§3 抽樣分布,由第五章關于依概率收斂的序列的性質(zhì)知,由第五章關于依概率收斂的序列的性質(zhì)知,以上結(jié)論是下一章所要介紹的矩估計法的理,論根據(jù).,§3 抽樣分布,3. 經(jīng)驗分布函數(shù),經(jīng)驗分布函數(shù)的做法如下:,§3 抽樣分布,實例,§3 抽樣分布,實例,§3 抽樣分布,一般地,,§3 抽樣分布,格里汶科
19、定理,§3 抽樣分布,二、常見分布,統(tǒng)計量的分布稱為抽樣分布.,自由度是指上式右端包含的獨立變量的個數(shù).,§3 抽樣分布,證明,§3 抽樣分布,§3 抽樣分布,性質(zhì)1,( 此性質(zhì)可以推廣到多個隨機變量的情形. ),§3 抽樣分布,性質(zhì)2,證明,§3 抽樣分布,§3 抽樣分布,根據(jù)正態(tài)分布的對稱性知,例1,§3 抽樣分布,附表5只詳列到n=40為止.,例2,&
20、#167;3 抽樣分布,例如,利用上面公式,,而查詳表可得,費舍爾(R.A.Fisher)證明:,§3 抽樣分布,例3,解,根據(jù)正態(tài)分布的性質(zhì),,§3 抽樣分布,§3 抽樣分布,§3 抽樣分布,t 分布又稱學生氏(Student)分布.,2.,§3 抽樣分布,形.,當n充分大時,,其圖,形類似于標準正態(tài),變量概率密度的圖,§3 抽樣分布,由分布的對稱性知,§3 抽樣分
21、布,例4,§3 抽樣分布,3.,§3 抽樣分布,§3 抽樣分布,根據(jù)定義可知,,§3 抽樣分布,,例5,§3 抽樣分布,證明,§3 抽樣分布,§3 抽樣分布,4. 正態(tài)總體的樣本均值與樣本方差的分布,定理一,§3 抽樣分布,定理二,§3 抽樣分布,證明,由 t 分布的定義知,定理三,且兩者獨立,,§3 抽樣分布,定理四,§3 抽
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 概率論與數(shù)理統(tǒng)計講義第六章樣本與抽樣分布
- 第2章概率論
- 概率論第4-6章課后習題答案
- 概率論和概率分布
- [學習]概率論與數(shù)理統(tǒng)計課件第6章
- [學習]概率論-抽樣原理與方法
- 概率論第8章-假設檢驗
- 大學概率論第7章習題答案
- 概率論課件-第1章第1講事件與概率
- 華農(nóng)概率論第7章答案
- [學習]概率論第8章假設檢驗
- 概率論與數(shù)理統(tǒng)計第章題庫
- 概率論第1講
- [學習]概率論完整ppt課件第6講
- 概率論與數(shù)理統(tǒng)計第9章題庫
- 《應用統(tǒng)計學》第4章概率論基礎
- 應用數(shù)學基礎下冊第20章-概率論初步
- 《概率論》第1章§1隨機試驗
- 概率論第7-10章課后習題答案
- 概率論與數(shù)理統(tǒng)計第8章題庫
評論
0/150
提交評論