第二章-簡單隨機(jī)抽樣(ppt)_第1頁
已閱讀1頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、《抽樣技術(shù)》第二章,王學(xué)民 編,第二章 簡單隨機(jī)抽樣,§2.1 簡單隨機(jī)抽樣的概念§2.2 總體均值(或總值)的估計(jì)§2.3 總體比例的估計(jì)§2.4 樣本容量的確定§2.5 逆抽樣,§2.1 簡單隨機(jī)抽樣的概念,一、簡單隨機(jī)抽樣的定義二、簡單隨機(jī)抽樣的抽選三、符號和定義,一、簡單隨機(jī)抽樣的定義,簡單隨機(jī)抽樣——從容量為N的有限總體中抽取n個(gè)單元,使

2、得所有不同的樣本每一個(gè)被抽中的概率相等。所得的樣本稱為簡單隨機(jī)樣本。共有 個(gè)不同的樣本,每一個(gè)樣本被抽中的概率 為 。任一個(gè)單元被選入樣本的概率均為n/N。但不能將“每一個(gè)單元被選入樣本的概率皆相等”作為簡單隨機(jī)抽樣的定義。,,實(shí)踐中,簡單隨機(jī)抽樣一般是通過不放回地逐個(gè)從總體中等概率抽取單元來實(shí)現(xiàn)的,故通常將其稱為不放回的簡單隨機(jī)抽樣。若抽樣是有放回地逐個(gè)等概率抽取的,則稱為放回的簡單隨機(jī)抽樣。

3、當(dāng)n/N很小時(shí),放回與不放回的抽樣幾乎給出相同的結(jié)果。在實(shí)際應(yīng)用中,一般都采用不放回抽樣。,例2.1,設(shè)總體有5個(gè)單元(1, 2, 3, 4, 5),按放回簡單隨機(jī)抽樣的方式抽取2個(gè)單元,則所有可能的樣本為25個(gè)(考慮樣本單元的順序):,例2.2,設(shè)總體有5個(gè)單元(1,2,3,4,5),按不放回簡單隨機(jī)抽樣的方式抽取2個(gè)單元,則所有可能的樣本為10個(gè):,二、簡單隨機(jī)抽樣的抽選,首先將容量為N的有限總體中的所有單元從1到N編好號碼,然后

4、從這N個(gè)編號中抽取n個(gè)。具體的抽取方式一般有: (1)抽簽法; (2)隨機(jī)數(shù)表法; (3)計(jì)算機(jī)產(chǎn)生偽隨機(jī)數(shù)法。,隨機(jī)數(shù)表法,隨機(jī)數(shù)表是由0, 1, 2, ?, 9這十個(gè)數(shù)字組成的,書中表3.2給出了由2500個(gè)一位數(shù)字組成的隨機(jī)數(shù)表。這個(gè)隨機(jī)數(shù)表是這樣產(chǎn)生的:在這2500個(gè)位置上分別獨(dú)立地做一次等可能地產(chǎn)生0, 1, 2, ?, 9的隨機(jī)試驗(yàn)。因此,在任意一個(gè)位置上0~9這十個(gè)數(shù)字出現(xiàn)的可能性都相同,在任意兩個(gè)位置

5、上00~99這一百個(gè)數(shù)字出現(xiàn)的可能性也都是相同的,在任意三個(gè)位置上000~999這一千個(gè)數(shù)字出現(xiàn)的可能性也都是相同的,依次類推。,例1,設(shè)總體中的所有個(gè)體編號從1到N,試在以下三種情況下分別抽取一個(gè)容量為n的簡單隨機(jī)樣本。 (1)N=63,n=10,不放回抽樣; (2)在(1)中放回抽樣; (3)N=247,n=7,不放回抽樣。,三、符號和定義,組成總體的N個(gè)單元的標(biāo)志值:Y1,Y2, ?,YN ; 樣本中n個(gè)

6、單元的標(biāo)志值:y1,y2, ?,yn。總體總值: ;總體均值: 樣本總值: ;樣本均值:,方差的定義,對有限總體,總體方差通常定義為習(xí)慣上我們使用形式,抽樣的興趣,通常,抽樣的興趣都集中于總體的四項(xiàng)標(biāo)志: ⑴ 均值 ; ⑵ 總值Y ; ⑶ 具有某一特征的單元所占的比例P(或所占的總數(shù)A=NP); ⑷ 兩個(gè)總值的比率或兩個(gè)均值的比 :,比率的例

7、子,(1)調(diào)查某地區(qū)居民家庭食品消費(fèi)支出占家庭收入的比重。令 Xi——第i個(gè)家庭的家庭收入Yi——第i個(gè)家庭的食品消費(fèi)支出 i=1,2,?,N家庭食品消費(fèi)支出占家庭收入的比重為,比率的例子,(2)在住戶調(diào)查中,要估計(jì)每個(gè)成年女子化妝品的平均費(fèi)用。令Xi——第i個(gè)家庭的成年女子數(shù)Yi——第i個(gè)家庭成年女子化妝品的總費(fèi)用 i=1,2,?,N每個(gè)成年女子化妝品的平均費(fèi)用為,比率的例子,(3)在某住宅小區(qū)的房

8、價(jià)調(diào)查中,要估計(jì)該小區(qū)的平均房屋單價(jià)。令 Xi——第i套住宅的建筑面積 Yi——第i套住宅的市場價(jià)格 i=1,2,?,N該小區(qū)的平均房屋單價(jià)為,§2.2 總體均值(或總值)的估計(jì),定理1 樣本均值 是總體均值 的無偏估計(jì)。證明 方法一:,,方法二: 令  則,,推論1 是總體總值Y的無偏估計(jì)。定理2

9、 。其中f =n/N稱為抽樣比; 1? f 對方差, 對標(biāo)準(zhǔn)誤都稱為有限總體的校正系數(shù)。證明 令,,,,,,,公式 的說明,,,推論2 的標(biāo)準(zhǔn)誤推論3 作為總體總值Y的估計(jì)量, 的方差是推論4 的標(biāo)準(zhǔn)誤,,定理3 對簡單隨

10、機(jī)樣本,樣本方差 是總體方差 的無偏估計(jì)。 證明 令,,,例1,考慮從一個(gè)N=6的總體中抽取n=3的樣本,設(shè)這6個(gè)單元的值分別為Y1=21, Y2=12, Y3=15, Y4=24, Y5=6, Y6=18則 。,,,,可用s來估計(jì)S,但它是有偏的,n較大時(shí)這個(gè)偏差一般可以忽略。推論5 和 的方差的無偏估計(jì)是我

11、們?nèi)∽鳛?的估計(jì)量,它們是有偏的。,樣本均值分布的正態(tài)近似,對有限總體的不放回抽樣,哈杰克(Hajek)在1960年給出了樣本均值 的分布趨于正態(tài)的充分條件。一般地,當(dāng)n≥30時(shí)可認(rèn)為 。,置信區(qū)間,現(xiàn)假定 ,給定置信度1?α,可得均值 和總值Y的置信區(qū)間:當(dāng)n >50時(shí),tα/

12、2(n?1)可由uα/2代替。,,例2,為估計(jì)某中學(xué)300名新生的平均身高,從中抽取了10名進(jìn)行測量,得數(shù)據(jù)(單位:厘米)為158, 149, 156, 153, 160, 151, 157, 145, 152, 159。試問是否求得出平均身高的置信區(qū)間?如何求?解,例3,下頁表列出美國1940年197個(gè)城市的居民數(shù),分別按下述抽樣方案估計(jì)197個(gè)城市的居民總數(shù),請算出估計(jì)量的標(biāo)準(zhǔn)差:(1)容量為50的簡單隨機(jī)樣本;(2)含有

13、5個(gè)最大的城市。并從其余192個(gè)城市中抽出容量為45的簡單隨機(jī)樣本;(3)含有9個(gè)最大的城市,并從其余188個(gè)城市中抽出容量為41的簡單隨機(jī)樣本。,,城市大小的頻數(shù)分布,,,*例4,為了估計(jì)學(xué)校上月用于教學(xué)的開支,從學(xué)校的2389項(xiàng)開支中抽取185項(xiàng),得一簡單隨機(jī)樣本。經(jīng)分析,185項(xiàng)中有160項(xiàng)與教學(xué)有關(guān)。用z表示這160項(xiàng)開支的數(shù)值(單位:千元),經(jīng)計(jì)算試求學(xué)校上月用于教學(xué)的總開支的點(diǎn)估計(jì)、標(biāo)準(zhǔn)誤估計(jì)和0.95置信區(qū)間。,

14、,解 令,,0.95置信區(qū)間:,*例5,通常可以認(rèn)為Y1是很小的,YN是很大的。1972年薩倫達(dá)爾(Sarndal)檢驗(yàn)了下述 的估計(jì)量 其中c是一個(gè)常數(shù)。證明薩倫達(dá)爾的結(jié)果: (1) 是無偏的; (2) 。,,證明(1)令(2)提示,§2.3 總體比例的估計(jì),設(shè)總體容量為N,其中具有某一特征的單元數(shù)為A,總體比例為P=A/N?,F(xiàn)從總體中抽取一個(gè)容量為n的

15、簡單隨機(jī)樣本,又設(shè)樣本中具有某一特征的單元數(shù)為a,樣本比例為p=a/n。定理4 樣本比例p=a/n是總體比例P=A/N的無偏估計(jì)。,,證明 令推論6 是A的無偏估計(jì)。定理5 p的方差是 其中Q=1?P。,,證明 令 于是,,推論7 的方差是定理6 p的方差V(p)的無偏估計(jì)是其中q=1?p。,,證明 令,,推論8

16、 的方差 的無偏估計(jì)是當(dāng)n很大,p和q都不太小時(shí),由中心極限定理知,p近似服從正態(tài)分布。由此可以構(gòu)造出P的1-α置信區(qū)間:其中 是連續(xù)性的校正項(xiàng);A=NP的1-α置信區(qū)間:,例6,從一份共有3042人的人名錄中隨機(jī)抽200人,發(fā)現(xiàn)38人的地址已變動(dòng),試對這份人名錄中需要修改的地址總數(shù)作出點(diǎn)估計(jì)和95%的置信區(qū)間。,,解,§2.4 樣本容量的確定,精度與費(fèi)用之間是一

17、對矛盾。一般地,調(diào)查所要求的精度越高,調(diào)查所需的費(fèi)用也就越大。最簡單的一種費(fèi)用函數(shù)是:C=c0+cn ,這時(shí),確定C?確定n。本節(jié)討論在精度給定的條件下如何來確定n。,,估計(jì)總體均值時(shí)樣本容量的確定,設(shè)V是一事先給定的值,若要求滿足 (或 ),則所需的樣本容量當(dāng) 很小時(shí),可近似地表示為n≥n0(或n=n0)。當(dāng)用 來估計(jì) 時(shí),估計(jì)的絕對誤差是

18、 ,而相對誤差是 ,它們都是隨機(jī)變量。,,給定置信度1?α,稱d為絕對誤差限,稱r為相對誤差限,且 。當(dāng)n足夠大時(shí), 。在確定n之前,先假定求出的n會足夠大,使得 ,這時(shí)有 其中 稱為 的變異系數(shù)。 其中cv是

19、總體的變異系數(shù),稱cv2為總體的相對方差。,例7,為調(diào)查學(xué)生購書支出,某高校在全校6000名大學(xué)生中按簡單隨機(jī)抽樣抽出80名學(xué)生,調(diào)查了他們最近一個(gè)學(xué)期用于購書支出后,得到 (元),s2=13712,試估計(jì)該校大學(xué)生最近一個(gè)學(xué)期用于購書的總支出,并給出估計(jì)的標(biāo)準(zhǔn)差。如果在95%置信度下,估計(jì)的相對誤差限不超過10%,則應(yīng)該抽出多少學(xué)生進(jìn)行調(diào)查?,,解,估計(jì)總體比例時(shí)樣本容量的確定,可推得,設(shè)計(jì)效應(yīng),為比較不同

20、抽樣設(shè)計(jì)的效率,基什(L.Kish)提出一個(gè)稱為設(shè)計(jì)效應(yīng)的量。deff=所考慮抽樣設(shè)計(jì)估計(jì)量的方差/相同樣本容量下簡單隨機(jī)抽樣估計(jì)量的方差設(shè)計(jì)效應(yīng)值愈大,表明它的效率愈低。若deff>1,表明所考慮的抽樣設(shè)計(jì)的效率不如簡單隨機(jī)抽樣;若deft<1,則表明該抽樣設(shè)計(jì)的效率比簡單隨機(jī)抽樣高。,,放回簡單隨機(jī)抽樣的設(shè)計(jì)效應(yīng)為設(shè)計(jì)效應(yīng)在實(shí)際中還有一個(gè)十分重要的作用,即用于確定樣本容量。一種設(shè)計(jì)要達(dá)到與(不放回)簡單隨機(jī)抽樣

21、同樣的精度(相等的方差),它的樣本容量恰應(yīng)是簡單隨機(jī)抽樣的deff倍。,,抽樣前未知參數(shù)的估計(jì),一般來說, , S2, P皆未知,要算出n,必須先要對 S2(或P)作出點(diǎn)估計(jì)。常用的簡單方法有: ⑴ 分兩步抽取樣本,先抽取一個(gè)容量為n1的較小樣本,用來估計(jì) S2(或P),計(jì)算出n后,再抽一個(gè)容量為n?n1的樣本; ⑵ 從以往同一總體或同類總體的研究中得出S2(或P)的估計(jì)值; ⑶ 根據(jù)經(jīng)驗(yàn),給出一個(gè)足夠大的n。,估

22、計(jì)總體比例時(shí)樣本容量的放大,,§2.5 逆抽樣,當(dāng)用 來估計(jì)P時(shí),若給定r值,則所需的樣本容量。當(dāng)P很小時(shí),所需的n很大,這時(shí)在抽取樣本之前精確地估計(jì)P非常重要,而這往往難以做到,因而n難以確定。逆抽樣就是一直抽到第m個(gè)具有某特征的單元出現(xiàn)為止。樣本容量 是一個(gè)隨機(jī)變量,P的一個(gè)無偏估計(jì)是,,當(dāng)N很大,P較小,m≥10時(shí),例8 使用逆抽樣,當(dāng)P較小時(shí),若要求估計(jì)量的變異系數(shù)不超過2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論