版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、統計學抽樣與抽樣分布(2016),抽樣與抽樣分布,1 抽樣基本知識2 抽樣分布3 樣本統計量的抽樣分布 (一個總體參數推斷時)4 樣本統計量的抽樣分布 (兩個總體參數推斷時),學習目標,了解概率抽樣方法區(qū)分總體分布、樣本分布、抽樣分布理解抽樣分布與總體分布的關系掌握單總體參數推斷時樣本統計量的分布,抽樣基本知識,總體與樣本 抽樣方法 抽樣框抽樣誤差,總體和參數,總體(Population),是指所要研究的
2、對象的全體,它是由所研究范圍內具有某種共同性質的全部單位所組成的集合體。總體單位總數用N表示。參數(parameter)。用來反映總體數量特征的指標稱。研究目的一經確定,總體也唯一地確定了,所以總體指標的數值是客觀存在的、確定的,但又是未知的,需要用樣本資料去估計。,總體和參數(續(xù)),通常所要估計的總體指標有,樣本和統計量,樣本(Sample),它是從總體中抽取的部分總體單位的集合體 。樣本容量。樣本中所包含的個體的數量,一般用n表
3、示。在實際工作中,人們通常把n≥30的樣本稱為大樣本,而把n<30的樣本稱為小樣本。對于某一既定的總體,由于抽樣的方式方法不同,樣本容量也可大可小,因而,樣本是不確定的、可變的。抽樣的目的就是為要用樣本的特征去估計總體特征,但樣本只是總體的一部分,而且樣本的抽取又具有隨機性,因此,樣本的內部構成與總體的內部構成總是具有一定的差異,樣本不能完全代表總體,抽樣估計總是存在一定的代表性誤差。,樣本和統計量(續(xù)),統計量(statis
4、tic)。在抽樣估計中,用來反映樣本總體數量特征的指標稱為樣本指標,也稱為樣本統計量或估計量,是根據樣本資料計算的、用以估計或推斷相應總體指標的綜合指標。常見的樣本統計量有: 樣本統計量不含未知參數,它是隨樣本不同而不同的隨機變量。,樣本統計量一、統計量 隨機抽樣每次抽取的結果Xi,可能是總體中任何一個個體。因此可以看成是一個隨機變量。n次抽取形成的樣本X1, X2,… , Xn可以看成是一組隨機變量?! ≡O
5、X1, X2,… , Xn是來自總體X 的一個樣本,g(X1, X2,… , Xn) 是X1, X2,… , Xn的一個函數。若 g 是連續(xù)函數,且 g 中不含任何未知參數,則稱 g(X1, X2,… , Xn) 是一個統計量。統計量也是一個隨機變量。 設x1, x2,… , xn 是相應于樣本X1, X2,… , Xn的一個樣本值, 則稱 g(x1, x2,… , xn ) 是統計量 g(X1, X2,… , Xn) 的一個觀測
6、值。 統計量作為一個隨機變量,它的分布稱為抽樣分布。,設X1, X2,… , Xn是來自總體X 的一個樣本。 x1, x2,… , xn是這個樣本的一個樣本值。則都是統計量,它們的觀測值分別是,抽樣方法,概率抽樣(probability sampling),概率抽樣也叫隨機抽樣,是指按隨機原則抽取樣本。隨機原則,就是排除主觀意識的干擾,使總體每一個單位都有一定的概率被抽選為樣本單位,每個單位能否入選是隨機的。 特點
7、能有效地避免主觀選樣帶來的傾向性誤差(系統偏差),使樣本資料能夠用于估計和推斷總體的數量特征,而且這種估計和推斷得以建立在概率論和數理統計的科學理論之上可以計算和控制抽樣誤差,說明估計的可靠程度。作用:在不可能或不必要進行全面調查時,利用概率抽樣來推斷總體;利用概率抽樣修正或補充全面調查的不足。,概率抽樣 (probability sampling) (續(xù)),統計上所指的抽樣一般都是指概率抽樣概率抽樣最基本的組織形式有:簡單
8、隨機抽樣、分層抽樣、等距抽樣和整群抽樣。,簡單隨機抽樣(simple random sampling),從總體N個單位(元素)中隨機地抽取n個單位作為樣本,使得總體中每一個元素都有相同的機會(概率)被抽中 抽取元素的具體方法有重復抽樣和不重復抽樣特點簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統計量對目標量進行估計比較方便局限性當N很大時,不易構造抽樣框抽出的單位很分散,給實施調查增加了困難沒有利用其他輔助信息
9、以提高估計的效率,簡單隨機樣本(simple random sample),由簡單隨機抽樣形成的樣本從總體N個單位中隨機地抽取n個單位作為樣本,使得每一個容量為n樣本都有相同的機會(概率)被抽中 參數估計和假設檢驗所依據的主要是簡單隨機樣本,簡單隨機抽樣(用Excel對分類數據隨機抽樣),【例】某班級共有30名學生,他們的名單如右表。用Excel抽出一個由5個學生構成的隨機樣本,簡單隨機抽樣(用Excel對分類數據隨機抽樣),
10、第1步:將30個學生的名單錄入到Excel工作表中的一列第2步:給每個學生一個數字代碼,分別為1,2…,30,并按順序排列,將代碼錄入到Excel工作表中的一列,與學生名單相對應第3步:選擇【工具】下拉菜單,并選擇【數據分析】選項, 然后在【數據分析】選項中選擇【抽樣】第4步:在【抽樣】對話框中的【輸入區(qū)域】中輸入學生代碼區(qū)域,在【抽樣方法】中單擊【隨機】 。在【樣本數】中輸入需要抽樣的學生個數。在【輸出區(qū)域】中選擇抽樣結果放置的
11、區(qū)域?!敬_定】后即得到要抽取的樣本,? 用Excel對分類數據抽樣,簡單隨機抽樣(用Excel對數值型數據隨機抽樣),第1步:將原始數據錄入到Excel工作表中的一列第2步:選擇【工具】下拉菜單,并選擇【數據分析 】選項 , 然后在【數據分析】選項中選擇【抽樣】第3步:在【抽樣】對話框中的【輸入區(qū)域】中輸入原始數據 區(qū)域,在【抽樣方法】中單擊【隨機】。在【樣本數】中輸入需要抽樣的數據個數。在【輸出區(qū)域】中選擇抽樣結果放置的區(qū)域。
12、【確定】后即得到要抽取的樣本數據,? 用Excel對數值型數據抽樣,分層抽樣(stratified sampling),又稱類型抽樣或分類抽樣。先對總體各單位按主要標志加以分組(層),然后再從各組(層)中按隨機原則獨立抽選一定單位構成樣本。分層抽樣通過分類(組),把總體中標志值比較接近的單位歸為一組,減少各組內的差異程度,這樣再從各組抽取樣本單位就更具有代表性,因而抽樣誤差也就相對縮小。特別是在標志值相差懸殊時,由于劃分了類型,
13、一方面縮小了組內方差,另一方面也保證各組都能抽取一定的樣本單位,所以,分層抽樣較之純隨機抽樣可以提高樣本的代表性,能獲得更為滿意的效果,分層抽樣(stratified sampling)續(xù),優(yōu)點:除了可以對總體進行估計外,還可以對各層的子總體進行估計可以按自然區(qū)域或行政區(qū)域進行分層,使抽樣的組織和實施都比較方便分層抽樣的樣本分布在各個層內,從而使樣本在總體中的分布比較均勻如果分層抽樣做得好,便可以提高估計的精度,系統抽樣(s
14、ystematic sampling),將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位先從數字1到k之間隨機抽取一個數字r作為初始單位,以后依次取r+k,r+2k等單位優(yōu)點:簡便易行??商岣吖烙嫷木热秉c:對估計量方差的估計比較困難,等距抽樣(續(xù)),間隔相等,樣本數n,,整群抽樣(cluster sampling),將總體中若干個單位合并為組(群
15、),抽樣時直接抽取群,然后對中選群中的所有單位全部實施調查特點抽樣時只需群的抽樣框,可簡化工作量調查的地點相對集中,節(jié)省調查費用,方便調查的實施缺點是估計的精度較差,多階段抽樣(multi-stage sampling),先抽取群,但并不是調查群內的所有單位,而是再進行一步抽樣,從選中的群中抽取出若干個單位進行調查群是初級抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數增多,就稱為多階段抽樣具有整群抽樣的
16、優(yōu)點,保證樣本相對集中,節(jié)約調查費用需要包含所有低階段抽樣單位的抽樣框;同時由于實行了再抽樣,使調查單位在更廣泛的范圍內展開在大規(guī)模的抽樣調查中,經常被采用的方法,概率抽樣(小結),非概率抽樣,也叫非隨機抽樣,是指從研究目的出發(fā),根據調查者的經驗或判斷,從總體中有意識地抽取若干單位構成樣本。重點調查、典型調查、配額抽樣(是按照一定標準或一定條件分配樣本單位數量,然后由調查者在規(guī)定的數額內主觀地抽取樣本)、方便抽樣(指調查者按其方便
17、任意選取樣本。如商場柜臺售貨員拿著廠家的調查表對顧客的調查)等就屬于非隨機抽樣。優(yōu)點:及時了解總體大致情況,總結經驗教訓,在進行大規(guī)模抽樣調查之前的試點。缺點:非隨機抽樣容易產生傾向性誤差,并且誤差不能計算和控制 ,也就無法說明調查結果的可靠程度。,,概率抽樣與非概率抽樣,,,,,4. 系統隨機抽樣 先隨機地抽取一個樣本,然后按某種規(guī)律順次地得到全部樣本的抽取方法。 系統隨機抽樣的實現方法:對容量為
18、N的總體,先將總體中各個個體按某種順序從1到N編號。設要從中抽取出容量為n的樣本,設?N / n ?=k ,則先從編號為1到k的k個個體中隨機地抽取一個,然后每隔k個抽取一個,順次得到容量為n的樣本。 系統隨機抽樣也稱為系統抽樣、等距抽樣或機械抽樣。,重復抽樣與非重復抽樣,重復抽樣,又稱回置抽樣,是指從總體的N個單位中,每次抽取一個單位后,再將其放回總體中參加下一次抽選,連續(xù)抽n次,即得到一個樣本。特點:樣本是由n次相
19、互獨立的連續(xù)試驗構成的,每次試驗是在完全相同的條件下進行,每個單位中選的機會在各次都完全相等?!爸爻椤保紤]順序)可能的樣本數目(從總體中可能抽取的樣本個數,用M表示)為:Nn個。,重復抽樣與非重復抽樣,不重復抽樣,也叫不回置抽樣,是指抽中的單位不再放回總體中,下一個樣本單位只能從余下的總體單位中抽取。特點:樣本由n次連續(xù)抽取的結果構成,實際上等于一次同時從總體中抽取n個樣本單位。 n次抽取結果不是獨立的 可能的樣本數目(考慮順
20、序): N(N-1)(N-2)…(N-n+1)個。,重復抽樣與非重復抽樣,設有4名學生的月消費支出分別為:240,280,360,400元。我們分別用A、B、C、D替代。若從中抽取兩個單位構成樣本,則全部可能的樣本數目為:重復:42=16個。它們是 AA AB AC AD; BA BB BC BD CA CB CC CD; DA DB DC DD不重復:4
21、215;3=12。它們是 AB AC AD; BA BC BD CA CB CD; DA DB DC,抽樣框,調查目的確定之后,抽樣總體(目標總體)也就隨之確定。 但實際進行抽樣的總體范圍與目標總體有時是不一致的。所以,有了目標總體,還必須明確實際進行抽樣的總體范圍和抽樣單位,這就需要編制一個抽樣框。抽樣框是包括全部抽樣單位的名單框架。編制抽樣框是實施抽樣的基礎。抽樣框的
22、好壞通常會直接影響到抽樣調查的隨機性和調查效果。,抽樣框,名單抽樣框。列出全部總體單位的名錄一覽表。區(qū)域抽樣框。按地理位置將總體范圍劃分為若干小區(qū)域,以小區(qū)域為抽樣單位。時間表抽樣框。將總體全部單位按時間順序排列,把總體的時間過程分為若干個小的時間單位,以此時間單位為抽樣單位。理想的抽樣框:不重復、不遺漏。,抽樣誤差,統計調查誤差,是指調查所得結果與總體真實數值之間的差異。 登記性誤差。是任何一種統計調查都可能產生。 代表性
23、誤差系統性誤差:是由于非隨機因素引起的 樣本代表性不足而產生的誤差,表現為樣本估計量的值系統性偏高或偏低,故也稱偏差;隨機誤差:又稱偶然性誤差,是指遵循隨機原則抽樣,但由于樣本各單位的結構不足以代表總體各單位的結構而引起的樣本估計量與總體參數之間的誤差。這就是抽樣估計中所謂的抽樣誤差 。,三個誤差概念,實際抽樣誤差 某一具體樣本的樣本估計值與總體參數真實值之間的離差??傮w參數未知,每次抽樣的實際抽樣誤差是無法計算的。樣本是隨
24、機抽取,樣本估計量是隨樣本不同而不同的隨機變量,隨機抽樣誤差也是隨機變量,但樣本估計量的所有可能取值總有一定的分布規(guī)律,抽樣誤差也就有一定的規(guī)律可循。抽樣誤差可以計算和控制,并不是指某次具體抽樣的實際誤差,而是從所有可能樣本來考察的抽樣平均誤差和抽樣極限誤差。,三個誤差概念,抽樣平均誤差(抽樣標準誤)是反映抽樣誤差一般水平的指標(因為抽樣誤差是一個隨機變量,它的數值隨著可能抽取的樣本不同而或大或小,為了總的衡量樣本代表性的高低,就需
25、要計算抽樣誤差的一般水平)。通常用樣本估計量的標準差來反映所有可能樣本估計值與其中心值的平均離散程度??梢宰C明,對于既定的總體和樣本容量,樣本估計量是以相應總體參數為分布中心的。統計上把樣本估計量的標準差定義為抽樣平均誤差,三個誤差概念,抽樣平均誤差(抽樣標準誤)抽樣平均誤差可衡量樣本對總體的代表性大小。抽樣平均誤越小,則樣本估計量的分布就越集中在總體參數的附近,平均來說,樣本估計值與總體參數之間的抽樣誤差越小,樣本對總體的代
26、表性越大。,三個誤差概念,實際中,抽樣平均誤差不可能按定義式來計算,只能根據概率論和數理統計的有關理論來推導其計算公式。在總體方差已知,總體單位總數為N,樣本容量為n,簡單隨機抽樣條件下,抽樣平均誤的計算公式為:,三個誤差概念,抽樣極限誤差一定概率下抽樣誤差的可能范圍,也稱為允許誤差。用Δ表示,由定義知其表達式:在一定概率下, 上式表示,在一定概率下可認為樣本估計量與相應的總體參數的誤差的絕對值不超過 。用 、
27、分別表示平均數和比例(成數)的抽樣極限誤差,則在一定概率下有:,三個誤差概念,抽樣極限誤差估計均值的置信區(qū)間:估計成數(比例)的置信區(qū)間:,三個誤差概念,抽樣極限誤差是抽樣誤差的可能范圍,而不是完全肯定的范圍。所以,這一可能范圍的大小是與其估計的可靠程度的大?。锤怕剩┚o密聯系的。在抽樣估計中,這個概率叫置信度,習慣上也稱為可靠程度、把握程度或概率保證程度等,用1-α表示。顯然在其他條件不變的情況下,抽樣極限誤差越大,相應的置
28、信度也就越大。與抽樣極限誤差相關的兩個概念是: 抽樣誤差率和抽樣估計精度。抽樣誤差率=(抽樣極限誤差/估計量)×100%抽樣估計精度=100%-抽樣誤差率,三個誤差概念,估計精度與估計的可靠程度是矛盾的。也就是說,如果精度很高,則會由于估計區(qū)間太窄而使錯誤估計的可能性大增,從而大大降低估計的可靠程度,使估計結果沒有多大的作用;如果置信度很高,則意味著允許誤差范圍較大,而使估計精度太低 ,這時盡管估計的可靠程度接近或等于1
29、00%,但抽樣估計本身也會失去意義。實際中,只能依據具體情況,先滿足一方面,然后確定另一方面 。抽樣極限誤差與抽樣平均誤差的關系?,三種不同性質的分布,1 總體分布2 樣本分布3 抽樣分布,總體分布(population distribution),總體中各元素的觀察值所形成的分布 分布通常是未知的可以假定它服從某種分布,樣本分布(sample distribution),一個樣本中各觀察值的分布 也稱經驗
30、分布 當樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布,抽樣分布 (sampling distribution),樣本統計量的概率分布,是一種理論分布在重復選取容量為n的樣本時,由該統計量的所有可能取值及出現的概率分布 樣本統計量(樣本均值, 樣本比例,樣本方差等)是隨機變量,它有若干可能取值,每個可能取值都有一定的可能性(即概率),從而形成它的概率分布,即統計上所謂的抽樣分布。樣本統計量是由n個隨機變量構成的函數,故抽樣分
31、布屬于隨機變量函數的分布。結果來自容量相同的所有可能樣本,抽樣分布 (sampling distribution),抽樣分布反映了樣本指標的分布特征,是抽樣推斷的重要依據。根據樣本分布的規(guī)律,可揭示樣本指標與總體指標之間的關系,估計抽樣誤差,并說明抽樣推斷的可靠程度。尋求抽樣分布的方法:精確分布,小樣本方法漸進分布,大樣本方法,,抽樣分布的形成過程 (sampling distribution),抽樣分布(例證),四名學生的
32、月消費支出(240,280,360,400 元)。現按重復取樣的方法,隨機抽取兩位構成一個樣本,則全部可能的樣本及其各樣本的均值如下表所示:,,抽樣分布(例證),,樣本統計量的抽樣分布 (一個總體參數推斷時),樣本均值的抽樣分布樣本比例的抽樣分布 樣本方差的抽樣分布,樣本均值的抽樣分布,樣本均值的抽樣分布,在重復選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數分布一種理論概率分布推斷總體均值?的
33、理論基礎,樣本均值的抽樣分布(例題分析),【例】設一個總體,含有4個元素(個體) ,即總體單位數N=4。4 個個體分別為x1=1,x2=2,x3=3,x4=4 ??傮w的均值、方差及分布如下,均值和方差,樣本均值的抽樣分布 (例題分析),? 現從總體中抽取n=2的簡單隨機樣本,在重復抽樣條件下,共有42=16個樣本。所有樣本的結果為,樣本均值的抽樣分布 (例題分析),? 計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布,,樣本均
34、值的分布與總體分布的比較 (例題分析),? = 2.5 σ2 =1.25,總體分布,樣本均值的抽樣分布與中心極限定理,當總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值?x也服從正態(tài)分布,?x 的數學期望為μ,方差為σ2/n。即?x~N(μ,σ2/n),中心極限定理(central limit theorem),中心極限定理:設從均值為?,方差為? 2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均
35、值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布,樣本均值和樣本方差的分布 1. 一般情況 設總體X 的均值為?,方差為? 2, X1, X2,… , Xn是X 的一個樣本,則有E(Xi)= ?, D(Xi)= ? 2 (i=1,2,…,n)。由數學期望和方差的性質,有,中心極限定理 (central limit theorem),?x 的分布趨于正態(tài)分布的過程,,2. 正態(tài)總體情況定理1 設隨機變量X1, X2,
36、…, Xn相互獨立, 且服從正態(tài)分布N(?i, ?i2),則它們的線性組合,該定理說明相互獨立的正態(tài)分布隨機變量的線性組合仍是正態(tài)分布。推論1 設X1, X2,… , Xn為來自正態(tài)總體X~N(?, ? 2 ) 的一個樣本,則,定理2,定理3,定理4 設X1, X2,… , Xn1與 Y1, Y2,… , Yn2分別是來自具有相同方差的兩個正態(tài)總體N(μ1, σ2) 與 N(μ2, σ2) 的樣本,且這兩個樣本相互獨立,則,3. 中
37、心極限定理,正態(tài)總體方差未知,小樣本,設總體X~N(µ,σ²),(x1,x2,……xn)是其簡單隨機樣本,則統計量,,抽樣分布與總體分布的關系,總體分布,,,,,,,正態(tài)分布,未知,大樣本,小樣本,樣本均值正態(tài)分布,,樣本均值正態(tài)分布,樣本均值t分布,,,方差已知,方差未知,樣本均值的抽樣分布(數學期望與方差),樣本均值的數學期望樣本均值的方差重復抽樣不重復抽樣,樣本均值的抽樣分布(數學期望與方差
38、),比較及結論:1. 樣本均值的均值(數學期望) 等于總體均值 2. 樣本均值的方差等于總體方差的1/n,統計量的標準誤 (standard error),樣本統計量的抽樣分布的標準差,稱為統計量的標準誤,也稱為標準誤差標準誤衡量的是統計量的離散程度,它測度了用樣本統計量估計總體參數的精確程度以樣本均值的抽樣分布為例,在重復抽樣條件下,樣本均值的標準誤為,估計的標準誤 (standar
39、d error of estimation),當計算標準誤時涉及的總體參數未知時,用樣本統計量代替計算的標準誤,稱為估計的標準誤以樣本均值的抽樣分布為例,當總體標準差?未知時,可用樣本標準差s代替,則在重復抽樣條件下,樣本均值的估計標準誤為,樣本比例的抽樣分布,比例(proportion),總體(或樣本)中具有某種屬性的單位與全部單位總數之比不同性別的人與全部人數之比合格品(或不合格品) 與全部產品總數之比總體比例可表示為
40、樣本比例可表示為,樣本比例的抽樣分布,在重復選取容量為n的樣本時,由樣本比例的所有可能取值形成的相對頻數分布一種理論概率分布當樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似 推斷總體比例P的理論基礎,樣本比例的抽樣分布,當從總體中抽取一個樣本容量為n的樣本時,樣本中具有某種特征的單位數X服從二項分布,即有X~B(n,π)E(X)=nπVar(X)=nπ(1-π),樣本比例的抽樣分布(數學期望與方差),樣本比例p=x/n也
41、服從二項分布樣本比例的數學期望樣本比例的方差重復抽樣不重復抽樣,樣本比例的抽樣分布,根據中心極限定理,當n→∞時,二項分布趨近于正態(tài)分布。所以,在大樣本下,若nP和n(1-P)皆大于5,樣本比例近似服從正態(tài)分布,樣本方差的抽樣分布,樣本方差的分布,在重復選取容量為n的樣本時,由樣本方差的所有可能取值形成的相對頻數分布對于來自正態(tài)總體的簡單隨機樣本,則比值 的抽樣分布服從自由度為 (n -1) 的?2分布,即,?2
42、分布(?2 distribution),由阿貝(Abbe) 于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson) 分別于1875年和1900年推導出來設 ,則令 ,則 Y 服從自由度為1的?2分布,即 當總體 ,從中抽取容量為n的樣本,則,?2分布
43、(性質和特點),分布的變量值始終為正 分布的形狀取決于其自由度n的大小,通常為不對稱的正偏分布,但隨著自由度的增大逐漸趨于對稱 期望為E(?2)=n,方差為D(?2)=2n(n為自由度) 可加性:若U和V為兩個獨立的服從?2分布的隨機變量,U~?2(n1),V~?2(n2),則U+V這一隨機變量服從自由度為n1+n2的?2分布,,c2分布(圖示),,,c2分布(例題的圖示),,,c2分布(用Excel計算c2分布的概率),
44、利用Excel提供的CHIDIST統計函數,計算c2分布右單尾的概率值語法為CHIDIST(x,df),其中df為自由度,x是隨機變量的取值給定自由度和統計量取值的右尾概率,也可以利用“插入函數”命令來實現計算自由度為8,統計量的取值大于10的概率,? 用Excel計算c2 分布的概率,c2分布(用Excel計算c2分布的臨界值),利用Excel提供的CHIINV統計函數,計算分布右單尾的概率值為?的臨界值語法為CHIINV(
45、?,df),其中df為自由度給定自由度和分布右尾概率為?的臨界值也可以利用“插入函數”命令來實現計算自由度為10,右尾概率為0.1的臨界值,? 用Excel計算c2 分布的臨界值,c2分布(用Excel生成c2分布的臨界值表),第一步:將c2分布自由度df的值輸入到工作表的 A列,將右尾概率的取值輸入到第1行第二步:在B2單元格輸入公式 “=CHIINV(B$1,$A2)”
46、 然后將其向下、向右復制即可得到分布 的臨界值表,? 用Excel生成c2 分布的臨界值表,c2分布 (用Excel繪制c2分布圖),第1步:在工作表的第1列A2:A62輸入應一個等差數列,初始 值為“0”,步長為“1”,終值為“60”第2步:在單元格B1輸入c2分布自由度(如“15”) 第3步:在單元格B2輸入公式“=CHIDIST(A2,$B$1
47、)”,并將其 復制到B3:B62區(qū)域第4步:在單元格C2輸入公“=B2-B3”,并將其復制到C3:C62 區(qū)域第5步:將A2:A62作為橫坐標、C2:C62作為縱坐標,根據“ 圖表向導”繪制折線圖,? 用Excel繪制c2分布圖,,c2分布 (用Excel繪制c2分布圖),樣本均值,樣本比例,樣本方差,分布未知大樣本,正態(tài)總體方差
48、已知,正態(tài)總體方差未知小樣本,大樣本,正態(tài)分布,t分布,χ2分布,樣本統計量,,,,,,,,,,,,,樣本統計量的抽樣分布 (兩個總體參數推斷時),兩個樣本均值之差的抽樣分布 兩個樣本比例之差的抽樣分布 兩個樣本方差比的抽樣分布,兩個樣本均值之差的抽樣分布,兩個樣本均值之差的抽樣分布,兩個總體都為正態(tài)分布,即 , 兩個樣本均值
49、之差 的抽樣分布服從正態(tài)分布,其分布的數學期望為兩個總體均值之差 方差為各自的方差之和,,兩個樣本均值之差的抽樣分布,兩個樣本比例之差的抽樣分布,兩個樣本比例之差的抽樣分布,兩個總體都服從二項分布分別從兩個總體中抽取容量為n1和n2的獨立樣本,當兩個樣本都為大樣本時,兩個樣本比例之差的抽樣分布可用正態(tài)分布來近似分布的數學期望為 方差為各自的方差之和,兩個樣本方差比的抽樣分布,兩個樣本方差
50、比的抽樣分布,兩個總體都為正態(tài)分布,即X1~N(μ1 ,σ12),X2~N(μ2 ,σ22 )從兩個總體中分別抽取容量為n1和n2的獨立樣本兩個樣本方差比的抽樣分布,服從分子自由度為(n1-1),分母自由度為(n2-1) 的F分布,即,F分布(F distribution),由統計學家費希爾(R.A.Fisher) 提出的,以其姓氏的第一個字母來命名設若U為服從自由度為n1的?2分布,即U~?2(n1),V為服從自由度為n2的?
51、2分布,即V~?2(n2),且U和V相互獨立,則 稱F為服從自由度n1和n2的F分布,記為,,F分布(圖示),? 不同自由度的F分布,F 分布(用Excel計算F分布的概率),利用Excel提供的FDIST統計函數,計算分布右單尾的概率值其語法為FDIST(x,df1,df2),其中x是隨機變量的取值,df1為分子自由度,df2為分母自由度給定分子自由度df1、分母自由度df2和統計量取值的右尾概率,也可以利用“
52、粘貼函數”命令來實現計算分子自由度為4,分母自由度為6,統計量的取值大于2.5的概率,? 用Excel計算F分布的概率,F 分布(用Excel計算F分布的臨界值),利用Excel提供的FINV統計函數,計算分布右單尾的概率值為?的臨界值其語法為FINV(?,df1,df2),其中df1為分子自由度,df2為分母自由度給定分子自由度、分母自由度df2和分布右尾概率為?的臨界值也可以利用“粘貼函數”命令來實現計算分子自由度為4,分
53、母自由度為6,F分布右尾概率為0.05的臨界值,? 用Excel計算F分布的臨界值,F 分布(用Excel生成F分布的臨界值表),第一步:在B1單元格輸入分布右尾概率的取值(如 ?=0.05),在第2行輸入分子自由度df1的 值,在第1列輸入分母自由度df2的值第二步:在B2單元格輸入公式 “=CHIINV(B$1,$A2)”
54、 然后將其向下、向右復制即可,? 用Excel生成F分布的臨界值表,F 分布 (用Excel繪制F分布圖),第1步:在工作表的第1列A2:A62輸入一個等差數列,初始 值為“0”,步長為“0.1”,終值為“6”第2步:在單元格B1輸入分子自由度(如“10”) ,在單元格D1輸 入分母自由度(如“15”) 第3步:在單元格B2輸入公式“=FDIST(A2,$B$1,$D$1)”
55、,并 將其復制到B3:B62區(qū)域第4步:在單元格C2輸入公式“=(B2-B3)*10”,并將其復制到 C3:C62區(qū)域第5步:將A2:A62作為橫坐標、C2:C62作為縱坐標,根據 “圖表向導”繪制折線圖,? 用Excel繪制F分布圖,,F 分布 (用Excel繪制F分布圖),小結,概率抽樣方法總體分布、樣本分布、抽樣分布單總體參數推斷時樣本統計量的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- [醫(yī)學]統計學抽樣與抽樣分布練習題
- 統計學06第6章--統計量及其抽樣分布
- 統計學課件第5章抽樣分布配套講義
- 心理與教育統計學 22 抽樣設計
- 統計學a第6章-抽樣推斷
- 《統計學》-第八章-抽樣推斷
- 應用統計-基本概念與抽樣分布
- 統計學06第六章-抽樣調查
- 抽樣與抽樣估計
- 抽樣方法、正態(tài)分布
- 抽樣分布與參數估計
- [學習]概論統計——抽樣檢驗
- 實驗四 時域抽樣與頻域抽樣
- 實驗二 時域抽樣與頻域抽樣
- [學習]概率統計課件167;64.1—2(文.工)抽樣分布
- 醫(yī)學統計學正態(tài)分布
- 正態(tài)總體的抽樣分布
- 簡單隨機抽樣、系統抽樣、分層抽樣
- 第六章 抽樣分布
- -貿易統計抽樣調查研究
評論
0/150
提交評論