[學習]概率論與數(shù)理統(tǒng)計課件(第3-5章)_第1頁
已閱讀1頁,還剩214頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、二維隨機變量及其分布,第三章,二維隨機變量及其聯(lián)合分布,邊緣分布與獨立性,兩個隨機變量的函數(shù)的分布,例如 E:抽樣調(diào)查15-18歲青少年的身高 X與體重 Y,以研究當前該年齡段青少年的身體發(fā)育情況。,前面我們討論的是隨機實驗中單獨的一個隨機變量,又稱為一維隨機變量;然而在許多實際問題中,常常需要同時研究一個試驗中的兩個甚至更多個隨機變量。,不過此時我們需要研究的不僅僅是X及Y各自的性質, 更需要了解這兩個隨機變量的相互依賴和制約

2、關系。因此, 我們將二者作為一個整體來進行研究,記為(X, Y),稱為二維隨機變(向)量。,設X、Y 為定義在同一樣本空間Ω上的隨機變量,則稱向量( X,Y )為Ω上的一個二維隨機變量。,定義,二維隨機變量,二維隨機變量(X, Y)的取值可看作平面上的點,二維隨機變量的聯(lián)合分布函數(shù),若(X,Y)是隨機變量,對于任意的實數(shù)x,y.,定義,,稱為二維隨機變量的聯(lián)合分布函數(shù),性質,(3),,P(x1? X ?x2,y1? Y ?y2)

3、= F(x2,y2)- F(x2,y1)- F(x1,y2) + F(x1,y1),聯(lián)合分布函數(shù)表示矩形域概率,P(x1 ? X ? x2,y1 ? Y ? y2),F(x2,y2),-F(x2,y1),-F(x1,y2),+F(x1,y1),二維離散型隨機變量,若二維 隨機變量 (X,Y)的所有可能取值只有限對或可列對,則稱(X,Y)為二維離散型隨機變量。,如何反映(X,Y)的取值規(guī)律呢?,定義,研究問題,聯(lián)想一維離散型隨機變量的分布

4、律。,(X,Y)的聯(lián)合概率分布(分布律),表達式形式,,,,,,,,,,,,,,,,,,表格形式(常見形式),性質,,的可能取值為(1, 2), (2, 1), (2, 2).,P{X=1,Y=2}=(1/3) × (2/2)=1/3, P{X=2,Y=1}=(2/3) ×(1/2)=1/3, P{X=2,Y=2}= (2/3) ×(1/2)=1/3,,例,解,見書P

5、69,習題1,,的可能取值為,例,解,(0, 0), (-1, 1), (-1, 1/3),(2,0),(X,Y)的聯(lián)合分布律為,若存在非負函數(shù) f(x,y),使對任意實數(shù)x,y,二元隨機變量(X,Y)的分布函數(shù) 可表示成如下形式,則稱(X,Y)是二元連續(xù)型隨機變量。f(x,y)稱為二元隨機變量(X,Y)的聯(lián)合概率密度函數(shù).,二維連續(xù)型隨機變量的聯(lián)合概率密度,定義,聯(lián)合概率密度函數(shù)的性質,非負性,幾何解釋,.,.,隨機事件的概率=

6、曲頂柱體的體積,設二維隨機變量,的概率密度為,(1) 確定常數(shù) k;,;,.,(4) 求,例,(1),所以,解,(2),當 時,,當 時,,所以,,(3),或解,(4),解,續(xù)解 ……….,x+y=3,,1,,解答,二維均勻分布,,,,思考 已知二維隨機變量(X,Y)服從區(qū)域D上的均勻分布,D為x軸,y軸及直線y=2x

7、+1所圍成的三角形區(qū)域。求(1)分布函數(shù);(2),解 (X,Y)的密度函數(shù)為,(1)當 時,,分布函數(shù)為,(2)當 時,,,,,,(3)當 時,,,,,,所以,所求的分布函數(shù)為,-1/2,二維正態(tài)分布,,,,,,邊緣分布,隨機變量的相互獨立性,邊緣分布 marginal distribution,二維隨機變量 ,是兩個

8、隨機變量視為一個整體,來討論其取值規(guī)律的,我們可用分布函數(shù)來描述其取值規(guī)律。,,,,問題:能否由二維隨機變量的分布來確定兩個一維隨機變量的取值規(guī)律呢?如何確定呢?,——邊緣分布問題,邊緣分布 marginal distribution,設二維隨機變量 的分布函數(shù)為 ,,,,,二維離散型R.v.的邊緣分布,,如果二維離散型隨機變量(X,Y)的聯(lián)合分布律為,即,二維離散型R.v.的邊緣

9、分布,關于X的邊緣分布,關于Y的邊緣分布,,二維離散型R.v.的邊緣分布,關于X的邊緣分布,關于Y的邊緣分布,,第j列之和,第i行之和,二維離散型R.v.的邊緣分布,,例1 設二維離散型隨機變量(X,Y)的聯(lián)合分布律為,求關于X、Y的邊緣分布,關于Y的邊緣分布,,解 關于X的邊緣分布為,(X,Y)的聯(lián)合分布列,二維連續(xù)型隨機變量的邊緣分布,關于X的邊緣概率密度為,關于Y的邊緣概率密度為,例2 設(X, Y)的聯(lián)合密度為,求k值

10、和兩個邊緣分布密度函數(shù),解,由,得,,當 時,關于X的邊緣分布密度為,,,解,所以,關于X的邊緣分布密度為,所以,關于Y的邊緣分布密度為,當 時,當 時,當 時,關于Y的邊緣分布密度為,邊緣分布密度和概率的計算,例3,設(X, Y) 的聯(lián)合分布密度為,(1)求k值,(2) 求關于X和Y的邊緣密度,(3)

11、求概率P(X+Y1/2),,(2),均勻分布,解,得,,當 時,,當 時,所以,關于X的邊緣分布密度函數(shù)為,,續(xù)解 ………..,,,解,當 時,當 時,所以,關于Y的邊緣分布密度函數(shù)為,,,解 (3),見課本P59例3,如果二維隨機變量(X,Y)服從正態(tài)分布,則兩個邊緣分布分別服從正態(tài)分布,與

12、相關系數(shù) 無關,可見,聯(lián)合分布可以確定邊緣分布,但邊緣分布不能確定聯(lián)合分布,解 關于X的分布密度函數(shù)為,所以,,同理可得,不同的聯(lián)合分布,可有相同的邊緣分布。,可見,聯(lián)合分布可以確定邊緣分布,但邊緣分布不能確定聯(lián)合分布,隨機變量的相互獨立性,特別,對于離散型和連續(xù)型的隨機變量,該定義分別等價于,★,★,定義 設(X,Y)的聯(lián)合分布函數(shù)為F(x,y),兩個邊緣分布函數(shù)分別為FX(x),FY(y),如果對于任意的x,

13、y都有F(x,y)= FX(x) FY(y),則稱隨機變量X,Y相互獨立。,對任意i,j,對任意x,y,,在實際問題或應用中,當X的取值與Y的取值互不影響時,我們就認為X與Y是相互獨立的,進而把上述定義式當公式運用.,,? 在X與Y是相互獨立的前提下,,邊緣分布可確定聯(lián)合分布!,實際意義,補充說明,設(X,Y)的概率分布(律)為,證明:X、Y相互獨立。,例1,逐個驗證等式,證 ∵X與Y的邊緣分布律分別為,∴X、Y相互獨立,例2

14、 設(X,Y)的概率密度為,求 (1) P(0≤X≤1 ,0≤Y≤1) (2) (X,Y)的邊緣密度, (3)判斷X、Y是否獨立。,解 ① 設A={(x,y):0≤x≤1 ,0≤y≤1)},② 邊緣密度函數(shù)分別為,當 時,當 時,所以,,同理可得,③,所以 X 與 Y 相互獨立。,例3 已知二維隨機變量(X,Y)服從區(qū)域D上的均勻分 布,D為x軸

15、,y軸及直線y=2x+1所圍成的三角形區(qū) 域。判斷X,Y是否獨立。,解 (X,Y)的密度函數(shù)為,當 時,,,所以,關于X的邊緣分布密度為,關于X的邊緣分布密度為,當 或 時,當 時,,,所以,關于Y的邊緣分布密度為,關于Y的邊緣分布密度為,當 或

16、 時,所以,所以,X與Y不獨立。,例4,時,解,于是,同理,所以,即 X 與 Y 獨立。,時,二維隨機變量的函數(shù)的分布,二維隨機變量的函數(shù)的分布,的分布函數(shù),問題:如何確定隨機變量Z的分布呢?,二維離散型隨機變量的函數(shù)的分布,則 是一維的離散型隨機變量,其分布列為,例 設 的聯(lián)合分布列為,分別求出(1)X+Y;(2)X-Y;(3)X2+Y-2的分布列,解 由(X,Y)

17、的聯(lián)合分布列可得如下表格,解 得所求的各分布列為,二維連續(xù)型隨機變量的函數(shù)的分布,則 是一維的連續(xù)型隨機變量,其分布函數(shù)為,是二元連續(xù)函數(shù),,其分布密度函數(shù)為,解,解 ……………,所求分布函數(shù)為,分布密度函數(shù)為,兩個隨機變量的和的分布,見課本P67例1,如果(X,Y)的聯(lián)合分布密度函數(shù)為 f(x,y),則Z=X+Y的分布密度函數(shù)為,或,特別,當X,Y相互獨立時,有卷積公式,或

18、,記 住 結 論!,兩個獨立隨機變量的和的分布,如果X與Y相互獨立,例 證明:如果X與Y相互獨立,且X~B(n,p), Y~B(m,p),則X+Y~B(n+m,p),證明 X+Y所有可能取值為 0,1,…,m+n.,證畢,第四章 隨機變量的數(shù)字特征,數(shù)學期望,方差,* 協(xié)方差與相關系數(shù),大數(shù)定律與中心極限定理,數(shù)學期望的引例,Mathematical Expectation,例如:某7人的高數(shù)成績?yōu)?

19、0,85,85,80,80, 75,60,則他們的平均成績?yōu)?以頻率為權重的加權平均,,數(shù)學期望E(X),Mathematical Expectation,定義 設離散型隨機變量的概率分布為,離散型隨機變量,隨機變量X的數(shù)學期望,記作E(X),即,數(shù)學期望的計算,已知隨機變量X的分布律:,例,求數(shù)學期望E(X),解,連續(xù)型隨機變量的數(shù)學期望E(X),連續(xù)型隨機變量,定義,設連續(xù)型隨機變量X的概率密度為 f (x),

20、則,即,數(shù)學期望的計算,已知隨機變量X的密度函數(shù)為,例,求數(shù)學期望。,解,數(shù)學期望的意義,試驗次數(shù)較大時,X的觀測值的算術平均值 在E(X)附近擺動,數(shù)學期望又可以稱為期望值(Expected Value),均值(Mean),,,E(X)反映了隨機變量X取值的“概率平均”,是X的可能值以其相應概率的加權平均。,二維隨機變量的數(shù)學期望及邊緣分布的數(shù)學期望,(X,Y)為二維離散型隨機變量,(X,Y)為二維連續(xù)型隨機變量,(1) 求

21、k,(2) 求X和Y的邊緣密度,(3) 求E(X), E(Y).,(1)由,解,所以,所以,得,(3),時,,(3)另解,無需求邊緣分布密度函數(shù),,隨機變量的函數(shù)的數(shù)學期望,定理 1:一維情形,離散型,連續(xù)型,概率密度為,因為,所以,例,解,隨機變量的函數(shù)的數(shù)學期望,定理 2:二維情形,聯(lián)合概率密度為,,連續(xù)型,離散型,例 設相互獨立的隨機變量X,Y的密度函數(shù)分別為,求E(XY),解,,數(shù)學期望的性質,,.,.,,設(X,Y)在

22、由4個點(0,0)(3,0),(3,2),(0,2)決定的矩形域內(nèi)服從均勻分布,求E(X+Y),E(X2)E(Y2),E(XY).,練一練,答案:,0-1分布的數(shù)學期望,X服從0-1分布,其概率分布為,P(X=1)=p,P(X=0)=1- p,若X 服從參數(shù)為 p 的0-1分布, 則E(X) = p,分布律,數(shù)學期望,If X~B( n, p ), then E(X)= np,二項分布的數(shù)學期望,分布律,X服從二項分布,其概率

23、分布為,數(shù)學期望,,其中,則,泊松分布的數(shù)學期望,If , then,分布律,數(shù)學期望,,均勻分布的期望,分布密度,數(shù)學期望,,X~ N (μ,σ2),正態(tài)分布的期望,分布密度,,數(shù)學期望,,指數(shù)分布的期望,分布密度,數(shù)學期望,數(shù)學期望在醫(yī)學上的一個應用,An application of Expected Value in Medicine,考慮用驗血的方法在人群中普查某種疾病。集

24、體做法是每10個人一組,把這10個人的血液樣本混合起來進行化驗。如果結果為陰性,則10個人只需化驗1次;若結果為陽性,則需對10個人在逐個化驗,總計化驗11次。假定人群中這種病的患病率是10%,且每人患病與否是相互獨立的。試問:這種分組化驗的方法與通常的逐一化驗方法相比,是否能減少化驗次數(shù)?,分析:,設隨機抽取的10人組所需的化驗次數(shù)為X,我們需要計算X的數(shù)學期望,然后與10比較,,化驗次數(shù)X的可能取值為1,11,先求出化驗次數(shù)X的分布

25、律。,(X=1)=“10人都是陰性”,(X=11)=“至少1人陽性”,結論:,分組化驗法的次數(shù)少于逐一化驗法的次數(shù),注意求 X期望值的步驟!,1、概率p對是否分組的影響,問題的進一步討論,若p=0.2,則,當p>0.2057時,E(X)>10,2、概率p對每組人數(shù)n的影響,,當p=0.2時,可得出n<10.32,才能保證EX<10.,當p=0.1時,為使,例 獨立地操作兩臺儀器,他們發(fā)生故障的概率分別為p1和

26、p2.證明:產(chǎn)生故障的儀器數(shù)目的數(shù)學期望為 p1 + p2,設產(chǎn)生故障的儀器數(shù)目為X,則X的所有可能取值為0,1,,解,,所以,方差大數(shù)定律中心極限定理,方 差 的 引 入,E( X1 )=5,E( X2 )=5,設有兩種球形產(chǎn)品,其直徑的取值規(guī)律如下:,兩種產(chǎn)品的直徑均值是相同的,但產(chǎn)品2的偏差大,如果需要使用直徑為5的產(chǎn)品,則產(chǎn)品1較產(chǎn)品2理想。,方差(Variance)的定義,定義,均方差(標準差),設 是一隨機變量,

27、如果 存在,則稱為 的方差,記作 或,即,方差的計算公式,Proof.,,一維隨機變量的方差,設離散型隨機變量X的概率分布為,離散型,連續(xù)型,設連續(xù)型隨機變量X的分布密度為 f (x),其中,方 差 的 計算,E( X1 )=5,E( X2 )=5,例 設有兩種球形產(chǎn)品,其直徑的取值規(guī)律如下:,求D(X1) ,D(X2),解,0-1分布的方差,分布律,方差,其

28、中,二項分布的方差,If X ~ B ( n, p ) , then D ( X ) = n p ( 1- p ),分布律,方差,X ~ B ( n, p ),其中,推導?,泊松分布的方差,分布律,方差,推導?,均勻分布的方差,分布密度,方差,,,正態(tài)分布的方差,分布密度,方差,,,,指數(shù)分布的方差,分布密度,方差,,,常見分布及其期望和方差列表P84,分布名稱 數(shù)學期望E(X) 方差D(X),0-

29、1分布,二項分布,泊松分布,均勻分布,正態(tài)分布,指數(shù)分布,方差的計算步驟,Step 1: 計算期望 E(X),Step 2: 計算 E(X2),Step 3: 計算 D(X),離散型,連續(xù)型,離散型,連續(xù)型,方差的性質,證明,二維隨機變量的方差,(X,Y)為二維離散型隨機變量,,,二維隨機變量的方差,,,(X,Y)為二維連續(xù)型隨機變量,,,,求,.,練一練,解 因為 相互獨立,所以,而,所以,例 某地出產(chǎn)的某品種的

30、蘋果的總量X服從正態(tài)分布。若E(X)=148, D(X)=162.寫出X的分布律和概率密度,并用積分表示,解,若隨機變量X服從均值為2,方差為σ2的正態(tài)分布,且P{2<X<4}=0.3,求P{X<0}。,練一練,所以,解,若隨機變量X服從均值為2,方差為σ2的正態(tài)分布,且P{2<X<4}=0.3,求P{X<0}。,練一練,所以,得,所以,例 已知一批玉米種子的發(fā)芽率是75%,播種時每穴種三粒,求

31、每穴發(fā)芽種子粒數(shù)的數(shù)學期望、方差及均方差.,,,,,,.,設發(fā)芽種子數(shù)為 X,則 X 服從二項分布,且,解,設X表示10次獨立重復射擊命中目標的次數(shù),每次射擊命中的概率為0.4,求 X 的數(shù)學期望。,練一練,所以,所以這種動物的平均壽命為10年,標準差為10年.,解,練一練,設隨機變量X服從參數(shù)為1的指數(shù)分布,求,解 X的密度函數(shù)為,練一練,設隨機變量X服從參數(shù)為1的指數(shù)分布,求,所以,而,所以,解 X的密度函數(shù)為,練一練,設隨機

32、變量X服從參數(shù)為1的指數(shù)分布,求,所以,證畢,證明,,,證畢,證明,大數(shù)定律中心極限定理,大 數(shù) 定 律,在大量的隨機現(xiàn)象中,隨機事件的頻率具有穩(wěn)定性,大量的隨機現(xiàn)象的平均結果具有穩(wěn)定性,概率論中用來闡明大量隨機現(xiàn)象平均結果的穩(wěn)定性的一系列定理,稱為大數(shù)定律(law of large number),切比雪夫(Chebyshev)不等式,設隨機變量X具有有限數(shù)學期望EX和方差DX,則對于任意正數(shù) ,如下不等式成立。

33、,——切比雪夫不等式,證明 設X為連續(xù)型隨機變量,其密度函數(shù)為,則,證畢,切比雪夫(Chebyshev)不等式的應用,在隨機變量X的分布未知的情況下,只利用X的期望和方差,即可對X的概率分布進行估值。,例 已知正常男性成人血液中,每毫升白細胞數(shù)的平均值是7300,均方差是700,利用切比雪夫不等式估計每毫升血液含白細胞數(shù)在5200~9400之間的概率。,解 設X表示每毫升血液中含白細胞個數(shù),則,則,而,所以,練一練,設隨機變

34、量X的方差為2.5,利用切比雪夫不等式估計概率,,練習 設隨機變量X的方差為2.5,利用切比雪夫不等式估計概率,解,樣本平均數(shù)穩(wěn)定性定理,定理 設隨機變量X1,X2,…,Xn,…相互獨立,且服從同一分布,并具有數(shù)學期望 及方差 ,則對于任意正數(shù) ,恒有,觀測量X在相同的條件下重復觀測n次,當n充分大時,“觀測值的算術平均值接近于期望”是一大概率事件。,即,依概率收斂于,即n充分大時,,——辛欽大

35、數(shù)定理,伯努利大數(shù)定理(頻率的穩(wěn)定性),定理 設 是n次獨立試驗中事件A發(fā)生的次數(shù),p是事件A在每次試驗中發(fā)生的概率,則對于任意正數(shù)恒有,定理的應用:可通過多次重復一個試驗,確定事件A在每次試驗中出現(xiàn)的概率,中心極限定理(Central limit theoem),客觀背景:客觀實際中,許多隨機變量是由大量相互獨立的偶然因素的綜合影響所形成,每一個微小因素,在總的影響中所起的作用是很小的,但總起來,卻對總和有顯著影

36、響,這種隨機變量往往近似地服從正態(tài)分布。,概率論中有關論證獨立隨機變量的和的極限分布是正態(tài)分布的一系列定理稱為中心極限定理。,獨立同分布的中心極限定理,設隨機變量X1,X2,…,Xn相互獨立,服從同一分布,且有有限的數(shù)學期望 和方差 ,則隨機變量 的分布函數(shù) 滿足如下極限式,定理的應用:對于獨立的隨機變量序列 ,不管

37、 服從什么分布,只要它們是同分布,且有有限的數(shù)學期望和方差,那么,當n充分大時,這些隨機變量之和 近似地服從正態(tài)分布,例 一部件包括10部分,每部分的長度是一個隨機變量,相互獨立,且具有同一分布。其數(shù)學期望是2mm,均方差是0.05mm,規(guī)定總長度為20±0.1mm時產(chǎn)品合格,試求產(chǎn)品合格的概率。,解 設部件的總長度為X,每部分的長度為

38、 Xi(i=1,2,…,10),則,由定理4.5可知:X近似地服從正態(tài)分布,即,續(xù)解 則產(chǎn)品合格的概率為,棣莫弗—拉普拉斯中心極限定理,(De Moivre-Laplace),定理 設隨機變量 服從二項分布 ,則對于任意區(qū)間 ,恒有,二項分布的極限分布是正態(tài)分布,例 現(xiàn)有一大批種子,其中良種占1/6,今在其中任選6000粒,試問在這些種子中良種所占的比例與

39、1/6之差小于1%的概率是多少?,解 設取出的種子中的良種粒數(shù)為X,則,所求概率為,續(xù)例 種子中良種占1/6,我們有99%的把握斷定在6000粒種子中良種所占的比例與1/6之差是多少?這時相應的良種數(shù)落在哪個范圍?,解 設良種數(shù)為X,則,設良種所占比例與1/6的差值為 ,則依題意有,查表得,,此時有,即,,解 設100根木材中長度不短于3米的根數(shù)為X,則,有一大批建筑房屋用的木柱,其中80%的長度不小于3米,現(xiàn)從

40、這批木材中任取100根,試求其中至少有30根短于3米的概率。,練習,所求概率為,作業(yè) 習題四 21、29、30預習 第五章之1、2節(jié),數(shù) 理 統(tǒng) 計 部分,第五章,樣本與統(tǒng)計量,引 言,隨機變量及其所伴隨的概率分布全面描述了隨機現(xiàn)象的統(tǒng)計性規(guī)律。,概率論的許多問題中,隨機變量的概率分布通常是已知的,或者假設是已知的,而一切計算與推理都

41、是在這已知是基礎上得出來的。,但實際中,情況往往并非如此,一個隨機現(xiàn)象所服從的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些參數(shù)是未知的。,引 言,例如:,某公路上行駛車輛的速度服從什么分布是未知的;,電視機的使用壽命服從什么分布是未知的;,產(chǎn)品是否合格服從兩點分布,但參數(shù)——合格率p是未知的;,數(shù)理統(tǒng)計的任務則是以概率論為基礎,根據(jù)試驗所得到的數(shù)據(jù),對研究對象的客觀統(tǒng)計規(guī)律性做出合理的推斷。,從第五

42、章開始,我們學習數(shù)理統(tǒng)計的基礎知識。數(shù)理統(tǒng)計的任務是以概率論為基礎,根據(jù)試驗所得到的數(shù)據(jù),對研究對象的客觀統(tǒng)計規(guī)律性作出合理的推斷.數(shù)理統(tǒng)計所包含的內(nèi)容十分豐富,本書介紹其中的參數(shù)估計、假設檢驗、方差分析、回歸分析等內(nèi)容.第五章主要介紹數(shù)理統(tǒng)計的一些基本術語、基本概念、重要的統(tǒng)計量及其分布,它們是后面各章的基礎。,學習的基本內(nèi)容,樣本與統(tǒng)計量,總體與樣本,在數(shù)理統(tǒng)計中,把研究對象的全體稱為總體(population)或母體,而把組成總

43、體的每個單元稱為個體。,抽樣,要了解總體的分布規(guī)律,在統(tǒng)計分析工作中,往往是從總體中抽取一部分個體進行觀測,這個過程稱為抽樣。,樣本與統(tǒng)計量,子樣,子樣 是n個隨機變量,抽取之后的觀測數(shù)據(jù) 稱為樣本值或子樣觀察值。,在抽取過程中,每抽取一個個體,就是對總體X進行一次隨機試驗,每次抽取的n個個體

44、 ,稱為總體X的一個容量為n的樣本(sample)或子樣;其中樣本中所包含的個體數(shù)量稱為樣本容量。,隨機抽樣方法的基本要求,獨立性——即每次抽樣的結果既不影響其余各次抽樣的 結果,也不受其它各次抽樣結果的影響。,滿足上述兩點要求的子樣稱為簡單隨機子樣.獲得簡單隨機子樣的抽樣方法叫簡單隨機抽樣.,代表性——即子樣( )的每個分量 與總體

45、 具有相同的概率分布。,從簡單隨機子樣的含義可知,樣本 是來自總體 、與總體 具有相同分布的隨機變量.,簡單隨機抽樣,例如:要通過隨機抽樣了解一批產(chǎn)品的次品率,如果每次抽取一件產(chǎn)品觀測后放回原來的總量中,則這是一個簡單隨機抽樣。,但實際抽樣中,往往是不再放回產(chǎn)品,則這不是一個簡單隨機抽樣。但當總量N很大時,可近似看成是簡單隨機抽樣。,統(tǒng)

46、計量,定義 設( )為總體X的一個樣本, 為不含任何未知參數(shù)的連續(xù)函數(shù),則稱 為樣本( )的一個統(tǒng)計量。,則,例如: 設 是從正態(tài)總體 中抽取的一個樣本,其中 為已知參數(shù)

47、, 為未知參數(shù),,是統(tǒng)計量,不是統(tǒng)計量,幾個常用的統(tǒng)計量,樣本均值(sample mean),設 是總體 的一個樣本,,樣本方差(sample variance),樣本均方差或標準差,它們的觀測值用相應的小寫字母表示.反映總體X取值的平均,或反映總體X取值的離散程度。,幾個常用的統(tǒng)計量,設 是總體 的一個樣本

48、,,子樣的K階(原點)矩,幾個常用的統(tǒng)計量,設 是總體 的一個樣本,,子樣的K階中心矩,它包括兩個方面——數(shù)據(jù)整理 計算樣本特征數(shù),數(shù)據(jù)的簡單處理,為了研究隨機現(xiàn)象,首要的工作是收集原始數(shù)據(jù).一般通過抽樣調(diào)查或試驗得到的數(shù)據(jù)往往是雜亂無章的,需要通過整理后才能顯示出它們的分布狀況。,數(shù)據(jù)的簡單處理是以一種直觀明

49、了方式加工數(shù)據(jù)。,計算樣本特征數(shù):,數(shù)據(jù)的簡單處理,(1)反映趨勢的特征數(shù),樣本均值,中位數(shù):數(shù)據(jù)按大小順序排列后,位置居中的那個數(shù) 或居中的兩個數(shù)的平均數(shù)。,眾數(shù):樣本中出現(xiàn)最多的那個數(shù)。,數(shù)據(jù)的簡單處理,(2)反映分散程度的特征數(shù):極差、四分位差,極差——樣本數(shù)據(jù)中最大值與最小值之差,,四分位數(shù)——將樣本數(shù)據(jù)依概率分為四等份的3個數(shù)椐, 依次稱為第一、第二、第三四

50、分位數(shù)。,第一四分位數(shù)Q1:,第二四分位數(shù)Q2:,第三四分位數(shù)Q3:,例1 為對某小麥雜交組合F2代的株高X進行研究,抽取容量為100的樣本,測試的原始數(shù)據(jù)記錄如下(單位:厘米),試根據(jù)以上數(shù)據(jù),畫出它的頻率直方圖,求隨機變量X的分布狀況。 87 88111 91 73 70 92 98105 94 99 91 98110 98 97 90 83 92 88 86 94102 99

51、 89104 94 94 92 96 87 94 92 86102 88 75 90 90 80 84 91 82 94 99102 91 96 94 94 85 88 80 83 81 69 95 80 97 92 96109 91 80 80 94102 80 86 91 90 83 84 91 87 95 76 90 91

52、 77103 89 88 85 95 92104 92 95 83 86 81 86 91 89 83 96 86 75 92,第一.整理原始數(shù)據(jù),加工為分組資料,作出頻率分布表,畫直方圖,提取樣本分布特征的信息.步驟如下:,1.找出數(shù)據(jù)中最小值m=69,最大值M=111,極差為 M-m=42,2.數(shù)據(jù)分組,根據(jù)樣本容量n的大小,決定分組數(shù)k。,一般規(guī)律 30≤n≤40

53、 5≤k≤6 40≤n≤60 6≤k≤8 60≤n≤100 8≤k≤10 100≤n≤500 10≤k≤20,數(shù)據(jù)分組數(shù)參考表,一般采取等距分組(也可以不等距分組),組距等于比極差除以組數(shù)略大的測量單位的整數(shù)倍。,本例取k=9.,本例測量單位為

54、1厘米,組距為,3.確定組限和組中點值。,注意:組的上限與下限應比數(shù)據(jù)多一位小數(shù)。,當取a=67.5,b=112.49(a略小于m,b略大于M,且a和b都比數(shù)據(jù)多一位小數(shù)),分組如下:,一般根據(jù)算式: 各組中點值 組距=組的上限或下限,[67.5,72.5) [72.5,77.5) [77.5,82.5) [82.5,87.5) [87.5,92.5)

55、 [92.5,97.5) [97.5,102.5) [102.5,107.5) [107.5,112.5),組中值分別為:70 75 80 85 90 95 100 105 110,4.將數(shù)據(jù)分組,計算出各組頻數(shù),作頻數(shù)、頻率分布表,作頻率直方圖,5.作出頻率直方圖,以樣本值為橫坐標,頻率/組距為縱坐標;,以分組區(qū)間為底,以 為高,

56、,從頻率直方圖可看到:靠近兩個極端的數(shù)據(jù)出現(xiàn)比較少,而中間附近的數(shù)據(jù)比較多,即中間大兩頭小的分布趨勢,——隨機變量分布狀況的最粗略的信息。,在頻率直方圖中, 每個矩形面積恰好等于樣本值落在該矩形對應的分組區(qū)間內(nèi)的頻率,即,頻率直方圖中的小矩形的面積近似地反映了樣本數(shù)據(jù)落在某個區(qū)間內(nèi)的可能性大小,故它可近似描述X的分布狀況。,樣本方差 樣本標準差 Q1 Q3 極差 四分位差 68.6909 8.288

57、 85.25 95 42 4.875,第二.計算樣本特征數(shù),1.反映集中趨勢的特征數(shù):樣本均值、中位數(shù)、眾數(shù)等,樣本均值MEAN 中位數(shù)MEDIAN 眾數(shù),2.反映分散程度的特征數(shù):樣本方差、樣本標準差、 極差、四分位差等,上述差異特征統(tǒng)計量的值越小,表示離散程度越小.,MTB > set c1DATA> 87 88 111 91 73 70

58、 92 98 105 94 99 91 98 DATA> 110 98 97 83 90 83 92 88 86 94 102 99 89 104 DATA> 94 94 92 96 87 94 92 86 102 88 75 90 90 80 DATA> 84 91 82 94 99 102 91 96 94 94

59、 85 88 80 83 DATA> 81 69 95 80 97 92 96 109 91 80 80 94 102 DATA> 80 86 91 90 83 84 91 87 95 76 90 91 77 103DATA> 89 88 85 95 92 104 92 95 83 86 81 86 91 89 83 DA

60、TA> 96 86 75 92MTB > endMTB > describe c1,例1 DOS狀態(tài)下的MINITAB操作,顯示: N MEAN MEDIAN TRMEAN STDEV C1 100 90.300 91.000 90.322 8.288 SEMEAN MIN

61、 MAX Q1 Q3 C1 0.829 69.000 111.000 85.250 95.000,中位數(shù),第一四分位數(shù),第三四分位數(shù),MTB>CODE (67.5:72.49)70 (72.5:77.49)75 (77.5:82.49)80 (82.5:87.49)85

62、 (87.5:92.49)90 (92.5:97.49)95 (97.5:102.49)100 (102.5:107.49)105 (107.5:112.49)110 C1 C2MTB>TALLY C2;SUBC>ALL.,,將C1數(shù)據(jù)列重新編碼,并保存到C2數(shù)據(jù)列,,顯示各列數(shù)據(jù)的頻數(shù)、累計頻數(shù)、頻率、累計頻率

63、,C2 COUNTS CUMCNTS PERCENTS CUMPCENTS (頻數(shù)) (累計頻數(shù)) (頻率) (累計頻率) 1 2 0.02 0.02 5 7 0.05

64、 0.07 10 17 0.10 0.17 18 35 0.18 0.35 30 65 0.30

65、 0.65 18 83 0.18 0.83 10 93 0.10 0.93 4 97 0.04

66、 0.97 3 100 0.03 1.00,顯示結果,作業(yè) 習題五 P111 2;3;4預習 第三節(jié) 統(tǒng)計量的分布,統(tǒng)計量的分布,統(tǒng)計量 是樣本 的不含任何未知數(shù)的函數(shù),它是一個隨機變量,統(tǒng)計量的分布稱為抽樣分布。,由于正態(tài)總體是最

67、常見的總體,因此這里主要討論正態(tài)總體下的抽樣分布.,由于這些抽樣分布的論證要用到較多的數(shù)學知識,故在本節(jié)中,我們主要給出有關結論,以供應用.,正態(tài)總體樣本均值的分布,設總體 , 是 的一個樣本, 則樣本均值服從正態(tài)分布,U—分布,概率分布的分位數(shù)(分位點),如圖.,P{X≥x?} =?,,,雙側? 分位數(shù)或雙側臨界值的特例,當X的分布關于y軸對稱時,,則稱 為X分布的雙

68、側?分位數(shù)或雙側臨界值.,如圖.,若存在 使,U—分布的上側分位數(shù),對標準正態(tài)分布變量U~N(0, 1)和給定?的,上側?分位數(shù)是由:,P{U≥u?} =,即,P{U<u?} =1-?,?(u?) =1-?,確定的點u?.,如圖.,例如, ?=0.05,而,P{U≥1.645} =0.05,所以, u0.05 =1.645.,U—分布的雙側分位數(shù),的點u?/2為標準正態(tài)分布的雙側?分位數(shù)或雙側臨界值.,如圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論