版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、計(jì)量資料的統(tǒng)計(jì)推斷,主要內(nèi)容:,標(biāo)準(zhǔn)誤t 分布總體均數(shù)的估計(jì)假設(shè)檢驗(yàn)均數(shù)的 t檢驗(yàn)、u 檢驗(yàn)、方差分析,幾個(gè)重要概念的回顧:計(jì)量資料:總體:樣本:統(tǒng)計(jì)量:參數(shù):統(tǒng)計(jì)推斷:參數(shù)估計(jì)、假設(shè)檢驗(yàn),第一節(jié) 均數(shù)的抽樣誤差與總體均數(shù)的估計(jì),欲了解某地2000年正常成年男性血清總膽固醇的平均水平,隨機(jī)抽取該地200名正常成年男性作為樣本。由于存在個(gè)體差異,抽得的樣本均數(shù)不太可能恰好等于總體均數(shù)。,,一、均數(shù)的抽樣誤差
2、與標(biāo)準(zhǔn)誤,抽樣誤差: 由于抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異 ?X ? ?,,一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤,數(shù)理統(tǒng)計(jì)推理和中心極限定理表明:,1、從正態(tài)總體N(?,?2)中,隨機(jī)抽取例數(shù)為n的樣本,樣本均數(shù)?X也服從正態(tài)分布;即使從偏態(tài)總體抽樣,當(dāng)n足夠大時(shí)?X也近似正態(tài)分布。2、從均數(shù)為?,標(biāo)準(zhǔn)差為?的正態(tài)或偏態(tài)總體中抽取例數(shù)為n的樣本,樣本均數(shù)?X的總體均數(shù)也為?,標(biāo)準(zhǔn)差為??X,,7,標(biāo)準(zhǔn)誤,含義 :
3、樣本均數(shù)的標(biāo)準(zhǔn)差計(jì)算:,(標(biāo)準(zhǔn)誤的估計(jì)值)注意: ??X 、S?X均為樣本均數(shù)的標(biāo)準(zhǔn)誤,8,標(biāo)準(zhǔn)誤,意義: 反映抽樣誤差的大小。標(biāo)準(zhǔn)誤越小,抽樣誤差越小,用樣本均數(shù)估計(jì)總體均數(shù)的可靠性越大。,9,標(biāo)準(zhǔn)誤,用途:衡量抽樣誤差大小估計(jì)總體均數(shù)可信區(qū)間用于假設(shè)檢驗(yàn),二 t 分布,對(duì)正態(tài)變量樣本均數(shù)?X做正態(tài)變換(u變換):,??X 常未知而用S?X估計(jì),則為t變換:,二、 t 分布,t值的分布即為t分布,t 分布的曲線:
4、與?有關(guān),14,t分布與標(biāo)準(zhǔn)正態(tài)分布的比較,1、二者都是單峰分布,以0為中心左右對(duì)稱2、t分布的峰部較矮而尾部翹得較高說(shuō)明遠(yuǎn)側(cè)的t值個(gè)數(shù)相對(duì)較多即尾部面積(概率P值)較大。當(dāng)ν逐漸增大時(shí),t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布,當(dāng)ν→?時(shí),t分布完全成為標(biāo)準(zhǔn)正態(tài)分布,t 界值表(附表9-1 )t?/2,?:表示自由度為?,雙側(cè)概率P為?時(shí)t的界值,t分布曲線下面積的規(guī)律:中間95%的t值:- t0.05/2,? ? t0.05/2,?中間
5、99%的t值:- t0.01/2,? ? t0.01/2,?單尾概率:一側(cè)尾部面積雙尾概率:雙側(cè)尾部面積(1) 自由度(ν)一定時(shí),p與t成反比;(2) 概率(p)一定時(shí),ν與t成反比;,三 總體均數(shù)的估計(jì),統(tǒng)計(jì)推斷:用樣本信息推論總體特征。 包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)參數(shù)估計(jì):用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)。
6、 1、 點(diǎn)(值)估計(jì):用樣本統(tǒng)計(jì)量作為對(duì)總體參數(shù)的估計(jì)值,2、 區(qū)間估計(jì):根據(jù)選定的置信度(或可信度,用概率表示)估計(jì)總體參數(shù)所在的范圍置信度:估計(jì)正確的概率。1- ?置信區(qū)間(confidence level, CI):,總體均數(shù)的可信區(qū)間,按一定的可信度由樣本均數(shù)計(jì)算的總體均數(shù)可能所在的范圍,這個(gè)范圍稱為總體均數(shù)的可信區(qū)間。方法:(1) u 分布法(2) t 分布法,20,
7、總體均數(shù)的95%可信區(qū)間,總體均數(shù)的95%可信區(qū)間:從總體中作隨機(jī)抽樣,作100次抽樣,每個(gè)樣本可算得一個(gè)可信區(qū)間,得100個(gè)可信區(qū)間,平均有95個(gè)可信區(qū)間包括總體均數(shù)(估計(jì)正確),只有5個(gè)可信區(qū)間不包括總體均數(shù)(估計(jì)錯(cuò)誤),,(1)u 分布法(均以95%CI為例),?已知時(shí)95%CI:,,(1)u 分布 法,?未知但n足夠大時(shí)總體均數(shù)95%CI:,,(2)t分布 法,?未知、n小時(shí)總體均數(shù)95%CI:按t分布原理,例題:P168,區(qū)
8、間估計(jì)的準(zhǔn)確度:說(shuō)對(duì)的可能性大小, 用 (1-?) 來(lái)衡量。99%的可信區(qū)間好于95%的可信區(qū)間(n, S 一定時(shí)) 。區(qū)間估計(jì)的精確度:指區(qū)間范圍的寬窄,范圍越寬精確度越差。99%的可信區(qū)間差于95%的可信區(qū)間(n, S 一定時(shí)) 。 準(zhǔn)確度與精確度的關(guān)系:,,25,均數(shù)的標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別,26,總體均數(shù)可信區(qū)間與參考值范圍的區(qū)別,第二節(jié) 假設(shè)檢驗(yàn)(hypothesis testing),例:某地抽查了26名男性管理
9、人員的空腹血糖,均數(shù)?x為4.84mmol/L,標(biāo)準(zhǔn)差S為0.85mmol/L,已知大量調(diào)查的一般健康成年男性空腹靜脈血糖均數(shù)為4.70mmol/L。試問(wèn)能否認(rèn)為該地抽查的26名健康男性管理人員的空腹血糖均值與一般正常健康成年男性的空腹血糖均值不同?,差異來(lái)源的分析,兩種可能性:(1)抽樣誤差造成了二者的差別:? = ?0 t=…=0.844(2)可能由于飲食習(xí)慣、生活條件等的影響,樣本所代表的總體與已知總體確實(shí)不同
10、: ? ? ?0,假 設(shè) 檢 驗(yàn),假設(shè)檢驗(yàn)的一般步驟,1、建立假設(shè): 無(wú)效假設(shè)(檢驗(yàn)假設(shè),零假設(shè),H0 ): ? = ?0 備擇假設(shè) (H1):? ? ?0 (? > ?0或? < ?0 ) 單側(cè)檢驗(yàn): 雙側(cè)檢驗(yàn):2、確定檢驗(yàn)水準(zhǔn)(顯著性水準(zhǔn)):? 無(wú)效假設(shè)H0實(shí)際上成立,但樣本信息不支持H0 ,統(tǒng)計(jì)上拒絕H0的可能性大小的度量(小概率事件的標(biāo)準(zhǔn)),假設(shè)檢驗(yàn)的一般步驟,3、選定
11、檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量:4、確定概率P值: P值:由H0所規(guī)定的總體中進(jìn)行隨機(jī)抽樣,獲得等于及大于(和/或等于及小于)現(xiàn)有樣本統(tǒng)計(jì)量值的概率5、做出推斷結(jié)論(統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論): P > ?:不拒絕H0 ,還不能認(rèn)為差異有統(tǒng)計(jì)學(xué)意義… P ? ?:拒絕H0,接受H1 ,差異有統(tǒng)計(jì)學(xué)意義…,第三節(jié) 均數(shù)的 t 檢驗(yàn)、u檢驗(yàn),t檢驗(yàn)的應(yīng)用條件: 樣本例數(shù)n較小、樣本來(lái)自正態(tài)或近似正態(tài)總體,兩樣
12、本均數(shù)比較時(shí)還要求相應(yīng)的兩總體方差齊同 u檢驗(yàn)的應(yīng)用條件: 大樣本資料,樣本例數(shù)n較小但總體標(biāo)準(zhǔn)差已知,樣本來(lái)自對(duì)稱或正態(tài)總體,33,一、樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn),總體均數(shù): 一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過(guò)大量觀察所得的穩(wěn)定值 ?0 比較的目的: 樣本所代表的未知總體均數(shù)?與已知的總體均數(shù)?0是否不同。統(tǒng)計(jì)量t的計(jì)算公式: ? = n - 1,34,P170例9.3:已知一
13、般無(wú)肝腎疾患的健康人群尿素氮均值為4.882(mmol/L),16名脂肪肝患者的尿素氮(mmol/L)測(cè)定值為5.74,5.75,4.26,6.24,5.36,8.68,6.47,5.24,4.13,11.8,5.57,5.61,4.37,4.59,5.18,6.96。問(wèn)脂肪肝患者尿素氮測(cè)定值的均數(shù)是否高于健康人 假設(shè)檢驗(yàn)的步驟: … ?x=5.997 S=1.92 n=16 t=…=2.32 (
14、單側(cè)檢驗(yàn))0.01<p<0.025,35,二、配對(duì)資料的 t 檢驗(yàn),36,表1 不同飼料組大鼠肝中維生素A含量(IU/g),37,表2 克矽平治療前后血清粘蛋白含量(mg/L),38,,配對(duì)資料: 同一受試對(duì)象處理前后的比較或不同部位測(cè)定值比較 同一樣品用兩種不同方法測(cè)試 同對(duì)的兩個(gè)受試對(duì)象分別接受不同處理,39,?=對(duì)子數(shù) - 1,統(tǒng)計(jì)量t的計(jì)算公式:,40,P171例9.4:應(yīng)用某藥治療8例高膽固醇
15、血癥患者,觀察治療前后血漿膽固醇變化情況,見表9-1,問(wèn)該藥是否對(duì)患者治療前后血漿膽固醇變化有影響?,表9-1 用某新藥治療前后血漿膽固醇變化情況,42,目的:由兩個(gè)樣本均數(shù)的差別推斷兩樣本 所代表的總體均數(shù)間有無(wú)差別。,三、成組設(shè)計(jì)的兩小樣本均數(shù)比較的t檢驗(yàn),,,43,表3 實(shí)熱型與虛寒型皮質(zhì)醇含量比較,,44,? = n1+n2 - 2,統(tǒng)計(jì)量t的計(jì)算公式:,45,P172例9.6:,從40-59歲有無(wú)腎囊腫
16、的女性中分別隨機(jī)抽取10與20人,測(cè)定他們的尿素氮水平(mmol/L)如下,問(wèn)兩組女性尿素氮水平有無(wú)不同?,46,四、大樣本均數(shù)比較的 u 檢驗(yàn),1. 大樣本均數(shù)與已知總體均數(shù)比較的u 檢驗(yàn)2. 兩個(gè)(大)樣本均數(shù)比較的u 檢驗(yàn),47,目的:由兩個(gè)樣本均數(shù)的差別推斷兩樣本所代表的總體均數(shù)間有無(wú)差別。 統(tǒng)計(jì)量u的計(jì)算公式:,兩大樣本均數(shù)比較的u 檢驗(yàn),48,P172例9.5:,某地隨機(jī)抽取正常男性264名,測(cè)得空腹血中膽固醇
17、的均數(shù)為4.404mmol/L,標(biāo)準(zhǔn)差為1.169mmol/L,隨機(jī)抽取正常女性160名,測(cè)得空腹血中膽固醇的均數(shù)為4.288mmol/L,標(biāo)準(zhǔn)差為1.106mmol/L,問(wèn)男女膽固醇濃度有無(wú)差別?,49,第五節(jié) 假設(shè)檢驗(yàn)中的兩類錯(cuò)誤及注意事項(xiàng),50,第Ⅰ類錯(cuò)誤和第Ⅱ類錯(cuò)誤: 當(dāng)拒絕H0時(shí),可能拒絕了實(shí)際上成立的H0,這類錯(cuò)誤稱為Ⅰ類錯(cuò)誤(“棄真”),其概率大小用α表示。常稱之為檢驗(yàn)水準(zhǔn) 當(dāng)不拒絕H0時(shí),沒(méi)有拒絕實(shí)際上不成
18、立的H0,這類錯(cuò)誤稱為Ⅱ類錯(cuò)誤(“存?zhèn)巍?,其概率大小用β表示。,假設(shè)檢驗(yàn)中的兩類錯(cuò)誤,假設(shè)檢驗(yàn)中的兩類錯(cuò)誤,52,檢驗(yàn)效能:1-β 當(dāng)兩個(gè)總體存在差異時(shí)所使用的統(tǒng)計(jì)檢驗(yàn)?zāi)軌虬l(fā)現(xiàn)這種差異的能力,也稱為把握度 α與β的關(guān)系:當(dāng)樣本量一定時(shí), α 愈小, 則 β 愈大,反之α 愈大, 則 β 愈小增加樣本量, 可同時(shí)減小α、 β,53,假設(shè)檢驗(yàn)的注意事項(xiàng),1、資料必須遵循隨機(jī)化原則2、選用的假設(shè)檢驗(yàn)的方法應(yīng)符合其應(yīng)用條件
19、3、實(shí)際差別大小與統(tǒng)計(jì)學(xué)意義的區(qū)別4、判斷不能絕對(duì)化5、單雙側(cè)檢驗(yàn)的選擇6、可信區(qū)間和假設(shè)檢驗(yàn)的關(guān)系,54,練習(xí)題是非判斷:1.標(biāo)準(zhǔn)誤是一種特殊的標(biāo)準(zhǔn)差,其表示抽樣誤差的大小。2.N一定時(shí),測(cè)量值的離散程度越小,用樣本均數(shù)估計(jì)總體均數(shù)的抽樣誤差就越小。3.假設(shè)檢驗(yàn)的目的是要判斷兩個(gè)樣本均數(shù)的差別有多大。,55,選擇題:1. 按α=0.10水準(zhǔn)做t檢驗(yàn),P>0.10,不能認(rèn)為兩總體均數(shù)不相等,此時(shí)若推斷有錯(cuò),其錯(cuò)
20、誤的概率為( )。A.大于0.10 B.β,而β未知C.小于0.10 D.1-β,而β未知2.某地正常成年男子紅細(xì)胞的普查結(jié)果,均數(shù)為480萬(wàn)/mm3,標(biāo)準(zhǔn)差為41.0萬(wàn)/mm3,后者反映( )A.個(gè)體變異 B.抽樣誤差 C.總體均數(shù)不同 D.均數(shù)間變異,56,3.兩個(gè)樣本均數(shù)比較,經(jīng)t檢驗(yàn),差異有統(tǒng)計(jì)學(xué)意義,p越小,說(shuō)明()A.兩樣本均數(shù)差別越大
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 統(tǒng)計(jì)學(xué)-計(jì)量資料
- 計(jì)量經(jīng)濟(jì)模型中的統(tǒng)計(jì)推斷:非參數(shù)與半?yún)?shù)方法.pdf
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)習(xí)題計(jì)量資料
- 第02章--計(jì)量資料的統(tǒng)計(jì)描述正式
- 統(tǒng)計(jì)推斷的基本問(wèn)題
- 第十七章分類資料的統(tǒng)計(jì)推斷參考答案
- 空間計(jì)量經(jīng)濟(jì)模型的統(tǒng)計(jì)推斷——基于限制性似然方程方法.pdf
- 空間計(jì)量經(jīng)濟(jì)模型的統(tǒng)計(jì)推斷——基于極大似然函數(shù)的估計(jì)方程法.pdf
- 高維數(shù)據(jù)的統(tǒng)計(jì)推斷.pdf
- 擴(kuò)散過(guò)程的統(tǒng)計(jì)推斷.pdf
- 69690.地震資料處理中的高階統(tǒng)計(jì)量方法研究
- 跳—斜度變點(diǎn)的統(tǒng)計(jì)推斷.pdf
- RCA(1)模型的統(tǒng)計(jì)推斷研究.pdf
- 冪級(jí)數(shù)分布的統(tǒng)計(jì)推斷.pdf
- 關(guān)于異方差樣本的統(tǒng)計(jì)推斷.pdf
- 33122.異方差模型的統(tǒng)計(jì)推斷
- 充分統(tǒng)計(jì)量
- VaR的幾種統(tǒng)計(jì)推斷方法的比較.pdf
- 缺失數(shù)據(jù)情形兩類統(tǒng)計(jì)模型的統(tǒng)計(jì)推斷.pdf
- 57287.地震資料數(shù)字處理的高階統(tǒng)計(jì)量方法研究
評(píng)論
0/150
提交評(píng)論