-
簡介:第五講多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)(MPG)基本原理與應(yīng)用,多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)的提出多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)的基本原理應(yīng)用實(shí)例問題與展望,一多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)的提出,1多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)是相對于傳統(tǒng)的兩點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)而言的。,傳統(tǒng)的地質(zhì)統(tǒng)計(jì)學(xué)在儲層建模中主要應(yīng)用于兩大方面其一,應(yīng)用各種克里金方法建立確定性的模型.其二,應(yīng)用各種隨機(jī)建模的方法建立可選的、等可能的地質(zhì)模型,這類方法主要有高斯模擬如序貫高斯模擬、截?cái)喔咚鼓M、指示模擬如序貫指示模擬等。上述方法的共同特點(diǎn)是空間賦值單元為象元即網(wǎng)格,故在儲層建模領(lǐng)域?qū)⑵錃w屬為基于象元的方法。這些方法均以變差函數(shù)為工具,亦可將其歸屬為基于變差函數(shù)的方法。變差函數(shù)是傳統(tǒng)地質(zhì)統(tǒng)計(jì)學(xué)中研究地質(zhì)變量空間相關(guān)性的重要工具。然而,變差函數(shù)只能把握空間上兩點(diǎn)之間的相關(guān)性,亦即在二階平穩(wěn)或本征假設(shè)的前提下空間上任意兩點(diǎn)之間的相關(guān)性,因而難于表征復(fù)雜的空間結(jié)構(gòu)和再現(xiàn)復(fù)雜目標(biāo)的幾何形態(tài)如彎曲河道.,,,,河道的3種不同的空間結(jié)構(gòu)圖A,B,C在橫向上東西方向,圖D和縱向上南北方向,圖E的變差函數(shù)十分相似,這說明應(yīng)用變差函數(shù)不能區(qū)分這3種不同的空間結(jié)構(gòu)及幾何形態(tài)。因此,基于變差函數(shù)的傳統(tǒng)地質(zhì)統(tǒng)計(jì)學(xué)插值和模擬方法難于精確表征具有復(fù)雜空間結(jié)構(gòu)和幾何形態(tài)的地質(zhì)體。,鑒于傳統(tǒng)的基于變差函數(shù)的隨機(jī)建模方法和基于目標(biāo)的隨機(jī)建模方法存在的不足,多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)方法應(yīng)運(yùn)而生。在多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)中,(1)應(yīng)用“訓(xùn)練圖像”代替變差函數(shù)表達(dá)地質(zhì)變量的空間結(jié)構(gòu)性,因而可克服傳統(tǒng)地質(zhì)統(tǒng)計(jì)學(xué)不能再現(xiàn)目標(biāo)幾何形態(tài)的不足。(2)方法兼具基于目標(biāo)與基于像元的兩種算法的優(yōu)點(diǎn),即仍然以象元為模擬單元,而且采用序貫算法非迭代算法,因而很容易忠實(shí)硬數(shù)據(jù),并具有快速的特點(diǎn),故克服了基于目標(biāo)的隨機(jī)模擬算法的不足。,,,,多點(diǎn)統(tǒng)計(jì)學(xué)著重表達(dá)多點(diǎn)之間的相關(guān)性?!岸帱c(diǎn)”的集合則用一個新的概念,即數(shù)據(jù)事件DATAEVENT來表述。圖A為一個五點(diǎn)構(gòu)形的數(shù)據(jù)事件,由一個中心點(diǎn)和四個向量及數(shù)值組成。圖B為一個反映河道黑色與河道間白色分布的訓(xùn)練圖像。一個給定的數(shù)據(jù)事件的概率則可通過應(yīng)用該數(shù)據(jù)事件對訓(xùn)練圖像進(jìn)行掃描來獲取。,二多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)的基本原理,多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)首先引入一訓(xùn)練圖像,通過在訓(xùn)練圖像中尋找與待估點(diǎn)內(nèi)條件數(shù)據(jù)分布完全相同的事件的個數(shù)來確定概率分布,因此它可以反映出多個位置的聯(lián)合變異性。,與傳統(tǒng)地質(zhì)統(tǒng)計(jì)學(xué)隨機(jī)模擬的主要區(qū)別,主要區(qū)別在于未取樣點(diǎn)處條件概率分布函數(shù)的求取方法不同傳統(tǒng)的地質(zhì)統(tǒng)計(jì)學(xué)如序貫指示模擬SIS通過變差函數(shù)分析并應(yīng)用克里金方法求取條件概率分布函數(shù)MPG如SNESIM算法應(yīng)用多點(diǎn)數(shù)據(jù)樣板掃描訓(xùn)練圖像以構(gòu)建搜索樹并從搜索樹中求取條件概率分布函數(shù),例如,計(jì)算圖1A中U點(diǎn)的概率時,相應(yīng)的條件數(shù)據(jù)場DN{ZU1,ZU2,ZU3,ZU4}其基本方法首先要在訓(xùn)練圖像B中尋找與圖A中數(shù)據(jù)分布完全相同的事件的個數(shù),即要在訓(xùn)練圖像中找出與圖A幾何完全相同的區(qū)域,同時在該區(qū)域中相同的位置處ZU1,ZU2,ZU3,ZU4的值完全相同在訓(xùn)練圖像中一共找到4個既能滿足條件數(shù)據(jù)U1,U2,U3,U4數(shù)值,同時又能滿足它們分空間幾何形狀的事件,在這4個事件中,3個事件的U點(diǎn)的值為0,只有1個事件中U點(diǎn)值為1,因此U點(diǎn)巖相為1的條件概率為P{U1|DN}1/4,而P{U0|DN}3/4,這樣便可求出了U點(diǎn)的條件概率,這一方法不僅考慮了區(qū)域內(nèi)條件數(shù)據(jù)的值,而且也考慮了條件數(shù)據(jù)的幾何形狀而兩點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)只是依靠ZU1,ZU2,ZU3,ZU4的值及各點(diǎn)與U點(diǎn)距離通過求解克里格方程組來確定U點(diǎn)的概率,并沒有考慮DN的幾何形狀和各條件數(shù)據(jù)的配位關(guān)系,STREBELLEANDJOURNEL2001提出了SNESIM模擬算法,利用該算法可以快速、靈活地模擬巖相分布該方法的具體步驟為1利用非條件模擬建立三維訓(xùn)練圖像2定義通過所有待估結(jié)點(diǎn)的隨機(jī)路徑3對隨機(jī)路徑中的任意待估點(diǎn)L1,2,,L①定義查找范圍內(nèi)的條件數(shù)據(jù)②保留鄰區(qū)的數(shù)據(jù)點(diǎn)③在訓(xùn)練圖像中尋找與該區(qū)域內(nèi)條件數(shù)據(jù)完全相同的事件,計(jì)算該點(diǎn)巖相的分布概率④由MONTOCARLO法得到位置處的一個模擬值⑤將模擬結(jié)果歸入條件指示數(shù)據(jù)集中4重復(fù)上一步模擬,直到所有的點(diǎn)全被模擬訓(xùn)練圖像既可以通過非條件模擬如布爾模擬方法求出,也可以通過該地區(qū)的地質(zhì)露頭資料分析得出,多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)的建模方法,三應(yīng)用實(shí)例,開發(fā)中后期的砂巖油藏儲層參數(shù)模擬模擬區(qū)域選擇我國東部某砂巖油藏第15小層,在該層一共有64口井,測井資料解釋結(jié)果表明有26口井鉆遇砂體,另外38口井鉆遇泥巖,砂體比例為40對巖相進(jìn)行編碼,砂巖為1,泥巖為0右圖為井位分布圖。,采用SNESIM方法模擬砂體的分布,首先建立訓(xùn)練圖像,運(yùn)用布爾模擬方法,把砂體比例40輸入,為保證訓(xùn)練圖像數(shù)據(jù)充足,網(wǎng)格劃分為2502501,一共由62500個模擬數(shù)據(jù)組成。右圖為布爾模擬結(jié)果,,把條件數(shù)據(jù)和布爾模擬生成的訓(xùn)練圖像,輸入到SNESIM模擬算法中進(jìn)行模擬根據(jù)該區(qū)域的特點(diǎn),橢圓最大搜索半徑選為300M,搜索半徑內(nèi)最多的條件數(shù)據(jù)設(shè)為30,搜索主方向選擇物源方向,得到該層的砂泥巖分布如右圖,模擬結(jié)果分析它很好地滿足了條件數(shù)據(jù),即在各井點(diǎn)處的模擬結(jié)果與數(shù)據(jù)相一致,這表明該方法為條件模擬同時,模擬的砂體展布方向和趨勢與依靠地質(zhì)經(jīng)驗(yàn)手工繪制的砂體展布圖下圖比較吻合,在模擬的左下角與左上角砂體的展布與手工勾繪的幾乎完全一致。該方法在局部區(qū)域表現(xiàn)出砂體展布的非均質(zhì)性和不確定性,與手工勾畫砂體展布的平滑而唯一的表現(xiàn)是具有一定差別的,它充分體現(xiàn)了砂體局部的變異性和非均質(zhì)性,四國內(nèi)外研究狀況,多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)的發(fā)展迄今只有十多年的研究歷史,而真正作為一種可實(shí)用的隨機(jī)建模方法則是STREBELLEANDJOURNEL2001提出訓(xùn)練樹的概念及SNESIM算法之后。多點(diǎn)統(tǒng)計(jì)學(xué)隨機(jī)建模方法尚需在以下幾方面進(jìn)行深入的研究。,1訓(xùn)練圖像平穩(wěn)性問題任何空間統(tǒng)計(jì)預(yù)測均要求平穩(wěn)假設(shè)。在二點(diǎn)統(tǒng)計(jì)學(xué)中,要求二階平穩(wěn)或內(nèi)蘊(yùn)假設(shè),即協(xié)方差或變差函數(shù)與空間具體位置無關(guān)而與矢量距離有關(guān)。同樣,在多點(diǎn)統(tǒng)計(jì)學(xué)中,要求訓(xùn)練圖像平穩(wěn),即訓(xùn)練圖像內(nèi)目標(biāo)體的幾何構(gòu)型及目標(biāo)形態(tài)在全區(qū)基本不變,不存在明顯趨勢或局部的明顯變異性。ZHANG2002提出了一個幾何變換的方法,即通過旋轉(zhuǎn)和比例壓縮將非平穩(wěn)訓(xùn)練圖像變?yōu)槠椒€(wěn)訓(xùn)練圖像,并建立多個訓(xùn)練圖像以獲取未取樣點(diǎn)條件概率分布函數(shù)。但是,這一方法仍是一種簡單化的解決途徑,可以解決具有明顯趨勢而且用少量定量指標(biāo)如方向和壓縮比例能夠表達(dá)的非平穩(wěn)性,而對于無規(guī)律的局部明顯變異性,尚需要更為有效的解決方案。,2目標(biāo)體連續(xù)性問題目前的SNESIM算法為一序貫?zāi)M算法,每個未取樣點(diǎn)僅訪問一次,已模擬值則“凍結(jié)”為硬數(shù)據(jù)。這一方法雖然保證快速且易忠實(shí)硬數(shù)據(jù),但可能導(dǎo)致目標(biāo)體的非連續(xù)性。APARTANDCAERS2003提出了一個型式PATTERN模擬的算法,稱為SIMPAT算法,通過對訓(xùn)練圖像數(shù)據(jù)事件進(jìn)行分類、多重網(wǎng)格模擬時不“傳遞”硬數(shù)據(jù)而“傳遞”概率值、同時模擬一個數(shù)據(jù)樣板內(nèi)的所有節(jié)點(diǎn)等措施,在一定程度上改進(jìn)了目標(biāo)體不連續(xù)的問題。,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 16
大小: 0.98(MB)
子文件數(shù):
-
簡介:第四章隨機(jī)模擬(條件模擬),估計(jì)和模擬,用克立格法來估值雖然有不少優(yōu)點(diǎn),但也有缺點(diǎn),即它有圓滑修勻效應(yīng)。若用克立格估值的離散方差來估計(jì)真實(shí)品位的離散方差,則估計(jì)往往偏小。而在編制采礦計(jì)劃中很需要了解各種礦石特征如品位或礦化厚度等)真實(shí)值的離散方差,叫其波動性大小。怎樣才能更好地估計(jì)礦石特征真實(shí)值的離散方差呢?條件模擬的方法來重現(xiàn)真實(shí)值的離散方差。因?yàn)?,用條件模擬方法得出的模擬值不但能保持與ZX的數(shù)學(xué)期望、方差和分布函數(shù)一樣,而且還能保持協(xié)方差函數(shù)或變差函數(shù)一樣,同時在各實(shí)測點(diǎn)處的模擬位還等于該點(diǎn)的實(shí)測值。但是,如果要用模擬值來估計(jì)其一點(diǎn)處的品位值或礦體厚度則是不好的,模擬值不是最優(yōu)的估計(jì)值,因?yàn)槠涔烙?jì)方差太大??肆⒏窆乐登€平均地說更接近于真實(shí)曲線,條件模擬曲線卻較好地再現(xiàn)真實(shí)曲線的被動性。用克立格法來估計(jì),用條件模擬來重現(xiàn)波動性,二者結(jié)合起來,體現(xiàn)地質(zhì)統(tǒng)計(jì)學(xué)的全部威力。,傳統(tǒng)模擬與地質(zhì)統(tǒng)計(jì)學(xué)模擬,傳統(tǒng)統(tǒng)計(jì)模擬要求偽隨機(jī)數(shù)服從一定的概率分布,具有相同的數(shù)學(xué)期望與方差。地質(zhì)統(tǒng)計(jì)學(xué)模擬除上述要求外,還要保持一定的的空間自相關(guān)性,即保持與實(shí)際數(shù)據(jù)有相同的協(xié)力差函數(shù)或變差函數(shù)。這是因?yàn)閰^(qū)域化變量不僅有隨機(jī)性的一面,而且還有空間結(jié)構(gòu)性的一面。保持上述性質(zhì)的模擬在地質(zhì)統(tǒng)計(jì)學(xué)中稱為非條件模擬。如果再增加一個條件,要求在各觀測點(diǎn)處的模擬值均等于該點(diǎn)處的實(shí)例值。這時的模擬就稱為條件模擬。,地質(zhì)統(tǒng)計(jì)學(xué)條件模擬,條件模擬是地質(zhì)統(tǒng)計(jì)學(xué)里特有的內(nèi)容,可說是一種新的蒙特卡洛法。它比起傳統(tǒng)的蒙特卡洛模擬有以下幾個特點(diǎn)1它能保持變量的空間自相關(guān)函數(shù)即指協(xié)方差圖數(shù)或變差函數(shù)不變,因而更適用于區(qū)域化變量的模擬;(2它能使觀測點(diǎn)處的模擬恒等于實(shí)測值,因而,觀測點(diǎn)越多,則模擬就越接近客觀實(shí)際;條件模擬在地質(zhì)統(tǒng)計(jì)學(xué)中占有一個很重要的位置,它與克立格估計(jì)配合使用,可以解決地質(zhì)、石油、礦業(yè)中的許多實(shí)際問題。,條件模擬的基本原理和方法,設(shè)ZX為滿足二階平穩(wěn)假設(shè)的區(qū)域化變量,EZXM,并存在協(xié)方差函數(shù)CH及變差函數(shù)ΓH。要想求ZX的條件模擬ZSCX,就是要找出與ZX同構(gòu)的區(qū)域化變量ZSCX的一個現(xiàn)實(shí),且在實(shí)測點(diǎn)XA上模擬值等于實(shí)測值,即ZSCXAZXA注所謂ZSCX與ZX同構(gòu),是指它們有相同的數(shù)學(xué)期望和相同的分布直方圖或頻率密度曲線,以及相同的CH或ΓH。,如何求得條件模擬ZSCX的計(jì)算公式呢需要引入克立格估值和非條件模擬ZS(X),ZX在任一點(diǎn)X處的真實(shí)值ZX可表為其克立格估值與其誤差之和,即ZXZKXZXZKXZKXRX其中誤差RX是未知的??梢宰C明(略),只要用一個與此誤差同構(gòu)且獨(dú)立的非條件模擬的克立格誤差ZSXZSKX來代替上述未知克立格誤差ZXZKX,就可得到條件模擬ZCSX的計(jì)算公式ZSCXZKXZSXZSKX,,線性地質(zhì)統(tǒng)計(jì)學(xué)(王仁鐸等),一旦生成了非條件模擬,就可在有數(shù)據(jù)的位置處進(jìn)行采樣,再用它們進(jìn)行克里格內(nèi)插估值,進(jìn)而比較內(nèi)插結(jié)果與非條件模擬的差異,該差異加上根據(jù)實(shí)際數(shù)據(jù)進(jìn)行內(nèi)插后的結(jié)果就是一個條件模擬。它不僅具有正確的空間變異性,而且正好也忠實(shí)于觀察的實(shí)際值。,隨機(jī)建模和地質(zhì)統(tǒng)計(jì)學(xué)原理、方法和實(shí)例研究,ESE方法(估計(jì)加模擬誤差法)用于模擬孔隙度的例子,該例中,非條件模擬是由白噪的加權(quán)滑動平均生成的。,隨機(jī)建模和地質(zhì)統(tǒng)計(jì)學(xué)原理、方法和實(shí)例研究,地統(tǒng)插值,地統(tǒng)插值,,,條件模擬計(jì)算公式的另一種比較實(shí)用的表示法由于ZSX與ZX有相同的變差函數(shù),且求克立格估值ZSKX與ZKX時數(shù)據(jù)構(gòu)形又相同,故其克立格方程組也一樣。方程組的解也一樣,即有相同的權(quán)系數(shù)ΛA,A1,2,,N。于是因此,要計(jì)算條件模擬ZSC(X),先要求出一個非條件模擬值ZSX,再對實(shí)測點(diǎn)XA上的差值ZXAZSXA,A1,2,,N進(jìn)行克里格估計(jì),最后再把這二者相加,即可得ZSC(X)。該公式比較更為簡單、實(shí)用,可減少一次解克立格方程組的運(yùn)算。,線性地質(zhì)統(tǒng)計(jì)學(xué)(王仁鐸等),常見的隨機(jī)模擬方法,序貫?zāi)MSEQUENTIALSIMULATIONSEQUENTIALGAUSSIANSIMULATIONSEQUENTIALINDICATORSIMULATIONGAUSSIANTRUNCATEDSIMULATIONSEQUENTIALINDICATORSIMULATION布爾模擬BOOLEANSIMULATION估計(jì)加模擬誤差ESE轉(zhuǎn)向帶模擬分形模擬模擬退火SIMULATEDANNEALING概率場模擬PROBABILITYFIELDSIMULATIONLU矩陣分解模擬LUSIMULATION迭代方法混合方法蒙特卡洛法MONTECARLODRAWING,隨機(jī)建模和地質(zhì)統(tǒng)計(jì)學(xué)原理、方法和實(shí)例研究,序貫?zāi)M,序貫?zāi)M框架,所有的“序貫”方法都采用下圖所示的基本算法1隨機(jī)地選擇一個還沒有模擬值的網(wǎng)格節(jié)點(diǎn)。2估計(jì)該處的局部條件概率分布LCPD。3從局部條件概率分布中隨機(jī)地抽取一個數(shù)值。4使剛模擬的數(shù)值也作為條件化數(shù)據(jù)。5重復(fù)步驟1~4,直到所有的網(wǎng)格節(jié)點(diǎn)都有一個模擬值為止。,隨機(jī)建模和地質(zhì)統(tǒng)計(jì)學(xué)原理、方法和實(shí)例研究,各種序貫方法之間的主要區(qū)別在于估計(jì)局部條件概率分布的方式任何一個能夠生成局部條件概率分布估計(jì)量的方法都可以作為序貫?zāi)M的基礎(chǔ)。例如,多元高斯克里格可以產(chǎn)生局部條件概率分布的估計(jì)量,它是通過假設(shè)該估計(jì)量服從經(jīng)典的鐘形正態(tài)分布來估計(jì)其均值和標(biāo)準(zhǔn)偏差來實(shí)現(xiàn)的。如果將多元高斯克里格方法用于序貫?zāi)M方法中,則該算法通常稱之為序貫高斯模擬(下圖)。又如,指示克里格也可以用于估計(jì)局部條件概率分布,采用這種方法時就不用對分布形態(tài)作任何假設(shè),它通過直接估計(jì)小于一系列門檻值的概率或直接估計(jì)屬于一系列離散區(qū)間的概率等來估計(jì)其局部條件概率分布。若將該方法用于序貫?zāi)M,則該算法通常稱之為序貫指示模擬。,,,,,,,,,,,,名義型變量的序貫指示模擬,,,,,,,,,,,,,,,孔隙度序貫高斯模擬,,,,,,,,,數(shù)據(jù)綜合的模擬退火法,砂、泥巖模型的退火程序該模型的凈毛比為70%,泥巖平均長度為60M,平均厚度為10M。,模擬退火法示意圖,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,END,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 72
大小: 8.66(MB)
子文件數(shù):
-
簡介:第二章地質(zhì)統(tǒng)計(jì)學(xué)理論基礎(chǔ),一、隨機(jī)場與區(qū)域化變量1.定義以空間點(diǎn)X的三個直角坐標(biāo)XU,XV,XW為自變量的隨機(jī)場ZXU,XV,XW)ZX)稱為一個區(qū)域化變量。區(qū)域化變量具有兩重性觀測前,將ZX)看作隨機(jī)場;觀測后,將ZX)看作一個普通的三元實(shí)值函數(shù)。即空間點(diǎn)函數(shù),一次觀測后,就得到它的一個實(shí)現(xiàn)ZX。,第一節(jié)區(qū)域化變量的理論,2功能能同時反映地質(zhì)變量的結(jié)構(gòu)性與隨機(jī)性。①當(dāng)空間點(diǎn)X固定后,ZX)即為一個隨機(jī)變量;②X與XH兩點(diǎn)處的ZX)具有某種程度的相關(guān)性(因隨機(jī)場有相關(guān)函數(shù)R(X,XH))即為一個隨機(jī)變量;3物理學(xué)或地質(zhì)學(xué)特征①空間局限性;②不同程度的連續(xù)性;③不同類型的各向異性。,1協(xié)方差函數(shù)若ZX)是隨機(jī)場,在空間兩點(diǎn)X和XH處兩個隨機(jī)變量ZX)和Z(XH)的二階中心混合矩稱為隨機(jī)場的ZX)自協(xié)方差函數(shù),簡稱協(xié)方差函數(shù)。一般地講,它是依賴于點(diǎn)X和向量H的函數(shù)。特殊地當(dāng)H0時,就等于方差函數(shù)當(dāng)其不依賴于X時簡稱方差,故有,二、協(xié)方差函數(shù)與變差函數(shù),基本公式,,在二維、三維情況下定義時,以一維變差函數(shù)為基礎(chǔ),需考慮各向異性,結(jié)構(gòu)套合等問題。當(dāng)R(X,H)與X的取值無關(guān)時,R(X,H)只依賴與H(滯后、間隔、步長),則可將R(X,H)寫成R(H),此時以H為橫坐標(biāo),R(H)為縱坐標(biāo)作出圖形謂之變差圖。,問題由數(shù)理統(tǒng)計(jì)知要估計(jì)變差函數(shù)值就要估計(jì)數(shù)學(xué)期望值這必須有若干對Z(X)和Z(XH)的值才可通過求平均數(shù)的辦法來估計(jì)上述數(shù)學(xué)期望。而這在實(shí)際地質(zhì),采礦工作中是不可實(shí)現(xiàn)的,因?yàn)椴豢赡芮≡诳臻g同一點(diǎn)上重復(fù)直接取得二個樣品。這就使統(tǒng)計(jì)陷入困境。需借助假設(shè)來解決。,三.平穩(wěn)假設(shè)與本征假設(shè),兩個重要的假設(shè)條件,1平穩(wěn)假設(shè)2本征假設(shè),1.平穩(wěn)假設(shè)①嚴(yán)格的平穩(wěn)假設(shè)區(qū)域化變量Z(X)的任意N維分布函數(shù)不因空間點(diǎn)X發(fā)生位移H而改變。即這種要求是Z(X)的各階矩存在,且平穩(wěn),這在實(shí)際中不能滿足,且不好驗(yàn)證。所以實(shí)用上采用的只需一、二階矩且平穩(wěn)就夠了?!A平穩(wěn)(弱平穩(wěn))。,,②二階平穩(wěn)假設(shè)滿足下列兩個條件1)整個研究區(qū)內(nèi),Z(X)的數(shù)學(xué)期望存在,且等于常數(shù),2)整個研究區(qū)內(nèi),Z(X)的協(xié)方差函數(shù)存在且平穩(wěn)(即只依賴于滯后H,而與X無關(guān))特殊地當(dāng)H0時C(0)即方差存在且為常數(shù)。當(dāng)上述條件仍不能滿足時,條件進(jìn)一步放寬,導(dǎo)致本征假設(shè)。,對平穩(wěn)的理解空間變異性只與兩點(diǎn)間的距離和方向有關(guān),而與點(diǎn)的位置無關(guān)。,,,X1,X2,,,X1,X1H,,,X2,X2H,,,X3,X3H,,,,,2本征假設(shè)區(qū)域化變量Z(X)的增量Z(X)Z(XH)滿足下列兩個條件1)在整個研究區(qū)內(nèi)有2)增量Z(X)–Z(XH)的方差函數(shù)存在且平穩(wěn)(不依賴于X)即2RH,即Z(X)的變差函數(shù)存在且平穩(wěn)。,,3二階平穩(wěn)假設(shè)與本征假設(shè)的比較總的結(jié)論二階平穩(wěn)假設(shè)較強(qiáng),本征假設(shè)較弱1)由二階平穩(wěn)假設(shè)的第一個條件可推出本征假設(shè)條件一。如設(shè)Y為一服從柯西分布的隨機(jī)變量,其概率密度為則,不存在但,存在且為0,1)二階平穩(wěn)假設(shè)的第二個條件可以推出本征假設(shè)條件之二在二階平穩(wěn)假設(shè)滿足時由二階平穩(wěn)假設(shè)條件之二C(0),,當(dāng)HO故同理有而由H≠0時的二階平穩(wěn)假設(shè)條件二有則只要協(xié)方差函數(shù)存在,則C(0)存在,于是RH存在,協(xié)方差函數(shù)不存在,而RH存在的例子,步朗運(yùn)動其隨機(jī)函數(shù)的理論模型即WIENERLEVY過程隨機(jī)游走過程,其驗(yàn)前方差和協(xié)方差函數(shù)皆不確定。但其增量卻具有限方差如一維隨機(jī)游走,1)隨機(jī)過程的方差無限2)的增量的方差(的變差函數(shù))存在且平穩(wěn)。可設(shè)(M,N均為正整數(shù)),令HMN,于是有故的變差函數(shù)確實(shí)存在且平穩(wěn)。,,4.準(zhǔn)二階平穩(wěn)假設(shè)與準(zhǔn)本征假設(shè),區(qū)域化變量在整個區(qū)域內(nèi)并不滿足二階平穩(wěn)(或本征)假設(shè)而在有限的領(lǐng)域(如以X為中心,X為半徑的圓)內(nèi)是二階平穩(wěn)(本征)的,則稱區(qū)域化變量Z(X)是準(zhǔn)二階平穩(wěn)(或準(zhǔn)本征)的。這才是在大多數(shù)情況下適用的,有了這一假設(shè),我們便可根據(jù)N對ZX和ZXH(I1,2,,N的數(shù)值,通過求某種平均值的辦法來估計(jì)變函數(shù)值了。,一、協(xié)方差數(shù)C(H)的性質(zhì)(在二階平穩(wěn)假設(shè)下),第二節(jié)變差函數(shù)及結(jié)構(gòu)分析,,4設(shè)其中權(quán)系數(shù)為任意的,則有,2.變量函數(shù)Γ(H)的性質(zhì)(Z(X)滿足二階平穩(wěn)假設(shè))(1)Γ(0)0(2)Γ(H)≥0(3)Γ(H)Γ(H)(4)Γ(H)必須是條件非負(fù)定函數(shù)(即由Γ(XIXJ)構(gòu)成的矩陣必須是條件非負(fù)定矩陣)。具體地,若成立,則Γ(XIXJ)為非負(fù)定陣。(5)Γ(∞)C(0),,,4交叉協(xié)方差函數(shù)和交叉變差函數(shù)的性質(zhì)(1)協(xié)同區(qū)域化用一組K個相關(guān)的區(qū)域化變量Z1X,Z2X,ZKX來表示的區(qū)域化謂之協(xié)同區(qū)域化(2)在二階平穩(wěn)假設(shè)條件下,定義①EZKXMK常數(shù),∨X,K1,2,,K②對每對區(qū)域化變量ZKX和ZK’X,交叉協(xié)方差函數(shù)為EZK’XHZKXMK’MKCK’KH∨X③對每對區(qū)域化變量ZKX和ZK’X,交叉變差函數(shù)為1/2EZK’XHZK’XZKXHZKXΓK’KH∨X,,(3)交叉協(xié)方差函數(shù)的性質(zhì)①當(dāng)K’K時,交叉協(xié)方差函數(shù)(變差函數(shù))變?yōu)閰f(xié)方差(變差)函數(shù)CKKHCKH,ΓKKHΓKKH∨X②ΓK’KH可以取負(fù)值,而ΓKH總是≥0,?負(fù)相關(guān)③交叉變差函數(shù)關(guān)于K’和K對稱,關(guān)于H和(H)對稱ΓK’KHΓKK’H,ΓK’KHΓK’KH④交叉協(xié)方差函數(shù)CK’KHCKK’H對K對稱CK’KH≠CKK’H對H不對稱⑤在二階平穩(wěn)假設(shè)下,交叉協(xié)方差函數(shù)和交叉變差函數(shù)皆存在,且⑥協(xié)同區(qū)域化中互相矢函數(shù)可定義為在同一點(diǎn)X處兩個變量ZK’X和ZKX之間點(diǎn)對點(diǎn)的互相關(guān)函數(shù),,證性質(zhì)③,證性質(zhì)③因ΓK’KH1/2EZK’XHZK’XZKXHZKX1/2EZKXHZKXZK’XHZK’XΓKK’H又ΓK’KH1/2EZK’XHZK’XZKXHZKX令YXH,則XYH,代入上式ΓK’KH1/2EZK’YZK’YHZKYZKYH1/2EZK’YHZK’YZKYHZKYΓK’KH證性質(zhì)④CK’KHEZK’XHZKXMK’MK令YXH,則XYH代入上式得CK’KHEZKYHZK’YMK’MKCKK’H因EZKYHZK’Y不一定等于EZK’YHZKY,故CKK’H不一定等于CK’KH,即交叉協(xié)方差函數(shù)CKK’H對H和(H)無對稱性,這是較特殊的情況。因此,在兩個變量出現(xiàn)遲后效應(yīng)時,應(yīng)采用交叉協(xié)方差函數(shù)進(jìn)行研究。,,證性質(zhì)⑤,,二、變差函數(shù)的功能1.通過“變程”反映變量的影響范圍2.變差函數(shù)在原點(diǎn)處的性狀反映了變量的空間連續(xù)性(1)拋物線型(或連續(xù)性)?高度連續(xù)性當(dāng)|H|?0時,ΓH?A|H|2(A為常數(shù))(2)線性型?平均連續(xù)性(均方意義下連續(xù))當(dāng)|H|?0時,ΓH?A|H|(A為常數(shù))(3)間斷型(或有“塊金效應(yīng)型”)?連續(xù)性很差(無平均連續(xù)性),Γ00(4)隨機(jī)型(“或純塊金效應(yīng)型)(5)“過度型”?介于(1)和(4)之間3.不同方面上的變差圖反映礦化的各向異性。,,設(shè)Z(X)是滿足本征假設(shè)的區(qū)域化變量,它具有各向同性的變差函數(shù)ΓH,則常見的變差函數(shù)理論模型有,三.變差函數(shù)的理論模型,三種有基臺值模型的比較,證明,(1)對標(biāo)準(zhǔn)球狀模型求原點(diǎn)處的導(dǎo)數(shù)過原點(diǎn)的切線方程為基臺值為解得所以(2)對標(biāo)準(zhǔn)指數(shù)函數(shù)模型求原點(diǎn)處的導(dǎo)數(shù)過原點(diǎn)的切線方程為基臺值為解得所以,(4)冪函數(shù)模型實(shí)踐上,常采用線性模型注意Θ必須嚴(yán)格地小于2,因Θ≥2,則(RΘ)不再是條件非負(fù)定,RΘ就不能作為變差函數(shù)。(5)對數(shù)函數(shù)模型六十年代的DEWIJS模型由于當(dāng)R→0時,LOGR→∞,這與變差函數(shù)的性質(zhì)不符合。因此,對數(shù)函數(shù)模型不能用來描述點(diǎn)承載的區(qū)域化變量。但卻可以用來作為正則化變量的變差函數(shù)ΓVR的模型。如對鉆孔巖心樣品以L1進(jìn)行正則化后,點(diǎn)對數(shù)函數(shù)模型ΓRLNR變?yōu)檎齽t化對數(shù)函數(shù)模型,,(6)純塊金效應(yīng)模型(7)空穴效應(yīng)模型當(dāng)ΓR并非單調(diào)遞增,而顯示出有一定的周期性的波動時,叫做空穴效應(yīng)(也叫孔穴效應(yīng))常見的空穴效應(yīng)模型公式其中C0塊金常數(shù),C拱高,B高品位帶的平均距離,A變程(指數(shù)模型),0,1,1,0,ΓR,ΓR,R,R,1A的情況都很簡單,所以僅討論0H≤A的情況令YΓH,X1H,X2H3,B0C0,則上式變?yōu)閅B0B2XB2X2這樣對球模型變差函數(shù)的擬合問題就變成了多元線性回歸問題。,第五節(jié)變差函數(shù)計(jì)算一般軟件界面圖示,第六節(jié)、變差函數(shù)的應(yīng)用,變差函數(shù)在地質(zhì)統(tǒng)計(jì)學(xué)中具有特別重要的地位,它除了主要用來進(jìn)行克立格估值之外,在實(shí)際工作中,變差函數(shù)本身還有一些直接的應(yīng)用。1.反映礦體變化程度的綜合指標(biāo)2.變差等值線圖可劃分礦體的空間變化類型3.在給定精度下確定最優(yōu)勘探網(wǎng)的形狀和大小,SPATIALSAMPLING空間采樣/勘探網(wǎng)度的確定,克里格估計(jì)方差,根據(jù)普通克里格法,在已知地質(zhì)變量理論變差函數(shù)時,可以計(jì)算出地質(zhì)變量的估計(jì)方差點(diǎn)估計(jì)塊估計(jì)可以看出主要取決于1變差函數(shù)模型2待估塊段的大小和形狀3信息數(shù)量與空間分布4待估塊段與信息點(diǎn)之間的距離,,如果網(wǎng)型固定(矩形或三角形等),則減小估計(jì)方差的辦法只有減小采樣間隔,以減小變差函數(shù)值增加估計(jì)塊段的大小,,,⊙,⊙,,,,,,勘探網(wǎng)度的最優(yōu)確定,在待估塊段和形狀確定后,在不同的網(wǎng)度下以鉆孔數(shù)表示由疏到密模擬勘探網(wǎng)度,可獲得礦床在各種網(wǎng)度下的鉆孔數(shù)與估計(jì)標(biāo)準(zhǔn)差之間的定量關(guān)系曲線一般認(rèn)為曲線由陡變緩的部位所對應(yīng)的橫坐標(biāo)即為最佳勘探網(wǎng)度即勘探所需的鉆孔數(shù)將計(jì)算結(jié)果與實(shí)際勘探網(wǎng)度下的標(biāo)準(zhǔn)差對比,就可以了解勘探過程對礦床的實(shí)際控制程度。,,估計(jì)方差除了與網(wǎng)度、網(wǎng)型有關(guān)以外,還與控制的地質(zhì)變量的量綱、量級有關(guān),在實(shí)際應(yīng)用,常用相對估計(jì)標(biāo)準(zhǔn)差來表達(dá)勘探網(wǎng)度對該地質(zhì)變量的控制程度,設(shè)控制系數(shù),勘探網(wǎng)度優(yōu)化步驟,一是建立地質(zhì)變量的最佳理論變差函數(shù)正確地計(jì)算實(shí)驗(yàn)變差函數(shù)并通過交叉檢驗(yàn)優(yōu)選最佳的理論變差函數(shù)模型。在統(tǒng)計(jì)分析勘探區(qū)原始數(shù)據(jù)的基礎(chǔ)上,合理剔除異常值,求出勘探區(qū)主采煤層地質(zhì)變量在特征方向上的實(shí)驗(yàn)變差函數(shù),經(jīng)過理論擬和交叉檢驗(yàn)優(yōu)選,得出最佳的理論變差函數(shù)模型二是用地質(zhì)變量的估計(jì)方差評價勘探過程對礦床的控制程度,實(shí)例,某露天礦勘探區(qū)有效鉆孔655個首采區(qū)勘探網(wǎng)度160190M,每平方公里平均38個鉆孔在首采區(qū)附近,勘探網(wǎng)度為500M左右其余地區(qū)勘探線網(wǎng)度為1000M左右,,,,,,結(jié)論該露天礦首采區(qū)地質(zhì)變量的實(shí)際控制程度為89,已達(dá)到最佳控制網(wǎng)度。后續(xù)區(qū)則勘探控制程度較低,實(shí)際網(wǎng)度為1000M1000M左右,與最佳控制網(wǎng)度300300相差甚遠(yuǎn)實(shí)踐證明,地質(zhì)統(tǒng)計(jì)學(xué)不僅可以對區(qū)域變量進(jìn)行無偏“最優(yōu)”估計(jì),而且在勘探網(wǎng)度的研究方面也有著廣闊的應(yīng)用前景,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 77
大?。?1.74(MB)
子文件數(shù):
-
簡介:醫(yī)學(xué)統(tǒng)計(jì)學(xué)復(fù)習(xí),201312陳啟光主編,樣本不確定數(shù)據(jù),,總體規(guī)律性結(jié)論,醫(yī)學(xué)統(tǒng)計(jì)學(xué)分析,統(tǒng)計(jì)方法的體系,主要內(nèi)容,研究設(shè)計(jì)基礎(chǔ)統(tǒng)計(jì)描述參數(shù)估計(jì)與假設(shè)檢驗(yàn)相關(guān)與回歸統(tǒng)計(jì)表與統(tǒng)計(jì)圖涉及章節(jié)16,810,考試要求,題型選擇題50分;簡答題50分不用帶計(jì)算器教材醫(yī)學(xué)統(tǒng)計(jì)學(xué)(2版)陳啟光主編認(rèn)真復(fù)習(xí)三套模擬題紅色字體為復(fù)習(xí)重點(diǎn),1變量分類及資料類型數(shù)值變量分類變量有序無序二項(xiàng)分類多項(xiàng)分類定量資料等級資料計(jì)數(shù)資料如血清轉(zhuǎn)鐵蛋白療效性別職業(yè)、血型嘔吐次數(shù),,,,,,,,,定量資料的描述集中趨勢的描述,,平均數(shù),,,,,,,,,,均數(shù)Μ,幾何均數(shù)G,中位數(shù)M,其他,應(yīng)用條件,常用集中趨勢指標(biāo),離散趨勢的描述QSCV,應(yīng)用條件,常用離散趨勢指標(biāo),3分類資料的統(tǒng)計(jì)描述相對數(shù)兩個有聯(lián)系的指標(biāo)之比。率說明某現(xiàn)象發(fā)生的頻率和強(qiáng)度。率K有100、1000‰構(gòu)成比說明某一事物內(nèi)部各組成部分所占的比重構(gòu)成比A/(ABC)100比或相對比A/B,如男/女,注意事項(xiàng)分母一般不宜過小分析時不能以構(gòu)成比代替率,不能用構(gòu)成比的動態(tài)分析代替率的動態(tài)分析總率的計(jì)算在比較相對數(shù)時應(yīng)注意可比性對樣本率(或構(gòu)成比)的比較應(yīng)注意抽樣誤差,率、百分比計(jì)算例,4統(tǒng)計(jì)表與統(tǒng)計(jì)圖,統(tǒng)計(jì)表繪制合格的統(tǒng)計(jì)分析表P33,EX3統(tǒng)計(jì)圖選擇恰當(dāng)?shù)慕y(tǒng)計(jì)分析圖P32,EX1,,5研究設(shè)計(jì)基礎(chǔ),實(shí)驗(yàn)研究的三要素降壓藥高血壓患者血壓改變處理因素;受試對象;實(shí)驗(yàn)效應(yīng)實(shí)驗(yàn)研究的三原則對照重復(fù)隨機(jī)化目的是盡量減少或抵消非處理因素的干擾常用的有完全隨機(jī)設(shè)計(jì)、配對設(shè)計(jì),配對設(shè)計(jì),完全隨機(jī)設(shè)計(jì),6正態(tài)分布,掌握正態(tài)分布特征參考值范圍的理解與制定,正態(tài)分布的性質(zhì),⑴正態(tài)分布只有一個高峰,高峰位置在XΜ。,⑵正態(tài)分布以均數(shù)為中心,左右對稱。,⑶正態(tài)分布的兩個參數(shù),Μ和Σ,決定了分布的位置和形狀。其中Μ是位置參數(shù),Σ是變異度參數(shù)4正態(tài)分布曲線下面積分布有一定的規(guī)律Μ±196Σ或XBAR±196S的面積為95,參考值范圍是指絕大多數(shù)正常人的某項(xiàng)指標(biāo)的波動范圍絕大多數(shù)根據(jù)專業(yè)和正異常者指標(biāo)分布重疊多少來確定正常人排除了影響所研究指標(biāo)的疾病和有關(guān)因素的人波動范圍由于個體間有差異,同一個體不同時間檢測的結(jié)果也不一定相同,故參考值是一個范圍用于被調(diào)查者該指標(biāo)是否正常的參考參考,7統(tǒng)計(jì)推斷基礎(chǔ),樣本均數(shù)與總體均數(shù)的差異用什么指標(biāo)來衡量標(biāo)準(zhǔn)誤如何由樣本均數(shù)的大小來估計(jì)總體均數(shù)的大小點(diǎn)估計(jì)與區(qū)間估計(jì)(參數(shù)估計(jì))由兩個不一樣大的樣本均數(shù)如何判斷其是否來自同一總體或總體均數(shù)相等的兩個總體假設(shè)檢驗(yàn),統(tǒng)計(jì)推斷包括參數(shù)估計(jì)與假設(shè)檢驗(yàn),抽樣誤差是不可避免的,由于個體變異的存在,抽樣誤差在抽樣研究中是不可避免的;樣本統(tǒng)計(jì)量與總體參數(shù)的差別;不同樣本的統(tǒng)計(jì)量之間的差別,抽樣誤差是有規(guī)律的,抽樣誤差與個體變異有關(guān),個體變異越大,抽樣誤差越大,反之,越小;抽樣誤差與樣本含量有關(guān),樣本含量越大,抽樣誤差越小,反之,越大;樣本含量接近總體數(shù)時,抽樣誤差逐漸消失。不同的統(tǒng)計(jì)指標(biāo)有其特定的抽樣分布,標(biāo)準(zhǔn)差S與標(biāo)準(zhǔn)誤的區(qū)別與聯(lián)系,可信區(qū)間與參考值范圍,檢驗(yàn)假設(shè)H0與備擇假設(shè)H1H0是根據(jù)反證法思想提出的,因此常常的表述為相等/差為零/差為一個常數(shù)H1兩樣本比較總體均數(shù)不等多樣本比較總體均數(shù)不等或不全等非參數(shù)檢驗(yàn)假設(shè)針對總體分布進(jìn)行,,,統(tǒng)計(jì)推斷是有風(fēng)險的,參數(shù)估計(jì)中,可信區(qū)間的可信度不是100;假設(shè)檢驗(yàn)中,存在I型誤差和II型誤差(P73)。因此,任何推斷結(jié)論都不是絕對正確的。統(tǒng)計(jì)推斷的結(jié)論不能說“證明”,”肯定”。只能說“可以認(rèn)為”,“推斷為”,“尚不能認(rèn)為“。,以Α005為例P≤005兩樣本均數(shù)差異有統(tǒng)計(jì)學(xué)意義可認(rèn)為兩總體均數(shù)不等多個總體均數(shù)不等或不全相等P005兩樣本均數(shù)差異無統(tǒng)計(jì)學(xué)意義;還不能認(rèn)為總體均數(shù)不等。P越小,并不意味著兩總體之間差異就越大,8T檢驗(yàn),用于計(jì)量資料均數(shù)的比較所比較的均數(shù)數(shù)目最多為兩個適用條件小樣本,獨(dú)立,正態(tài),方差齊有三種形式完全隨機(jī)設(shè)計(jì)單樣本資料配對設(shè)計(jì)資料完全隨機(jī)設(shè)計(jì)兩樣本資料,T檢驗(yàn)類型,單樣本T檢驗(yàn),類型,配對T檢驗(yàn),成組T檢驗(yàn),已知條件,,S,N,Μ0,,SD,N,S1,N1,,S2,N2,檢驗(yàn)假設(shè)H0,ΜΜ0,ΜD0,Μ1Μ2,資料選擇成組還是配對T檢驗(yàn)取決于實(shí)驗(yàn)設(shè)計(jì),9?2檢驗(yàn),實(shí)質(zhì)理論頻數(shù)與實(shí)際頻數(shù)的比較適用于率的比較;構(gòu)成比的比較;理論分布與實(shí)際分布的比較。四格表資料檢驗(yàn)條件N40N40N5140,T5普通卡方檢驗(yàn)CHISQUARETESTN40,1T5校正卡方檢驗(yàn)ADJUSTEDCHISQUARETESTN40,或T1確切概率法FISHEREXACTTEST,10非參數(shù)檢驗(yàn)的適用條件等級資料;有不確定數(shù)值的資料;極度偏態(tài)的資料;分布未知的資料注意配對設(shè)計(jì)資料與完全隨機(jī)設(shè)計(jì)資料是如何排秩的。,11直線相關(guān)與回歸,用于兩個或兩個以上指標(biāo)的分析相關(guān)分析變量協(xié)同變化的關(guān)系相關(guān)系數(shù)R回歸分析數(shù)量上的依存關(guān)系,R度量兩正態(tài)隨機(jī)變量呈線性關(guān)聯(lián)的方向與強(qiáng)度。R正負(fù)號表示方向,R的絕對值大小表示關(guān)聯(lián)的強(qiáng)度B回歸系數(shù)自變量改變一個單位時,應(yīng)變量平均改變的單位數(shù)。同一個資料計(jì)算得到R,B的正負(fù)號相同,假設(shè)檢驗(yàn)等價,12統(tǒng)計(jì)方法的選擇,計(jì)量資料等級資料計(jì)數(shù)資料T檢驗(yàn)秩和檢驗(yàn)卡方檢驗(yàn)U檢驗(yàn)U檢驗(yàn)秩和檢驗(yàn)精確檢驗(yàn),祝大家考試成功,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 39
大?。?0.73(MB)
子文件數(shù):
-
簡介:,第四章統(tǒng)計(jì)推斷基礎(chǔ)之三,假設(shè)檢驗(yàn),假設(shè)檢驗(yàn)的基本目的,推斷各樣本所代表的總體間的關(guān)系或者是與已知總體間的關(guān)系,反映到假設(shè)檢驗(yàn)方法就是比較各總體均數(shù)是否相等。,T檢驗(yàn),T檢驗(yàn),亦稱STUDENTT檢驗(yàn)(STUDENT’STTEST),主要用于樣本含量較小,總體標(biāo)準(zhǔn)差Σ未知的正態(tài)分布資料。,應(yīng)用條件,①樣本所服從的總體服從正態(tài)性分布(正態(tài)性)②兩樣本均數(shù)比較時,兩樣本對應(yīng)的總體方差相等(方差齊性)③各觀察值之間相互獨(dú)立(獨(dú)立性),,T檢驗(yàn),1)樣本均數(shù)與總體均數(shù)比較的T檢驗(yàn)2)配對設(shè)計(jì)數(shù)值變量資料的T檢驗(yàn)3)兩樣本均數(shù)比較的T檢驗(yàn),1樣本均數(shù)與總體均數(shù)比較的T檢驗(yàn),推斷一個小樣本均數(shù)所代表的未知總體均數(shù)Μ與已知總體均數(shù)Μ0有無差別。已知總體均數(shù)Μ0一般為理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀察所得的穩(wěn)定值。,T統(tǒng)計(jì)量的含義,在標(biāo)準(zhǔn)誤的尺度下,樣本均數(shù)與總體均數(shù)的偏離。這種偏離稱為標(biāo)準(zhǔn)T離差。根據(jù)抽樣誤差理論,在的假設(shè)前提下,統(tǒng)計(jì)量T服從自由度為N1的T分布,即T在0附近的可能性大,遠(yuǎn)離0的可能性小,離0越遠(yuǎn)可能性越小。,1樣本均數(shù)與總體均數(shù)比較的T檢驗(yàn),樣本均數(shù)與總體均數(shù)?0比較的目的推斷該樣本是否來自于已知的總體樣本所代表的總體其均數(shù)是否等于已知總體均數(shù)。,1樣本均數(shù)與總體均數(shù)比較的T檢驗(yàn),推斷一個小樣本均數(shù)所代表的未知總體均數(shù)Μ與已知總體均數(shù)Μ0有無差別。已知總體均數(shù)Μ0一般為理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀察所得的穩(wěn)定值。,例1測得25例某病女性患者的血紅蛋白(HB,其均數(shù)為150G/L,標(biāo)準(zhǔn)差為165G/L。而該地正常成年女性的HB均數(shù)為132G/L,問該病女性的HB是否與正常女性的HB相同。,解(一)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn),,132G/L,該病女性的HB是否與正常女性的HB相同132G/L,該病女性的HB是否與正常女性的不同。,(二)、計(jì)算檢驗(yàn)統(tǒng)計(jì)量,,(三)、求P值,下結(jié)論,查表得,,。,因此按?005的水準(zhǔn)拒絕H0,接受H1,差別有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為該病女性患者的血紅蛋白含量高于正常女性。,例2根據(jù)大量調(diào)查,已知健康成年男子的脈搏均數(shù)?0為72次/分,某醫(yī)生在一山區(qū)隨機(jī)調(diào)查了25名健康成年男子,求得其脈搏均數(shù)為742次/分,標(biāo)準(zhǔn)差60次/分,能否認(rèn)定該山區(qū)成年男子的脈搏均數(shù)高于一般成年男子,單側(cè)?005,H0Μ72,山區(qū)成年男子平均脈搏數(shù)與一般人群相等H1Μ72,山區(qū)成年男子平均脈搏數(shù)高于一般人群,解(一)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn),(二)計(jì)算檢驗(yàn)統(tǒng)計(jì)量,查單側(cè)T005,241711,現(xiàn)TT005,24,則PT005/2,6,P50均數(shù)的比較,,U檢驗(yàn),,兩樣本均數(shù)差值的標(biāo)準(zhǔn)誤,當(dāng)隨機(jī)抽樣的樣本例數(shù)足夠大時,T檢驗(yàn)統(tǒng)計(jì)量的自由度逐漸增大,T分布逐漸逼近于標(biāo)準(zhǔn)正態(tài)分布,可以利用近似正態(tài)分布的原理進(jìn)行U檢驗(yàn)。,N1175,X10425,S10254N2167,X20438,S20292,例4解(一)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn),已知U005/2196,現(xiàn)U005,按?005的水準(zhǔn)不拒絕H0,不能認(rèn)為正常男女新生兒血中甘油三酯濃度不同。,(2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量,(3)求P值,下結(jié)論,U檢驗(yàn)應(yīng)用條件,(1)樣本大?。∟50)(2)大樣本時,對原資料的正態(tài)分布要求可以放寬,均數(shù)的假設(shè)檢驗(yàn)應(yīng)用條件,資料的代表性與可比性獨(dú)立性、正態(tài)性、方差齊性與應(yīng)用條件有關(guān)的一些內(nèi)容正態(tài)性檢驗(yàn)方差齊性檢驗(yàn)方差不齊時的近似T檢驗(yàn)大樣本時,均數(shù)比較的U檢驗(yàn),方差不齊時兩小樣本均數(shù)的比較,T’檢驗(yàn)--近似T檢驗(yàn),SATTERTHWAITE法1946對自由度校正,最終結(jié)果查附表2的T界值表。,例為探討硫酸氧釩對糖尿病性白內(nèi)障的防治作用,研究人員將已誘導(dǎo)糖尿病模型的20只大鼠隨機(jī)分為兩組。一組用硫酸氧釩治療(DV組),另一組作對照組(D組),12周后測大鼠血糖含量(MMOL/L)。試問兩組動物血糖含量的總體均數(shù)是否相同,T005/2,8=2306,TT005/2,8,P010,不拒絕H0,注意,1F檢驗(yàn)是雙側(cè)檢驗(yàn),2S13S2,可認(rèn)為方差不齊,3樣本含量較大時可以不做方差齊性檢驗(yàn),
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 51
大?。?0.64(MB)
子文件數(shù):
-
簡介:第五章正態(tài)分布白志茂ZHIMAOBAI163COM,總體內(nèi)個體間的變異總是客觀存在的,但其變量值的分布是有一定規(guī)律的如第二章例21某地120名7歲男童身高資料頻數(shù)身高(CM),51隨機(jī)變量的概率分布,取不同隨機(jī)變量值的概率按隨機(jī)變量值的分布稱為隨機(jī)變量的概率分布概率分布是統(tǒng)計(jì)學(xué)賴以發(fā)展的理論基礎(chǔ),任何統(tǒng)計(jì)方法都離不開特定的統(tǒng)計(jì)分布,隨機(jī)變量無法事先確定其具體取值的變量隨機(jī)變量的分類連續(xù)型隨機(jī)變量和離散型隨機(jī)變量1)連續(xù)型隨機(jī)變量可在某一實(shí)數(shù)區(qū)間內(nèi)任意取值如身高、體重等數(shù)值變量2)離散型隨機(jī)變量變量只取有限個數(shù)或可列個數(shù)如性別、血型等分類變量及門診接待的病人數(shù)等離散取值的變量,兩個重要概念分布函數(shù)和密度函數(shù)1)分布函數(shù)FX即總體中個體值小于或等于X的觀察值所占的比例2)密度函數(shù)FX對離散型隨機(jī)變量,F(xiàn)X是變量取X值的概率,常記為PX對連續(xù)性隨機(jī)變量,F(xiàn)X是FX的導(dǎo)函數(shù),頻率密度圖直條高度表示頻率密度,直條面積表示頻率大小,52正態(tài)分布,正態(tài)分布又稱GAUSS分布,是最重要一種的連續(xù)型分布?!?dāng)?shù)學(xué)王子’高斯(1777-1855)德國數(shù)學(xué)家、物理學(xué)家、天文學(xué)家一般說來,若影響某一數(shù)量指標(biāo)的隨機(jī)因素很多,而每個因素所起的作用均不太大,這個指標(biāo)服從正態(tài)分布。,正態(tài)分布的重要性,1、某些醫(yī)學(xué)現(xiàn)象服從或近似服從正態(tài)分布;如同性別、同年齡兒童的身高,同性別健康成人的紅細(xì)胞數(shù),血紅蛋白量,脈搏數(shù)等,以及實(shí)驗(yàn)中的試驗(yàn)誤差等2、很多統(tǒng)計(jì)方法是建立在正態(tài)分布的基礎(chǔ)之上的;如T檢驗(yàn),卡方檢驗(yàn),F(xiàn)檢驗(yàn)3、很多其他分布的極限為正態(tài)分布。如T分布,卡方分布,二項(xiàng)分布等分布因此,正態(tài)分布是統(tǒng)計(jì)分析方法的重要基礎(chǔ)。,若隨機(jī)變量X的密度函數(shù)是則稱隨機(jī)變量X服從正態(tài)分布,X為正態(tài)變量。式中Μ為隨機(jī)變量X的總體均數(shù),Σ為標(biāo)準(zhǔn)差;若X服從均數(shù)為Μ,方差為Σ2的正態(tài)分布,則簡記為。,521正態(tài)分布的定義,正態(tài)分布的一種重要特例標(biāo)準(zhǔn)正態(tài)分布總體均值為零,標(biāo)準(zhǔn)差為1的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布,記作。標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù),522正態(tài)分布的性質(zhì),1正態(tài)分布只有一個高峰,高峰位置在XΜ2正態(tài)分布以均數(shù)為中心,左右對稱,3正態(tài)分布的兩個參數(shù)Μ和Σ決定了分布的位置和形狀。,Μ是位置參數(shù),當(dāng)Σ恒定時,Μ越大,則曲線沿橫軸越向右移動;反之,Μ越小,則曲線沿橫軸越向左移動。,,,Σ是變異度參數(shù),當(dāng)Μ恒定時,Σ越大,表示數(shù)據(jù)越分散,曲線越“矮胖”;Σ越小,表示數(shù)據(jù)越集中,曲線越“瘦高”,,,,?,?1,4)正態(tài)變量的線性變換U稱為標(biāo)準(zhǔn)正態(tài)差圖54一般正態(tài)分布變換成標(biāo)準(zhǔn)正態(tài)分布示意圖,當(dāng)資料服從正態(tài)分布時,估計(jì)某區(qū)間的例數(shù)占總例數(shù)的百分?jǐn)?shù),或變量值落在某區(qū)間的概率如估計(jì)7歲男童身高低于110CM的比例;任取一名7歲男童,身高高于125CM的概率是多少等問題。,523正態(tài)曲線下面積的分布規(guī)律,FX為正態(tài)變量X的累計(jì)分布函數(shù),反映正態(tài)曲線下,橫軸尺度自∞到X的面積,ΦU為標(biāo)準(zhǔn)正態(tài)變量U的累計(jì)分布函數(shù),,U,標(biāo)準(zhǔn)正態(tài)分布曲線下面積?U,U00000200400600830000130001300012000110001025000620005900055000520004920002280021700207001970018819002870027400262002500023916005480052600505004850046510015870153901492014460140105030850301502946028770281000500004920048400476104681,,0,U,,,例51求標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間∞,196的面積先求區(qū)間∞,196的面積,查附表1,得標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間∞,196的面積是002502區(qū)間∞,196的面積為1196,∞的面積,即100250975,例52求標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間的面積與區(qū)間的面積?!?258的面積是00049,約為05%。區(qū)間258,∞的面積亦為05%,例53求標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間1,1的面積區(qū)間1,1的面積=12∞,1的面積=1201587=06826,例54求正態(tài)分布N11941,4382曲線下區(qū)間11083,12799內(nèi)的面積,⑴先用求對應(yīng)的U值,UL1108311941/438196UU1279911941/438196,⑵查U界值表,得面積,196,196的面積=12標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間∞,-196的面積=120025=095,謝謝大家,再見,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 24
大?。?0.29(MB)
子文件數(shù):
-
簡介:統(tǒng)計(jì)中的幾個基本概念一、總體與樣本總體指同質(zhì)觀察單位的集合2指同質(zhì)觀察單位某個變量值的集合(同質(zhì)是指被研究指標(biāo)的主要影響因素相同)總體根據(jù)有無時間和空間的限制又分為有限總體和無限總體,樣本從總體中按隨機(jī)抽樣的方式抽取一定數(shù)量的觀察單位所組成的集合樣本要具備以下兩個條件(1)可靠性樣本中的每一個個體均來自既定的同一總體(2)代表性樣本中受試對象的構(gòu)成分布與總體構(gòu)成分布齊同。隨機(jī)抽樣足夠數(shù)量分層抽樣總體和樣本的關(guān)系如下,總體,,抽樣研究過程,統(tǒng)計(jì)推斷過程,樣本,,,統(tǒng)計(jì)分析的基本思想,,,總體,樣本,抽樣,推斷,,,,樣本,統(tǒng)計(jì)描述,,二、同質(zhì)與變異同質(zhì)是指被研究指標(biāo)的主要影響因素相同變異指同質(zhì)事物間的差異。是客觀存在的現(xiàn)象,可分為以下兩類個體變異指同一特征或同一條件下個體間的差異。同質(zhì)條件都是鼻咽癌患者都用相同治療方法變異現(xiàn)象療效各不相同隨機(jī)測量變異指同一個體重復(fù)觀測結(jié)果未必相等的現(xiàn)象。,三、概率與頻率1、頻率某變量值出現(xiàn)的次數(shù)(頻數(shù))/重復(fù)觀察的總次數(shù)。對一個隨機(jī)事件重復(fù)觀察時,盡管每進(jìn)行N次試驗(yàn),所得到的頻率可能各不相同,但隨著N的增大,頻率會逐漸穩(wěn)定在某個常數(shù)附近波動。頻率的穩(wěn)定性說明隨機(jī)事件發(fā)生的可能性大小是事件本身固有的一種客觀屬性。,2、概率表示隨機(jī)事件發(fā)生可能性大小的數(shù)值。(用P表示)通常由頻率的穩(wěn)定值反映。確定性事件(1)必然事件P1,(2)不可能事件P0;隨機(jī)性事件(3)概率取值介于0~1之間。概率越接近0,表明事件發(fā)生的可能性越小。概率越接近1,表明事件發(fā)生的可能性越大。,概率和頻率有區(qū)別頻率是已經(jīng)進(jìn)行試驗(yàn)的結(jié)果,描述的是樣本中事件出現(xiàn)的可能性大?。颖拘畔ⅲ瑯颖静煌?,其值也不同,具有偶然性;概率刻畫的則是總體中隨機(jī)事件出現(xiàn)的可能性大小(總體信息),是一種客觀存在,是個確定數(shù)值,具有必然性。,小概率原理概率很小的隨機(jī)事件在一次或少量實(shí)際觀察中是不可能發(fā)生的(盡管理論上有發(fā)生的可能)小概率P≤005或P≤001,五、參數(shù)與統(tǒng)計(jì)量1、參數(shù)根據(jù)總體分布特征而計(jì)算的總體指標(biāo)。一般用小寫的希臘字母表示。2、統(tǒng)計(jì)量根據(jù)樣本計(jì)算的相應(yīng)指標(biāo)樣本指標(biāo)。用拉丁字母表示。,六、假設(shè)檢驗(yàn)與兩類錯誤1、假設(shè)檢驗(yàn)先對總體的參數(shù)或分布作出某種假設(shè),然后用適當(dāng)?shù)姆椒ǜ鶕?jù)樣本對總體提供的信息,運(yùn)用“小概率原理”推斷假設(shè)是否成立。,2、兩類錯誤Ⅰ型錯誤拒絕實(shí)際成立的H0(棄真)Ⅱ型錯誤不拒絕實(shí)際不成立的H0(存?zhèn)危?)由假設(shè)檢驗(yàn)可知,假設(shè)檢驗(yàn)實(shí)際是在假定H0(Μ1Μ2成立)的前提下抽樣觀察,出現(xiàn)當(dāng)前樣本現(xiàn)象的可能性大小(概率P)來進(jìn)行推斷的,,(2)假設(shè)檢驗(yàn)的結(jié)論是概率性結(jié)論,無論是拒絕H0還是不拒絕H0,都有犯錯誤的可能;拒絕H0時可能犯Ⅰ型錯誤(當(dāng)H0成立時),這時犯錯誤的限制為通過假設(shè)檢驗(yàn)下結(jié)論,平均100次抽樣推斷犯錯誤不超過5次,不拒絕實(shí)際不成立的H0時可能犯Ⅱ型錯誤,犯錯誤的概率用不易確定。為把握度,即Μ1和Μ2確實(shí)有差別的話,通過假設(shè)檢驗(yàn)發(fā)現(xiàn)這種差別的能力檢驗(yàn)效能,3要同時降低犯兩類錯誤的概率,唯一的辦法就是增大樣本含量進(jìn)行觀察,第五章參數(shù)估計(jì),有關(guān)抽樣的概念隨機(jī)抽樣在抽樣過程中,要使總體中的每一個觀察對象都有同等機(jī)會被抽中成為樣本。抽樣研究的目的利用樣本信息估計(jì)或推斷總體特征。,統(tǒng)計(jì)分析的基本思想,,,總體,樣本,抽樣,推斷,,,,樣本,統(tǒng)計(jì)描述,,第一節(jié)抽樣誤差,定義(1)從總體中隨機(jī)抽取樣本所產(chǎn)生的樣本指標(biāo)(統(tǒng)計(jì)量)與總體指標(biāo)(參數(shù))之間的差異。(2)從同一總體中隨機(jī)抽樣,樣本指標(biāo)(統(tǒng)計(jì)量)之間的差異。產(chǎn)生原因總體中存在個體差異(生物的個體變異)特點(diǎn)客觀存在,不可避免;有一定范圍,可以控制并估計(jì)其大小。,,假定正常成年男子的紅細(xì)胞計(jì)數(shù)服從正態(tài)分布,總體均數(shù)?5001012/L、總體標(biāo)準(zhǔn)差?0501012/L。我們借助計(jì)算機(jī)從該總體中作隨機(jī)抽樣,每次抽10名成年男子的紅細(xì)胞計(jì)數(shù)組成一個樣本,重復(fù)100次抽樣。求出每個樣本的樣本均數(shù)和標(biāo)準(zhǔn)差。,,,,,?500?050,,X2,S2,,X1,S1,,X3,S3,N10,100次抽樣所得樣本均數(shù)與標(biāo)準(zhǔn)差,,,,樣本均數(shù)的抽樣分布具有如下特點(diǎn),1各樣本均數(shù)未必等于總體均數(shù)。2各樣本均數(shù)間存在差異。3樣本均數(shù)的分布為中間多,兩邊少,左右基本對稱。4樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小。5隨著樣本含量增大,樣本均數(shù)的變異范圍逐漸縮小。,標(biāo)準(zhǔn)誤是統(tǒng)計(jì)量(如樣本均數(shù)、樣本率)的標(biāo)準(zhǔn)差,1反映樣本均數(shù)間的離散程度2反映樣本均數(shù)與總體均數(shù)間的離散程度(即抽樣誤差的大?。?100次抽樣所得樣本均數(shù)與標(biāo)準(zhǔn)差,,,,,,標(biāo)準(zhǔn)誤的值越大,反映樣本統(tǒng)計(jì)量的離散程度越大,通過一次抽樣得到的某個樣本統(tǒng)計(jì)量與總體參數(shù)(是個定值)相差也越大。,第二節(jié)總體均數(shù)的估計(jì)統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩方面。參數(shù)估計(jì)用樣本指標(biāo)(即樣本統(tǒng)計(jì)量)來估計(jì)總體指標(biāo)(即參數(shù))。,統(tǒng)計(jì)描述,統(tǒng)計(jì)分析,統(tǒng)計(jì)推斷,假設(shè)檢驗(yàn),參數(shù)估計(jì),區(qū)間估計(jì),點(diǎn)估計(jì),,,,,統(tǒng)計(jì)指標(biāo),,集中趨勢,離散趨勢,統(tǒng)計(jì)圖表,二、T分布1、T分布從同一總體中抽出許多樣本(N相同),就可得到許多T值,將這些T值繪成直方圖,當(dāng)樣本數(shù)無限多時,就得到一條光滑的曲線,這就是T分布曲線,這種T值的分布就稱為T分布。2、T分布的特點(diǎn)(1)是單峰分布,以0為中心左右兩側(cè)對稱;(2)形似標(biāo)準(zhǔn)正態(tài)分布,當(dāng)自由度趨向無窮大時,T分布就成了標(biāo)準(zhǔn)正態(tài)分布;(3)T分布是一簇曲線,一個自由度對應(yīng)一條曲線,自由度越大,曲線的峰越高,尾越低。,T界值表臨界值TΑ,?Α005檢驗(yàn)水準(zhǔn)?N1自由度在T界值表中每一個T值都對應(yīng)著一個P值在相同自由度時,T值越大,概率P值越小在相同自由度及相同T值時,雙側(cè)概率P值是單側(cè)概率的兩倍。,一、總體均數(shù)的點(diǎn)值估計(jì)點(diǎn)值估計(jì)用某一隨機(jī)樣本均數(shù)來作總體均數(shù)的估計(jì)值。如隨機(jī)抽查120例成年男子,測得血清銅含量均值為1448ΜMOL/L,以此值作為當(dāng)?shù)爻赡昴凶拥目傮w均數(shù)的估計(jì)值,叫“點(diǎn)值估計(jì)”。由于存在抽樣誤差,不同的樣本可能得到不同的估計(jì)值。,二、總體均數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)是按預(yù)先給定的概率(稱為可信度,符號為1Α)利用樣本來給總體均數(shù)定出一個范圍(可信區(qū)間)。用公式表示為,其含義為從被估計(jì)的總體中隨機(jī)抽取若干個含量為N的樣本,每一個樣本可得到一個相應(yīng)的可信區(qū)間,理論上有(1?。﹤€區(qū)間包含總體均數(shù)(估計(jì)正確),有Α個區(qū)間不包總體均數(shù)(估計(jì)錯誤)。,總體均數(shù)95CI表示該區(qū)間包括總體均數(shù)Μ的概率為95,意思是若作100次抽樣,可算得100個可信區(qū)間,平均有95個區(qū)間包括Μ(估計(jì)正確),只有5個區(qū)間不包括Μ(估計(jì)錯誤);由于5是小概率,在一次實(shí)驗(yàn)中可認(rèn)為小概率不發(fā)生,故實(shí)際應(yīng)用時可認(rèn)為估計(jì)的區(qū)間包括總體均數(shù)。由一個樣本估計(jì)一個相應(yīng)的可信區(qū)間,當(dāng)Α005時,被估計(jì)的總體均數(shù)不在該區(qū)間的概率僅5,是個小概率,故可認(rèn)為該區(qū)間包含總體均數(shù)(總體均數(shù)95可信區(qū)間)。,三、模擬實(shí)驗(yàn)?zāi)M抽樣成年男子紅細(xì)胞數(shù)。設(shè)定產(chǎn)生100個隨機(jī)樣本,分別計(jì)算其95的可信區(qū)間,結(jié)果用圖示的方法表示。從圖可以看出絕大多數(shù)可信區(qū)間包含總體參數(shù),只有5個可信區(qū)間沒有包含總體參數(shù)。,圖42模擬抽樣成年男子紅細(xì)胞數(shù)100次的95可信區(qū)間示意圖,例53隨機(jī)抽取某地2002年9名7歲正常發(fā)育男孩測量其身高值得均數(shù)為12144(CM),標(biāo)準(zhǔn)差為575(CM)估計(jì)該地2002年7歲正常發(fā)育男孩身高總體均數(shù)95可信區(qū)間。,T00582306121442306192121442306192即(11701,12587),可信間的兩要素1、準(zhǔn)確度就是CI包含Μ的概率大??;(1?。┲翟酱?,可信度越高。2、精密度就是區(qū)間的長度;長度越小(區(qū)間越窄)精密度越高。當(dāng)N確定時,準(zhǔn)確度越高則精密度越低,兩者是相矛盾的,在實(shí)際工作中為兼顧兩者,以95CI更為常用。,第六章假設(shè)檢驗(yàn)第一節(jié)假設(shè)檢驗(yàn)的概念在比較樣本均數(shù)與已知總體均數(shù)差異、或兩個樣本均數(shù)及多個樣本均數(shù)差異時,先對總體的參數(shù)或分布作出某種假設(shè),然后用適當(dāng)?shù)姆椒ǜ鶕?jù)樣本對總體提供的信息,運(yùn)用“小概率原理”推斷假設(shè)是否成立。,小概率原理概率很小的隨機(jī)事件在一次或少量實(shí)際觀察中是不可能發(fā)生的(盡管理論上有發(fā)生的可能)小概率P≤005或P≤001,,C病,,10例,,,,,,,,A藥,A藥,,10例,樣本1,樣本2,,有效率50,有效率60,,,,差異,,試驗(yàn)1,問題差異是什么原因?qū)е?抽樣誤差(個體差異),,C病,,10例,,,,,,,,A藥,B藥,,10例,樣本1,樣本2,,有效率50,有效率60,,,,差異,,試驗(yàn)2,問題差異是什么原因?qū)е?A藥B藥,抽樣誤差(個體差異),,C病,,10例,,,,,,,,A藥,B藥,,10例,樣本1,樣本2,,有效率50,有效率60,,,,差異,,試驗(yàn)3,問題差異是什么原因?qū)е?A藥≠B藥,處理因素(藥物因素),,C病,,10例,,,,,,,,A藥,B藥,,10例,樣本1,樣本2,,有效率50,有效率60,,,,差異,,試驗(yàn)4,問題差異是什么原因?qū)е?1處理因素(藥物因素)2抽樣誤差(個體差異),,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,A總體B總體差異A總體≠B總體(抽樣誤差)(處理因素),,,A總體,A總體,B總體,B總體,第二節(jié)假設(shè)檢驗(yàn)的一般步驟一、建立假設(shè),確定檢驗(yàn)水準(zhǔn)1、檢驗(yàn)假設(shè)(無效假設(shè))H0Μ1Μ2(或ΜD0(備擇假設(shè))H1Μ1≠Μ2(或ΜD≠0)Μ1<Μ2(ΜD<02、檢驗(yàn)水準(zhǔn)Α,它作為假設(shè)檢驗(yàn)時預(yù)先確定的判斷小概率事件的水準(zhǔn),以便由P值和Α的關(guān)系決定是拒絕H0還是不拒絕H0作為判斷小概率的標(biāo)準(zhǔn),Α常取005或001。,二、計(jì)算相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量根據(jù)設(shè)計(jì)的類型、資料的類型和分布情況、統(tǒng)計(jì)推斷目的以及N的大小選用不同的檢驗(yàn)方法,計(jì)算相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量。如完全隨機(jī)設(shè)計(jì)實(shí)驗(yàn)中,兩樣本均數(shù)比較可計(jì)算統(tǒng)計(jì)量T值(即作T檢驗(yàn))。,三、確定P值,作出推斷結(jié)論P(yáng)值是指在H0所規(guī)定的總體(例如Μ1Μ2)中作隨機(jī)抽樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計(jì)量(如T值)的概率;亦即這種樣本差異()來自抽樣誤差的概率。推斷結(jié)論統(tǒng)計(jì)結(jié)論1對H0如何推斷2對H1如何推斷3對差異如何推斷專業(yè)結(jié)論1正確2明確3符合醫(yī)學(xué)邏輯,第七章兩樣本均數(shù)比較的假設(shè)檢驗(yàn)第一節(jié)單樣本均數(shù)T檢驗(yàn)(樣本均數(shù)與總體均數(shù)比較)總體均數(shù)理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀測所得的穩(wěn)定值。前提條件正態(tài)分布或大樣本。分析目的推斷樣本所代表的未知總體均數(shù)?與已知的總體均數(shù)?0是否相等(??0)。,1、資料類型(1)給定一個已知的總體均數(shù)和一個隨機(jī)抽取的樣本,(2)該隨機(jī)樣本服從正態(tài)分布(若原數(shù)據(jù)是非正態(tài)分布,要通過數(shù)據(jù)變換使之服從正態(tài)分布)2、計(jì)算統(tǒng)計(jì)量T值,通過以往大量資料得知某地20歲男子平均身高為168㎝,現(xiàn)隨機(jī)測量當(dāng)?shù)?6名20歲男子,其身高均數(shù)為172㎝,標(biāo)準(zhǔn)差為14㎝。問當(dāng)?shù)噩F(xiàn)在20歲男子的平均身高是否比以往高,一H0ΜΜ0H1Μ﹥Μ0?005二T1143三查T界值表(T?、V)T005151753P﹥005接受H0,拒絕H1,差異無統(tǒng)計(jì)學(xué)意義(差異無顯著意義)?,F(xiàn)在當(dāng)?shù)?0歲男子平均身高與以往相同。,第二節(jié)成對資料均數(shù)的T檢驗(yàn)成對(配對)比較的T檢驗(yàn)適用于下列情況自身配對1同一受試對象處理前后的比較2同一受試對象接受兩種不同處理異體配對3將兩個受試者配成對子,施予兩種不同處理要求1配對資料(差值D符合正態(tài)分布)2假設(shè)成對資料差數(shù)的總體均數(shù)為0(?D0),檢驗(yàn)樣本差數(shù)的均數(shù)與0之間差別有無顯著性,例72某醫(yī)院用A、B兩種血紅蛋白測定儀檢測16名健康男青年的血紅蛋白含量(G/L),問兩種血紅蛋白測量儀的檢測結(jié)果是否有差別,表71兩種血紅蛋白測量儀的檢測結(jié)果(G/L),,,,8125≠0,,1處理因素(不同儀器),2抽樣誤差(個體差異),一H0ΜD0H1Μ≠0?005二T2366三查T界值表(T?、V)T005151753P﹤005拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義(差異有顯著意義)。儀器B檢測的血紅蛋白值高于儀器A,為研究三棱莪術(shù)液的抑瘤效果,將20只小白鼠按體重配成10對,然后把每對中的2只動物隨機(jī)分到實(shí)驗(yàn)組和對照組中。兩組動物都接種腫瘤,實(shí)驗(yàn)組在接種腫瘤3天后注射30的三棱莪術(shù)液05ML,對照組不加任何處理。測量瘤體直徑如表163,問兩組瘤體大小差異是否有統(tǒng)計(jì)學(xué)意義,從而判斷三棱莪術(shù)是否有抑制腫瘤生長的作用,,,,,表163三棱莪術(shù)液抑瘤實(shí)驗(yàn)的結(jié)果(CM),,用SPSS分析結(jié)果ANALYZE→COMPAREMEANS→PAIREDSAMPLESTTEST,第三節(jié)兩獨(dú)立樣本均數(shù)T比較成組T檢驗(yàn)?zāi)康氖峭茢鄡蓸颖痉謩e代表的兩總體均數(shù)是否相等(?1?2)。1、資料類型隨機(jī)分組的兩組資料,為獨(dú)立樣本滿足正態(tài)性和方差齊性,受試者血糖濃度(MMOL/L),患者手術(shù)前后癥狀評分,兔咬肌IIB型纖維平均橫截面積(N5±S,ΜM2),例74為了解內(nèi)毒素對肌酐的影響,將20只雄性中年大鼠隨機(jī)分為甲、乙兩組,甲組中的大鼠不給于內(nèi)毒素,乙組中的每只大鼠則給予3MG/KG的內(nèi)毒素。分別測得兩組大鼠的肌酐(MG/L)結(jié)果如下,問內(nèi)毒素對肌酐是否有影響甲組(MG/L62375827396167783869乙組(MG/L856811394937356797282,甲組大鼠肌酐均數(shù)(5360)乙組大鼠肌酐均數(shù)(8150),,,,差異,1處理因素(內(nèi)毒素),2抽樣誤差(個體差異),一H0Μ1Μ2H1Μ1≠Μ2?005二T3785三查T界值表(T?、V)T005182101P﹤005拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義。內(nèi)毒素具有升高肌酐的作用。,均衡可比性除研究因素不同外,能夠影響實(shí)驗(yàn)效應(yīng)的最重要非研究因素齊同。假設(shè)體重是能夠影響實(shí)驗(yàn)效應(yīng)的最重要的非研究因素配對設(shè)計(jì)1234567891012345A組23689B組145710完全隨機(jī)設(shè)計(jì),,,,,,,,,,,153892610,,13542,,598710,A組(體重大),B組(體重?。?,用SPSS分析結(jié)果ANALYZE→COMPAREMEANS→INDEPENDENTSAMPLESTTEST,第五節(jié)兩樣本的方差齊性檢驗(yàn)(F檢驗(yàn))一、兩個方差的齊性檢驗(yàn)用檢驗(yàn)比較兩樣本均數(shù)的差別,其先決條件之一是兩總體方差相等,即對于兩樣本方差不等是否由抽樣誤差所致,需用方差齊性檢驗(yàn)(計(jì)算F值),例76對例74用F檢驗(yàn)判斷兩總體的方差是否齊性一H0Σ21Σ22H1Σ21≠Σ22?005二F113三查F界值表(F?、V)F00599403P﹤005拒絕H0,接受H1,差異無統(tǒng)計(jì)學(xué)意義。兩組資料總體方差齊性,方差不齊時兩樣本均數(shù)的比較(1)可采用適當(dāng)?shù)淖兞孔儞Q,使之達(dá)到方差齊的要求,再作T檢驗(yàn)(2)作秩和檢驗(yàn)(3)作,例77對10例肺癌病人和12例矽肺0期工人用X光片測量肺門橫徑右側(cè)距RD值(CM)問肺癌病人RD值是否高于矽肺0期工人的RD值矽肺0期工人的RD值323350404428434447464475482495510肺癌病人RD值278323420487512621718805856960,(一)經(jīng)方差齊性檢驗(yàn)兩總體方差不齊(F43558PΜ2?005二2160?9893≈10(自由度校正)三查T界值表(T?、V)T005101812P﹤005拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義肺癌病人RD值高于矽肺0期工人的RD值。,假設(shè)檢驗(yàn)時應(yīng)注意的問題1、前提科學(xué)的統(tǒng)計(jì)學(xué)設(shè)計(jì);如隨機(jī)抽樣和分組、注意組間的均衡性和資料的可比性、盡量減少或消除混雜因素的影響。2、正確選擇假設(shè)檢驗(yàn)的方法要按照設(shè)計(jì)類型、資料性質(zhì)、分布類型和樣本大小等情況正確計(jì)算統(tǒng)計(jì)量。3、Α通常為005是人為規(guī)定的(考慮到犯Ⅰ類、Ⅱ類錯誤的概率都不是很大);如篩選抗癌中藥時,可將Α定為01甚至02,這樣雖然增加了誤選的機(jī)會,卻減少了漏選的概率,4、合理確定單雙側(cè)檢驗(yàn)單雙側(cè)檢驗(yàn)的選取是由研究目的、結(jié)合專業(yè)知識決定的;如欲了解A、B兩藥合用是否比只用A藥好,由藥理知識知道A、B兩藥有相加或相乘作用而無拮抗作用,這時就可用單側(cè)檢驗(yàn);否則,A、B兩藥聯(lián)合作用的機(jī)理不清楚,就只能用雙側(cè)檢驗(yàn)了。區(qū)別在相同自由度條件下,單側(cè)檢驗(yàn)的概率是雙側(cè)檢驗(yàn)的一半,雙側(cè)檢驗(yàn),單側(cè)檢驗(yàn),,,,,,,,某新藥治療貧血的療效,以某傳統(tǒng)藥作對照,事先無法確定是否新藥優(yōu)于傳統(tǒng)藥,事先能明確新藥的療效不會低于傳統(tǒng)藥,5、科學(xué)地解釋假設(shè)檢驗(yàn)的結(jié)論(1)拒絕H0,可以認(rèn)為被研究的事物存在本質(zhì)差異;不拒絕H0,只能說被研究事物可能并無本質(zhì)差異,也可能是N較小使抽樣誤差較大所致,如增大N有可能就拒絕H0,(2)P值的意義P值是指在H0所規(guī)定的總體(例如Μ1Μ2)中作隨機(jī)抽樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計(jì)量(如T值)的概率;亦即這種樣本差異()來自抽樣誤差的概率。P值越小只能認(rèn)為當(dāng)前的樣本信息越“不利于”接受H0,不能理解為被比較的事物數(shù)量上相差很大,總體參數(shù)間的差別大小需計(jì)算總體均數(shù)95可信區(qū)間。至于這種差別有無實(shí)用價值還得由專業(yè)知識決定。,統(tǒng)計(jì)結(jié)論僅僅表明了某隨機(jī)事件發(fā)生的機(jī)會大小,并不宜說明專業(yè)意義或生物學(xué)價值的大小。,(3)假設(shè)檢驗(yàn)的結(jié)論是概率性的結(jié)論,無論是拒絕H0還是不拒絕H0,都有可能犯錯誤;拒絕H0可能犯Ⅰ類錯誤,不拒絕H0,可能犯Ⅱ類錯誤。,假設(shè)檢驗(yàn)的兩類錯誤,上圖的陰影部分代表Ⅰ型錯誤下圖的陰影部分代表Ⅱ型錯誤,兩類錯誤示意圖,
下載積分: 6 賞幣
上傳時間:2024-01-06
頁數(shù): 91
大小: 1.65(MB)
子文件數(shù):
-
簡介:T檢驗(yàn)的基本知識及應(yīng)用,王嬌張琦,作用,檢驗(yàn)計(jì)量數(shù)據(jù)兩個均數(shù)的差別有無統(tǒng)計(jì)學(xué)意義。根據(jù)設(shè)計(jì)不同,有以下T檢驗(yàn),單樣本數(shù)據(jù)的T檢驗(yàn)樣本均數(shù)與總體均數(shù)比較配對樣本數(shù)據(jù)比較的T檢驗(yàn)一組樣本在處理前后平均值的比較兩樣本T檢驗(yàn)兩組數(shù)據(jù)平均值的比較,,,,,異源,同源,自身,配對T檢驗(yàn)條件,兩同質(zhì)受試對象配成對子分別接受兩種不同的處理,同一受試對象分別接受兩種不同的處理,同一受試對象接受一種美好處理的前后,單樣本T檢驗(yàn)(ONESAMPLETTEST)即比較抽樣的單個樣本均數(shù)與已知總體均數(shù)的差別。,單樣本T檢驗(yàn),,例題,已知某小樣本中含CACO3的真值為207MG/L?,F(xiàn)用某法重復(fù)測定該小樣本15次,CACO3含量(MG/L)分別為2099,2041,2062,2075,2010,2000,2080,2091,2260,2230,2099,2041,2050,2300,2260。問該法測得的均數(shù)與真值有無差異,STEP1,檢驗(yàn)正態(tài)性,STEP2,單樣本T檢驗(yàn),操作步驟,具體步驟,1,2,分析非參數(shù)檢驗(yàn)舊對話框單個樣本檢驗(yàn),分析比較均值單個樣本T檢驗(yàn),,,分析得出的概率值有無統(tǒng)計(jì)學(xué)意義,1,若有意義,比較樣本均數(shù)與總體均數(shù)的大小,2,結(jié),論,配對樣本T檢驗(yàn)(PAIREDTTEST),將比較組受試對象某些影響結(jié)果的因素(如年齡,性別等),按特征相似配成對子,測定某指標(biāo)結(jié)果。,例題,某研究者為比較耳垂血和手指血的白細(xì)胞數(shù),調(diào)查12名成年人,同時采取耳垂血和手指血見下表,試比較兩者的白細(xì)胞數(shù)有無不同。,STEP1,求差值,STEP2,正態(tài)性檢驗(yàn),STEP3,配對樣本T檢驗(yàn),操作步驟,具體步驟,1,2,3,轉(zhuǎn)換計(jì)算變量求差值,分析非參數(shù)檢驗(yàn)舊對話框單個樣本檢驗(yàn),分析比較均值單個樣本T檢驗(yàn),分析得出的概率值有無統(tǒng)計(jì)學(xué)意義,1,若有意義,比較兩者均數(shù)的大小,2,結(jié),論,兩獨(dú)立樣本T檢驗(yàn)(TWOSAMPLE,適用于完全隨機(jī)設(shè)計(jì)兩樣本均數(shù)的比較,此時比較的是兩樣本均數(shù)所代表的兩總體均數(shù)是否相等。,,,適用條件,1資料服從正態(tài)分布,2方差具有齊性,注若方差不具有齊性,用T檢驗(yàn),例題,分別測得15名健康人和13名Ⅲ度肺氣腫病人痰中抗胰蛋白酶含量G/L如下表,問健康人與Ⅲ度肺氣腫病人抗胰蛋白酶含量是否不同,STEP1,拆分?jǐn)?shù)據(jù),STEP2,正態(tài)性檢驗(yàn),STEP4,合并數(shù)據(jù),STEP3,兩獨(dú)立樣本T檢驗(yàn),操作步驟,,具體步驟,1,2,3,4,數(shù)據(jù)拆分文件,,分析非參數(shù)檢驗(yàn)舊對話框單個樣本檢驗(yàn),數(shù)據(jù)拆分文件,分析比較均值兩獨(dú)立樣本T檢驗(yàn),例為研究國產(chǎn)四類新藥阿卡波糖膠囊降血糖效果,某醫(yī)院用40名II型糖尿病病人分為兩組進(jìn)行同期隨機(jī)對照試驗(yàn)。問兩組8周后的血糖改變量有無差別兩組用藥前后血糖值結(jié)果試驗(yàn)組(N20)對照組(N20)對象阿卡波糖膠囊拜唐蘋膠囊編號基線8周后基線8周后1543852745643852654220910275,,,,兩獨(dú)立樣本T檢驗(yàn)的步驟,兩組基本統(tǒng)計(jì)量的計(jì)算NS試驗(yàn)組20206530601對照組20262524205,合并方差計(jì)算,2計(jì)算檢驗(yàn)統(tǒng)計(jì)量,?N1N2?22N?1220?138,3確定P值,作出推斷結(jié)論結(jié)論按?005水準(zhǔn),P>050不拒絕H0,差別無統(tǒng)計(jì)學(xué)意義。還不能認(rèn)為阿卡波糖膠囊與拜唐蘋膠囊對空腹血糖的降糖效果有不同。,,本次內(nèi)容結(jié)束,謝謝大家,,LOREMIPSUMDOLOR,LOREMIPSUMDOLORSITAMET,CONSECTETURADIPISICINGELIT,LOREMIPSUMDOLOR,1,LOREMIPSUMDOLOR,2,目,錄,CONTENTS,LOREMIPSUMDOLOR,1,LOREMIPSUMDOLOR,2,LOREMIPSUMDOLOR,3,LOREMIPSUMDOLOR,4,目,錄,CONTENTS,LOREMIPSUMDOLOR,1,LOREMIPSUMDOLOR,2,LOREMIPSUMDOLOR,3,LOREMIPSUMDOLOR,4,LOREMIPSUMDOLOR,5,目,錄,CONTENTS,LOREMIPSUMDOLOR,1,LOREMIPSUMDOLOR,2,LOREMIPSUMDOLOR,3,LOREMIPSUMDOLOR,4,LOREMIPSUMDOLOR,5,LOREMIPSUMDOLOR,6,目,錄,CONTENTS,PART,1,LOREMIPSUMDOLOR,LOREM,LOREMIPSUM,LOREMIPSUMDOLOR,LOREM,LORE,LOREM,LORE,LOREM,LORE,LOREM,LORE,LOREM,LORE,LOREM,LORE,LOREMIPSUMDOLOR,LOREM,LOREMIPSUMDOLORSITAMET,CONSECTETURADIPISICINGELIT,SEDDOEIUSMODTEMPORINCIDIDUNTUTLABOREETDOLOREMAGNAALIQUAUTENIMADMINIMVENIAM,QUISNOSTRUDEXERCITATIONULLAMCOLABORISNISIUTALIQUIPEXEACOMMODOCONSEQUAT,LOREMIPSUMDOLOR,LOREM,LOREM,LOREMIPSUMDOLORSITAMET,CONSECTETURADIPISICINGELIT,SEDDOEIUSMODTEMPORINCIDIDUNTUTLABOREETDOLOREMAGNAALIQUAUTENIMADMINIMVENIAM,QUISNOSTRUDEXERCITATIONULLAMCOLABORISNISIUTALIQUIPEXEACOMMODOCONSEQUAT,LOREMIPSUMDOLOR,LOREM,LOREM,LOREM,LOREMIPSUMDOLORSITAMET,CONSECTETURADIPISICINGELIT,LOREMIPSUMDOLOR,LORE,LORE,LORE,LORE,LOREMIPSUMDOLORSITAMET,CONSECTETURADIPISICINGELIT,SEDDOEIUSMODTEMPORINCIDIDUNTUTLABOREETDOLOREMAGNAALIQUAUTENIMADMINIMVENIAM,QUISNOSTRUDEXERCITATIONULLAMCOLABORISNISIUTALIQUIPEXEACOMMODOCONSEQUAT,LOREMIPSUMDOLOR,LORE,LORE,LORE,LORE,LORE,LOREMIPSUMDOLORSITAMET,CONSECTETURADIPISICINGELIT,SEDDOEIUSMODTEMPORINCIDIDUNTUTLABOREETDOLOREMAGNAALIQUAUTENIMADMINIMVENIAM,QUISNOSTRUDEXERCITATIONULLAMCOLABORISNISIUTALIQUIPEXEACOMMODOCONSEQUAT,LOREMIPSUMDOLOR,LORE,LORE,LORE,LORE,LORE,LORE,LOREMIPSUMDOLORSITAMET,CONSECTETURADIPISICINGELIT,SEDDOEIUSMODTEMPORINCIDIDUNTUTLABOREETDOLOREMAGNAALIQUAUTENIMADMINIMVENIAM,QUISNOSTRUDEXERCITATIONULLAMCOLABORISNISIUTALIQUIPEXEACOMMODOCONSEQUAT,LOREMIPSUMDOLOR,LORE,LOREMIPSUMDOLORSITAMET,CONSECTETURADIPISICINGELIT,LORE,LORE,LORE,LOREMIPSUMDOLOR,,N,,A,,H,,T,,K,
下載積分: 6 賞幣
上傳時間:2024-01-06
頁數(shù): 41
大小: 1.61(MB)
子文件數(shù):
-
簡介:醫(yī)學(xué)統(tǒng)計(jì)學(xué)(13)復(fù)習(xí),季聰華20121226,META分析,什么是META分析,是對具備特定條件的、同課題的諸多研究結(jié)果進(jìn)行定量合并的一類統(tǒng)計(jì)方法。優(yōu)點(diǎn)META分析整合大量的研究報告,增加了樣本量,增加了結(jié)論的統(tǒng)計(jì)功效,解決分歧意見,比綜述的結(jié)論更客觀全面,并可引出新見解。,META分析研究步驟,遵循一個結(jié)構(gòu)式程序–提出研究問題–綜合搜索資料–嚴(yán)格評價資料–提取資料數(shù)據(jù)–分析并形成結(jié)果(META分析方法),步驟1提出問題,選題是最重要最困難的事情需要考慮以下幾個方面重要性爭議性創(chuàng)新性可行性,步驟1提出問題,PPOPULATION/PATIENTS人群/病人群關(guān)心的是哪一類人群或病人IINTERVENTION/EXPOSURE干預(yù)/暴露進(jìn)行什么治療、處于何種暴露CCOMPARISONORCONTROL比較物或?qū)φ諏φ瘴?、處理策略、試?yàn)或暴露是什么OOUTCOME結(jié)果結(jié)局如何,PICO原則,步驟2全面查找資料,1制定檢索詞、檢索策略2嚴(yán)格納入和排除標(biāo)準(zhǔn)3全面檢索資料PUBMED、COCHRANE、EBMBASE、OVID、GOOGLE、國內(nèi)全文數(shù)據(jù)庫、報告、會議、摘要等所有可用資源4文獻(xiàn)管理軟件NOTEEXPRESS、ENDNOTE,步驟3資料評價,對檢索資料進(jìn)行評價、評分,分5級。,JADAD評分量表1隨機(jī)分組序列的產(chǎn)生方法2分通過計(jì)算機(jī)產(chǎn)生的隨機(jī)序列或隨機(jī)數(shù)表產(chǎn)生的序列;1分試驗(yàn)提到隨機(jī)分配,但產(chǎn)生隨機(jī)序列的方法未予交待;0分半隨機(jī)或準(zhǔn)隨機(jī)試驗(yàn),指采用交替分配病例的方法,如入院順序、出生日期單雙數(shù);2雙盲法2分描述了實(shí)施雙盲的具體方法并且被認(rèn)為是恰當(dāng)?shù)?,如采用完全一致的安慰劑等?分試驗(yàn)僅提及采用雙盲法;0分試驗(yàn)提及采用雙盲,但方法不恰當(dāng),如比較片劑與注射劑而未提及使用雙偽法;3退出與失防1分對退出與失防的病例數(shù)和退出理由進(jìn)行了詳細(xì)的描述;0分沒有提到退出與失防;,評價治療或篩查的證據(jù)質(zhì)量,預(yù)防、診斷、預(yù)后、治療和危害研究等領(lǐng)域的研究評價,,,,,,步驟4抽取資料,,,,步驟5數(shù)據(jù)分析整理,計(jì)量資料均數(shù)之差例1氟對女童II掌骨皮質(zhì)厚度的影響,標(biāo)準(zhǔn)化均數(shù)之差DI1I2I/SCI,I1,2,3,K權(quán)重系數(shù)WIN1IN2I,,步驟6結(jié)果展示,步驟7討論與總結(jié),評估該系統(tǒng)評價的局限性實(shí)用性論證強(qiáng)度對醫(yī)學(xué)研究的意義,META分析軟件,REVMAN操作簡易系統(tǒng)綜述和META分析STATA功能強(qiáng)大發(fā)表偏倚定量及圖片編輯METADICSRSAS,META分析涉及的幾個統(tǒng)計(jì)處理,統(tǒng)計(jì)處理流程A.異質(zhì)性檢驗(yàn)(齊性檢驗(yàn))。B.統(tǒng)計(jì)合并效應(yīng)量并進(jìn)行統(tǒng)計(jì)推斷。C.采用“倒漏斗圖”了解潛在的發(fā)表偏倚。,異質(zhì)性檢驗(yàn)(齊性檢驗(yàn)),異質(zhì)性檢驗(yàn)基本思想假如研究資料間的真實(shí)效應(yīng)量一致,那么實(shí)際效應(yīng)量間的差異可認(rèn)為是由誤差引起的。常用Q檢驗(yàn)方法檢驗(yàn),P值50,說明存在比較明顯的異質(zhì)性。,異質(zhì)性檢驗(yàn)(齊性檢驗(yàn)),識別異質(zhì)性觀察幾個獨(dú)立研究的差異情況,是否合并Q檢驗(yàn)P值|T|95CONFINTERVALSLOPE|4270146286694149019730995581163985BIAS|0547229947982006095623821432491589,如何提高,檢索,系統(tǒng)綜述/META分析,,英語,醫(yī)學(xué),統(tǒng)計(jì),,,,做一個系統(tǒng)綜述研究常需要多人協(xié)作,更多了解,丁香園循證醫(yī)學(xué)專版HTTP//EBMDXYCN/BBS/POST/PAGEBID96STY0AGE0,醫(yī)學(xué)統(tǒng)計(jì)學(xué),一、緒論二、統(tǒng)計(jì)描述三、概率分布四、參數(shù)估計(jì)與假設(shè)檢驗(yàn)五、T檢驗(yàn)六、方差分析七、雙變量相關(guān)與回歸分析八、X2檢驗(yàn),九、基于秩次的非參數(shù)檢驗(yàn)十、實(shí)驗(yàn)設(shè)計(jì)十一、調(diào)查設(shè)計(jì)十二、協(xié)方差分析十三、多重線性回歸分析十四、LOGISTIC回歸分析十五、生存分析,,,中華醫(yī)學(xué)雜志對來稿統(tǒng)計(jì)學(xué)處理的有關(guān)要求,醫(yī)學(xué)統(tǒng)計(jì)學(xué),一、緒論二、統(tǒng)計(jì)描述三、概率分布四、參數(shù)估計(jì)與假設(shè)檢驗(yàn)五、T檢驗(yàn)六、方差分析七、雙變量相關(guān)與回歸分析八、X2檢驗(yàn),九、基于秩次的非參數(shù)檢驗(yàn)十、實(shí)驗(yàn)設(shè)計(jì)十一、調(diào)查設(shè)計(jì)十二、協(xié)方差分析十三、多重線性回歸分析十四、LOGISTIC回歸分析十五、生存分析,統(tǒng)計(jì)工作的步驟及內(nèi)容,統(tǒng)計(jì)描述統(tǒng)計(jì)推斷,參數(shù)估計(jì)假設(shè)檢驗(yàn),統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)圖表,,,,研究設(shè)計(jì)收集資料整理資料分析資料,,統(tǒng)計(jì)描述的常用指標(biāo),例數(shù)(N)均數(shù)±標(biāo)準(zhǔn)差(X±S)最小值,最大值(MIN,MAX)中位數(shù)(M,MEDIAN)四分位間距、百分位數(shù)頻數(shù)、百分比,,,,,,,,MIN,MEDIAN,P75,MAX,P25,T檢驗(yàn),資料由什么設(shè)計(jì)而來完全隨機(jī)設(shè)計(jì)、配對設(shè)計(jì)統(tǒng)計(jì)學(xué)描述(例數(shù)、均數(shù)、標(biāo)準(zhǔn)差)統(tǒng)計(jì)學(xué)檢驗(yàn)方法(單組、兩組、配對)統(tǒng)計(jì)學(xué)檢驗(yàn)結(jié)果(根據(jù)方差是否齊,選擇不同結(jié)果),T值,P值專業(yè)意義,【例1】為了驗(yàn)證腎上腺素有無降低呼吸道阻力的作用,用豚鼠12只進(jìn)行支氣管灌流法實(shí)驗(yàn),在注入定量腎上腺素前后,測得豚鼠支氣管功能反映在儀器上的灌流速度每分鐘灌流滴數(shù),結(jié)果見下表。問腎上腺素能否降低豚鼠呼吸道阻力,,結(jié)果解讀,結(jié)果解讀1,N用藥前、用藥后樣本例數(shù)12均值用藥前、用藥后均值分別為4483、5283標(biāo)準(zhǔn)差用藥前、用藥后標(biāo)準(zhǔn)差分別為9815、6952,結(jié)果解讀2,T統(tǒng)計(jì)量T2653SIG(雙側(cè))P值0022均值差值兩個均數(shù)的差值8000差值的95CI146361364,【例2】為觀察中成藥青黛明礬片對急性黃疸肝炎的退黃效果,以單用輸液保肝的患者作為對照進(jìn)行了完全隨機(jī)設(shè)計(jì)觀察,受試對象為黃疸指數(shù)在3050之間的成年患者,觀測結(jié)果為退黃天數(shù),數(shù)據(jù)見下表。試比較中藥組與對照組退黃天數(shù)有無差別,結(jié)果解讀,結(jié)果解讀1,N組1、組2的樣本例數(shù)分別為8、9;均值組1、組2的均值分別為1175、2144;標(biāo)準(zhǔn)差組1、組2的標(biāo)準(zhǔn)差分別為5392、6405;,結(jié)果解讀2,方差齊性檢驗(yàn)F0002,P0968,P005方差相等,T檢驗(yàn)結(jié)果選第一行。,,,結(jié)果解讀3,T統(tǒng)計(jì)量T3351SIG(雙側(cè))P值0004,P1,危險因素X4為緩解出院后的鞏固治療(0無,1有),RR005),方差不齊,采用隨機(jī)區(qū)組設(shè)計(jì)的非參數(shù)檢驗(yàn),SNK法皮質(zhì)醇3優(yōu)于2、4,優(yōu)于1,3、4低于12與1差異沒有統(tǒng)計(jì)學(xué)意義,析因設(shè)計(jì)60,液氮196,保存5天活力最大,時間溫度時間與溫度有交互作用,,應(yīng)變量Y為連續(xù)變量自變量X可為連續(xù)、有序分類或無序分類變量,1線性趨勢Y與XI間具有線性關(guān)系。2獨(dú)立性應(yīng)變量Y的取值相互獨(dú)立。3正態(tài)性對任意一組自變量取值,因變量Y服從正態(tài)分布。4方差齊性對任意一組自變量取值,因變量Y的方差相同。,回歸系數(shù)大于0的項(xiàng)目,,,Y沒有告訴截距時取標(biāo)準(zhǔn)化回歸系數(shù)告訴截距時取回歸系數(shù),,考試注意事項(xiàng),1、分A、B卷,看清你應(yīng)該答什么卷2、最后一題,選做其中一題。題目上有說明,要看仔細(xì)。,預(yù)祝好成績,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 101
大?。?3.53(MB)
子文件數(shù):
-
簡介:,,醫(yī)學(xué)統(tǒng)計(jì)學(xué)MEDICALSTATISTICS,醫(yī)學(xué)統(tǒng)計(jì)學(xué)講授內(nèi)容第一章緒論第二章計(jì)量資料的統(tǒng)計(jì)描述第三章總體均數(shù)的估計(jì)與假設(shè)檢驗(yàn)第四章多個樣本均數(shù)比較的方差分析第五章計(jì)數(shù)資料的統(tǒng)計(jì)描述第六章幾種離散型變量的分布及其應(yīng)用第七章檢驗(yàn)第八章秩轉(zhuǎn)換的非參數(shù)檢驗(yàn)第九章雙變量回歸與相關(guān)第十章統(tǒng)計(jì)表與統(tǒng)計(jì)圖,第十一章多因素試驗(yàn)資料的方差分析第十二章重復(fù)測量設(shè)計(jì)資料的方差分析第十五章多元線性回歸分析第十六章LOGISTIC回歸分析第十七章生存分析第十八章判別分析第十九章聚類分析第二十三章常用綜合評價方法第二十四章量表研制與量表資料的統(tǒng)計(jì)分析方法,“非常痛心地看到,因?yàn)閿?shù)據(jù)分析的缺陷和錯誤,那么多好的生物研究工作面臨著被葬送的危險”。FYATES,MJRHEALY,統(tǒng)計(jì)知識的運(yùn)用,撰寫論文報告自己觀察或?qū)嶒?yàn)的研究結(jié)果。,閱讀論文吸收新知識,了解學(xué)術(shù)進(jìn)展。,為什么要學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué),60年代到80年代,國外醫(yī)學(xué)雜志調(diào)查表明2072的論文有統(tǒng)計(jì)錯誤。1984年對中華醫(yī)學(xué)雜志、中華內(nèi)科雜志、中華外科雜志、中華婦產(chǎn)科雜志、中華兒科雜志595篇論文的調(diào)查結(jié)果為相對數(shù)誤用占112,抽樣方法誤用占159,統(tǒng)計(jì)圖表誤用占1171996年對4586篇論文統(tǒng)計(jì)(中華醫(yī)學(xué)會系列雜志占69),數(shù)據(jù)分析方法誤用達(dá)557。2001年中華預(yù)防醫(yī)學(xué)雜志中華醫(yī)學(xué)會系列雜志誤用約54(1995)。,1996年,有機(jī)構(gòu)對申報科技成果的4586篇科研論文分析,統(tǒng)計(jì)方法使用率為76。醫(yī)學(xué)論文中統(tǒng)計(jì)運(yùn)用錯誤,除了影響論文的科學(xué)性,還可能導(dǎo)致嚴(yán)重的倫理學(xué)問題。,為什么要學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué),英國統(tǒng)計(jì)學(xué)家RAFISHER(18901962)對遺傳學(xué)家MENDEL(18221884)雜交試驗(yàn)結(jié)果的評價,MENDEL的豌豆雜交試驗(yàn)父本母本第一代YGYG第二代Y/YY/GG/YG/G,雜交試驗(yàn)結(jié)果綠色種子的頻率2001/8023期望值8023?0252006,標(biāo)準(zhǔn)差39PROP2001520115011,結(jié)合MENDEL歷次報告的其它實(shí)驗(yàn)結(jié)果,每次都有如此好的吻合的概率約10萬分之4。,為什么要學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué),緒論INTRODUCTION,講授內(nèi)容一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的意義二、統(tǒng)計(jì)學(xué)中的幾個基本概念三、統(tǒng)計(jì)資料的類型四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟五、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)應(yīng)注意的問題,一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的意義,1統(tǒng)計(jì)學(xué)(STATISTICS)應(yīng)用數(shù)學(xué)的原理與方法,研究數(shù)據(jù)的搜集、整理與分析的科學(xué),對不確定性數(shù)據(jù)作出科學(xué)的推斷。2醫(yī)學(xué)統(tǒng)計(jì)學(xué)(STATISTICSOFMEDICINE)統(tǒng)計(jì)學(xué)的原理與方法應(yīng)用于醫(yī)學(xué)科研與實(shí)踐。,一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的意義,3統(tǒng)計(jì)學(xué)方法的特點(diǎn)1用數(shù)量反映質(zhì)量1體格檢查量血壓、脈搏)→個體健康質(zhì)量2)考試分?jǐn)?shù)→個體學(xué)習(xí)質(zhì)量3期望壽命反映人群健康狀況的指標(biāo)4嬰兒死亡率反映衛(wèi)生服務(wù)質(zhì)量的指標(biāo),一、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的意義,2用群體歸納個體請同學(xué)們回答2002年長沙市7歲男孩有多高,17歲男孩身高有高有矮2N100,平均身高1195CM95的長沙市7歲男孩的身高在11020CM12920CM之間,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,1、研究單位(觀察單位、UNIT)和變量VARIABLE)、變量值(VALUEOFVARIABLE)(1)、研究單位(UNIT)研究中的個體(INDIVIDUAL),是根據(jù)研究目的確定的。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,例如研究7歲男孩身高的正常值范圍一個人研究大學(xué)生視力一只眼睛研究水污染情況一毫升水研究細(xì)胞變性一個細(xì)胞研究肝癌的地區(qū)分布一個地區(qū),二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(2)變量VARIABLE)研究單位的研究特征。例如研究7歲男孩身高的正常值范圍變量身高(3)變量值(VALUEOFVARIABLE),二、統(tǒng)計(jì)學(xué)中的幾個基本概念,變量值(VALUEOFVARIABLE)變量的觀察結(jié)果。例如研究7歲男孩身高變量值測得的身高值(1202CM,1186CM,1218CM,研究某人群性別構(gòu)成變量值男、女。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,2、同質(zhì)(HOMOGENEITY)和變異(VARIATION)(1)、同質(zhì)(HOMOGENEITY)根據(jù)研究目的給研究單位確定的相同性質(zhì)。研究長沙市2004年7歲男孩身高的正常值范圍同質(zhì)同長沙市、同7歲、同男孩、同無影響身高的疾病。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(2)、變異(VARIATION)變異(VARIATION)同質(zhì)研究單位中變量值間的差異。例如1)長沙市2004年7歲男孩身高有高有矮2)相同的藥方治療相同的疾病的病人,療效有好有壞,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,3、總體(POPULATION)和樣本(SAMPLE)(1)、總體(POPULATION)是根據(jù)研究目的確定的同質(zhì)研究單位的全體。更確切地說是同質(zhì)研究單位某種變量值的集合。例如調(diào)查某地2002年正常成年男子的紅細(xì)胞數(shù)的正常值范圍,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,研究單位一個人變量紅細(xì)胞數(shù)同質(zhì)同某地、同2002年、同成年男子、同正常??傮w1)某地所有的正常成年男子2)某地所有的正常成年男子的紅細(xì)胞數(shù),二、統(tǒng)計(jì)學(xué)中的幾個基本概念,1)有限總體(FINITEPOPULATION)研究單位數(shù)是有限的例如調(diào)查某地2002年正常成年男子的紅細(xì)胞數(shù)的正常值范圍2)無限總體(INFINITEPOPULATION)研究單位數(shù)是無限的例如高血壓患者←無時間、空間限制。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(2)樣本(SAMPLE)是總體中抽取的有代表性的一部分。注意隨機(jī)抽樣(無主觀性)樣本含量(SAMPLESIZE)樣本中包含的研究單位數(shù)。例如某藥治療高血壓患者30名樣本含量(N)為30,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,4、參數(shù)(PARAMETER)和統(tǒng)計(jì)量(STATISTIC)(1)參數(shù)(PARAMETER)根據(jù)總體個體值統(tǒng)計(jì)計(jì)算出來的描述總體的特征量。一般用希臘字母表示(2)、統(tǒng)計(jì)量(STATISTIC)根據(jù)樣本個體值統(tǒng)計(jì)計(jì)算出來的描述樣本的特征量。一般用拉丁字母表示,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,總體參數(shù)一般是不知道的統(tǒng)計(jì)學(xué)抽樣研究的目的就是樣本統(tǒng)計(jì)量→總體參數(shù),二、統(tǒng)計(jì)學(xué)中的幾個基本概念,5、系統(tǒng)誤差(SYSTEMATICERROR)、非系統(tǒng)誤差(NONSYSTEMATICERROR)、抽樣誤差(SAMPLINGERROR)誤差(ERROR)是指實(shí)際觀察值與觀察真值之差、樣本指標(biāo)與總體指標(biāo)之差。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(1)、系統(tǒng)誤差(SYSTEMATICERROR)由于儀器未校正、測量者感官的某種障礙、醫(yī)生掌握療效標(biāo)準(zhǔn)偏高或偏低等原因,使觀察值不是分散在真值兩側(cè),而是有方向性、系統(tǒng)性或周期性地偏離真值。例如測量血糖,有斑氏法和葡萄糖氧化法,斑氏法的測量結(jié)果偏高←易受體內(nèi)還原性物質(zhì)的影響。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,這類誤差可以通過實(shí)驗(yàn)設(shè)計(jì)和技術(shù)措施來消除或使之減少。觀察性研究由于組間不可比性產(chǎn)生的系統(tǒng)誤差稱為偏倚(BIAS),如吸煙組的平均年齡大于吸煙組,兩組死亡率的差異包含年齡偏倚。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(2)、非系統(tǒng)誤差(NONSYSTEMATICERROR)由于研究者偶然失誤而造成的誤差。例如儀器失靈、抄錯數(shù)據(jù)、點(diǎn)錯小數(shù)點(diǎn)、寫錯單位等,亦稱過失誤差(GROSSERROR)這類誤差應(yīng)當(dāng)通過認(rèn)真檢查核對予以清除,否則將會影響研究結(jié)果的準(zhǔn)確性。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(3)、抽樣誤差(SAMPLINGERROR)由于抽樣所造成的樣本統(tǒng)計(jì)量與總體參數(shù)的差別。例如?1200CMN100N5萬→1186CM特點(diǎn)1不可避免性2有統(tǒng)計(jì)規(guī)律性,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,產(chǎn)生原因個體差異生物變異,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,6、頻率(RELATIVEFREQUENCY)、概率(PROBABILITY)、小概率事件.(1)、頻率(RELATIVEFREGUENCY)一次隨機(jī)試驗(yàn)有幾種可能結(jié)果,在重復(fù)進(jìn)行試驗(yàn)時,個別結(jié)果看來是偶然發(fā)生的,但當(dāng)重復(fù)試驗(yàn)次數(shù)相當(dāng)多時,將顯現(xiàn)某種規(guī)律性。例如,投擲一枚硬幣,結(jié)果不外乎出現(xiàn)“正面”與“反面”兩種,現(xiàn)在,我們看一擲幣模擬試驗(yàn),二、統(tǒng)計(jì)學(xué)中的幾個基本概念,實(shí)驗(yàn)者投擲次數(shù)出現(xiàn)“正面”次數(shù)頻率HUPINGCHENG1110000HUPINGCHENG2000000HUPINGCHENG3206667HUPINGCHENG4307500HUPINGCHENG5306000HUPINGCHENG6204000HUPINGCHENG7405714BUFFON4040204805069KPEARSON12000601905016KPEARSON240001201205005,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,可見,在相同條件下重復(fù)試驗(yàn),試驗(yàn)結(jié)果為“正面”或“反面”雖不能事先斷定,但我們知道試驗(yàn)的所有可能結(jié)果只有兩種。在重復(fù)多次后,出現(xiàn)“正面”或“反面”這個結(jié)果的比例稱之為頻率。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,.2、概率(PROBABILITY)概率是度量隨機(jī)事件發(fā)生可能性大小的一個數(shù)值。設(shè)在相同條件下,獨(dú)立地重復(fù)N次試驗(yàn),隨機(jī)事件A出現(xiàn)次,則稱為隨機(jī)事件A出現(xiàn)的頻率。當(dāng)N逐漸增大時,頻率趨向于一個常數(shù),則稱該常數(shù)為隨機(jī)事件A的概率,可記為P(A),簡記為。0≤P(A)≤1,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,0<P(A)<1隨機(jī)事件P(A)1必然事件P(A)0不可能事件。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,頻率是就樣本而言的,而概率從總體的意義上說的,M/N是概率P(A)的估計(jì)值。試驗(yàn)次數(shù)越多,估計(jì)越可靠。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,(3)小概率事件統(tǒng)計(jì)分析中的很多結(jié)論都基于一定置信程度下的概率推斷,習(xí)慣上將稱為小概率事件,我們認(rèn)為小概率事件在一次試驗(yàn)中不可能發(fā)生。,二、統(tǒng)計(jì)學(xué)中的幾個基本概念,湖南風(fēng)采中獎概率大約為1/671萬交通事故發(fā)生概率為1/20萬,三、統(tǒng)計(jì)資料的類型,變量與統(tǒng)計(jì)資料的分類方法1概述2數(shù)值變量NUMERICALVARIABLE和計(jì)量資料MEASUREMENTDATA3無序分類變量UNORDEREDCATEGORIESVARIABLE和計(jì)數(shù)資料ENUMERATIONDATA4有序分類變量ORDINALCATEGORIESVARIABLE和等級資料RANKEDDATA,三、統(tǒng)計(jì)資料的類型,1概述數(shù)值變量構(gòu)成計(jì)量資料分類變量無序分類變量構(gòu)成計(jì)數(shù)資料有序分類變量構(gòu)成等級資料,,,三、統(tǒng)計(jì)資料的類型,2數(shù)值變量與計(jì)量資料1數(shù)值變量NUMERICALVARIABLE變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如身高CM、體重KG、血壓PA、坐高/身高。2計(jì)量資料MEASUREMENTDATA由一群個體的數(shù)值變量值構(gòu)成的資料,即一群變量值。如長沙市99年7歲男孩身高值(1202CM,1186CM,1218CM,三、統(tǒng)計(jì)資料的類型,3無序分類變量與計(jì)數(shù)資料1無序分類變量UNORDEREDCATEGORIESVARIABLE變量值是定性的,有類別。特點(diǎn)類別是客觀存在的,各類無秩序,可任意排列;類與類之間界限清楚,(理論上不會錯判。如性別男、女。血型O、A、B、AB。2計(jì)數(shù)資料ENUMERATIONDATA一群個體按無序分類變量的類別清點(diǎn)每類有多少個個體,即分類個體數(shù)。如衛(wèi)生統(tǒng)計(jì)學(xué)教研室教師性別構(gòu)成男6,女7。某人群血型構(gòu)成O20A35B30AB10,三、統(tǒng)計(jì)資料的類型,4有序分類變量與等級資料1有序分類變量ORDINALCATEGORIESVARIABLE變量值是定性的、分等級。特點(diǎn)等級是主觀劃分的,各級沒有大小但有秩序,必須從低到高或由高到低;級和級之間界限模糊,可能錯判。如療效無效、好轉(zhuǎn)、顯效、治愈。血清反應(yīng)–、、、2等級資料RANKEDDATA一群個體按有序分類變量的級別清點(diǎn)每級有多少個個體,即分級個體數(shù)。如某地某人群EB病毒抗體反應(yīng)–65231,四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,1、設(shè)計(jì)(DESIGN)專業(yè)設(shè)計(jì)統(tǒng)計(jì)設(shè)計(jì)調(diào)查設(shè)計(jì)醫(yī)學(xué)科研設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì)臨床實(shí)驗(yàn)設(shè)計(jì),,,醫(yī)學(xué)科研設(shè)計(jì)的程序,科研選題選題又叫立題,確定所要研究的問題。選題是科研的起點(diǎn),也是關(guān)系到成敗的關(guān)鍵。(1)題意產(chǎn)生綜述背景材料來源個人經(jīng)驗(yàn)的積累;向有關(guān)專家請教;文獻(xiàn)檢索等,專業(yè)設(shè)計(jì),文獻(xiàn)檢索的要點(diǎn),1)有助于認(rèn)識本課題的重要性(2)了解有關(guān)的既往研究工作情況(3)了解有關(guān)研究現(xiàn)狀(4)尋找可借鑒的研究方法(5)注意有關(guān)的不同見解與爭論。如與商榷類文章,專業(yè)設(shè)計(jì),文獻(xiàn)檢索的幾種查法,(1)先查國內(nèi)文獻(xiàn),再查國外文獻(xiàn)(2)先查綜述性文章,后原始文章。(3)先近期后遠(yuǎn)期(4)先核心期刊后一般期刊。,專業(yè)設(shè)計(jì),綜述性文章是收集大量文獻(xiàn)資料經(jīng)過分析綜合,結(jié)合自己的工作和體會整理成的文章。它是對某一課題或新進(jìn)展作出的總結(jié),并指明發(fā)展方向,有較大的參考價值,是專題性文獻(xiàn)資料最集中的表現(xiàn)形式。,專業(yè)設(shè)計(jì),科研選題的原則,(1)創(chuàng)新性包括探索和創(chuàng)新兩個連續(xù)的過程,創(chuàng)新就是選擇前人沒有解決或沒有完全解決的問題。是本學(xué)科的空白點(diǎn),或者將會在理論上或應(yīng)用上有新的發(fā)展和補(bǔ)充。(2)科學(xué)性以科學(xué)理論為指導(dǎo),符合客觀規(guī)律。(3)先進(jìn)性先進(jìn)性是相對的,有國際先進(jìn)和國內(nèi)先進(jìn)。更重要的是結(jié)合實(shí)際條件選擇適合的先進(jìn)技術(shù)。(4)可行性研究課題的主要技術(shù)指標(biāo)實(shí)現(xiàn)的可能性。它包括人、財(cái)、物的支持和工作基礎(chǔ)。,專業(yè)設(shè)計(jì),選題方法,(1)從招標(biāo)范圍中選題。(2)從碰到的問題中選題(3)從文獻(xiàn)的空白點(diǎn)選題(4)從已有的課題延伸中選題(5)從改變研究內(nèi)容組合中選題(6)從其他學(xué)科移植中選題。,專業(yè)設(shè)計(jì),四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,統(tǒng)計(jì)設(shè)計(jì)的內(nèi)容要包括資料的收集、整理和分析全過和的設(shè)想和安排。例如研究目的和假說研究對象和研究單位研究因素(變量)收集哪些原始資料用什么方式和方法取得這些原始資料怎樣整理匯總和計(jì)算統(tǒng)計(jì)指標(biāo)如何控制誤差預(yù)期會得到什么結(jié)果需要多少經(jīng)費(fèi),統(tǒng),統(tǒng)計(jì)設(shè)計(jì),四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,在研究者對統(tǒng)計(jì)設(shè)計(jì)的構(gòu)思過程中,有以下幾個問題最為關(guān)鍵如何進(jìn)行抽樣如何安排設(shè)計(jì)所規(guī)定的干預(yù)措施或稱處理(TREATMENT)。要達(dá)到研究目的應(yīng)抽取多少個觀察單位如何在諸多的影響因素中,分離出研究同素對結(jié)果的效應(yīng),統(tǒng)計(jì)設(shè)計(jì),四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,(1)、對照的原則對照(CONTROL)原則,即在均衡條件下實(shí)現(xiàn)實(shí)驗(yàn)組與對照組間科學(xué)對比的原則,它回答如何從諸多影響因素中,分離出研究因素對實(shí)驗(yàn)結(jié)果的效應(yīng)問題。所謂均衡性,即可比性,是指在對比組中,除研究因素不同外,或施加的處理不同外,其他影響實(shí)驗(yàn)結(jié)果的非研究因素,包括實(shí)驗(yàn)過程中的實(shí)驗(yàn)條件和輔助措施,都應(yīng)相同。,統(tǒng)計(jì)設(shè)計(jì),無對照的研究夸大了門腔分流手術(shù)的作用表12關(guān)于門腔分流手術(shù)的51次研究結(jié)果對照方式門腔分流手術(shù)的價值小計(jì)非常支持支持不支持無對照247132非隨機(jī)對照103215隨機(jī)對照0134合計(jì)3411651,統(tǒng)計(jì)設(shè)計(jì),,統(tǒng)計(jì)學(xué)家STUDENT1930年2月至6月主持的牛奶營養(yǎng)試驗(yàn)的現(xiàn)場觀察研究對照組(1萬兒童)飲奶組(1萬兒童),,對照組飲奶組,年齡(歲),體重(磅),結(jié)論對照組體重>飲奶組,統(tǒng)計(jì)設(shè)計(jì),四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,(2)、重復(fù)(REPETITION)的原則重復(fù)(REPETITION)原則,即確定樣本含量的原則,它回答至少應(yīng)抽取多少個觀察單位的問題。,統(tǒng)計(jì)設(shè)計(jì),四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,(3)、隨機(jī)化(RANDOMIZATION)的原則1)、隨機(jī)抽樣(RANDOMIZEDSAMPLING)指總體中的每一個觀察單位都有同等機(jī)會進(jìn)入樣本;2)、隨機(jī)分配(RANDOMIZEDALLOCATION)指本次研究所選定的實(shí)驗(yàn)受試對象都有同等機(jī)會進(jìn)入根據(jù)研究目的而設(shè)定的處理組和對照組。,統(tǒng)計(jì)設(shè)計(jì),四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,2、收集資料(COLLECTIONOFDATA)(1)資料來源第一手資料1)經(jīng)常性統(tǒng)計(jì)報表(傳染病報表、職業(yè)病報表、醫(yī)院工作報表、死亡登記、疫情報告等),工作記錄(衛(wèi)生監(jiān)督記錄、健康檢查記錄、病歷等);2)一時性專題調(diào)查、實(shí)驗(yàn)或臨床試驗(yàn)。第二手資料已公布的資料,如數(shù)據(jù)銀行、全國、全省衛(wèi)生統(tǒng)計(jì)資料。,四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,(2)、資料要求1).完整觀察單位及觀察項(xiàng)目完整。2)準(zhǔn)確即真實(shí)、可靠。真實(shí)是統(tǒng)計(jì)學(xué)的靈魂。3).及時即時限性。如人口普查規(guī)定調(diào)查開始日期和截止日期。,四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,3、整理(SORTINGDATA)資料整理資料即原始數(shù)據(jù)的條理化、系統(tǒng)化的過程。,DATACOLLECTION,DATAANALYSIS,THEISSUESSHOULDBECONCERNEDINDATASCREENING,THEACCURACYOFTHEDATAMISSINGDATAOUTLIERSTHEFITBETWEENYOURDATAANDTHEASSUMPTIONSPERFECTORNEARPERFECTCORRELATIONSAMONGVARIABLES,四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,4、分析(ANALYSISOFDATA)資料任務(wù)計(jì)算有關(guān)指標(biāo),反映數(shù)據(jù)的綜合特征、闡明事物的內(nèi)在聯(lián)系和規(guī)律。工具1)FOXBASE數(shù)據(jù)庫2)SPSSFORWINDOWS1103)SAS,四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,統(tǒng)計(jì)描述統(tǒng)計(jì)分析統(tǒng)計(jì)推斷參數(shù)估計(jì)假設(shè)檢驗(yàn),,,五、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)應(yīng)注意的問題,1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)研究的是群體的數(shù)量特征↑適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)2、學(xué)會統(tǒng)計(jì)學(xué)的思維方法抽樣研究→抽樣誤差→結(jié)論具有概率性↑醫(yī)學(xué)專業(yè)知識解釋,五、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)應(yīng)注意的問題,3、正確選用統(tǒng)計(jì)學(xué)方法(1)資料類型不同→統(tǒng)計(jì)學(xué)方法不同(2)設(shè)計(jì)類型不同→統(tǒng)計(jì)學(xué)方法不同(3)研究目的不同→統(tǒng)計(jì)學(xué)方法不同,五、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)應(yīng)注意的問題,4、不管公式來源、推導(dǎo),只要求了解其意義、用途和應(yīng)用條件。舉例1)看電視,知道開、關(guān)就行。2)牛吃的是草,擠出來的是牛奶。↑↑數(shù)據(jù)結(jié)果,THANKYOU,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 67
大?。?1.52(MB)
子文件數(shù):
-
簡介:醫(yī)學(xué)統(tǒng)計(jì)學(xué),余小金XIAOJINYUSEUEDUCN東南大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室,內(nèi)容復(fù)習(xí),基本概念研究設(shè)計(jì)基礎(chǔ)統(tǒng)計(jì)描述,2,,,3,基本概念匯總,總體個體、個體變異,總體參數(shù)未知,樣本代表性、抽樣誤差,,隨機(jī)抽樣,樣本統(tǒng)計(jì)量已知,,,,統(tǒng)計(jì)推斷,風(fēng)險,研究設(shè)計(jì)基礎(chǔ),抽樣研究的科學(xué)性如何保障抽樣研究的合理性隨機(jī)原則RANDOMIZATION重復(fù)原則REPLICATION比較原則CONTRAST,4,,統(tǒng)計(jì)學(xué)分支,統(tǒng)計(jì)描述STATISTICALDESCRIPTION統(tǒng)計(jì)推斷STATISTICALINFERENCE,5,,統(tǒng)計(jì)描述,圖表方法指標(biāo)方法,6,,5常用概率分布,你想怎樣,中國成年男子的身高范圍中國成年男子的平均身高哪個范圍的可能性最大哪個范圍的可能性最小,8,,9,主要內(nèi)容CONTENTS,50隨機(jī)變量的概率分布51正態(tài)分布52二項(xiàng)分布53POISSON分布,,,10,隨機(jī)變量,假如一個變量的取值依賴于隨機(jī)現(xiàn)象的基本結(jié)果,則稱此變量為隨機(jī)變量,用大寫字母表示,其取值用小寫字母表示相對頻率說明了具有某個性質(zhì)的觀察對象的出現(xiàn)的可能性。隨機(jī)變量的類型離散型性別、血型、子女?dāng)?shù)、事故數(shù)、菌落數(shù)連續(xù)型身高、體重,,51正態(tài)分布,正態(tài)分布的特征標(biāo)準(zhǔn)正態(tài)分布正態(tài)分布曲線下面積的規(guī)律正態(tài)分布的應(yīng)用,11,,12,例密度函數(shù)和分布函數(shù),拋兩枚硬幣,,,,密度函數(shù),,,分布函數(shù),,13,例密度函數(shù)和分布函數(shù),,,,14,隨機(jī)變量的概率分布,概率函數(shù)(PROBABILITYFUNCTION,或者說概率密度函數(shù)(PROBABILITYDENSITYFUNCTION、密度函數(shù)。在統(tǒng)計(jì)學(xué)中,分布函數(shù)DISTRIBUTIONFUNCTION。說明變量取某些值的可能性。當(dāng)變量的取值包括了所有可能的取值時,分布函數(shù)為1。密度函數(shù)和分布函數(shù)構(gòu)成某種分布(DISTRIBUTION,,,15,正態(tài)分布的概念及圖形,,16,正態(tài)分布的概念及圖形,NORMALDISTRIBUTIONGAUSS發(fā)現(xiàn)最早用于物理學(xué)、天文學(xué)GAUSSIANDISTRIBUTION,,17,正態(tài)分布的概率密度函數(shù),如果隨機(jī)變量X的概率密度函數(shù)則稱X服從正態(tài)分布,記作X~N?,?2,其中,?為分布的均數(shù),?為分布的標(biāo)準(zhǔn)差。,,∞<X<∞,,18,正態(tài)分布圖示,,,X,,,,,,,,,,0,,1,,2,,3,,4,,,,,FX,,19,方差相等、均數(shù)不等的正態(tài)分布圖示,,,,20,均數(shù)相等、方差不等的正態(tài)分布圖示,,,,?,?1,,,21,正態(tài)分布的特征,單峰分布且峰在均數(shù)處;以均數(shù)為中心,均數(shù)兩側(cè)完全對稱。正態(tài)分布有兩個參數(shù)PARAMETER,即位置參數(shù)均數(shù)和變異度參數(shù)標(biāo)準(zhǔn)差。有些指標(biāo)服從正態(tài)分布有些指標(biāo)本身不服從正態(tài)分布,但經(jīng)過數(shù)值變換之后服從正態(tài)分布。正態(tài)曲線下的面積分布有一定的規(guī)律。,,,22,標(biāo)準(zhǔn)正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布STANDARDNORMALDISTRIBUTION是均數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布。記為N0,1。標(biāo)準(zhǔn)正態(tài)分布是一條曲線。概率密度函數(shù),,,,,∞<U<∞,,23,圖54一般正態(tài)分布變換成標(biāo)準(zhǔn)正態(tài)分布示意圖,,24,正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布,若X~N?,?2,作變換則Z服從標(biāo)準(zhǔn)正態(tài)分布。Z稱為標(biāo)準(zhǔn)正態(tài)離差STANDARDNORMALDEVIATION,,25,標(biāo)準(zhǔn)正態(tài)分布曲線下面積?Z,Z00000200400600830000130001300012000110001025000620005900055000520004920002280021700207001970018819002870027400262002500023916005480052600505004850046510015870153901492014460140105030850301502946028770281000500004920048400476104681,,0,Z,,26,,,正態(tài)曲線下的面積規(guī)律,X軸與正態(tài)曲線所夾面積恒等于1。對稱區(qū)域面積相等。,,,,,,,,S?,?X,S?X,?=S?,?X,?,,27,,,正態(tài)曲線下的面積規(guī)律,對稱區(qū)域面積相等。,,,,S?X1,?X2,,?X1?X2?X2?X1,S?X1,?X2S?X1,?X2,?,,28,,,,,,,,,正態(tài)曲線下的面積規(guī)律,432101234,?3??2???????2??3?,S?,?3?00013,S?,?2?00228,S?,?1?01587,S?,?05,S?,?3?09987,S?,?2?09772,S?,?1?08413,S?,?1,,29,正態(tài)曲線下的面積規(guī)律,432101234,?3??2???????2??3?,1S?3?,?3?00026,1S?2?,?2?00456,1S??,??03174,,30,,,,,,,,,正態(tài)曲線下的面積規(guī)律,432101234,?3??2???????2??3?,S?,?3?00013,S?,?2?00228,S?,?1?01587,S?,?05,S?,?3?09987,S?,?2?09772,S?,?1?08413,S?,?1,,31,正態(tài)曲線下的面積規(guī)律,正態(tài)分布的一個顯著特點(diǎn)曲線下面積完全決定于以標(biāo)準(zhǔn)差為單位從點(diǎn)X到Μ的離差。,,32,,,?,,?1,,,,,33,正態(tài)曲線下的面積規(guī)律,例51求標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間∞,196的面積,1先求區(qū)間∞,196的面積,查附表1,得標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間∞,196的面積是00250,2區(qū)間∞,196的面積為1196,∞的面積,即100250975,,34,例52求標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間∞,258的面積與區(qū)間258,∞的面積,∞,258的面積是00049,約為05%。區(qū)間258,∞的面積亦為05%,正態(tài)曲線下的面積規(guī)律,,35,例53求標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間1,1的面積,區(qū)間1,1的面積=12∞,1的面積=1201587=06826,正態(tài)曲線下的面積規(guī)律,,36,例54求正態(tài)分布N11941,4382曲線下區(qū)間11083,12799內(nèi)的面積,⑴先用求對應(yīng)的U值,UL1108311941/438196UU1279911941/438196,⑵查U界值表,得面積,196,196的面積=12標(biāo)準(zhǔn)正態(tài)分布曲線下區(qū)間∞,196的面積=120025=095,常用正態(tài)曲線下的面積規(guī)律,37,,,常用正態(tài)曲線下的面積規(guī)律,,,?196?,?196?,25,25,,,95,,38,,,常用正態(tài)曲線下的面積規(guī)律,,,39,,,常用正態(tài)曲線下的面積規(guī)律,?258?,?258?,05,05,,,99,,,,40,正態(tài)曲線下的面積規(guī)律,正態(tài)曲線下面積總和為1;正態(tài)曲線關(guān)于均數(shù)對稱;對稱的區(qū)域內(nèi)面積相等;對任意正態(tài)曲線,按標(biāo)準(zhǔn)差為單位,對應(yīng)的面積相等;?164?~?164?內(nèi)面積為90;?196?~?196?內(nèi)面積為95;?258?~?258?內(nèi)面積為99。,,,41,514正態(tài)分布的應(yīng)用,正態(tài)分布是許多統(tǒng)計(jì)方法的理論基礎(chǔ)估計(jì)頻數(shù)分布FREQUENCYDISTRIBUTION自學(xué)確定臨床參考值范圍REFERENCEINTERVAL自學(xué),,,42,作業(yè),閱讀內(nèi)容P5154查閱文獻(xiàn),介紹某項(xiàng)參考值范圍REFERENCEINTERVAL的制定過程最新進(jìn)展每人準(zhǔn)備510張PPT中英文均可,我會給你1020分鐘時間,,,52二項(xiàng)分布,二項(xiàng)生或死,這是個問題生男生女一個樣硬幣的正面和反面陰陽隔昏曉,43,,什么樣的結(jié)局用二項(xiàng)分布來描述,1對立的結(jié)果2觀察單位的結(jié)果獨(dú)立3發(fā)生某一結(jié)果的總體概率不變,44,,伯努利試驗(yàn)BERNOULLITRIAL是只有兩種可能結(jié)果的單次隨機(jī)試驗(yàn),即對于一個隨機(jī)變量X而言,PRX1P,PRX01P,52主要內(nèi)容,521二項(xiàng)分布的概率及定義522二項(xiàng)分布的性質(zhì)523二項(xiàng)分布的應(yīng)用條件,45,,521二項(xiàng)分布的概念,,,,,三只小白鼠存亡的排列和組合方式及其概率的計(jì)算,46,,二項(xiàng)分布的概率,設(shè)事件A出現(xiàn)的概率為?。則在N次獨(dú)立試驗(yàn)中,事件A恰好出現(xiàn)K次的概率為對應(yīng)于二項(xiàng)展開式,47,二項(xiàng)展開,02083023302208302082083,,,,,,,48,,累計(jì)概率,PX≤KPX0PX1PXKPX≥KPXKPXK1PXNPX≤K1-PX≥K1,49,,522二項(xiàng)分布的性質(zhì),如果XBN,P,則X的均數(shù)X的方差X的標(biāo)準(zhǔn)差,50,,二項(xiàng)分布的圖形,,X,,51,,二項(xiàng)分布的應(yīng)用條件,各觀察單位的觀察結(jié)果只能是相互對立的兩種結(jié)果之一;某事件出現(xiàn)的概率不變;N次試驗(yàn)條件相同,N個觀察對象同質(zhì),且相互之間不影響例如,無傳染性、聚集性等。,52,,二項(xiàng)分布的應(yīng)用,53,計(jì)算二項(xiàng)結(jié)局事件的概率質(zhì)量控制疾病的家族聚集性,二項(xiàng)分布與伯努利分布,伯努利分布(THEBERNOULLIDISTRIBUTION,又名兩點(diǎn)分布或者01分布,是一個離散型概率分布,為紀(jì)念瑞士科學(xué)家雅各布伯努利而命名。若伯努利試驗(yàn)成功,則伯努利隨機(jī)變量取值為1。若伯努利試驗(yàn)失敗,則伯努利隨機(jī)變量取值為0。記其成功概率為批P,失敗概率為1P。,54,53POISSON分布,LIFEISGOODFORONLYTWOTHINGSTOSTUDYMATHEMATICSANDTOTEACHIT,SIMéONDENISPOISSON17811840,55,何種結(jié)局需要POISSON分布,二項(xiàng)分布的極限分布不同地區(qū)的某慢性病比例數(shù)單位時間放射源釋放的原子數(shù)細(xì)菌培養(yǎng)中單位面積的菌落數(shù)單位時間你接到的電話或信息足球比賽的進(jìn)球數(shù),,56,53主要內(nèi)容,POISSON分布的定義POISSON分布的性質(zhì)POISSON分布的應(yīng)用,57,,1POISSON分布的概率,如果一個隨機(jī)變量X的取值為0,1,2,,且則稱X服從參數(shù)為?的POISSON分布。記為XPOISSON?。,58,,累計(jì)概率,PX≤KPX0PX1PXKPX≥KPXKPXK1PX≥K1-PXK,59,,POISSON分布例1,單位容積內(nèi)細(xì)菌數(shù)服從POISSON分布。?=249。,60,,POISSON分布的遞推公式,,,61,,單位容積內(nèi)細(xì)菌數(shù)的分布,62,,POISSON分布例2,2002年韓日世界杯64場比賽中,各隊(duì)進(jìn)球數(shù)有多有少。大部分是0,1,2個進(jìn)球,個別隊(duì)是5個以上進(jìn)球,最多的是8個進(jìn)球,平均是12578個/場/隊(duì)。雖然強(qiáng)隊(duì)大都能進(jìn)球、贏球如巴西隊(duì),弱隊(duì)大都不能進(jìn)球如中國隊(duì)。但宏觀上來說,各隊(duì)進(jìn)球數(shù)服從POISSON分布,63,,平均計(jì)數(shù)為12578的POISSON分布,每場各隊(duì)進(jìn)球數(shù)場次理論數(shù)03736391474577227287831312074237951095≥6102512812800,64,,21POISSON分布的均數(shù)和方差,如果XPOISSON?,則X的均數(shù)X的方差X的標(biāo)準(zhǔn)差,65,,POISSON分布的兩個實(shí)例的均數(shù)和標(biāo)準(zhǔn)差,例1資料的均數(shù)和方差均數(shù)=2490,方差2257例2資料的均數(shù)和方差均數(shù)=12578,方差12247,66,,22POISSON分布的圖形,,,67,,POISSON分布中均數(shù)的抽樣分布及其性質(zhì),在?足夠大時,POISSON分布的平均計(jì)數(shù)近似正態(tài)分布。平均計(jì)數(shù)的標(biāo)準(zhǔn)誤N1時1個單位,,68,,POISSON分布的可加性,如果X1服從POISSON?1,X2服從POISSON?2,則X1X2服從POISSON?1?2。即,POISSON分布具有可加性。,69,POISSON分布的應(yīng)用條件1,主要用于研究單位時間、單位空間內(nèi)某事件的發(fā)生數(shù),理論上X可為無窮大。平穩(wěn)性X與觀察單位的位置、狀態(tài)無關(guān);獨(dú)立性無傳染性、聚集性的事件。普遍性在充分小的觀察單位中,X最多只發(fā)生1次。,70,POISSON分布的應(yīng)用條件2,單位人群人數(shù)要求多。比如以500人,1000人或更多人作為單位人群,發(fā)病率越低,要求單位人群的人數(shù)越多。分析中特別注意觀察單位數(shù),71,,二項(xiàng)分布、POISSON分布、正態(tài)分布間的關(guān)系,N?較大時,二項(xiàng)分布BN,?中樣本率的分布近似正態(tài)分布;?較大時,POISSON分布中平均計(jì)數(shù)近似正態(tài)分布;XIBNI,?I,若CNI?I不變,則NI??時,二項(xiàng)分布近似POISSON分布,72,,73,總結(jié),正態(tài)分布是描述個體變異的重要分布之一,也是統(tǒng)計(jì)學(xué)理論中的重要分布之一;正態(tài)分布是由兩個參數(shù)決定均數(shù)和標(biāo)準(zhǔn)差;正態(tài)分布曲線下的面積是有規(guī)律的,且與標(biāo)準(zhǔn)正態(tài)分布曲線下的面積對應(yīng)以標(biāo)準(zhǔn)正態(tài)離差為單位。,總結(jié),二項(xiàng)分布是描述分類變量最常用的分布POISSON分布可以看作說觀察單位大,總體概率小時二項(xiàng)分布的極限分布一定條件下,二者均可近似正態(tài)分布,,74,75,THANKYOUFORYOURATTENTION,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 75
大?。?1.85(MB)
子文件數(shù):
-
簡介:統(tǒng)計(jì)學(xué),STATISTICS,高等學(xué)校應(yīng)用型特色規(guī)劃教材,清華大學(xué)出版社,第一節(jié)變異指標(biāo)的基本理論,第二節(jié)全距、分位差和平均差,第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),【學(xué)習(xí)目標(biāo)】通過本章的學(xué)習(xí)和習(xí)題演算,掌握變異指標(biāo)的意義和作用;標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù)的計(jì)算和應(yīng)用。了解變異指標(biāo)的分布特性;極差、平均差和四分位差的概念、計(jì)算公式和特點(diǎn);分布的偏度與峰度。,第四節(jié)偏度和峰度,第五節(jié)變異指標(biāo)的應(yīng)用,第六章變異指標(biāo),一、離中趨勢的涵義,第六章變異指標(biāo),第一節(jié)變異指標(biāo)的基本理論,變異指標(biāo)值越大,平均指標(biāo)的代表性越??;反之,平均指標(biāo)的代表性越大,二、變異指標(biāo)的作用,第六章變異指標(biāo),第一節(jié)變異指標(biāo)的基本理論,衡量和比較平均數(shù)代表性的大??;是進(jìn)行質(zhì)量控制的基礎(chǔ);是衡量風(fēng)險程度的尺度。,例如某車間有兩個生產(chǎn)小組,各有7名工人,各人日產(chǎn)量如下甲組20,40,60,70,80,100,120乙組67,68,69,70,71,72,73,第六章變異指標(biāo),第一節(jié)變異指標(biāo)的基本理論,第六章變異指標(biāo),第一節(jié)變異指標(biāo)的基本理論,【專欄6-1】,國家統(tǒng)計(jì)局日前發(fā)布的報告稱,與2005年的工資數(shù)據(jù)相比,2006年全國城鎮(zhèn)單位在崗職工的年平均工資增加了2596元,日平均工資增加了1036元。(中國證券報3月26日)溫家寶總理在十屆全國人大五次會議記者招待會上曾說“一個艦隊(duì)決定它速度快慢的不是那個航行最快的船只,而是那個最慢的船只?!蓖瑯?,決定全國城鎮(zhèn)單位在崗職工工資整體發(fā)展速度的是廣大低收入者的增長情況。,別把平均指標(biāo)看得過重,第六章變異指標(biāo),【專欄6-1】,目前,雖然過去15年中,中國居民工資性收入穩(wěn)步增長,但收入差距的擴(kuò)大,已成為工資分配中的突出問題。1月31日,國家發(fā)改委官方網(wǎng)站公布系列收入分配報告顯示,1990~2005年,城鄉(xiāng)居民的工資性收入在居民總收入中所占的比重從453逐步提高到632但也就在這一時期,平均貨幣工資收入最高最低行業(yè)之比由176∶1擴(kuò)大為488∶1。如果我們不注重行業(yè)間的收入差距過大問題,不采取措施彌補(bǔ)這種差距,而是任其擴(kuò)大,一味追求平均指標(biāo)的增長,那就無助于“整個社會的生活狀況”的改善,因?yàn)橐粋€艦隊(duì)的速度,取決于那個最慢的船只。,別把平均指標(biāo)看得過重,第六章變異指標(biāo),第六章變異指標(biāo),第一節(jié)變異指標(biāo)的基本理論,二、變異指標(biāo)的種類,,以標(biāo)志值之間相互比較說明變異情況,以平均數(shù)為比較標(biāo)準(zhǔn)來說明標(biāo)志的變異情況,以正態(tài)分布為標(biāo)準(zhǔn)說明分配數(shù)列偏離情況的指標(biāo),平均差,標(biāo)準(zhǔn)差,平均差系數(shù),標(biāo)準(zhǔn)差系數(shù),方差,峰度,偏度,全距,分位差,,,第二節(jié)全距、分位差和平均差,第六章變異指標(biāo),指所研究的數(shù)據(jù)中,最大值與最小值之差,又稱極差。,一、全距,第二節(jié)全距、分位差和平均差,第六章變異指標(biāo),一、全距,第二節(jié)全距、分位差和平均差,第六章變異指標(biāo),一、全距,【例B】某季度某工業(yè)公司18個工業(yè)企業(yè)產(chǎn)值計(jì)劃完成情況如下,第二節(jié)全距、分位差和平均差,第六章變異指標(biāo),一、全距,缺點(diǎn)①僅取決于兩個極端值的水平,不能反映其間的變量分布情況;②受個別極端值的影響過于顯著,不符合穩(wěn)健性和耐抗性的要求。,全距的特點(diǎn),優(yōu)點(diǎn)計(jì)算方法簡單、易懂;,第二節(jié)全距、分位差和平均差,第六章變異指標(biāo),二、分位差,從變量數(shù)列中,剔除了一部分極端值后計(jì)算的類似于極差的指標(biāo)。,四分位差,十六分位差,十分位差,八分位差,三十二分位差,百分位差,,上四分位數(shù),下四分位數(shù),第二節(jié)全距、分位差和平均差,第六章變異指標(biāo),三、平均差,⑴簡單平均差適用于未分組資料,是各個數(shù)據(jù)與其算術(shù)平均數(shù)的離差絕對值的算術(shù)平均數(shù),用表示。,計(jì)算公式,第二節(jié)全距、分位差和平均差,第六章變異指標(biāo),三、平均差,【例A】某售貨小組5個人,某天的銷售額分別為440元、480元、520元、600元、750元,求該售貨小組銷售額的平均差。,解,即該售貨小組5個人銷售額的平均差為936元。,第二節(jié)全距、分位差和平均差,第六章變異指標(biāo),三、平均差,⑵加權(quán)平均差適用于分組資料,第二節(jié)全距、分位差和平均差,第六章變異指標(biāo),三、平均差,【例B】計(jì)算下表中某公司職工月工資的平均差。,第二節(jié)全距、分位差和平均差,第六章變異指標(biāo),三、平均差,解,即該公司職工月工資的平均差為13895元。,第二節(jié)全距、分位差和平均差,第六章變異指標(biāo),三、平均差,優(yōu)點(diǎn)不易受極端數(shù)值的影響,能綜合反映全部單位標(biāo)志值的實(shí)際差異程度;缺點(diǎn)用絕對值的形式消除各標(biāo)志值與算術(shù)平均數(shù)離差的正負(fù)值問題,不便于作數(shù)學(xué)處理和參與統(tǒng)計(jì)分析運(yùn)算。,平均差的特點(diǎn),第二節(jié)全距、分位差和平均差,第六章變異指標(biāo),三、平均差,平均差系數(shù),第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),⑴簡單標(biāo)準(zhǔn)差適用于未分組資料,是各個數(shù)據(jù)與其算術(shù)平均數(shù)的離差平方的算術(shù)平均數(shù)的開平方根,用來表示;標(biāo)準(zhǔn)差的平方又叫作方差,用來表示。,標(biāo)準(zhǔn)差,計(jì)算公式,第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),【例A】某售貨小組5個人,某天的銷售額分別為440元、480元、520元、600元、750元,求該售貨小組銷售額的標(biāo)準(zhǔn)差。,解,第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),標(biāo)準(zhǔn)差,⑵加權(quán)標(biāo)準(zhǔn)差適用于分組資料,第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),【例B】計(jì)算下表中某公司職工月工資的標(biāo)準(zhǔn)差。,第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),解,(比較其工資的平均差為13895元),即該公司職工月工資的標(biāo)準(zhǔn)差為1679元。,第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),由同一資料計(jì)算的標(biāo)準(zhǔn)差的結(jié)果一般要略大于平均差。證明當(dāng)A,B,C≥0時,有,標(biāo)準(zhǔn)差的特點(diǎn),不易受極端數(shù)值的影響,能綜合反映全部單位標(biāo)志值的實(shí)際差異程度;用平方的方法消除各標(biāo)志值與算術(shù)平均數(shù)離差的正負(fù)值問題,可方便地用于數(shù)學(xué)處理和統(tǒng)計(jì)分析運(yùn)算,第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),標(biāo)準(zhǔn)差的簡捷計(jì)算,第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),標(biāo)準(zhǔn)差系數(shù),第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),,,,可比,,,,第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),身高的差異水平CM,體重的差異水平KG,可比,第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),【例】某年級一、二兩班某門課的平均成績分別為82分和76分,其成績的標(biāo)準(zhǔn)差分別為156分和148分,比較兩班平均成績代表性的大小。,解,二班成績的標(biāo)準(zhǔn)差系數(shù)為,因?yàn)?,所以一班平均成績的代表性比二班大?第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),是非標(biāo)志總體,為研究是非標(biāo)志總體的數(shù)量特征,令,第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),是非標(biāo)志總體的指標(biāo),具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的成數(shù),不具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的成數(shù),第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),是非標(biāo)志總體的指標(biāo),均值,標(biāo)準(zhǔn)差,第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),是非標(biāo)志總體的指標(biāo),方差,標(biāo)準(zhǔn)差系數(shù),第三節(jié)標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),第六章變異指標(biāo),是非標(biāo)志總體的指標(biāo),【例】某廠某月份生產(chǎn)了400件產(chǎn)品,其中合格品380件,不合格品20件。求產(chǎn)品質(zhì)量分布的集中趨勢與離中趨勢。,解,,常用的幾種標(biāo)志變異指標(biāo),概念計(jì)算特點(diǎn),數(shù)列中最大值與最小值之差,1.極差(R),R最大值最小值,優(yōu)點(diǎn)容易理解,計(jì)算方便缺點(diǎn)不能反映全部數(shù)據(jù)分布狀況,2.平均差(AD),各標(biāo)志值與均值離差絕對值的算術(shù)平均,,,,簡單,加權(quán),優(yōu)點(diǎn)反映全部數(shù)據(jù)分布狀況缺點(diǎn)取絕對值,數(shù)字上不盡合理,,,,,第六章變異指標(biāo),概念計(jì)算特點(diǎn),各標(biāo)志值與均值離差平方的平均。方差的平方根(取正根),3.方差(Σ2)和標(biāo)準(zhǔn)差Σ,優(yōu)點(diǎn)反映全部數(shù)據(jù)分布狀況,數(shù)字上合理。缺點(diǎn)受計(jì)量單位和平均水平影響,不便于比較,4.標(biāo)準(zhǔn)差系數(shù)(VΣ),標(biāo)準(zhǔn)差與均值之商,是無量綱的系數(shù),,,,簡單,加權(quán),優(yōu)點(diǎn)適宜不同數(shù)據(jù)集的比較缺點(diǎn)對數(shù)據(jù)結(jié)構(gòu)變化反應(yīng)不靈敏,,,,,第六章變異指標(biāo),,分布的矩,1矩的基本形式,,,第I個變量,,,常數(shù),,,權(quán)數(shù),,,第六章變異指標(biāo),第六章變異指標(biāo),第四節(jié)偏度與峰度,,,原點(diǎn)矩,中心矩,,,未分組資料,分組資料,未分組資料,分組資料,第六章變異指標(biāo),,,,,,,,,,,,對稱分布,正偏態(tài)分布(右),負(fù)偏態(tài)分布左),1平均數(shù)與眾數(shù)比較法,第六章變異指標(biāo),2矩法,M3三階中心矩,定義M∑XAK/N為變量X關(guān)于A的K階矩。,當(dāng)A0,即以原點(diǎn)為中心,上式稱為““K階原點(diǎn)矩”。,K1,2,3時,有,一階原點(diǎn)矩Μ1∑X01/N∑X/N二階原點(diǎn)矩Μ2∑X02/N∑X2/N三階原點(diǎn)矩Μ3∑X03/N∑X3/N,第六章變異指標(biāo),2矩法,當(dāng)A,即以為中心,上式稱為“K階中心矩”。,K1,2,3時,有,一階中心矩二階中心矩三階中心矩,第六章變異指標(biāo),K1,2,3時,有,一階中心矩二階中心矩三階中心矩,,,,所以,Ν3可以測定偏度。為消除量綱,轉(zhuǎn)變?yōu)橄禂?shù),再除以Σ3。,,0正偏態(tài),0,第六章變異指標(biāo),測定分布的偏度,,,,,,,,,,,,對稱分布,正偏態(tài)分布(右),負(fù)偏態(tài)分布左),3分位數(shù)法,,不同分布情形下諸四分位數(shù)之間的關(guān)系,,,,,第六章變異指標(biāo),3分位數(shù)法,,由上頁圖可知,當(dāng)公布為對稱時,中位數(shù)與上、下四分位數(shù)的距離相等地;當(dāng)分布為正偏時,中位數(shù)與上四分位數(shù)的距離大于它與下四分位數(shù)的距離;當(dāng)分布為負(fù)偏時,中位數(shù)與上四分位數(shù)的距離小于它與下四分位數(shù)的距離,因此,中位數(shù)與上、下四分位數(shù)的距離之差可以反映偏斜方向。,第六章變異指標(biāo),測定分布的偏度,3分位數(shù)法,,>0分布為正偏,<0分布為負(fù)偏,0分布為對稱,第六章變異指標(biāo),1矩法,,,測定分布的峰度,,>0分布為高峰度的,<0分布為低峰度的,0分布為正態(tài)峰度的,第六章變異指標(biāo),第六章變異指標(biāo),2分位數(shù)法,,,觀察表明,此式計(jì)算的結(jié)果數(shù)值越小,分布圖形越陡峭;反之,數(shù)值越大,分布圖形越平坦。且在理論上可證明,對于正態(tài)分布,這樣計(jì)算的結(jié)果總是0526,故可定義相應(yīng)的峰度指標(biāo)為,第五節(jié)變異指標(biāo)的應(yīng)用,,,,,,,,2總方差與組方差相結(jié)合,3偏度、峰度與公差相結(jié)合,1平均指標(biāo)與變異指標(biāo)相結(jié)合,第六章變異指標(biāo),本章小結(jié),(1)平均指標(biāo)描述的是總體的集中趨勢,而標(biāo)志變異指標(biāo)描述的是總體的離中趨勢。它們從兩方面來反映總體的分布特征。其作用首先是衡量平均指標(biāo)代表性大小的一種尺度,其次還可以反映社會經(jīng)濟(jì)活動過程的均衡性與協(xié)調(diào)性。(2)全距、四分位差、平均差與標(biāo)準(zhǔn)差在反映標(biāo)志變異程度方面各有優(yōu)缺點(diǎn)。方差和標(biāo)準(zhǔn)差是應(yīng)用最廣的標(biāo)志變異指標(biāo)。標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)差系數(shù)是反映標(biāo)志差異程度的主要指標(biāo)。它比前面介紹的其它指標(biāo)都科學(xué)。標(biāo)準(zhǔn)差就是標(biāo)志值與其算術(shù)平均數(shù)離差的平方的算術(shù)平均數(shù)的平方根。,第六章變異指標(biāo),本章小結(jié),(3)為了對比和分析不同平均水平總體的標(biāo)志差異程度,就需要使用標(biāo)準(zhǔn)差系數(shù)。標(biāo)準(zhǔn)差系數(shù)是標(biāo)準(zhǔn)差與其算術(shù)平均數(shù)之比,它既消除了變量數(shù)列水平的影響,是反映標(biāo)志差異程度方面目前最科學(xué)的統(tǒng)計(jì)指標(biāo)之一。(4)要掌握是非標(biāo)志的平均數(shù)與標(biāo)準(zhǔn)差的計(jì)算。是非標(biāo)志的最大值是025。,第六章變異指標(biāo),復(fù)習(xí)思考題,1如何理解標(biāo)志變異指標(biāo)是衡量平均數(shù)代表性大小的尺度2全距、平均差和標(biāo)準(zhǔn)差各有什么特點(diǎn)3為什么說標(biāo)準(zhǔn)差是各種標(biāo)志變異指標(biāo)中最常用的指標(biāo)4什么是標(biāo)準(zhǔn)差系數(shù),計(jì)算標(biāo)準(zhǔn)差系數(shù)有何意義5標(biāo)志變異指標(biāo)與平均數(shù)有何關(guān)系6在何種情況下,只需計(jì)算標(biāo)準(zhǔn)差而不必計(jì)算標(biāo)志變異系數(shù),就可以比較出不同資料的平均數(shù)代表性的大小,為什么7某售貨小組5人某天的銷售額分別為440元、480元、520元、600元、750元。試計(jì)算全距。,,第六章變異指標(biāo),復(fù)習(xí)思考題,,第六章變異指標(biāo),8已知某售貨小組5個人,某天的銷售額分別為440元、480元、520元、600元、750元,求該售貨小組銷售額的平均差。9某車間有兩個小組,每組都是6個工人,各人日產(chǎn)量件數(shù)如下第一組20,40,60,80,100,120第二組67,68,69,71,72,73試計(jì)算其平均差。,復(fù)習(xí)思考題,,第六章變異指標(biāo),10某校統(tǒng)計(jì)學(xué)專業(yè)統(tǒng)計(jì)學(xué)成績?nèi)缦卤恚?jì)算其平均差。,復(fù)習(xí)思考題,,第六章變異指標(biāo),11某售貨小組5個人,某天的銷售額分別為440元、480元、520元、600元、750元,求該售貨小組銷售額的標(biāo)準(zhǔn)差。計(jì)算下表中某公司職工月工資的標(biāo)準(zhǔn)差。,復(fù)習(xí)思考題,,第六章變異指標(biāo),12甲、乙兩單位人數(shù)及月工資資料如下,根據(jù)上表資料(1)比較甲乙兩單位哪個單位工資水平高;(2)說明哪個單位工資更具有代表性。,復(fù)習(xí)思考題,,第六章變異指標(biāo),13根據(jù)平均數(shù)和標(biāo)準(zhǔn)差的關(guān)系。,,則標(biāo)準(zhǔn)差為多少,,則標(biāo)準(zhǔn)差系數(shù)為多少,,則平均數(shù)為多少,,則平均數(shù)為多少,1設(shè),2設(shè),3設(shè),4設(shè),
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 59
大?。?1.63(MB)
子文件數(shù):
-
簡介:第5章概率與概率分布,第5章概率與概率分布,51事件及其概率52離散型概率分布53連續(xù)型概率分布,學(xué)習(xí)目標(biāo),定義試驗(yàn)、事件、樣本空間、概率描述和使用概率的運(yùn)算法則定義和解釋隨機(jī)變量及其分布計(jì)算離散型隨機(jī)變量的概率和概率分布計(jì)算連續(xù)型隨機(jī)變量的概率用EXCEL計(jì)算分布的概率,51事件及其概率,511試驗(yàn)、事件和樣本空間512事件的概率513概率的性質(zhì)和運(yùn)算法則514條件概率與事件的獨(dú)立性515全概公式與逆概公式,試驗(yàn)、事件和樣本空間,試驗(yàn)EXPERIMENT,對試驗(yàn)對象進(jìn)行一次觀察或測量的過程擲一顆骰子,觀察其出現(xiàn)的點(diǎn)數(shù)從一副52張撲克牌中抽取一張,并觀察其結(jié)果紙牌的數(shù)字或花色試驗(yàn)的特點(diǎn)可以在相同的條件下重復(fù)進(jìn)行每次試驗(yàn)的可能結(jié)果可能不止一個,但試驗(yàn)的所有可能結(jié)果在試驗(yàn)之前是確切知道的在試驗(yàn)結(jié)束之前,不能確定該次試驗(yàn)的確切結(jié)果,事件EVENT,事件試驗(yàn)的每一個可能結(jié)果任何樣本點(diǎn)集合擲一顆骰子出現(xiàn)的點(diǎn)數(shù)為3用大寫字母A,B,C,表示隨機(jī)事件RANDOMEVENT每次試驗(yàn)可能出現(xiàn)也可能不出現(xiàn)的事件擲一顆骰子可能出現(xiàn)的點(diǎn)數(shù),事件EVENT,簡單事件SIMPLEEVENT不能被分解成其他事件組合的基本事件拋一枚均勻硬幣,“出現(xiàn)正面”和“出現(xiàn)反面”必然事件CERTAINEVENT每次試驗(yàn)一定出現(xiàn)的事件,用?表示擲一顆骰子出現(xiàn)的點(diǎn)數(shù)小于7不可能事件IMPOSSIBLEEVENT每次試驗(yàn)一定不出現(xiàn)的事件,用?表示擲一顆骰子出現(xiàn)的點(diǎn)數(shù)大于6,樣本空間與樣本點(diǎn),樣本空間SAMPLESPACE一個試驗(yàn)中所有結(jié)果的集合,用?表示例如在擲一顆骰子的試驗(yàn)中,樣本空間表示為??{1,2,3,4,5,6}在投擲硬幣的試驗(yàn)中,??{正面,反面}樣本點(diǎn)SAMPLEPOINT樣本空間中每一個特定的試驗(yàn)結(jié)果用符號?表示,事件的概率,事件的概率PROBABILITY,事件A的概率是一個介于0和1之間的一個值,用以度量試驗(yàn)完成時事件A發(fā)生的可能性大小,記為PA當(dāng)試驗(yàn)的次數(shù)很多時,概率PA可以由所觀察到的事件A發(fā)生次數(shù)頻數(shù)的比例來逼近在相同條件下,重復(fù)進(jìn)行N次試驗(yàn),事件A發(fā)生了M次,則事件A發(fā)生的概率可以寫為,事件的概率,?例如,投擲一枚硬幣,出現(xiàn)正面和反面的頻率,隨著投擲次數(shù)N的增大,出現(xiàn)正面和反面的頻率穩(wěn)定在1/2左右,概率的性質(zhì)和運(yùn)算法則,互斥事件及其概率MUTUALLYEXCLUSIVEEVENTS,?在試驗(yàn)中,兩個事件有一個發(fā)生時,另一個就不能發(fā)生,則稱事件A與事件B是互斥事件,沒有公共樣本點(diǎn),互斥事件的文氏圖VENNDIAGRAM,互斥事件及其概率例題分析,【例】在一所城市中隨機(jī)抽取600個家庭,用以確定擁有個人電腦的家庭所占的比例。定義如下事件A600個家庭中恰好有265個家庭擁有電腦B恰好有100個家庭擁有電腦C特定戶張三家擁有電腦說明下列各對事件是否為互斥事件,并說明你的理由1A與B2A與C3B與C,互斥事件及其概率例題分析,解1事件A與B是互斥事件。因?yàn)槟阌^察到恰好有265個家庭擁有電腦,就不可能恰好有100個家庭擁有電腦2事件A與C不是互斥事件。因?yàn)閺埲苍S正是這265個家庭之一,因而事件與有可能同時發(fā)生3事件B與C不是互斥事件。理由同2,互斥事件及其概率例題分析,,【例】同時拋擲兩枚硬幣,并考察其結(jié)果。恰好有一枚正面朝上的概率是多少,解用H表示正面,T表示反面,下標(biāo)1和2表示硬幣1和硬幣2。該項(xiàng)試驗(yàn)會有4個互斥事件之一發(fā)生1兩枚硬幣都正面朝上,記為H1H221號硬幣正面朝上而2號硬幣反面朝上,記為H1T231號硬幣反面朝上而2號硬幣正面朝上,記為T1H24兩枚硬幣都是反面朝上,記為T1T2,互斥事件及其概率例題分析,解由于每一枚硬幣出現(xiàn)正面或出現(xiàn)反面的概率都是1/2,當(dāng)拋擲的次數(shù)逐漸增大時,上面的4個簡單事件中每一事件發(fā)生的相對頻數(shù)概率將近似等于1/4。因?yàn)閮H當(dāng)H1T2或T1H2發(fā)生時,才會恰好有一枚硬幣朝上的事件發(fā)生,而事件H1T2或T1H2又為互斥事件,兩個事件中一個事件發(fā)生或者另一個事件發(fā)生的概率便是1/21/41/4。因此,拋擲兩枚硬幣,恰好有一枚出現(xiàn)正面的概率等于H1T2或T1H2發(fā)生的概率,也就是兩種事件中每個事件發(fā)生的概率之和,互斥事件的加法規(guī)則ADDITIONLAW,?加法規(guī)則若兩個事件A與B互斥,則事件A發(fā)生或事件B發(fā)生的概率等于這兩個事件各自的概率之和,即PA∪BPAPB事件A1,A2,,AN兩兩互斥,則有PA1∪A2∪∪ANPA1PA2PAN,互斥事件的加法規(guī)則例題分析,解擲一顆骰子出現(xiàn)的點(diǎn)數(shù)1,2,3,4,5,6共有6個互斥事件,而且每個事件出現(xiàn)的概率都為1/6根據(jù)互斥事件的加法規(guī)則,得,【例】拋擲一顆骰子,并考察其結(jié)果。求出其點(diǎn)數(shù)為1點(diǎn)或2點(diǎn)或3點(diǎn)或4點(diǎn)或5點(diǎn)或6點(diǎn)的概率,概率的性質(zhì)小結(jié),非負(fù)性對任意事件A,有P?1規(guī)范性一個事件的概率是一個介于0與1之間的值,即對于任意事件A,有0?P?1必然事件的概率為1;不可能事件的概率為0。即P?1;P?0可加性若A與B互斥,則PA∪BPAPB推廣到多個兩兩互斥事件A1,A2,,AN,有PA1∪A2∪∪ANPA1PA2PAN,事件的補(bǔ)及其概率,?事件的補(bǔ)COMPLEMENT事件A不發(fā)生的事件,稱為補(bǔ)事件A的補(bǔ)事件或稱逆事件,記為?A。它是樣本空間中所有不屬于事件A的樣本點(diǎn)的集合,,A,?,?A,P?A1PA,廣義加法公式,?廣義加法公式對任意兩個隨機(jī)事件A和B,它們和的概率為兩個事件分別概率的和減去兩個事件交的概率,即PA∪BPAPBPA∩B,兩個事件的并,兩個事件的交,,,廣義加法公式事件的并或和,?事件A或事件B發(fā)生的事件,稱為事件A與事件B的并。它是由屬于事件A或事件B的所有樣本點(diǎn)的集合,記為A∪B或AB,廣義加法公式事件的交或積,?事件A與事件B同時發(fā)生的事件,稱為事件A與事件B的交,它是由屬于事件A也屬于事件B的所有公共樣本點(diǎn)所組成的集合,記為B∩A或AB,廣義加法公式例題分析,解設(shè)A員工離職是因?yàn)閷べY不滿意B員工離職是因?yàn)閷ぷ鞑粷M意依題意有PA040;PB030;PAB015PAúBPAPBPAB040030015055,【例】一家計(jì)算機(jī)軟件開發(fā)公司的人事部門最近做了一項(xiàng)調(diào)查,發(fā)現(xiàn)在最近兩年內(nèi)離職的公司員工中有40是因?yàn)閷べY不滿意,有30是因?yàn)閷ぷ鞑粷M意,有15是因?yàn)樗麄儗べY和工作都不滿意。求兩年內(nèi)離職的員工中,離職原因是因?yàn)閷べY不滿意、或者對工作不滿意、或者二者皆有的概率,條件概率與事件的獨(dú)立性,條件概率CONDITIONALPROBABILITY,?在事件B已經(jīng)發(fā)生的條件下事件A發(fā)生的概率,稱為已知事件B時事件A的條件概率,記為PA|B,條件概率例題分析,解設(shè)A顧客購買食品,B顧客購買其他商品依題意有PA080;PB060;PAB035,【例】一家超市所作的一項(xiàng)調(diào)查表明,有80的顧客到超市是來購買食品,60的人是來購買其他商品,35的人既購買食品也購買其他商品。求1已知某顧客購買食品的條件下,也購買其他商品的概率2已知某顧客購買其他的條件下,也購買食品的概率,條件概率例題分析,【例】一家電腦公司從兩個供應(yīng)商處購買了同一種計(jì)算機(jī)配件,質(zhì)量狀況如下表所示從這200個配件中任取一個進(jìn)行檢查,求1取出的一個為正品的概率2取出的一個為供應(yīng)商甲的配件的概率3取出一個為供應(yīng)商乙的正品的概率4已知取出一個為供應(yīng)商甲的配件,它是正品的概率,,條件概率例題分析,解設(shè)A取出的一個為正品B取出的一個為供應(yīng)商甲供應(yīng)的配件1234,乘法公式MULTIPLICATIVELAW,用來計(jì)算兩事件交的概率以條件概率的定義為基礎(chǔ)設(shè)A,B為兩個事件,若PB0,則PABPBPA|B或PABPAPB|A,乘法公式例題分析,【例】一家報紙的發(fā)行部已知在某社區(qū)有75的住戶訂閱了該報紙的日報,而且還知道某個訂閱日報的住戶訂閱其晚報的概率為50。求某住戶既訂閱日報又訂閱晚報的概率,解設(shè)A某住戶訂閱了日報B某個訂閱了日報的住戶訂閱了晚報依題意有PA075;PB|A050PABPAPB|A075050375,獨(dú)立事件與乘法公式例題分析,【例】從一個裝有3個紅球2個白球的盒子里摸球摸出后球不放回,求連續(xù)兩次摸中紅球的概率,解設(shè)A第2次摸到紅球B第1次摸到紅球依題意有PB3/5;PA|B2/4PABPAPB|A3/52/403,獨(dú)立事件與乘法公式INDEPENDENTEVENTS,若PA|BPA或PB|APB,則稱事件A與B事件獨(dú)立,或稱獨(dú)立事件若兩個事件相互獨(dú)立,則這兩個事件同時發(fā)生的概率等于它們各自發(fā)生的概率之積,即PABPAPB若事件A1,A2,?,AN相互獨(dú)立,則PA1,A2,?,ANPA1PA2?PAN,獨(dú)立事件與乘法公式例題分析,【例】一個旅游經(jīng)景點(diǎn)的管理員根據(jù)以往的經(jīng)驗(yàn)得知,有80的游客在古建筑前照相留念。求接下來的兩個游客都照相留念的概率,解設(shè)A第一個游客照相留念B第二個游客照相留念兩個游客都照相留念是兩個事件的交。在沒有其他信息的情況下,我們可以假定事件A和事件B是相互立的,所以有PABPAPB080080064,獨(dú)立事件與乘法公式例題分析,【例】假定我們是從兩個同樣裝有3個紅球2個白球的盒子摸球。每個盒子里摸1個。求連續(xù)兩次摸中紅球的概率,解設(shè)A從第一個盒子里摸到紅球B從第二個盒子里摸到紅球依題意有PA3/5;PB|A3/5PABPAPB|A3/53/5036,全概公式與逆概公式,全概公式,?全概公式,完備事件組,全概公式例題分析,【例】假設(shè)在N張彩票中只有一張中獎獎券,那么第二個人摸到獎券的概率是多少,解設(shè)A第二個人摸到獎券,B第一個人摸到獎券依題意有PB1/N;P?BN1/NPA|B0PA|?B1/N1,逆概公式,?逆概公式貝葉斯公式,PBI被稱為事件BI的先驗(yàn)概率PRIORPROBABILITYPBI|A被稱為事件BI的后驗(yàn)概率POSTERIORPROBABILITY,逆概公式例題分析,【例】某考生回答一道四選一的考題,假設(shè)他知道正確答案的概率為1/2,而他不知道正確答案時猜對的概率應(yīng)該為1/4。考試結(jié)束后發(fā)現(xiàn)他答對了,那么他知道正確答案的概率是多大呢,解設(shè)A該考生答對了,B該考生知道正確答案依題意有PB1/2;P?B11/21/2PA|?B1/4PA|B1,52離散型概率分布,521隨機(jī)變量522離散型隨機(jī)變量的概率分布523離散型隨機(jī)變量的數(shù)學(xué)期望和方差524幾種常用的離散型概率分布,隨機(jī)變量,隨機(jī)變量RANDOMVARIABLES,,一次試驗(yàn)的結(jié)果的數(shù)值性描述一般用X,Y,Z來表示例如投擲兩枚硬幣出現(xiàn)正面的數(shù)量根據(jù)取值情況的不同分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量,離散型隨機(jī)變量DISCRETERANDOMVARIABLES,,隨機(jī)變量X取有限個值或所有取值都可以逐個列舉出來X1,X2,以確定的概率取這些不同的值離散型隨機(jī)變量的一些例子,連續(xù)型隨機(jī)變量CONTINUOUSRANDOMVARIABLES,,可以取一個或多個區(qū)間中任何值所有可能取值不可以逐個列舉出來,而是取數(shù)軸上某一區(qū)間內(nèi)的任意點(diǎn)連續(xù)型隨機(jī)變量的一些例子,離散型隨機(jī)變量的概率分布,離散型隨機(jī)變量的概率分布,,列出離散型隨機(jī)變量X的所有可能取值列出隨機(jī)變量取這些值的概率通常用下面的表格來表示,PXXIPI稱為離散型隨機(jī)變量的概率函數(shù)PI?0;,離散型隨機(jī)變量的概率分布例題分析,【例】投擲一顆骰子后出現(xiàn)的點(diǎn)數(shù)是一個離散型隨機(jī)變量。寫出擲一枚骰子出現(xiàn)點(diǎn)數(shù)的概率分布,概率分布,離散型隨機(jī)變量的概率分布例題分析,【例】一部電梯在一周內(nèi)發(fā)生故障的次數(shù)X及相應(yīng)的概率如下表,一部電梯一周發(fā)生故障的次數(shù)及概率分布,1確定?的值2求正好發(fā)生兩次故障的概率3求故障次數(shù)多于一次的概率4最多發(fā)生一次故障的概率,離散型隨機(jī)變量的概率分布例題分析,解1由于010025035?1所以,?0302PX20353PX?20100250350704PX?1035030065,離散型隨機(jī)變量的數(shù)學(xué)期望和方差,離散型隨機(jī)變量的數(shù)學(xué)期望EXPECTEDVALUE,,離散型隨機(jī)變量X的所有可能取值XI與其取相對應(yīng)的概率PI乘積之和描述離散型隨機(jī)變量取值的集中程度記為?或EX計(jì)算公式為,離散型隨機(jī)變量的方差VARIANCE,,隨機(jī)變量X的每一個取值與期望值的離差平方和的數(shù)學(xué)期望,記為?2或DX描述離散型隨機(jī)變量取值的分散程度計(jì)算公式為方差的平方根稱為標(biāo)準(zhǔn)差,記為?或?DX,,離散型數(shù)學(xué)期望和方差例題分析,【例】一家電腦配件供應(yīng)商聲稱,他所提供的配件100個中擁有次品的個數(shù)及概率如下表,每100個配件中的次品數(shù)及概率分布,求該供應(yīng)商次品數(shù)的數(shù)學(xué)期望和標(biāo)準(zhǔn)差,幾種常用的離散型概率分布,常用離散型概率分布,兩點(diǎn)分布,,一個離散型隨機(jī)變量X只取0和1兩個可能的值它們的概率分布為或也稱01分布,兩點(diǎn)分布例題分析,【例】已知一批產(chǎn)品的次品率為P=004,合格率為Q1P1004096。并指定廢品用1表示,合格品用0表示。則任取一件為廢品或合格品這一離散型隨機(jī)變量,其概率分布為,二項(xiàng)試驗(yàn)伯努利試驗(yàn),,二項(xiàng)分布與伯努利試驗(yàn)有關(guān)貝努里試驗(yàn)滿足下列條件一次試驗(yàn)只有兩個可能結(jié)果,即“成功”和“失敗”“成功”是指我們感興趣的某種特征一次試驗(yàn)“成功”的概率為P,失敗的概率為Q1P,且概率P對每次試驗(yàn)都是相同的試驗(yàn)是相互獨(dú)立的,并可以重復(fù)進(jìn)行N次在N次試驗(yàn)中,“成功”的次數(shù)對應(yīng)一個離散型隨機(jī)變量X,二項(xiàng)分布BINOMIALDISTRIBUTION,,重復(fù)進(jìn)行N次試驗(yàn),出現(xiàn)“成功”的次數(shù)的概率分布稱為二項(xiàng)分布,記為XBN,P設(shè)X為N次重復(fù)試驗(yàn)中出現(xiàn)成功的次數(shù),X取X的概率為,二項(xiàng)分布,,對于PXX?0,X1,2,,N,有同樣有當(dāng)N1時,二項(xiàng)分布化簡為,二項(xiàng)分布數(shù)學(xué)期望和方差,,數(shù)學(xué)期望?EXNP方差?2DXNPQ,二項(xiàng)分布例題分析,【例】已知一批產(chǎn)品的次品率為4,從中任意有放回地抽取5個。求5個產(chǎn)品中1沒有次品的概率是多少2恰好有1個次品的概率是多少3有3個以下次品的概率是多少,二項(xiàng)分布用EXCEL計(jì)算概率,第1步進(jìn)入EXCEL表格界面,將鼠標(biāo)停留在某一空白單元格第2步在EXCEL表格界面中,直接點(diǎn)擊“FX”粘貼函數(shù)命令第3步在復(fù)選框“函數(shù)分類”中點(diǎn)擊“統(tǒng)計(jì)”選項(xiàng),在“函數(shù)名”中點(diǎn)擊“BINOMDIST”選項(xiàng),然后確定第4步在NUMBER_S后填入試驗(yàn)成功次數(shù)本例為1在TRIALS后填入總試驗(yàn)次數(shù)本例為5在PROBABILITY_S后填入試驗(yàn)的成功概率本例為004在CUMULATIVE后填入0或FALSE,表示計(jì)算成功次數(shù)恰好等于指定數(shù)值的概率填入1或TRUE表示計(jì)算成功次數(shù)小于或等于指定數(shù)值的累積概率值,?用EXCEL計(jì)算概率,泊松分布POISSONDISTRIBUTION,,1837年法國數(shù)學(xué)家泊松DPOISSON,17811840首次提出用于描述在一指定時間范圍內(nèi)或在一定的長度、面積、體積之內(nèi)每一事件出現(xiàn)次數(shù)的分布泊松分布的例子一定時間段內(nèi),某航空公司接到的訂票電話數(shù)一定時間內(nèi),到車站等候公共汽車的人數(shù)一定路段內(nèi),路面出現(xiàn)大損壞的次數(shù)一定時間段內(nèi),放射性物質(zhì)放射的粒子數(shù)一匹布上發(fā)現(xiàn)的疵點(diǎn)個數(shù)一定頁數(shù)的書刊上出現(xiàn)的錯別字個數(shù),泊松分布概率分布函數(shù),,?給定的時間間隔、長度、面積、體積內(nèi)“成功”的平均數(shù)E271828X給定的時間間隔、長度、面積、體積內(nèi)“成功”的次數(shù),泊松分布數(shù)學(xué)期望和方差,,數(shù)學(xué)期望EX?方差DX?,泊松分布例題分析,【例】假定某航空公司預(yù)訂票處平均每小時接到42次訂票電話,那么10分鐘內(nèi)恰好接到6次電話的概率是多少,解設(shè)X10分鐘內(nèi)航空公司預(yù)訂票處接到的電話次數(shù),泊松分布用EXCEL計(jì)算概率,第1步進(jìn)入EXCEL表格界面,將鼠標(biāo)停留在某一空白單元格第2步在EXCEL表格界面中,直接點(diǎn)擊“FX”粘貼函數(shù)命令第3步在復(fù)選框“函數(shù)分類”中點(diǎn)擊“統(tǒng)計(jì)”選項(xiàng),并在“函數(shù)名”中點(diǎn)擊“POISSON”選項(xiàng),然后確定第4步在X后填入事件出現(xiàn)的次數(shù)本例為6在MEANS后填入泊松分布的均值?本例為7在CUMULATIVE后填入0或FALSE,表示計(jì)算成功次數(shù)恰好等于指定數(shù)值的概率填入1或TRUE表示計(jì)算成功次數(shù)小于或等于指定數(shù)值的累積概率值,?用EXCEL計(jì)算概率,泊松分布作為二項(xiàng)分布的近似,,當(dāng)試驗(yàn)的次數(shù)N很大,成功的概率P很小時,可用泊松分布來近似地計(jì)算二項(xiàng)分布的概率,即,實(shí)際應(yīng)用中,當(dāng)P?005,N20,NP?5時,近似效果良好,超幾何分布HYPERGEOMETRICDISTRIBUTION,,采用不重復(fù)抽樣,各次試驗(yàn)并不獨(dú)立,成功的概率也互不相等總體元素的數(shù)目N很小,或樣本容量N相對于N來說較大時,樣本中“成功”的次數(shù)則服從超幾何概率分布概率分布函數(shù)為,超幾何分布例題分析,【例】假定有10支股票,其中有3支購買后可以獲利,另外7支購買后將會虧損。如果你打算從10支股票中選擇4支購買,但你并不知道哪3支是獲利的,哪7支是虧損的。求1有3支能獲利的股票都被你選中的概率有多大23支可獲利的股票中有2支被你選中的概率有多大,解設(shè)N10,M3,N4,超幾何分布用EXCEL計(jì)算概率,第1步進(jìn)入EXCEL表格界面,將鼠標(biāo)停留在某一空白單元格第2步在EXCEL表格界面中,直接點(diǎn)擊“FX”粘貼函數(shù)命令第3步在復(fù)選框“函數(shù)分類”中點(diǎn)擊“統(tǒng)計(jì)”選項(xiàng),并在“函數(shù)名”中點(diǎn)擊“HYPGEOMDIST”選項(xiàng),然后確定第4步在SAMPLE_S后填入樣本中成功的次數(shù)X本例為3在NUMBER_SAMPLE后填入樣本容量N本例為4在POPULATION_S后填入總體中成功的次數(shù)M本例為3在NUMBER_POP后填入總體中的個體總數(shù)N本例為10,?用EXCEL計(jì)算概率,53連續(xù)型概率分布,531概率密度函數(shù)532正態(tài)分布533其他連續(xù)型概率分布,常用連續(xù)型概率分布,概率密度函數(shù),連續(xù)型隨機(jī)變量的概率分布,,連續(xù)型隨機(jī)變量可以取某一區(qū)間或整個實(shí)數(shù)軸上的任意一個值它取任何一個特定的值的概率都等于0不能列出每一個值及其相應(yīng)的概率通常研究它取某一區(qū)間值的概率用概率密度函數(shù)的形式和分布函數(shù)的形式來描述,概率密度函數(shù)PROBABILITYDENSITYFUNCTION,,設(shè)X為一連續(xù)型隨機(jī)變量,X為任意實(shí)數(shù),X的概率密度函數(shù)記為FX,它滿足條件,FX不是概率,概率密度函數(shù),?密度函數(shù)FX表示X的所有取值X及其頻數(shù)FX,概率密度函數(shù),,?在平面直角坐標(biāo)系中畫出FX的圖形,則對于任何實(shí)數(shù)X15,N1P100?102805,均勻分布,均勻分布UNIFORMDISTRIBUTION,若隨機(jī)變量X的概率密度函數(shù)為稱X在A,B上服從均勻分布,記為XUA,B數(shù)學(xué)期望和方差,均勻分布概率計(jì)算,隨機(jī)變量X在某取值范圍A,B的任一子區(qū)間C,D上取值的概率為同樣有,均勻分布例題分析,【例】某公共汽車站從早上6時起每隔15分鐘開出一趟班車,假定某乘客在6點(diǎn)以后到達(dá)車站的時刻是隨機(jī)的,所以有理由認(rèn)為他等候乘車的時間長度X服從參數(shù)為A0,B15的均勻分布。試求該乘客等候乘車的時間長度少于5分鐘的概率,解概率密度函數(shù)為落入?yún)^(qū)間0,15的任一子區(qū)間0,D的概率是,等候乘車的時間長度少于5分鐘即有D5,因此該事件發(fā)生的概率等于5/151/3,指數(shù)分布,指數(shù)分布EXPONENTIALDISTRIBUTION,若隨機(jī)變量X的概率密度函數(shù)為稱X服從參數(shù)為?的指數(shù)分布,記為XE?數(shù)學(xué)期望和方差,指數(shù)分布概率計(jì)算,隨機(jī)變量X取小于或等于某一特定值X的概率為隨機(jī)變量X落入任一區(qū)間A,B的概率為,指數(shù)分布例題分析,【例】假定某加油站在一輛汽車到達(dá)之后等待下一輛汽車到達(dá)所需要的時間單位分鐘服從參數(shù)為1/5的指數(shù)分布,如果現(xiàn)在正好有一輛汽車剛剛到站加油,試分別求以下幾個事件發(fā)生的概率1一輛汽車到站前需要等待5分鐘以上2一輛汽車到站前需要等待510分鐘,解,指數(shù)分布用EXCEL計(jì)算概率,第1步進(jìn)入EXCEL表格界面,將鼠標(biāo)停留在某一空白單元格第2步在EXCEL表格界面中,直接點(diǎn)擊“FX”粘貼函數(shù)命令第3步在復(fù)選框“函數(shù)分類”中點(diǎn)擊“統(tǒng)計(jì)”選項(xiàng),并在“函數(shù)名”中點(diǎn)擊“EXPONDIST”選項(xiàng),然后確定第4步在X后填入指數(shù)分布函數(shù)計(jì)算的區(qū)間點(diǎn)本例為5在LAMBDA后填入?yún)?shù)?本例為02在CUMULATIVE后填入1(或TRUE)表示計(jì)算事件出現(xiàn)次數(shù)小于或等于指定數(shù)值的累積概率值填入0或FALSE則表示計(jì)算事件出現(xiàn)次數(shù)大于指定數(shù)值的累積概率值,?用EXCEL計(jì)算概率,本章小結(jié),事件及其概率離散型概率分布兩點(diǎn)分布二項(xiàng)分布泊松分布連續(xù)型概率分布正態(tài)分布均勻分布指數(shù)分布用EXCEL計(jì)算分布的概率,結(jié)束,THANKS,
下載積分: 6 賞幣
上傳時間:2024-01-05
頁數(shù): 115
大?。?3.36(MB)
子文件數(shù):
-
簡介:第12章多元線性回歸,第12章多元線性回歸,121多元線性回歸模型122回歸方程的擬合優(yōu)度123顯著性檢驗(yàn)124多重共線性125利用回歸方程進(jìn)行估計(jì)和預(yù)測126虛擬自變量的回歸,學(xué)習(xí)目標(biāo),1回歸模型、回歸方程、估計(jì)的回歸方程2回歸方程的擬合優(yōu)度回歸方程的顯著性檢驗(yàn)多重共線性問題及其處理利用回歸方程進(jìn)行估計(jì)和預(yù)測虛擬自變量的回歸問題用EXCEL進(jìn)行回歸分析,121多元線性回歸模型,多元回歸模型與回歸方程估計(jì)的多元回歸方程參數(shù)的最小二乘估計(jì),多元回歸模型與回歸方程,多元回歸模型MULTIPLEREGRESSIONMODEL,一個因變量與兩個及兩個以上自變量的回歸描述因變量Y如何依賴于自變量X1,X2,,XP和誤差項(xiàng)?的方程,稱為多元回歸模型涉及P個自變量的多元回歸模型可表示為,B0,B1,B2,?,BP是參數(shù)?是被稱為誤差項(xiàng)的隨機(jī)變量Y是X1,,X2,?,XP的線性函數(shù)加上誤差項(xiàng)??包含在Y里面但不能被P個自變量的線性關(guān)系所解釋的變異性,多元回歸模型基本假定,誤差項(xiàng)Ε是一個期望值為0的隨機(jī)變量,即E?0對于自變量X1,X2,,XP的所有值,?的方差?2都相同誤差項(xiàng)Ε是一個服從正態(tài)分布的隨機(jī)變量,即ΕN0,?2,且相互獨(dú)立,多元回歸方程MULTIPLEREGRESSIONEQUATION,描述因變量Y的平均值或期望值如何依賴于自變量X1,X2,,XP的方程多元線性回歸方程的形式為EY?0?1X1?2X2?PXP,B1,B2,?,BP稱為偏回歸系數(shù)BI表示假定其他變量不變,當(dāng)XI每變動一個單位時,Y的平均平均變動值,二元回歸方程的直觀解釋,,估計(jì)的多元回歸方程,估計(jì)的多元回歸的方程ESTIMATEDMULTIPLEREGRESSIONEQUATION,是估計(jì)值是Y的估計(jì)值,用樣本統(tǒng)計(jì)量估計(jì)回歸方程中的參數(shù)時得到的方程由最小二乘法求得一般形式為,參數(shù)的最小二乘估計(jì),參數(shù)的最小二乘法,求解各回歸參數(shù)的標(biāo)準(zhǔn)方程如下,使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得。即,參數(shù)的最小二乘法例題分析,【例】一家大型商業(yè)銀行在多個地區(qū)設(shè)有分行,為弄清楚不良貸款形成的原因,抽取了該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)。試建立不良貸款Y與貸款余額X1、累計(jì)應(yīng)收貸款X2、貸款項(xiàng)目個數(shù)X3和固定資產(chǎn)投資額X4的線性回歸方程,并解釋各回歸系數(shù)的含義用EXCEL進(jìn)行回歸,,122回歸方程的擬合優(yōu)度,多重判定系數(shù)估計(jì)標(biāo)準(zhǔn)誤差,多重判定系數(shù),多重判定系數(shù)MULTIPLECOEFFICIENTOFDETERMINATION,回歸平方和占總平方和的比例計(jì)算公式為因變量取值的變差中,能被估計(jì)的多元回歸方程所解釋的比例,修正多重判定系數(shù)ADJUSTEDMULTIPLECOEFFICIENTOFDETERMINATION,用樣本容量N和自變量的個數(shù)P去修正R2得到計(jì)算公式為避免增加自變量而高估R2意義與R2類似數(shù)值小于R2,EXCEL輸出結(jié)果的分析,,估計(jì)標(biāo)準(zhǔn)誤差SY,對誤差項(xiàng)?的標(biāo)準(zhǔn)差?的一個估計(jì)值衡量多元回歸方的程擬合優(yōu)度計(jì)算公式為,EXCEL輸出結(jié)果的分析,,123顯著性檢驗(yàn),線性關(guān)系檢驗(yàn)回歸系數(shù)檢驗(yàn)和推斷,線性關(guān)系檢驗(yàn),線性關(guān)系檢驗(yàn),檢驗(yàn)因變量與所有自變量之間的是否顯著也被稱為總體的顯著性檢驗(yàn)檢驗(yàn)方法是將回歸離差平方和SSR同剩余離差平方和SSE加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著如果是顯著的,因變量與自變量之間存在線性關(guān)系如果不顯著,因變量與自變量之間不存在線性關(guān)系,線性關(guān)系檢驗(yàn),提出假設(shè)H0?1??2????P0線性關(guān)系不顯著H1?1,?2,?,?P至少有一個不等于0,2計(jì)算檢驗(yàn)統(tǒng)計(jì)量F,3確定顯著性水平?和分子自由度P、分母自由度NP1找出臨界值F?4作出決策若FF?,拒絕H0,EXCEL輸出結(jié)果的分析,,回歸系數(shù)檢驗(yàn)和推斷,回歸系數(shù)的檢驗(yàn),線性關(guān)系檢驗(yàn)通過后,對各個回歸系數(shù)有選擇地進(jìn)行一次或多次檢驗(yàn)究竟要對哪幾個回歸系數(shù)進(jìn)行檢驗(yàn),通常需要在建立模型之前作出決定對回歸系數(shù)檢驗(yàn)的個數(shù)進(jìn)行限制,以避免犯過多的第一類錯誤棄真錯誤對每一個自變量都要單獨(dú)進(jìn)行檢驗(yàn)應(yīng)用T檢驗(yàn)統(tǒng)計(jì)量,回歸系數(shù)的檢驗(yàn)步驟,提出假設(shè)H0BI0自變量XI與因變量Y沒有線性關(guān)系H1BI?0自變量XI與因變量Y有線性關(guān)系計(jì)算檢驗(yàn)的統(tǒng)計(jì)量T,確定顯著性水平?,并進(jìn)行決策?T?T???,拒絕H0;?T?T???25220687,所以均拒絕原假設(shè),說明這4個自變量兩兩之間都有顯著的相關(guān)關(guān)系由表EXCEL輸出的結(jié)果可知,回歸模型的線性關(guān)系顯著SIGNIFICANCEF=103539E06?005。這也暗示了模型中存在多重共線性固定資產(chǎn)投資額的回歸系數(shù)為負(fù)號0029193,與預(yù)期的不一致,多重共線性問題的處理,多重共線性問題的處理,將一個或多個相關(guān)的自變量從模型中剔除,使保留的自變量盡可能不相關(guān)如果要在模型中保留所有的自變量,則應(yīng)避免根據(jù)T統(tǒng)計(jì)量對單個參數(shù)進(jìn)行檢驗(yàn)對因變量值的推斷估計(jì)或預(yù)測的限定在自變量樣本值的范圍內(nèi),EXCEL輸出結(jié)果的分析,,125利用回歸方程進(jìn)行估計(jì)和預(yù)測,,軟件應(yīng)用,置信區(qū)間估計(jì)例題分析,STATISTICA輸出的不良貸款的置信區(qū)間,預(yù)測區(qū)間估計(jì)例題分析,STATISTICA輸出的不良貸款的預(yù)測區(qū)間,126虛擬自變量的回歸,含有一個虛擬自變量的回歸用虛擬自變量回歸解決方差分析問題,含有一個虛擬自變量的回歸,虛擬自變量DUMMYVARIABLE,用數(shù)字代碼表示的定性自變量虛擬自變量可有不同的水平只有兩個水平的虛擬自變量比如,性別男,女有兩個以上水平的虛擬自變量貸款企業(yè)的類型家電,醫(yī)藥,其他虛擬變量的取值為0,1,虛擬自變量的回歸,回歸模型中使用虛擬自變量時,稱為虛擬自變量的回歸當(dāng)虛擬自變量只有兩個水平時,可在回歸中引入一個虛擬變量比如,性別男,女一般而言,如果定性自變量有K個水平,需要在回歸中模型中引進(jìn)K1個虛擬變量,虛擬自變量的回歸例題分析,【例】為研究考試成績與性別之間的關(guān)系,從某大學(xué)商學(xué)院隨機(jī)抽取男女學(xué)生各8名,得到他們的市場營銷學(xué)課程的考試成績?nèi)缦卤?虛擬自變量的回歸例題分析,散點(diǎn)圖,Y與X的回歸,,虛擬自變量的回歸例題分析,引進(jìn)虛擬變量時,回歸方程可寫EY?0?1X男X0EY?0男學(xué)生考試成績的期望值女X0EY?0?1?1女學(xué)生考試成績的期望值注意當(dāng)指定虛擬變量01時?0總是代表與虛擬變量值0所對應(yīng)的那個分類變量水平的平均值?1總是代表與虛擬變量值1所對應(yīng)的那個分類變量水平的平均響應(yīng)與虛擬變量值0所對應(yīng)的那個分類變量水平的平均值的差值,即平均值的差值?0?1?0?1,虛擬自變量的回歸例題分析,【例】為研究工資水平與工作年限和性別之間的關(guān)系,在某行業(yè)中隨機(jī)抽取10名職工,所得數(shù)據(jù)如下表,Y與X1的回歸及分析,Y與X1、X2的回歸及分析,,,虛擬自變量的回歸例題分析,引進(jìn)虛擬變量時,回歸方程可寫EY?0?1X1?2X2女X20EY|女性?0?1X1男X21EY|男性?0?2?1X1?0的含義表示女性職工的期望月工資收入?0?2的含義表示男性職工的期望月工資收入?1含義表示工作年限每增加1年,男性或女性工資的平均增加值?2含義表示男性職工的期望月工資收入與女性職工的期望月工資收入之間的差值?0?2?0?2,用虛擬自變量回歸解決方差分析問題,方差分析的回歸方法例題分析,引進(jìn)虛擬變量建立回歸方程EY?0?1X1?2X2?3X3用EXCEL進(jìn)行回歸?0家電制造業(yè)投訴次數(shù)的平均值?0?1零售業(yè)投訴次數(shù)的平均值?0?2旅游業(yè)投訴次數(shù)的平均值?0?3航空公司投訴次數(shù)的平均值,,本章小結(jié),多元回歸模型、回歸方程、估計(jì)方程回歸方程的擬合優(yōu)度顯著性檢驗(yàn)多重共線性利用回歸方程進(jìn)行估計(jì)和預(yù)測虛擬自變量的回歸方差分析的回歸方法,結(jié)束,
下載積分: 6 賞幣
上傳時間:2024-01-06
頁數(shù): 53
大?。?1.58(MB)
子文件數(shù):
-
簡介:第二章統(tǒng)計(jì)數(shù)據(jù)的采集,學(xué)習(xí)目的,本章主要掌握了解統(tǒng)計(jì)數(shù)據(jù)的來源。統(tǒng)計(jì)調(diào)查的意義和種類各種統(tǒng)計(jì)數(shù)據(jù)采集的方法。能夠聯(lián)系實(shí)際,制定合理的調(diào)查方案,并設(shè)計(jì)調(diào)查問卷,并能夠?qū)嶋H操作。了解統(tǒng)計(jì)相關(guān)軟件EXCEL、SPSS的應(yīng)用。重點(diǎn)調(diào)查方案的設(shè)計(jì)。調(diào)查問卷的設(shè)計(jì)。,,第二章統(tǒng)計(jì)數(shù)據(jù)的采集,第一節(jié)統(tǒng)計(jì)數(shù)據(jù)的來源第二節(jié)統(tǒng)計(jì)調(diào)查方案與問卷設(shè)計(jì)第三節(jié)統(tǒng)計(jì)數(shù)據(jù)的采集方法第四節(jié)課程實(shí)驗(yàn),,,,,,,,,,,,,,,,,,,,,,,,第一節(jié)統(tǒng)計(jì)數(shù)據(jù)的來源,,一、統(tǒng)計(jì)數(shù)據(jù)直接來源統(tǒng)計(jì)數(shù)據(jù)的直接來源是指通過專門組織的調(diào)查和科學(xué)實(shí)驗(yàn)搜集數(shù)據(jù)??茖W(xué)實(shí)驗(yàn)是取得自然科學(xué)數(shù)據(jù)的主要手段,如醫(yī)學(xué)、生物學(xué)等的數(shù)據(jù)都是通過實(shí)驗(yàn)和觀察取得的。,,,,,,,,,數(shù)據(jù)來源,數(shù)據(jù)來源,,第一手資料,,實(shí)驗(yàn)法,,,,,,,調(diào)查,,觀察,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,出版物,,,,,,,,,,,,,第二手資料,(一)統(tǒng)計(jì)調(diào)查的意義和要求統(tǒng)計(jì)調(diào)查是指根據(jù)統(tǒng)計(jì)研究的目的和要求,利用各種統(tǒng)計(jì)調(diào)查的方式方法,搜集統(tǒng)計(jì)資料的工作過程。統(tǒng)計(jì)調(diào)查作為統(tǒng)計(jì)工作的第二個階段,在統(tǒng)計(jì)工作的整個過程中,擔(dān)負(fù)著提供基礎(chǔ)資料的任務(wù),對統(tǒng)計(jì)資料的搜集,要求做到準(zhǔn)確、及時和完整。,(二)統(tǒng)計(jì)調(diào)查的種類社會經(jīng)濟(jì)現(xiàn)象錯綜復(fù)雜,根據(jù)不同的調(diào)查目的,需要采取不同的統(tǒng)計(jì)調(diào)查方式方法。統(tǒng)計(jì)調(diào)查的常見分類有,是否包括全部調(diào)查單位,調(diào)查資料登記時間是否具有連續(xù)性,,,全面調(diào)查對調(diào)查對象中的全部單位一一加以調(diào)查。,非全面調(diào)查對調(diào)查對象中的部分單位進(jìn)行調(diào)查。,經(jīng)常性調(diào)查隨著調(diào)查對象的變化而進(jìn)行的經(jīng)常地、連續(xù)不斷地登記調(diào)查。,一次性調(diào)查是間隔一段時間對調(diào)查對象進(jìn)行的登記調(diào)查。,資料搜集的方法不同,調(diào)查的組織方式不同,統(tǒng)計(jì)報表按一定的表式和要求,自上而下統(tǒng)一布置,自下而上上報統(tǒng)計(jì)資料的一種統(tǒng)計(jì)調(diào)查方式方法,專門調(diào)查是為了研究某些專門問題,由進(jìn)行調(diào)查的單位專門組織的調(diào)查,直接觀察法采訪法報告法問卷法,,,統(tǒng)計(jì)報表分類,調(diào)查范圍不同,報送周期長短不同,報送方式不同,填報單位和程序的不同,,全面的統(tǒng)計(jì)報表非全面的統(tǒng)計(jì)報表。,日報旬報月報半年報年報,郵寄報表電訊報表,基層報表綜合報表。,,,,,電話電報傳真,,二、統(tǒng)計(jì)數(shù)據(jù)的間接來源統(tǒng)計(jì)數(shù)據(jù)的間接來源是指對次級資料的搜集,即第二手資料的搜集。一般是搜集公開出版或公開報道的數(shù)據(jù)。,(一)統(tǒng)計(jì)目的統(tǒng)計(jì)調(diào)查中,首先要明確調(diào)查目的,既通過調(diào)查要解決什么問題。(二)調(diào)查對象、調(diào)查個體單位和報告單位調(diào)查對象又稱調(diào)查總體,是我們所要研究事物的整體。調(diào)查個體單位就是調(diào)查對象范圍內(nèi)的各個個體單位。報告單位又稱填報單位,它是負(fù)責(zé)填報調(diào)查資料的單位。,一、統(tǒng)計(jì)調(diào)查方案的設(shè)計(jì),第二節(jié)統(tǒng)計(jì)調(diào)查方案與問卷設(shè)計(jì),,(三)調(diào)查項(xiàng)目和調(diào)查表1調(diào)查項(xiàng)目調(diào)查項(xiàng)目就是進(jìn)行調(diào)查時向調(diào)查單位需要調(diào)查的問題。一般來說有多少個問題,便有多少個調(diào)查項(xiàng)目。,調(diào)查項(xiàng)目應(yīng)該注意的事項(xiàng)(1)調(diào)查項(xiàng)目應(yīng)當(dāng)是調(diào)查目的所必需的,可有可無的項(xiàng)目不應(yīng)列入。(2)調(diào)查項(xiàng)目應(yīng)有確切的答案,還要明確答案形式,諸如文字式、數(shù)字式等。(3)調(diào)查項(xiàng)目提法應(yīng)設(shè)法避免出現(xiàn)歧義或減少被調(diào)查者的抵觸情緒或思想顧慮。(4)調(diào)查項(xiàng)目的提法不能帶有傾向性。(5)調(diào)查項(xiàng)目之間應(yīng)盡可能做到互相聯(lián)系,便于核對答案的準(zhǔn)確性。,2調(diào)查表,,調(diào)查表類型,單一表在一張表格上只登記一個調(diào)查單位的資料,可以容納較多的調(diào)查項(xiàng)目。,一覽表在一張表上登記若干個調(diào)查單位的資料,調(diào)查的項(xiàng)目不能過多。,調(diào)查表制定以后,為了保證調(diào)查資料的科學(xué)性和統(tǒng)一性,需要編寫填表說明和指標(biāo)解釋。,(四)調(diào)查時間和調(diào)查地點(diǎn)調(diào)查時間包括調(diào)查資料所屬的時間和調(diào)查期限。1調(diào)查資料所屬的時間。時期資料指事物在某一時期內(nèi)發(fā)展過程的總量。例如,總產(chǎn)值、總產(chǎn)量時點(diǎn)資料是指事物在某一時點(diǎn)上的水平。例如,工人數(shù)、商品庫存量、耕地面積等2調(diào)查期限。調(diào)查期限是指調(diào)查工作的起止時間。包括搜集資料和報送資料的整個工作所需的時間。調(diào)查地點(diǎn)是指登記調(diào)查資料的地點(diǎn)。在一般情況下,調(diào)查地點(diǎn)和調(diào)查單位所在地點(diǎn)是一致的。,(五)調(diào)查方式根據(jù)調(diào)查目的的不同,采取不同的調(diào)查方式。具體采用哪種調(diào)查方式,主要考慮人員、時間和經(jīng)費(fèi)等條件。一般來說,能夠通過非全面調(diào)查解決的問題,不要進(jìn)行全面調(diào)查。(六)制定調(diào)查的組織實(shí)施計(jì)劃一、建立調(diào)查隊(duì)伍;二、調(diào)查人員的組織和培訓(xùn);三、經(jīng)費(fèi)的預(yù)算和開支辦法;四、試點(diǎn)調(diào)查。,二、調(diào)查問卷設(shè)計(jì)(一)調(diào)查問卷的組織結(jié)構(gòu)調(diào)查問卷一種特殊形式的調(diào)查表。特點(diǎn)在表中用一系列按照嚴(yán)密邏輯結(jié)構(gòu)組成的問題,向被調(diào)查者調(diào)查具體事實(shí)和個人對某問題的反應(yīng)、看法,它不要求被調(diào)查者填寫姓名。組成部分眉頭部分、說明詞/開場白、篩選/過濾部分、主體部分、背景質(zhì)料部分和結(jié)束語,1眉頭部分問卷的最開端。一般由問卷名稱、問卷編號、調(diào)查組織名稱、城市編號、訪問員、問卷復(fù)核人等信息組成。2說明詞說明詞也就是開場白。包括問候語、調(diào)查主題、調(diào)查組織、調(diào)查員身份、調(diào)查用途、調(diào)查請求以及其他信息,如承諾調(diào)查的保密性。3篩選/過濾部分這部分主要是為了選擇符合要求的調(diào)查個體單位而設(shè)。,4主體部分主體部分是調(diào)查問卷的核心,它通常由主題問句和備選答案兩部分構(gòu)成。常見的問句形式和要求具體如下開放式問句即提出問題,由被調(diào)查者自由回答,不受限制,在問卷中不宜多用。對選式問句這類問句要求被調(diào)查者在兩個可能的答案中選擇一個。多項(xiàng)選擇式問句即列舉幾個可能的答案,由被調(diào)查者選出最符合自己情況和意見的一個答案。順位式問句即列出對某一問題不同層次的答案,由被調(diào)查者排出次序,表示自己的態(tài)度和傾向。,5背景質(zhì)料部分背景資料主要是一些人文信息,一般包括調(diào)查個體單位的性別、年齡、婚姻狀況、家庭人數(shù)、家庭或個人收入、職業(yè)等信息。這部分一般放在問卷的最后。6結(jié)束語結(jié)束語的任務(wù)就是告訴被調(diào)查者調(diào)查問卷結(jié)束,調(diào)查完畢了。(二)調(diào)查問卷設(shè)計(jì)的基本要求主題明確,形式簡明,文字通俗,容易理解,便于回答,三、量表設(shè)計(jì)(一)量表的含義量表是由反映某一抽象概念的所有測量指標(biāo)和備選答案構(gòu)成的調(diào)查表。量表是由相互關(guān)聯(lián)的指標(biāo)或題目構(gòu)成,所以,指標(biāo)的選擇至關(guān)重要,在選擇指標(biāo)時應(yīng)注意以下幾點(diǎn)。第一,構(gòu)成量表的指標(biāo)個數(shù)應(yīng)適當(dāng)?shù)诙?,?gòu)成量表的指標(biāo)的測量層次選擇應(yīng)適當(dāng),(二)量表的種類1.根據(jù)測量尺度不同可將量表分為類別量表、順序量表、等距量表和等比量表(1)類別量表。類別量表是指由定類尺度指標(biāo)構(gòu)成的量表。(2)順序量表。順序量表是指由定序尺度指標(biāo)構(gòu)成的量表。(3)等距量表。等距量表也稱區(qū)間量表,是由定距尺度指標(biāo)構(gòu)成的量表。(4)等比量表。等比量表是由定比尺度指標(biāo)構(gòu)成的量表。,2.根據(jù)答案數(shù)量的多少可分為五級量表、七級量表、九級量表等3.根據(jù)反映測量對象的特征多少可以將量表分為一維量表和多維量表(三)量表設(shè)計(jì)中應(yīng)注意的問題1.量級層次的個數(shù)2.平衡量表與非平衡量表3.奇數(shù)層次量表與偶數(shù)層次量表4.量表的形式,一、統(tǒng)計(jì)報表(一)統(tǒng)計(jì)報表的概念統(tǒng)計(jì)報表是我國取得統(tǒng)計(jì)資料的一種基本的組織形式。它是基層企業(yè)、事業(yè)單位以及各級領(lǐng)導(dǎo)機(jī)關(guān),按照國家有關(guān)部門統(tǒng)一規(guī)定的報表格式、報告內(nèi)容、報送時間和程序等,自下而上報送報表的一種調(diào)查方式。(二)統(tǒng)計(jì)報表的特點(diǎn)數(shù)據(jù)準(zhǔn)確、報送及時、便于匯總內(nèi)容比較固定,不能及時地反映新情況、新問題。,第三節(jié)統(tǒng)計(jì)數(shù)據(jù)的采集方法,二、普查(一)普查的概念普查是為了某一特定目的而專門組織的一次性全面調(diào)查,如人口普查、工業(yè)普查、農(nóng)業(yè)普查等。(二)普查的特點(diǎn)普查通常是一次性的或周期性的普查需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時間普查的數(shù)據(jù)比較準(zhǔn)確普查的成本高、時間才長,三、抽樣調(diào)查(一)抽樣調(diào)查的概念抽樣調(diào)查是實(shí)際中應(yīng)用最廣泛的一種調(diào)查方式和方法,它是從調(diào)查對象的總體中隨機(jī)抽取一部分單位做為樣本進(jìn)行調(diào)查,并根據(jù)樣本調(diào)查結(jié)果來推斷總體數(shù)量特征的一種非全面調(diào)查。(二)抽樣調(diào)查的特點(diǎn)經(jīng)濟(jì)性,時效性,適應(yīng)性,準(zhǔn)確性,四、重點(diǎn)調(diào)查(一)重點(diǎn)調(diào)查的概念重點(diǎn)調(diào)查在調(diào)查總體中,選擇一部分重點(diǎn)單位進(jìn)行調(diào)查,以了解總體基本情況的一種非全面調(diào)查。所謂重點(diǎn)單位,是指調(diào)查單位的標(biāo)志總量在總體標(biāo)志總量中占絕大比重的個體單位。(二)應(yīng)用重點(diǎn)調(diào)查的條件第一,調(diào)查的任務(wù)只要求掌握調(diào)查總體的基本情況。第二,在調(diào)查總體中,確實(shí)存在著重點(diǎn)單位。,五、典型調(diào)查(一)典型調(diào)查的概念典型調(diào)查是根據(jù)調(diào)查目的和要求,在對調(diào)查對象進(jìn)行初步分析的基礎(chǔ)上,有意識的選取少數(shù)具有代表性的典型單位進(jìn)行深入細(xì)致的調(diào)查研究,借以認(rèn)識同類事物的發(fā)展變化規(guī)律及本質(zhì)的一種非全面調(diào)查。(二)典型調(diào)查的特點(diǎn)1.有意識地選擇調(diào)查單位。2.對于推廣新生事物,總結(jié)經(jīng)驗(yàn)具有重要作用。3.調(diào)查內(nèi)容靈活性。,本章主要思考題統(tǒng)計(jì)調(diào)查的種類統(tǒng)計(jì)調(diào)查方案的內(nèi)容幾種非全面調(diào)查方法的共同點(diǎn)和不同點(diǎn)典型調(diào)查的作用是什么調(diào)查對象、調(diào)查單位與填報單位有什么關(guān)系本章主要參考資料葉明霞統(tǒng)計(jì)調(diào)查方案的比較統(tǒng)計(jì)與決策,1998年第11期漫談市場調(diào)查問卷的設(shè)計(jì)藝術(shù)中國統(tǒng)計(jì)1993年第4期,
下載積分: 6 賞幣
上傳時間:2024-01-06
頁數(shù): 28
大?。?1.1(MB)
子文件數(shù):