衛(wèi)生統(tǒng)計學(xué)課件( health statistic)

上傳人：奔*** IP屬地：河北更新時間：2024-01-05 格式：ppt 頁數(shù)：150 大小：671.00KB 人氣指數(shù)：12 舉報 版權(quán)申訴

衛(wèi)生統(tǒng)計學(xué)課件( health statistic)_第1頁

已閱讀1頁，還剩149頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、health statistic,present to clinical studentyulan21cn@yahoo.com.cn,一、衛(wèi)生統(tǒng)計學(xué)( health statistic)的定義和內(nèi)容,1.定義: 統(tǒng)計學(xué):研究數(shù)據(jù)的收集、整理、分析,對不確定的數(shù)據(jù)作出科學(xué)推理的一門科學(xué)(即概率論).衛(wèi)生統(tǒng)計學(xué):2.內(nèi)容：衛(wèi)生統(tǒng)計學(xué)的基本原理和方法健康統(tǒng)計衛(wèi)生服務(wù)統(tǒng)計,二、統(tǒng)計工作的基本步驟,全過程包括：計劃與設(shè)計、

2、收集資料、整理資料、分析資料 1、設(shè)計（design): 根據(jù)研究目的對統(tǒng)計全過程的一個全面的設(shè)想。這是最關(guān)鍵的一步。要求：科學(xué)、周密、簡捷。設(shè)計包括：實驗設(shè)計、調(diào)查設(shè)計、臨床實驗設(shè)計設(shè)計原則：齊同原則、對照原則、重復(fù)原則、隨機(jī)化原則,2、搜集資料（collection of data):,要求:完整、準(zhǔn)確、及時。醫(yī)學(xué)統(tǒng)計資料的來源主要有三個方面: (1) 統(tǒng)計報表:eg法定傳染病報表、職業(yè)病報表、醫(yī)院工作

3、報表; 報表項目較少，不具備可比性 (2) 日常醫(yī)療工作的原始記錄和報告卡片; eg:衛(wèi)生監(jiān)測記錄、健康檢查記錄（3）專題調(diào)查與實驗： A．常見專題調(diào)查的種類：居民健康狀況調(diào)查流行病調(diào)查（病因?qū)W調(diào)查）臨床遠(yuǎn)期療效觀察衛(wèi)生學(xué)調(diào)查：職業(yè)衛(wèi)生學(xué)調(diào)查、環(huán)境衛(wèi)生學(xué)調(diào)查、營養(yǎng)與食品衛(wèi)生學(xué)調(diào)查、放射衛(wèi)生學(xué)調(diào)查、心理衛(wèi)生學(xué)調(diào)查等。,B.調(diào)查的內(nèi)容：,

4、明確調(diào)查目的、內(nèi)容和指標(biāo)確定調(diào)查對象（總體）、觀察單位（個體）選擇調(diào)查方法：全面調(diào)查（普查：census）非全面調(diào)查：典型調(diào)查：有意識選擇范圍抽樣調(diào)查確定調(diào)查范圍：時間、空間、數(shù)量范圍選擇調(diào)查方式：觀察法、采訪法、填表法、通訊法。,調(diào)查設(shè)計,特點:調(diào)查計劃:1.明確調(diào)查目的和指標(biāo)2.確定觀察對象和單位3.調(diào)查方法(1)普查( 全面調(diào)查 ): 將組成總體的所有觀

5、察單位全部加一調(diào)查。 (2)抽樣調(diào)查: 從總體中隨機(jī)抽取一定數(shù)量的觀察單位組成樣本, 然后用樣本信息來推斷總體特征。(3)典型調(diào)查( 案例調(diào)查 ): 即在對事物作全面分析的基礎(chǔ)上, 有目的地選定典型的人、典型的單位進(jìn)行調(diào)查。,確定調(diào)查項目和設(shè)計調(diào)查表：,調(diào)查項目：核查項目（檢索項目、備考項）：被調(diào)查者的姓名、住址等。分析項目（業(yè)務(wù)項目）：資料不能缺少的分析項目。調(diào)查者項目（審核項目）：調(diào)查者的姓名和調(diào)查日期調(diào)查表：調(diào)查項

6、目按一定順序列成的表格。制表要求：簡便、清楚多用：選擇、填空、符號、數(shù)字；少用：文字?jǐn)⑹?調(diào)查表形式：,一覽表(list)：多個觀察單位記錄在一張表中適用于調(diào)查項目少、樣本少的專題調(diào)查單一表（card、調(diào)查卡片、個案卡片）: 一個觀察單位記錄在一張表中,適用于調(diào)查項目多、樣本多的專題調(diào)查編碼調(diào)查表（code sheet）:適用于樣本多、分析項目多、分析內(nèi)容復(fù)雜的專題調(diào)查，計算機(jī)保存。確定樣本大小制定調(diào)查的

7、組織工作：建立組織、確定起止時間、進(jìn)度、分工、培訓(xùn)調(diào)查員可先小范圍調(diào)查（預(yù)調(diào)查）,4.調(diào)查項目和調(diào)查表(1) 分析項目: 直接用于計算調(diào)處指標(biāo), 以及分析時排除混雜因素影響所必須得到的內(nèi)容。(2) 備查項目: 便于核查、補(bǔ)填和更正而設(shè)置的, 通常不直接用于分析。(3) 調(diào)查表的格式: 分為一覽表和單一表5.收集資料的方式6.隨機(jī)抽樣的方法: a.單純隨機(jī)抽樣 b. 系統(tǒng)抽樣 c. 整群抽樣 d. 分層抽樣;,根據(jù)抽

8、樣誤差的大小分層抽樣 < 系統(tǒng)抽樣 < 單純隨機(jī)抽樣 < 整群抽樣,3、整理資料（sorting data),系統(tǒng)化、條理化1)核查資料; 2)分組匯總，擬整理表：按性質(zhì)（分類變量）或數(shù)量（數(shù)值變量）分組,擬定整理表（過渡性的表格，按調(diào)查指標(biāo)合理設(shè)計，用于原始資料的歸組，表中有合計、總計等項目）。,4.分析資料:計算有關(guān)指標(biāo)，反映數(shù)據(jù)綜合特征,統(tǒng)計描述（descriptive statistic）包括指標(biāo)

9、的計算、統(tǒng)計圖表的繪制,描述數(shù)據(jù)的特征和分布規(guī)律。統(tǒng)計推斷（inferentical statistic）用樣本統(tǒng)計量通過參數(shù)估計、假設(shè)檢驗等統(tǒng)計方法推斷總體.推斷總體 1)推斷總體分布;是正態(tài)還是偏態(tài) (常有理論或經(jīng)驗得到) 2)推斷總體分布的參數(shù)或特征量: μ和?,三.統(tǒng)計中的幾個基本概念,1、變量與變異：　變量：個體的研究特征；變異：各觀察指標(biāo)（即個體）之間的差異:包括個體變異和隨機(jī)測

10、量變異同質(zhì)觀察單位之間的個體變異，是生物的重要特征，是偶然性的表現(xiàn)。變量值:變量的觀察結(jié)果: 定量變量: 數(shù)值變量資料定性變量: 分類變量資料數(shù)值變量(numerical variabal):用定量方法對每個觀察單位測定某項指標(biāo)的所得的資料.一般有度量衡單位（也稱計量資料measurement data)。,分類變量(categorical variable),表現(xiàn)為互不相容的類別或?qū)傩?分兩種:a.無序分類變量:(uno

11、rdered categories，計數(shù)資料enumeration data):將觀察單位按某種屬性或類別分組，再清點各組的觀察單位數(shù)?？煞譃槎検交蚨囗検椒诸愖兞?。b.有序分類變量(ordinal categories,等級資料ranked data半定量資料)：將觀察單位按某種屬性（或性質(zhì)、標(biāo)志）的不同程度分組，然后清點各組的數(shù)據(jù)所得的資料。（各組之間有程度的差異）.(這類資料與計數(shù)資料不同的是：屬性的分組有程度的差別，各

12、組按大小順序排列；與計量資料不同的是：每個觀察單位未確切定量，因而又稱為半定量資料。）三種資料間可以相互轉(zhuǎn)化。,2、總體與樣本,總體（population)：根據(jù)研究目的確定的同質(zhì)的研究對象的全體（性質(zhì)相同的所有觀察單位的某種變量值的集合）。樣本(sample)：從總體中隨機(jī)抽取一部分觀察單位進(jìn)行觀察，這部分觀察單位對總體有代表性，稱為樣本。(總體中每一觀察單位均有相同的機(jī)會被抽取到樣本中去。),3.概率(probability)與

13、頻率,描述某事物發(fā)生的可能性大小的數(shù)值,用分?jǐn)?shù)、小數(shù)、百分?jǐn)?shù)表示。符號p。 P=1 p=0 0<p<1 隨機(jī)事件 p≤0.05或p≤0.01 小概率事件,3.誤差(statistic error),測得值與真實值之差。系統(tǒng)誤差(systematic error)因儀器不準(zhǔn)等造成的呈傾向性偏大或偏小的誤差(可以消除)。隨機(jī)測量誤差(random measurement error

14、)儀器校正后由于偶然因素造成同一物體多次測量結(jié)果不完全一致(不可避免,無傾向性)。抽樣誤差(sampling error)：消除系統(tǒng)誤差和控制隨機(jī)測量誤差后,由于觀察單位間存在個體差異, 隨機(jī)抽樣造成的樣本指標(biāo)與總體參數(shù)有差異, 這種樣本統(tǒng)計量與總體參數(shù)間的差別稱為抽樣誤差。,4.參數(shù)與統(tǒng)計量:,總體指標(biāo)均稱參數(shù),用希臘字母表示: μ, σ, 樣本指標(biāo)均稱統(tǒng)計量,用拉丁字母表示?X,s。,頻數(shù)分布的集中趨勢和離散趨勢,數(shù)值變量資

15、料的頻數(shù)表頻數(shù)表的編制a.求全距（range）R R=最大值-最小值b.確定組距（class interval）i i=全距/組數(shù) 組數(shù)取決于資料性質(zhì)、樣本量、分析目的要求：組數(shù)一般8~15組，組距相等c.劃分組段：每組都有開始值、終止值第一組包括最小值，最后一組包括最大值每組段只寫組下限，省略組上限各組界限要分明（既不包含也不留空隙）,

16、d.歸納記數(shù)，擬整理表,方法：劃記法(tabulation method)：正適用于樣本少、內(nèi)容簡單的資料分卡法(card sorting method):卡片分組適用于樣本多的資料,Chapter 16 statistic table and statistic chart,present to clinical medical student,outline,Structure, classi

17、fy, tabulating principle and basic requirement of establishing a table and a graphSeveral plotting approach of statistic chartusability condition of statistic chart,一.統(tǒng)計表(statistic table)兩個組成:被說明的事物統(tǒng)計指標(biāo)(

18、1) 基本結(jié)構(gòu)與要求: 由標(biāo)題、標(biāo)目、線條、數(shù)字等組成a. 標(biāo)題: 要求中心內(nèi)容突出, 必要時注明資料的時間、地點。b. 標(biāo)目: 橫標(biāo)目: 位于表的左側(cè), 是表的主語位置?？v標(biāo)目: 位于表的上方, 是表的謂語位置。,,c 線條: 分頂線、底線、縱標(biāo)目下面與合計上面的橫線，斜線、豎線省略。 d 數(shù)字: 一律用阿拉伯?dāng)?shù)字。 …表示數(shù)值不詳或暫缺 -- 無數(shù)值備注: 列于表的下面, 對表中標(biāo)有( ? )的數(shù)字加以

19、描述。,,標(biāo)題橫標(biāo)目總稱縱標(biāo)目橫標(biāo) 目合計,,,,,,種類:內(nèi)容上:廣義: 狹義:形式上: a.簡單表: 被研究的事物只按一個特征或指標(biāo)分組。 b.復(fù)合表: 被研究的事物按兩個或兩個以上相關(guān)聯(lián)的特征或指標(biāo)分組。制表原則:簡單明了,重點突出主謂分明,層次清楚數(shù)據(jù)準(zhǔn)確,便于對比分析,,種類:內(nèi)容上:廣義: 狹義:形式上: a.簡單表: 被研究的事物

20、只按一個特征或指標(biāo)分組。 b.復(fù)合表: 被研究的事物按兩個或兩個以上相關(guān)聯(lián)的特征或指標(biāo)分組。制表原則:簡單明了,重點突出主謂分明,層次清楚數(shù)據(jù)準(zhǔn)確,便于對比分析,二.統(tǒng)計圖(statistic graph),基本要求:a 依據(jù)資料的性質(zhì)選擇適當(dāng)?shù)膱D形;b 標(biāo)題簡明扼要,必要時注明時間、地點;c 縱軸和橫軸應(yīng)有標(biāo)目,并注明單位d 尺度:橫軸尺度自左而右, 縱軸尺度自下而上, 數(shù)量一律由小到大, 并需等距標(biāo)明。縱橫坐標(biāo)長

21、度的比例一般為5? 7。e復(fù)式圖:比較不同事物時, 用不同的線條或顏色表示, 要附圖例說明。,3、常用統(tǒng)計圖,(1) 直條圖(bar graph): 用相同寬度條形的長短.來表示資料數(shù)值大小比例關(guān)系, 適用于按性質(zhì)分組,各個獨立的、無連續(xù)關(guān)系的統(tǒng)計圖。,,(2)百分條圖: 適用于表達(dá)構(gòu)成比的資料。,,(3) 線圖:,用線條的上升和下降來表示某事物( 或某現(xiàn)象 )因時間或條件而變化的趨勢。適用于連續(xù)性的變量資料。,(4)直方圖:,用于

22、表示連續(xù)變量的頻數(shù)分布。常以橫軸表示被觀察現(xiàn)象, 縱軸表示頻數(shù)或頻率, 以各矩形( 寬度為組距 )的面積代表各組段的頻數(shù)。,謝謝,outline,Descriptive approach and applicable condition about central tendency & tendency of dispersioncounting method of statistical descriptive index

23、Concept and trait of normal distributionEvaluation of reference rangearea distribution principle about normal distributionGraph of normal distribution,Statistical distribution of numerical variable,頻數(shù)分布的集中趨勢和離散趨勢數(shù)值變

24、量資料的頻數(shù)表頻數(shù)表的編制a.求全距（range）R R=最大值-最小值b.確定組距（class interval）i i=全距/組數(shù) 組數(shù)取決于資料性質(zhì)、樣本量、分析目的要求：組數(shù)一般8~15組，組距相等c.劃分組段：每組都有開始值、終止值第一組包括最小值，最后一組包括最大值每組段只寫組下限，省略組上限各組界限(demarcation)

25、要分明（既不包含也不留空隙）,頻數(shù)分布的兩個特征,集中趨勢和離散趨勢,頻數(shù)分布的類型,對稱分布和偏態(tài)分布(正偏和負(fù)偏),集中趨勢的描述:,平均數(shù)(average)1.概念:平均數(shù)是集中趨勢(central tendency)指標(biāo)(亦稱位置指標(biāo)), 用以描述同質(zhì)計量資料頻數(shù)分布的集中趨勢, 反映一組變量值的平均水平, 是一組變量值的代表值。,2.種類:,1) 算術(shù)均數(shù): arithmetic mean, 樣本均數(shù), 符號:?X

26、(eksba),拉丁字母,簡稱均數(shù), 總體均數(shù), 符號μ(miu), 希臘字母(1)適用范圍:對稱分布(特別是呈正態(tài)分布或近似正態(tài)分布)。(2)計算方法: A.直接法(direct method): 當(dāng)觀察值個數(shù)較少時 ?X =?x/n ?:希臘字母,sigma,求和符號B.加權(quán)法(weighting method): ?X =??x/??=??x/n條件: 當(dāng)觀察值個數(shù)較多時,步驟,A) 制備頻數(shù)表

27、B)求各組組中值(class-mid value) X=(本組段組下限+下組段組下限)/2C)統(tǒng)計各組段頻數(shù)fD) ?fxE) =?fx/?f 各組段f權(quán)衡了各組中值因f不同對均數(shù)的影響,起權(quán)衡作用,權(quán)數(shù)大,作用大.(3)均數(shù)的兩個重要特征: A. Σ（X-?X ）=0 B.Σ（X-?X ）2<Σ（X- a）2,2)幾何均數(shù)(geometric mean ,符號G表示),用于描述變量

28、值呈等比數(shù)列, 或呈對數(shù)正態(tài)分布(log-normal distribution)或近似對數(shù)正態(tài)分布資料。資料作對數(shù)變換(log arithmetic transformation)直接法:當(dāng)n較小時 G=(x1x2? x3? ?????? xn )1/n, G=lg-1( ?lgX/n )加權(quán)法: 當(dāng)n較大時 G=lg-1( ??lgX/?? )應(yīng)用條件:任何一個不能為0,不能同時有正有負(fù)步驟:求倒數(shù)

29、 X logX flogX ??lgX ??lgX/?? lg-1( ??lgX/?? )=G,,,,,,3)中位數(shù)(median, 位置平均數(shù),符號M),是一組變量值從小到大順序排列后位次居正中間的那個數(shù)值。應(yīng)用條件:多用于描述偏態(tài)分布資料,或一端或兩端無確定數(shù)值的開資料的集中趨勢,或頻數(shù)分布不明資料,。計算方法: 直接法：當(dāng)n較小時 n為奇數(shù)時 M=X

30、(n+1/2) n為偶數(shù)時 M=[ X(n/2)+X(n/2+1)]/2 頻數(shù)表計算方法: 當(dāng)n較大時用編頻數(shù)表(frequency table)PX =L+i/fm( n?x% - ??L )L：中位數(shù)所在組段下限；i: 中位數(shù)所在組段組距fm: 中位數(shù)所在組段頻數(shù)??L：中位數(shù)所在組段之前的累積頻數(shù)x%：百分位 50%,4)百分位數(shù)(percentile,PX ),描述一組有序排列的偏態(tài)分

31、布數(shù)據(jù)某百等分界值大?。ê喎Q界值，是一種位置指標(biāo)）應(yīng)用條件：偏態(tài)分布(skew distribution)資料應(yīng)用: 估計正常值范圍： 95%： P2.5 P97.5,離散程度的描述,描述變異程度的常用指標(biāo)：例：三組同性別同年齡兒童體重（Kg），其集中趨勢與離散程度分別是：甲組：26 28 30 32 34 ?X =30Kg 乙組：24 27 30 33 36 ?X

32、 =30Kg 丙組：26 29 30 31 34 X =30Kg三組數(shù)據(jù)集中位置用?X描述，?X =30Kg，三組數(shù)據(jù)離散度不同，分布特征不盡相同。,1)全距（range, R, 極差）,一組變量值中最大值與最小值之差。R=X最大—X最小優(yōu)點：簡單明了，常用于傳染病、食物中毒的最長、最短潛伏期缺點：A .不能反映組內(nèi)數(shù)據(jù)的變異度 B. N R C. 抽樣誤差較大,,,

33、2)四分位間距(quartile, Q),P75 QU P25 QL Q=QU—QL（包括全部觀察值的一半）應(yīng)用:偏態(tài)分布資料優(yōu)點：較穩(wěn)定，特別是N較大時，越接近分布的中間越穩(wěn)定。缺點：未考慮每個觀察的變異度。,3)方差(variance,?2 ，s2),離均差平方和的平均值離均差： X—μ, Σ（X—μ）=0離均差平方和（Sum of squares）,Σ（X—μ）2 1 .與變異

34、度有關(guān)：變異度越大，Σ（X—μ）2越大2．與N多少有關(guān)：N越大， Σ（X—μ）2越大為消除N的影響，取其均值 Σ（X—μ）2 Σ（X—?X ）2?2 = S2= (樣本方差公式) N n-1 缺點：單位平方優(yōu)點：考慮了每個變量值的變異，方差大小不受樣本量多少的影響,,,4)標(biāo)準(zhǔn)差(stan

35、dard deviation,? s),是最常用的衡量變量值間離散程度的變異指標(biāo)。 Σ（X—μ）2 ?= N定義：離均差的平方和的平均值的平方根意義：1.?越大，說明個體差異越大，則平均數(shù)代表性就越差 2.μ未知，用s估計?，用Σ（X—?X ）2 代替Σ（X—μ）2 用樣本例數(shù)n代替N，,,由于抽樣誤差存在,?X =μ可能性小,當(dāng)?X =μ按上式算得結(jié)果常比實

36、際?低，英國W.S.Gosset提出用n-1代替n校正， Σ（X—?X ）2 S= (樣本標(biāo)準(zhǔn)差公式) n-1自由度：隨機(jī)變量能自由取值的個數(shù)。υ(niu) υ=n-1 Σ（X—?X）2 ΣX2—(ΣX)2/ n ΣfX2—(fX)2/n

37、 S= = S= n-1 n-1 n-1Lxx=SS=ΣX2—(ΣX)2/ n Lxx=SS=ΣfX2—(ΣfX)2/n 應(yīng)用：（1）用來描述資料的變異程度：應(yīng)用條件:正態(tài)分布?X +s （2）比較不同資料變異程度大小

38、應(yīng)用條件:單位相同、均數(shù)相近優(yōu)點：考慮了每個觀察值的變異情況，與集中趨勢單位一致；當(dāng)資料呈正態(tài)或近似正態(tài)資料時可寫成: ?X ? S,表示均數(shù)的代表性。缺點:計算復(fù)雜,5)變異系數(shù):(離散系數(shù) coefficient of dispersion ,CV),CV= (S /?X ) *100%應(yīng)用:A、比較均數(shù)相差懸殊的幾組資料的變異程度; B、比較單位不同的多組資料的變異度:應(yīng)用條件：正態(tài)分布; 單位不同或

39、均數(shù)不等優(yōu)點:無單位,便于比較,正態(tài)分布及其應(yīng)用,正態(tài)分布（又稱Gauss分布）概念：: 是醫(yī)學(xué)和生物學(xué)中最常見的連續(xù)性總體頻數(shù)分布, 以均數(shù)為中心, 兩側(cè)逐漸下降并對稱, 兩端永遠(yuǎn)不與橫軸相交。正態(tài)分布（normal distribution）圖形：直方圖，當(dāng)n增大各直條逐漸變窄，其頂點中點將變成一條光滑曲線（頻數(shù)曲線），形狀呈鐘形，兩頭低，中間高，左右對稱。,正態(tài)分布用N(?, ?2)表示,為了應(yīng)用方便, 常對變量X 作 u=(

40、 X - ? )/ ?變換,u=( X - ? )/ ? 1）原點移到 ? 的位置2）橫軸尺度以 ? 為單位使?=0, ?=1,則正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution,U分布), 用N(0, 1)表示。U：稱為標(biāo)準(zhǔn)正態(tài)變量或標(biāo)準(zhǔn)正態(tài)差,特征:,A、均數(shù)處最高;B、以均數(shù)為中心, 左右對稱;C、有兩個參數(shù): ?和?, u 位置參數(shù)，圖形向右移動 ?變異度參數(shù)，

41、數(shù)據(jù)越分散D、正態(tài)曲線下的面積分布有一定規(guī)律:a.曲線與橫軸X所夾面積總和為1b.橫軸上某一區(qū)間和曲線所夾面積與總面積之比，相當(dāng)于變量值落在該區(qū)間的概率（概率分布），反映該區(qū)間例數(shù)與總例數(shù)之比（頻率分布，百分?jǐn)?shù)）c.橫軸上某一區(qū)間所夾面積可用函數(shù)積分求得,正態(tài)曲線下的面積分布規(guī)律,變量值范圍正態(tài)曲線下面積 (變量值出現(xiàn)的概率) ? ? 1.0? 68.

42、27% ? ? 1.96? 95.00% ? ? 2.58? 99.00%,,,,3) 正態(tài)分布的應(yīng)用,常用于估計頻數(shù)分布情況; 制定正常值范圍。正常值:指正常人的各種生理常數(shù)。當(dāng)資料呈正態(tài)分布時,最常用?X ? 1.96S估計95%正常值范圍, 其含義是指絕大多數(shù)正常的變量值都在這個范圍內(nèi), 絕大多數(shù)是包括正常的90%、95%和99%, 最常用95%。應(yīng)用：1.估計醫(yī)學(xué)參考值范圍 ?X ? uS

43、 2.質(zhì)量控制 ?X +2S 上下警戒線 ?X +3S 上下控制線,常用的U值表,參考值范圍% 單側(cè) 雙側(cè) 90 1.282 1.645 95 1.645 1.96 99 2.326 2.58,,,,95%參考值范圍雙側(cè) ?X ? 1.96S單側(cè) 上限 (u

44、pper limit) ?X +1.645S 下限(low limit) ?X -1.645S99%參考值范圍雙側(cè) ?X + 2.58S應(yīng)用條件：1.正態(tài)分布或近似正態(tài)分布資料2.可轉(zhuǎn)化為正態(tài)分布資料: 對數(shù)變換(抗體滴度、血清效價、住院天數(shù)、潛伏期、檢驗結(jié)果、殘留量、有害物質(zhì)的濃度等)3.t分布、二項分布、POISSON分布等極限為正態(tài)分布正態(tài)分布是X2分布、t分布、F分布的基礎(chǔ),Sta

45、tistic inference of numerical variable,,outline,Concept of sampling error and that of standard errorEvaluation of confidence intervalgeneral step and announcement of hypothesis testApplication condition of T test and

46、U testTape 1 error and tape 2 error,總體均數(shù)的估計和假設(shè)檢驗,一、均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤(standard error) 1）均數(shù)的抽樣誤差隨機(jī)抽10個變量值組成樣本第一次:x11 x12 x13 x14 x15 x16 x17 x18 x19 x110 ?X1 第二次:x21 x22 x23 x24 x25 x26 x27 x28 x29

47、x220 ?X2類推:第n次：xn1 xn2 xn3 xn4 xn5 xn6 xn7 xn8 xn9 xn10 ?X nN(?, ?2 ),,,(1)特征,a.樣本均數(shù) ?X 1 ?X 2 ?X 3…….. ?X n不一定相等.b.?為定值,s越大, 抽樣誤差越大.c.樣本均數(shù)?X 的頻數(shù)分布呈近似正態(tài)分布: ?X=Σ?X /n≈u,,(2)中心極限定律(central limit

48、theorem),a.正態(tài)總體中隨機(jī)抽取許多含量相等的樣本,這些樣本均數(shù)的頻數(shù)分布呈正態(tài)分布N(?,?2?X )b.偏態(tài)總體中隨機(jī)抽取許多含量相等的樣本,當(dāng)n>30時,樣本均數(shù)的頻數(shù)分布近似正態(tài)分布N(u, ?2?X ) 若變量x的總體(正態(tài)或偏態(tài))均數(shù)為?,標(biāo)準(zhǔn)差為?,則含量為n的樣本均數(shù)?X的總體均數(shù)也為?, 樣本均數(shù)的標(biāo)準(zhǔn)差為??X (放回抽樣).,（3）均數(shù)的抽樣誤差,A、定義：因隨機(jī)抽樣造成的樣本統(tǒng)計量之間以及樣

49、本統(tǒng)計量與總體參數(shù)之間的差異.記作??X , S?X . B、抽樣誤差影響因素:n大小?抽樣方法不同, ??X 不同。抽樣誤差不可避免.,2)標(biāo)準(zhǔn)誤的概念,(1)定義:樣本均數(shù)的標(biāo)準(zhǔn)差,是說明均數(shù)抽樣誤差大小的指標(biāo)。標(biāo)準(zhǔn)誤愈小,表示抽樣誤差愈小,樣本統(tǒng)計量對總體參數(shù)的估計愈可靠。(2)標(biāo)準(zhǔn)誤的計算 ??X =?/??n(總體標(biāo)準(zhǔn)誤) s?X =s/??n(樣本標(biāo)準(zhǔn)誤) (當(dāng)?未知,用s代替?),(3

50、)標(biāo)準(zhǔn)誤的應(yīng)用,表示樣本均數(shù)的離散度;估計總體均數(shù)的可信區(qū)間;進(jìn)行假設(shè)檢驗,(4)標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別和聯(lián)系,標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤區(qū)別: 表示個體之間的變異度表示樣本均數(shù)之間的變異度表示觀察值與樣本均值之間的離散度表示樣本均數(shù)與總體均數(shù)之間的離散度可以衡量樣本均數(shù)

51、抽樣誤差的大小聯(lián)系: ??X =?/??n,二.t分布(t distribution),（1）t分布的概念: 從正態(tài)總體中隨機(jī)抽取許多含量為n的樣本,由樣本算出樣本均值?X和s?X ,按t公式算出t值,將n個t值作直方圖,構(gòu)成t變量的頻數(shù)分布圖(連續(xù)性分布) ?X1 s1 t1值 ?X2 s2 t2值 ?X3

52、s3 t3值 …… ?Xn sn tn,u=( ?X - ? )/ ??X,U變換, Xn 由N(?, ??X 2)變換為標(biāo)準(zhǔn)正態(tài)分布(U分布)??X 往往用s?X 來估計t = (?X - ? )/ s?X t變換(t分布)。U值稱樣本檢驗統(tǒng)計量, t值也稱樣本檢驗統(tǒng)計量當(dāng)n逐漸增大，就成了t曲線,與標(biāo)準(zhǔn)正態(tài)分布相比有以下特征: a.二者都是單峰分布,

53、以0為中心, 左右對稱; b. t分布有一個參數(shù),?不同,t曲線不同, ?越大,峰度越大。?逐漸增大時, t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布; 當(dāng)?=?時,t=u, t分布就完全成為標(biāo)準(zhǔn)正態(tài)分布了。c.t分布曲線下的面積有一定規(guī)律:t曲線與橫軸所夾面積總和為1橫軸上某一區(qū)間和曲線所夾面積與總面積之比，相當(dāng)于t值落在該區(qū)間的概率（概率分布）從總體中隨機(jī)抽樣獲得t值落在整個橫軸概率為1,獲得t值? t?,?的概率p<?,,單側(cè):

54、P( t ? - t?,?)= ?, 或P(t ? t?,?)= ?雙側(cè): P( t ? - t?,?)+P(t ? t?,?)= ?; P( - t?,? < t < t?,?)= 1 - ?隨機(jī)抽樣算t值,95%滿足: - t?,? < t < t?,? - t?,? < （?X - ?) / s?X < t?,? ?X - t?,? s?X < ? <?X + t?

55、,? s?X ;,(3)t界值,t界值表, 橫標(biāo)目為自由度?, 縱標(biāo)目為概率P, 表中數(shù)字表示自由度為?, P為?(檢驗水準(zhǔn))時, t的界值, 常記為t?,?。注意: ?不同, t?,?不同?相同, p越大, t?,?越小，且單側(cè)P與雙側(cè)2P的t值相等,p相同, ?越大, t?,?越小,三.總體均數(shù)的估計,包括點值估計和區(qū)間估計:a.區(qū)間估計的涵義: 意思是從總體中作隨機(jī)抽樣, 每個樣本可以算得一個可信區(qū)間, 如95%可信區(qū)間,

56、意味著做100個可信區(qū)間, 平均有95個可信區(qū)間包括總體均數(shù)(估計正確), 只有5個可信區(qū)間不包括總體均數(shù)(估計錯誤)。,,b.區(qū)間估計的方法: ?X - t?,? S?X < ? <?X + t?,? S?X ;?已知 ?X - U? ??X < ? <?X + U? ??X ;?未知但n足夠大?X - U?S?X < ? <?X + U?S?X ;,c.可信區(qū)間兩要素:,準(zhǔn)確度:反

57、映區(qū)間包含總體均數(shù)的概率大小,即1-?大小,越趨近1越好精度: 反映區(qū)間的長度, 長度越小越好 1-? 一定,n越大，精度越高,四.假設(shè)檢驗(hypothesis test)一般步驟:,?X 與?不等的原因1.由于抽樣誤差引起，若無抽樣誤差，它們之間相等2.總體存在質(zhì)的差異，并非抽樣誤差引起，若無抽樣誤差，它們之間仍不相等(1)概念所謂假設(shè)檢驗, 就是根據(jù)研究目的, 對樣本所屬總體特征提出一個假設(shè), 然后用適當(dāng)方法根據(jù)樣本提

58、供的信息, 推斷此假設(shè)應(yīng)當(dāng)拒絕或不拒絕, 以使研究者了解在假設(shè)的條件下, 差異由抽樣誤差引起的可能性大小。,,即推斷樣本統(tǒng)計量與總體參數(shù)之間或樣本統(tǒng)計量之間的差異是由抽樣誤差引起還是總體存在質(zhì)的差異。假設(shè)檢驗（對總體而言）；顯著性檢驗（對樣本而言）,(2) 一般步驟,a.建立假設(shè):無效假設(shè)（null hypothesis）H0: ?= ?0即假設(shè)樣本指標(biāo)與總體參數(shù)（樣本與樣本指標(biāo)）是相等的,若不等，它們的差別是由抽樣誤差引起。

59、備擇假設(shè)H1: ?≠?0，是與H0相對立的假設(shè);差別不是由抽樣誤差引起，而是有本質(zhì)差異b.確定檢驗水準(zhǔn)?（亦稱顯著性水準(zhǔn)，第一類錯誤Ⅰ）,假陽性概率,即本來差異無顯著性而判斷其有顯著性的概率,是一個接受或拒絕H0的概率標(biāo)準(zhǔn)。常取? =0.05或?=0.01 1-?：可信度,,c.選定檢驗方法和計算統(tǒng)計量: t檢驗、U檢驗、?2檢驗、F檢驗等。d.確定P值：P值是指在由H0所規(guī)定的總體中作隨機(jī)抽樣,由于抽樣誤差引起的獲得≥現(xiàn)

60、有樣本統(tǒng)計量的概率。 ?X - ? t= S?X根據(jù)t值判斷：,,,若H0成立，理論上從總體中抽得樣本均數(shù)與總體均數(shù)差別 X -? 不會很大，則t值不會很大，t值很大的可能性（概率）是很小的，用尾部面積表示，即 t ≥t?,? 的概率P≤?，即由抽樣誤差引起兩均數(shù)有差別的概率很小，根據(jù)“小概率事件在依次一次試驗中基本上不發(fā)生”，故拒絕H0 ，本身有質(zhì)的差異的概率很大。t ≥t?,

61、? P≤?，拒絕H0，接受H1t≤ t?,? P≥?，不拒絕H0 e.作出統(tǒng)計推斷: 當(dāng)P? ?時, 統(tǒng)計推斷結(jié)論為按所取檢驗水準(zhǔn)拒絕H0, 接受H1, 差別有顯著性意義。P≥0.05,差異無顯著性（nonsignificance）P≤0.05,差異有顯著性P≤0.01,差異有高度顯著性,五.t檢驗與u檢驗,1.樣本均數(shù)與總體均數(shù)的比較: 應(yīng)用條件：正態(tài)分布 H0: ? = ?0 H1: ?≠?0

62、 ?=0.05 t = ( ?X - ? )/ s?X ， ? = n –1 t ≥t?,? ，P≤?，拒絕H0，接受H1 t≤ t?,?, P≥?，不拒絕H0,2.配對設(shè)計資料的t檢驗: 即差值均數(shù)與總體均數(shù)0比較的t檢驗配對方法: 對同對的兩個受試對象分別給予兩種處理;對同一受試對象分別給予兩種處理;同一受試對象給予某種處理，比較處理前后有無差別。,,H0: ? d = 0，差值的總體均數(shù)等于0

63、H1: ? d ≠ 0 ?=0.05 t = ?d / S?d ?d = ?d / n S?d =Sd / n Sd = ? [ ?d2- (?d)2/n]/(n-1),,3.成組設(shè)計兩樣本均數(shù)的t檢驗:,應(yīng)用條件：正態(tài)分布總體方差齊：σ12=σ22H0: ?1 = ?2 H1: ?1 ≠ ?2 ?=0.05t =(?X1 - ?X2)/ sx1-x2

64、? = n1 + n2 –2sx1-x2=?{[ ?x12- (?x1)2/n1+ ?x22- (?x2)2/n2 ] /( n1+ n2 - 2)}(1/n1+1/n2),,5..兩大樣本均數(shù)的U檢驗:（Z檢驗）,應(yīng)用條件：樣本例數(shù)較大,如兩樣本均樣本n≥50,樣本均數(shù)的分布呈近似正態(tài)分布或總體標(biāo)準(zhǔn)差已知 H0: ?1 = ?2 H1: ?1 ≠ ?2 ?=0.05 U = ( ?X1 - ?X2)/ ?SX1 2+

65、 SX2 2 SX1 2 =Sx12 / n,,方差不齊時兩小樣本均數(shù)的比較,1.兩樣本方差的齊性檢驗2.t`檢驗,6.第一類錯誤與第二類錯誤,第一類錯誤(type Ⅰ error): 拒絕實際上是成立的H0, 概率為?。第二類錯誤(type Ⅱ error): 不拒絕實際上是不成立H0,概率為?1-α：叫可信度：兩總體無差別按α水準(zhǔn)判斷其無差別的能力1-?:把握度,即兩總體確有差別，按α水準(zhǔn)能發(fā)現(xiàn)它們有差別

66、的能力,客觀實際拒絕H0 不拒絕H0H0成立第一類錯誤（α）判斷正確（1-α）H0 不成立判斷正確（1-β）第一類錯誤（β）α：根據(jù)研究者要求確定β：只有與H1結(jié)合才有意義，β值很難確切估計n一定,α↑,β↓ 反之亦然α、β根據(jù)研究要求適當(dāng)控制: 當(dāng)n↑，α一定，β也相應(yīng)減少n一定, 選定α來控制β 若重點減少α，可取α=0.01

67、若重點減少β，可取α=0.05α也可取其他水準(zhǔn),7.假設(shè)檢驗時應(yīng)注意的問題,a.要有嚴(yán)密的抽樣研究設(shè)計;b.選用假設(shè)檢驗方法應(yīng)符合其應(yīng)用條件;c.正確理解差別有無顯著性的意義;d. 結(jié)論不能絕對化;e.報告結(jié)論時注意應(yīng)列出檢驗統(tǒng)計量值, 注明采用的是單側(cè)或雙側(cè)檢驗,寫出報告，P值的確切范圍,8.可信區(qū)間和假設(shè)檢驗的關(guān)系,,Analysis of variance,,yulan21cn@yahoo.com.cn,outline

68、,,application：testing differences between two means and more than two meansHypothesis test of regression equation,方差分析的基本思想1. 總變異=組內(nèi)變異+組間變異總變異：隨機(jī)測量誤差+個體變異+處理因素作用組內(nèi)變異：隨機(jī)測量誤差+個體之間變異組間變異：隨機(jī)測量誤差+個體之間變異+處理因素作用 F=組間

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

衛(wèi)生統(tǒng)計學(xué)課件( health statistic)

文檔簡介

溫馨提示

最新文檔

評論

衛(wèi)生統(tǒng)計學(xué)課件( health statistic)

文檔簡介

溫馨提示

最新文檔

評論

免費下載