版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、衛(wèi)生統(tǒng)計學health statistics,南昌大學醫(yī)學院公共衛(wèi)生學院鄭輝烈ncuwstj@aliyun.com,,,,,第一章 緒論,?:本章第一節(jié),第二節(jié)作為課后自學材料!,統(tǒng)計學(statistics):指處理數(shù)據(jù)中變異性的科學與藝術,內容包括數(shù)據(jù)的收集(collection)、分析(analysis)、解釋(interpretation)和 表達(presentation),目的是求得可靠的結果。,概述,也可理解
2、為是研究數(shù)據(jù)的收集、整理、分析和推斷的一門科學。,根據(jù)研究領域和研究對象的不同,統(tǒng)計學又分為:數(shù)理統(tǒng)計、經(jīng)濟統(tǒng)計、生物統(tǒng)計、衛(wèi)生統(tǒng)計、醫(yī)學統(tǒng)計……醫(yī)學統(tǒng)計學(medical statistics):用統(tǒng)計學的原理和方法研究醫(yī)學中的問題。衛(wèi)生統(tǒng)計學(health statistics):與醫(yī)學統(tǒng)計學基本相同,但更側重于社會、人群的衛(wèi)生問題。,,發(fā)現(xiàn)不確定現(xiàn)象(隨機現(xiàn)象)背后隱藏的規(guī)律。,為什么要學習統(tǒng)計學?,變異(variatio
3、n)是個體間存在的差異,是絕對的,是社會和生物醫(yī)學中的普遍現(xiàn)象。變異使得實驗或觀察的結果具有不確定性,如每個人的身高、體重、血壓等各有不同。,最大值=6.18, 最小值=3.29, 極差=2.89,用統(tǒng)計學思維方式考慮有關醫(yī)學研究中的問題,“陽性”結果是否是虛假聯(lián)系? 某感冒藥治療1周后,治愈率為90%,能否說該感冒藥十分有效?,“陰性”結果是否是樣本含量不足? 有人曾對發(fā)表在Lancet, N Engl
4、J Med,JAMA等著名醫(yī)學雜志上的71篇陰性結果的論文作過分析,發(fā)現(xiàn)其中有62篇(93%)可能是由于樣本含量不足造成的假陰性。,有助于論文撰寫過程中統(tǒng)計方法的正確應用,據(jù)國外60~80年代對不同醫(yī)學雜志發(fā)表論文的調查,有統(tǒng)計錯誤的論文的百分比最高達72%,最低也有20%。 國內1984年對《中華醫(yī)學雜志》、《中華內科雜志》、《中華外科雜志》、《中華婦產(chǎn)科雜志》、《中華兒科雜志》595篇論文的調查結果,相對數(shù)誤用為1
5、1.2%,抽樣方法誤用15.9%,統(tǒng)計圖表誤用11.7%。 某研究者1996年對4586篇論文統(tǒng)計(中華醫(yī)學會系列雜志僅占6.9%),數(shù)據(jù)分析方法誤用達55.7%。,獲得循證醫(yī)學證據(jù)的主要手段,“良好愿望的醫(yī)學”(well-meaning medicine) 轉入“以證據(jù)為基礎的醫(yī)學”(evidence-based medicine,EBM)需要有統(tǒng)計學方法的支持。 全世界的醫(yī)學期刊每年大約刊登600萬學術論
6、文,但能作為可靠“證據(jù)”的論文并不多。,工作生活中常見的統(tǒng)計學問題,如何判斷藥物的療效?明天是否下雨?彩票能否中獎?子女為什么與父母相似,其強度有多大?民意測驗是如何進行的?市場調查的可信性有多大?,假設檢驗,概率論,相關與回歸,現(xiàn)場調查,抽樣設計,關于衛(wèi)生統(tǒng)計學的學習,為什么大家認為統(tǒng)計學難學? 特點:抽象,復雜,枯燥難,為什么還要學習? 怎樣學習衛(wèi)生統(tǒng)計學? 結合具體案例多練習!,醫(yī)學統(tǒng)計資料的來源與分類
7、,一、原始統(tǒng)計數(shù)據(jù)的來源,常規(guī)保存數(shù)據(jù) 醫(yī)院信息系統(tǒng)(HIS)、統(tǒng)計報表等現(xiàn)場調查記錄實驗記錄其他,二、統(tǒng)計數(shù)據(jù)的分類 只有認識了數(shù)據(jù)的特點,才能正確地選用統(tǒng)計分析方法。,變量及變量值的概念,研究者對每個觀察單位的某項特征進行觀察和測量,這種特征稱為變量,變量的測得值值叫變量值(也叫觀察值),全部變量值的集合也稱為資料。,變量的分類,定量 (quantitative)變量離散型變量(discrete var
8、iable)連續(xù)型變量(continuous variable),定性 (qualitative)變量分類變量(categorical variable)有序變量/等級變量(ordinal/ranked variable),按變量值的性質可將資料分為:,定性資料(qualitative) 定性變量中分類變量的觀察結果定量資料(quantitative) 定量變量的觀察結果等級資料(ranked) 定性
9、變量中有序/等級變量的觀察結果,定義: 將全體觀測單位按照某種性質或特征分組,然后再分別清點各組觀察單位的個數(shù)。特點: 沒有度量衡單位,多為間斷性資料,通 過枚舉或記數(shù)得來。可分為二項與多項定性資料。,定性資料(分類資料、分類變量),定量資料(計量資料、數(shù)值變量),定義: 通過度量衡的方法,測量每一個觀察單位的某項研究指標的量的大小,得到的一系列數(shù)據(jù)資料。例如:體重與身高特點:
10、 表現(xiàn)為數(shù)值大小,有度量衡單位,多為連續(xù)性資料,通過測量得到。,定義: 介于定量(計量)資料和定性(計數(shù))資料之間的一種資料,通過半定量方法測量得到。特點: 每一個觀察單位沒有確切值各組之間有性質上的差別或程度上的不同。,等級資料(有序變量),例如:檢查尿蛋白,觀察單位是每一份尿標本,按結果等級不同可分為-、+、++、 +++ 、++++等。,定性數(shù)據(jù)(qualitative data
11、) 分類數(shù)據(jù)(二項或多項)(categorical data) 計數(shù)數(shù)據(jù)(enumeration /counting data) 定量數(shù)據(jù)(quantitative data) 計量數(shù)據(jù)(measurement data) 區(qū)間數(shù)據(jù)(interval data)
12、 數(shù)值數(shù)據(jù)(numerical data)等級資料(ranked data) 有序資料(ordinal data),定性與定量數(shù)據(jù)的別名,<8 低血壓 8? 正常血壓 12? 輕度高血壓 15? 中度高血壓 17? 重度高血壓,三類數(shù)據(jù)間的關系,例如:一組20?40歲成年人的血壓(變量),以12kPa為界分為正常與異常兩組,統(tǒng)計每組例數(shù),三類
13、數(shù)據(jù)的編碼,例:一組20?40歲成年人的血壓,以12kPa為界分為正常(=0)與異常(=1)兩組,統(tǒng)計每組例數(shù)。,<8 低血壓 1 8? 正常血壓 2 12? 輕度高血壓 3 15? 中度高血壓 4 17? 重度高血壓 5,三類數(shù)據(jù)的計算分析,定量數(shù)據(jù):允許計算均數(shù)、標準差等(可采用t、F檢驗等,可當做有序或定性數(shù)據(jù)處理)。定性數(shù)據(jù):編碼是任
14、意的,不能對編碼執(zhí)行均數(shù)標準差等計算,但可計算率或比(可采用卡方檢驗等)。 調查14名男子的婚姻狀況,有序數(shù)據(jù):允許 基于順序的計算,如計算中位數(shù)、百分位數(shù)(可當做定性數(shù)據(jù)處理)。,統(tǒng)計學中常用的幾個基本概念,總體與樣本抽樣方法同質與變異誤差頻率與概率 參數(shù)與統(tǒng)計量,總體與樣本(population & sample),總體:根據(jù)研究目的確定的同質的、所有觀察單位的某種變量值的集合。,例:2013級撫州醫(yī)學院
15、本科女生身高; 2014年撫州醫(yī)學院大學生的身高;,總體的分類,有限總體:理論上說,觀察單位的數(shù)量是可知的、有限的。無限總體:沒有時間和地點的限制,觀察單位總數(shù)量是不可知的。 目標總體? 研究總體?,鑒于總體的巨大或不可知性,能否研究其中的一部分?,不可能或沒有必要對全體中的每一個對象進行研究,樣本(sample),概念:從總體中隨機抽取的、具有代表性的部分研究對象,其實測值的集合。,如何從總體中得到有代
16、表性的一部分?得到多少合適呢?,The relationship between the population and the sample,In research, we are usually interested in a broad population, but we can observe only a small sample from the population. After making observations
17、of our sample, we draw inferences about the population, based on the sample. This inferential process works well as long as the sample is reasonablyrepresentative of the population.,Fig.1-2 The relationship between the
18、population and the sample,隨機抽樣 (random sampling),為了保證樣本的可靠性和代表性,需要采用隨機的方法抽取樣本(在總體中每個個體具有相同的機會被抽到樣本中)。,能否成功的達到從樣本推斷總體的目的,關鍵是抽樣方法,樣本的代表性和推斷的技術,這些是統(tǒng)計學的核心內容。,隨機抽樣的過程,概率(隨機)抽樣,,,,,等概率抽樣,非等概率抽樣,,,,簡單隨機抽樣,,系統(tǒng)抽樣,,分層抽樣,,整群抽樣,抽樣方法
19、分類,同質與變異,同質與變異: 研究對象具有的相同的狀況或屬性等共性稱同質或同質性;對于同質的各觀察單位,其某變量值之間的差異,稱為變異。,同質事物個體間的差異來源于一些未加控制或無法控制的甚至不明原因的因素。,,例如:研究某新藥治療胃潰瘍的效果,所有研究對象都必須是確診為胃潰瘍的病人且病情相似,在這種同質的基礎上觀察治療效果,有的人治愈,有的人未愈,這種差異就是變異。,從本質上說,統(tǒng)計學就是研究變異的科學!,誤差,定義
20、: 統(tǒng)計上所說的誤差泛指測量值與真值之差,樣本指標與總體指標之差。主要有以下二種: 系統(tǒng)誤差 隨機誤差,系統(tǒng)誤差: 指數(shù)據(jù)搜集和測量過程中由于儀器不準確、標準不規(guī)范等原因,造成觀察結果呈傾向性的偏大或偏小,這種誤差稱為系統(tǒng)誤差。特點: 具有累加性,隨機誤差: 由于一些非人為的偶然因素使得結果或大或小,是不確定
21、、不可預知的。特點:隨測量次數(shù)增加而減小。(以隨機測量誤差、抽樣誤差為代表),在消除了系統(tǒng)誤差的前提下,由于非人為的偶然因素,對于同一樣本多次測定結果不完全一樣,結果有時偏大有時偏小,沒有傾向性,這種誤差叫隨機測量誤差。特點:沒有傾向性,多次測量計算平均值可以減 小甚至消除隨機測量誤差。,隨機測量誤差,由于抽樣原因造成的樣本指標與總體指標之間的差別。,抽樣誤差,特點:有抽樣發(fā)生抽樣誤差就不可避免。統(tǒng)計上
22、可以計算并在一定范圍內控制抽樣誤差。,改進抽樣方法,增加樣本的代表性; 樣本量 n 相等的情況下: 整群抽樣>單純隨機抽樣>系統(tǒng)抽樣>分層抽樣增加樣本量n ;選擇變異程度較小的研究指標。,減少抽樣誤差的方法,頻率:樣本的實際發(fā)生率稱為頻率。設在相同條件下,獨立重復進行n次試驗, 事件A出現(xiàn)m次,則事件A出現(xiàn)的頻率 為f = m /n。概率:隨機事件發(fā)生的可能性大小,用大寫 的P 表示;取值[0,1]
23、。,,頻率與概率 (frequency and probability),必然事件 P=1隨機事件 0 <P< 1不可能事件 P=0,三種類型事件,統(tǒng)計學習慣上把P≤0.05(5%)或P≤0.01(1%)的隨機事件稱為小概率事件,認為不大可能發(fā)生。因此,我們可以憑經(jīng)驗判斷小概率事件在一次隨機試驗中不發(fā)生。這一判斷準則被稱為小概率事件的經(jīng)驗判斷準則!,課堂提問
24、 大家能成為同班同學這件事發(fā)生的概率是大還是???,頻率與概率間的關系,樣本頻率總是圍繞概率上下波動;樣本含量n越大,波動幅度越小,頻率越接近概率。,參數(shù)與統(tǒng)計量(parameter and statistic),參數(shù):總體的統(tǒng)計指標,如總體均數(shù)、總體標準差,分別用希臘字母記為?、σ,為固定的常數(shù)。,統(tǒng)計量:樣本的統(tǒng)計指標,如樣本均數(shù)、標準差,采用拉丁字母分別記為 ,其為在參數(shù)附近波動的隨機變量 。,一、研究設
25、計二、搜集資料三、整理資料四、分析資料五、結果表達,統(tǒng)計工作的基本步驟,設計的內容包括資料的收集、整理和分析全過程的設想和安排。常有下列兩種情形:調查設計(survey design) 對研究對象不施加任何干預, 通常建立隨機抽樣(random sampling)方案。實驗設計(experiment design) 對研究對象施加干預,如動物實驗研究、臨床試驗, 通常建立隨機分組(random
26、 allocation)方案。,一、研究設計,隨機化(randomization)對照(control)重復(replication),實驗設計的三個基本原則,Fisher 在他的著作中多次強調,統(tǒng)計學家與科學研究者的合作應該在實驗設計階段,而不是在需要數(shù)據(jù)處理的時候。,“試驗完成后再找統(tǒng)計學家,無異于請統(tǒng)計學家為試驗進行“尸體解剖”。 統(tǒng)計學家或許只能告訴你試驗失敗的原因。,研究的成敗,始于設計!,收集資料(data collec
27、tion),收集資料要遵循完整、準確、及時三個原則。 衛(wèi)生工作中統(tǒng)計資料主要來源于三個方面:統(tǒng)計報表:由國家統(tǒng)一設計,要求醫(yī)療衛(wèi)生機構 定 期逐級上報。如傳染病防治法。經(jīng)常性工作記錄:如經(jīng)常性衛(wèi)生監(jiān)測記錄等。專題調查和實驗,我們常把前兩個來源稱經(jīng)常性資料,后者稱為一時性資料。,整理資料(sorting data),目的是將搜集到的原始資料系統(tǒng)化、條理化,便于進一步計算與分析。主要包括:
28、編碼,將數(shù)據(jù)輸入計算機糾錯改錯、補漏等,分析資料(data analysis),運用各種統(tǒng)計分析方法,結合專業(yè)知識,從經(jīng)過整理的資料中,計算出各種指標,進行統(tǒng)計描述和統(tǒng)計推斷,反映數(shù)據(jù)的綜合特征,闡明事物的內在聯(lián)系與規(guī)律。,統(tǒng)計描述(descriptive statistics):指用統(tǒng)計指標、統(tǒng)計表、統(tǒng)計圖等方法對資料的數(shù)量特征及分布規(guī)律進行測定和描述。統(tǒng)計推斷(inferential statistics) : 指如何抽樣,以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 衛(wèi)生統(tǒng)計學潘海燕衛(wèi)生統(tǒng)計學第章卡方檢驗
- 劉超-簡明應用統(tǒng)計學-第2版-第1章-統(tǒng)計學緒論
- 第一章衛(wèi)生統(tǒng)計學-緒論
- 衛(wèi)生統(tǒng)計學衛(wèi)生統(tǒng)計學 (35)
- 衛(wèi)生統(tǒng)計學衛(wèi)生統(tǒng)計學 (10)
- 衛(wèi)生統(tǒng)計學衛(wèi)生統(tǒng)計學 (37)
- 統(tǒng)計學第1章
- 衛(wèi)生統(tǒng)計學
- 衛(wèi)生統(tǒng)計學
- 衛(wèi)生統(tǒng)計學
- 衛(wèi)生統(tǒng)計學 醫(yī)學統(tǒng)計學 習題
- 衛(wèi)生統(tǒng)計學題庫
- 衛(wèi)生統(tǒng)計學課件
- 衛(wèi)生統(tǒng)計學題庫
- 衛(wèi)生統(tǒng)計學題庫
- 衛(wèi)生統(tǒng)計學復習20161225
- 實用衛(wèi)生統(tǒng)計學作業(yè)
- 衛(wèi)生統(tǒng)計學課程簡介
- 衛(wèi)生統(tǒng)計學試題及答案1
- 1衛(wèi)生統(tǒng)計學01-03
評論
0/150
提交評論