2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩83頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計(jì)學(xué)基礎(chǔ)知識,一.醫(yī)學(xué)統(tǒng)計(jì)學(xué)的意義,1.統(tǒng)計(jì)學(xué)(statistics):應(yīng)用數(shù)學(xué)的原理與方法,研究數(shù)據(jù)的搜集、整理與分析的科學(xué),對不確定性數(shù)據(jù)作出科學(xué)的推斷。2.醫(yī)學(xué)統(tǒng)計(jì)學(xué)(statistics of medicine):應(yīng)用統(tǒng)計(jì)學(xué)的原理與方法進(jìn)行醫(yī)學(xué)科研與實(shí)踐。,3.統(tǒng)計(jì)學(xué)方法的特點(diǎn): (1)用數(shù)量反映質(zhì)量 1)體格檢查(量血壓、脈搏…)→個體健康質(zhì)量 2)考試分?jǐn)?shù)→個體學(xué)習(xí)質(zhì)量 3)期望壽命→

2、反映人群健康狀況 4)嬰兒死亡率→反映衛(wèi)生服務(wù)質(zhì)量,(2)用群體歸納個體2011年長沙市7歲男孩有多高?7歲男孩身高有高有矮,平均身高=119.5cm95%的長沙市7歲男孩的身高在110.20cm~129.20cm之間,二、基本概念,1、研究單位(觀察單位、unit)、變量(variable)、變量值(value of variable) (1)研究單位(unit):研究中的個體。如:研究2011年長沙市7歲

3、男孩身高的正常值范圍 1個人 測得的身高值(120.2cm,118.6cm,121.8cm,…),2、同質(zhì)(homogeneity)和變異(variation)研究長沙市2011年7歲男孩身高的正常值范圍?同質(zhì):同長沙市、7歲、男孩、無影響身高的疾病。變異:長沙市2011年7歲男孩身高有高有矮,3、總體(population)和樣本(sample)(1)總體:是根據(jù)研究目的確定的

4、同質(zhì)研究單位的全體。更確切地說是同質(zhì)研究單位某種變量值的集合。例如:調(diào)查某地2011年正常成年男子的紅細(xì)胞數(shù)的正常值范圍。 總體:1)某地所有的正常成年男子 2)某地所有的正常成年男子的紅細(xì)胞數(shù),1)有限總體(finite population):研究單位數(shù)是有限的。例如:調(diào)查某地2011年正常成年男子的紅細(xì)胞數(shù)的正常值范圍。2)無限總體(infinite population):研究單位數(shù)是無限的。例如

5、:高血壓患者←無時(shí)間、空間限制。,(2)樣本(sample):是總體中抽取的有代表性的一部分。 注意:隨機(jī)抽樣(無主觀性) 樣本含量(sample size):樣本中包含的研究單位數(shù)。 例如:某藥治療高血壓患者30名 樣本含量(n)為30,4、參數(shù)(parameter)和統(tǒng)計(jì)量(statistic)(1)參數(shù):根據(jù)總體個體值統(tǒng)計(jì)計(jì)算出來的描述總體的特征量。一般用希臘字母表示(2

6、)統(tǒng)計(jì)量:根據(jù)樣本個體值統(tǒng)計(jì)計(jì)算出來的描述樣本的特征量。一般用拉丁字母表示,總體參數(shù)一般是不知道的統(tǒng)計(jì)學(xué)抽樣研究的目的就是: 樣本統(tǒng)計(jì)量→總體參數(shù)5、抽樣誤差由于抽樣原因所造成的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差別。 特點(diǎn):1)抽樣誤差是不可避免; 2)有統(tǒng)計(jì)規(guī)律性。 產(chǎn)生原因:個體差異(生物變異),6、頻率(frequency)、概率(probability)、小概率事件(1)頻

7、率: 一次隨機(jī)試驗(yàn)出現(xiàn)各種可能結(jié)果的比例。例如,投擲一枚硬幣,結(jié)果不外乎出現(xiàn)“正面”與“反面”兩種,在重復(fù)多次后,出現(xiàn)“正面” 或“反面”這個結(jié)果的比例稱之為頻率。,(2)概率(probability) 概率是度量隨機(jī)事件發(fā)生可能性大小的一個數(shù)值。 頻率是就樣本而言的,而概率從總體的意義上說的。,0< P(A) <1 隨機(jī)事件 P(A)=1 必然事件

8、 P(A)=0 不可能事件。,(3)小概率事件:統(tǒng)計(jì)分析中的很多結(jié)論都基于一定置信程度下的概率推斷,習(xí)慣上將 稱為小概率事件。,湖南風(fēng)采:中獎概率大約為: 1/671萬交通事故:發(fā)生概率為:1/20萬,三、統(tǒng)計(jì)資料的類型,變量與統(tǒng)計(jì)資料的分類方法概述 數(shù)值變量…………..構(gòu)成計(jì)量資料 分類變量

9、 無序分類變量………構(gòu)成計(jì)數(shù)資料 有序分類變量………構(gòu)成等級資料,,,2. 數(shù)值變量與計(jì)量資料1) 數(shù)值變量(numerical variable) :變量值是定量的,表現(xiàn)為數(shù)值大小,一般有度量衡單位。如:身高(cm)、體重(kg)。 2) 計(jì)量資料(measurement data) :由一群個體的數(shù)值變量值構(gòu)成的資料,即一群變量值。 如:長沙市2011年7歲男孩身高值(118.6cm,121

10、.8cm…),3.無序分類變量與計(jì)數(shù)資料1)無序分類變量(unordered categories variable):變量值是定性的,有類別。 特點(diǎn):類別是客觀存在的,各類無秩序,可任意排列;類與類之間界限清楚,(理論上)不會錯判。 如:性別:男、女。 血型:O、A、B、AB。2)計(jì)數(shù)資料(enumeration data):一群個體按無序分類變量的類別清點(diǎn)每類有多少個個體

11、,即分類個體數(shù)。 如:某人群性別構(gòu)成:男:6, 女:7。 某人群血型構(gòu)成:O:20, A:35, B:30, AB:15,4.有序分類變量與等級資料1)有序分類變量(ordinal categories variable) :變量值是定性的、 分等級。 特點(diǎn):等級是主觀劃分的,各級有秩序,從低到高或由高到低;級和級之間界限模糊,可能錯判。 如:療效:無效、好轉(zhuǎn)、顯效、治愈。

12、 血清反應(yīng):–、+、++2)等級資料(ranked data):一群個體按有序分類變量的級別清點(diǎn)每級有多少個個體,即分級個體數(shù)。 如:某地某人群EB病毒抗體反應(yīng): –:65, +:5, ++:6,1.專業(yè)設(shè)計(jì):選題、建立假說、確定研究對象和技術(shù)方法等2.統(tǒng)計(jì)設(shè)計(jì):圍繞專業(yè)設(shè)計(jì)確定統(tǒng)計(jì)設(shè)類型、樣本大小、分組方法、統(tǒng)計(jì)分析指標(biāo)及統(tǒng)計(jì)分析方法。,四、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟,設(shè)計(jì),統(tǒng)計(jì)設(shè)計(jì)

13、的內(nèi)容包括資料的搜集、整理和分析全過和的設(shè)想和安排。例如:研究目的和假說? 研究對象和研究單位? 研究因素(變量)? 搜集哪些原始資料? 用什么方式和方法取得這些原始資料? 怎樣整理匯總和計(jì)算統(tǒng)計(jì)指標(biāo)? 如何控制誤差? 預(yù)期會得到什么結(jié)果? 需要多少經(jīng)費(fèi)?,統(tǒng),,(一)資料來源第一手資料 ① 經(jīng)常性:統(tǒng)

14、計(jì)報(bào)表(死亡登記、疫情報(bào)告等),工作記錄(病歷、化驗(yàn)); ② 一時(shí)性:專題調(diào)查、實(shí)驗(yàn)或臨床試驗(yàn)。第二手資料:已公布的資料,如數(shù)據(jù)銀行、全國、全省衛(wèi)生統(tǒng)計(jì)資料。,收集資料,,分析資料 1.統(tǒng)計(jì)描述:用統(tǒng)計(jì)指標(biāo)、統(tǒng)計(jì)圖表對資料的數(shù)量特征及分布規(guī)律進(jìn)行測定和描述。 2.統(tǒng)計(jì)推斷:用樣本信息推斷總體特征: ①參數(shù)估計(jì) ②假設(shè)檢驗(yàn)。 工具:1)foxbase數(shù)據(jù)庫 2)spss

15、 3)SAS,五、數(shù)值變量資料的統(tǒng)計(jì)描述,頻數(shù)分布表(frequency table) :例 從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇的測量結(jié)果如下,試編制頻數(shù)分布表。,,,,,頻數(shù)表,頻數(shù)分布圖,,統(tǒng)計(jì)圖:指利用點(diǎn)的位置、線段的升降、直條的長短和面積的大小等各種幾何圖形來表達(dá)統(tǒng)計(jì)資料。統(tǒng)計(jì)圖只能提供概略的情況,而不能獲得確切數(shù)值,因此不能完全代替統(tǒng)計(jì)表,常需要同時(shí)列出統(tǒng)計(jì)表作為統(tǒng)計(jì)圖的數(shù)值

16、依據(jù)。,統(tǒng)計(jì)圖,統(tǒng)計(jì)圖的結(jié)構(gòu),標(biāo)題:用于簡明扼要地說明資料的內(nèi)容,一般位于圖的下方中央位置。圖域:即制圖空間,是整個統(tǒng)計(jì)圖的視覺中心。除圓圖外,一般都是存在于特定的坐標(biāo)體系下。標(biāo)目:分為縱標(biāo)目和橫標(biāo)目,表示坐標(biāo)系下縱軸與橫軸的含義。圖例:用于識別比較的統(tǒng)計(jì)圖中各種圖形所代表的含義??潭龋杭纯v軸和橫軸上的坐標(biāo)??潭葦?shù)值按從小到大的順序,縱軸由下向上,橫軸由左向右排列。,常用的統(tǒng)計(jì)圖,直條圖百分條圖圓圖線圖半對數(shù)線圖直方圖

17、散點(diǎn)圖,直條圖/條圖,圖12-1 某省1979年四個地區(qū)脊髓灰質(zhì)炎發(fā)病率,圖12-2 某地1952年與1972年三種疾病死亡率比較,圖12-4 復(fù)方豬膽囊治療單純型老年性氣管炎療效,圖12-5 20世紀(jì)70年代和80年代某地7常見惡性腫瘤發(fā)病構(gòu)成比較,圖12-6 某地1968-1974年結(jié)核病死亡率比較,圖12-7 某地1949-1958年白喉、傷寒、副傷寒死亡率比較(普通線圖),圖12-8 某地1949-

18、1958年白喉、傷寒、副傷寒死亡率比較(半對數(shù)線圖),請注意:在普通線圖中,白喉死亡率線條的坡度比傷寒、副傷寒死亡率線條下降的陡峭,只能說明兩種疾病的死亡率逐年變化幅度不同,不能錯認(rèn)為白喉死亡率的下降速度比傷寒、副傷寒死亡率的下降速度快。在半對數(shù)線圖中就不會出現(xiàn)這種錯覺。,頻數(shù),,紅細(xì)胞數(shù)(×1012/L),圖12-9 140名正常男子紅細(xì)胞計(jì)數(shù)的直方圖,,圖12-10 1997年某地乙型病毒性腦膜炎病例的年齡分布,

19、1 2 3 4 5 6 7 8 9 10~ 15~ 2 0~ 25~ 30~ 35~,,年齡(歲),散點(diǎn)圖(scatter chart),散點(diǎn)圖:使用點(diǎn)的密集程度和趨勢來表示兩種指標(biāo)或變量間的相關(guān)關(guān)系。,圖10-12 12名女大學(xué)生身高與體重散點(diǎn)圖,(一)平

20、均指標(biāo),1.算術(shù)均數(shù)(mean):可用于反映一組呈對稱分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征。,適用范圍:對稱分布,尤其正態(tài)分布,計(jì)量資料的描述指標(biāo),計(jì)算方法,,例 :從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇( )的測量結(jié)果如下:,,2.中位數(shù)中位數(shù)(median):是將變量值從小到大按順序排列,位置(位次)居于中間的那個變量值。1,3,7,5,>100

21、中位數(shù)為多少?,n為奇數(shù)時(shí) n為偶數(shù)時(shí),例 7名病人患某病的潛伏期分別為2,3,4,5,6,9,16天,求其中位數(shù)。,本例n=7,為奇數(shù) 例8名患者食物中毒的潛伏期分別為1,2,2,3,5,8,15,24小時(shí),求其中位數(shù)。本例n=8,為偶數(shù),應(yīng)用,適用于:1、各種分布類型的資料 2、特別是偏態(tài)分布資料和開口資料(一端或兩端無確切數(shù)值的資料)。,3、幾何均數(shù),幾何均數(shù)(geometric mean):可用

22、于反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的變量值在數(shù)量上的平均水平。計(jì)算方法,例 某地5例微絲蚴血癥患者治療七年后用間接熒光抗體試驗(yàn)測得其抗體滴度倒數(shù)分別為,10,20,40,40,160,求幾何均數(shù)。,適用于成等比級數(shù)的資料,特別是對數(shù)正態(tài)分布資料。,(二)變異指標(biāo),例 三組同齡男孩的身高值(cm),1. 極差極差(R):即一組變量值最大值與最小值之差。,,2.方差(variance)也稱均方差,即將離均差平方和用樣本含量n

23、 取平均,可反映一組數(shù)據(jù)的平均離散水平。總體方差-- ,樣本方差-- 。,,樣本標(biāo)準(zhǔn)差用s 表示 公式:,3.標(biāo)準(zhǔn)差,計(jì)算三組資料的標(biāo)準(zhǔn)差,甲組:,4、百分位數(shù),百分位數(shù)(percentile)是一種位置指標(biāo)。一個百分位數(shù) 將全部變量值分為兩部分,在不包含的全部變量值中有 的變量值比它小, 變量值比它大。,變異系數(shù)(coefficient of variation,CV),多用于觀察指標(biāo)單位不同時(shí),

24、如身高與體重的變異程度的比較;或均數(shù)相差較大時(shí),如兒童身高與成人身高變異程度的比較。,5. 變異系數(shù),例:某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71cm;體重均數(shù)為22.59kg,標(biāo)準(zhǔn)差為2.26kg, 比較其變異度?,第五章 計(jì)數(shù)資料的統(tǒng)計(jì)描述,常用的相對數(shù):一、率。二、構(gòu)成比三、相對比,第一節(jié) 常用相對數(shù),一、率率:說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。 常以百分率(%)、千分率(‰)、萬分率

25、(1/萬)、十萬分率(1/10萬)等表示,計(jì)算公式為:,例5-1 某醫(yī)院1998年在某城區(qū)隨機(jī)調(diào)查了8589例60歲及以上老人,體檢發(fā)現(xiàn)高血壓患者為2823例。高血壓患病率為:2823 / 8589 ? 100% = 32.87% 。,,2、構(gòu)成比構(gòu)成比:表示事物內(nèi)部某一部分的個體數(shù)與該事物各部分個體數(shù)的總和之比,用來說明各構(gòu)成部分在總體中所占的比重或分布。通常以100%為比例基數(shù)。其計(jì)算公式為,例7-22某正常人的白細(xì)胞分類

26、計(jì)數(shù),三、相對比相對比簡稱比(ratio),是兩個有關(guān)指標(biāo)之比,說明兩指標(biāo)間的比例關(guān)系。兩個指標(biāo)可以是性質(zhì)相同,如不同時(shí)期發(fā)病數(shù)之比;也可以性質(zhì)不同,如醫(yī)院的門診人次與病床數(shù)之比。通常以倍數(shù)或百分?jǐn)?shù)(%)表示。,,例5-3 某年某醫(yī)院出生嬰兒中,男性嬰兒為370人,女性嬰兒為358人,則出生嬰兒性別比例為370/358×100 = 103,說明該醫(yī)院該年每出生100名女嬰兒,就有103名男性嬰兒出生,它反映了男性嬰兒與女

27、性嬰兒出生的對比水平。,,第二節(jié) 應(yīng)用相對數(shù)的注意事項(xiàng),1、計(jì)算相對數(shù)應(yīng)有足夠數(shù)量即分母不宜太小。 如果例數(shù)較少會使相對數(shù)波動較大。如某種療法治療5例病人5例全部治愈,則計(jì)算治愈率為5/5×100% =100%,若4例治愈,則治愈率為4/5×100% =80%,由100%至80%波動幅度較大,但實(shí)際上只有1例的變化。在臨床試驗(yàn)或流行病調(diào)查中,各種偶然因素都可能導(dǎo)致計(jì)算結(jié)果的較大變化,因此例數(shù)很少的情況下最好用絕對數(shù)

28、直接表示。,2、不能以構(gòu)成比代替率構(gòu)成比是用以說明事物內(nèi)部某種構(gòu)成所占比重或分布,并不說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度,在實(shí)際工作中經(jīng)常會出現(xiàn)將構(gòu)成比指標(biāo)按率的概念去解釋的錯誤例如表5-2研究已婚育齡婦女在不同情況下放置避孕環(huán)與失敗率的關(guān)系。,,,3.正確計(jì)算合計(jì)率對分組資料計(jì)算合計(jì)率或稱平均率時(shí),不能簡單地由各組率相加或平均而得,而應(yīng)用合計(jì)的有關(guān)實(shí)際數(shù)字進(jìn)行計(jì)算。例如用某療法治療肝炎,甲醫(yī)院治療150人,治愈30人,治愈率為20%;乙醫(yī)

29、院治療100人,治愈30人,治愈率為30%。兩個醫(yī)院合計(jì)治愈率應(yīng)該是[(30+30)/(150+100)]×100%=24%。若算為20%+30%=50%或(20% +30%)/2=25%,則是錯的。,,4.注意資料的可比性 在比較相對數(shù)時(shí),除了要對比的因素(如不同的藥物),其余的影響因素應(yīng)盡可能相同或相近。在臨床研究和動物實(shí)驗(yàn)時(shí),應(yīng)遵循隨機(jī)抽樣原則進(jìn)行分組。,,5.對比不同時(shí)期資料應(yīng)注意客觀條件是否相同 例如, 疾病

30、報(bào)告制度完善和資料完整的地區(qū)或年份,發(fā)病率可以“升高”;居民因醫(yī)療普及,就診機(jī)會增加,或診斷技術(shù)提高,也會引起發(fā)病率“升高”。因此在分析討論時(shí),應(yīng)根據(jù)各方面情形全面考慮,慎重對待。6.樣本率(或構(gòu)成比)的比較應(yīng)做樣本率(或構(gòu)成比)假設(shè)檢驗(yàn)。,,假設(shè)檢驗(yàn)過去稱顯著性檢驗(yàn)。它是利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量,最后獲得P值來判斷。,七、統(tǒng)計(jì)推斷,例3

31、-5 某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標(biāo)準(zhǔn)差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?130.83g/L ≠140g/L原因: 1.可能是總體均數(shù)不同 2.是抽樣造成的,假設(shè)檢驗(yàn)應(yīng)注意的問題(1)要有嚴(yán)密的研究設(shè)計(jì) 這是假設(shè)檢驗(yàn)的前提。組間應(yīng)均衡,具有可比性,也就是除對比的主要因素(如臨床試驗(yàn)用新藥和對照藥)

32、外,其它可能影響結(jié)果的因素(如年齡、性別、病程、病情輕重等)在對比組間應(yīng)相同或相近。保證均衡性的方法主要是從同質(zhì)總體中隨機(jī)抽取樣本,或隨機(jī)分配樣本。,(2)變量變換,常用的變量變換有對數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等。,(3)合理選用檢驗(yàn)方法 應(yīng)根據(jù)分析目的、資料類型以及分布、設(shè)計(jì)方案的種類、樣本含量大小等選用適當(dāng)?shù)臋z驗(yàn)方法。,(4)正確理解“顯著性”一詞的含義 差別有或無統(tǒng)計(jì)學(xué)意義,過去稱差別有或無“顯著性

33、”,是對樣本統(tǒng)計(jì)量與總體參數(shù)或樣本統(tǒng)計(jì)量之間的比較而言,相應(yīng)推斷為:可以認(rèn)為或還不能認(rèn)為兩個或多個總體參數(shù)有差別。,(5)結(jié)論不能絕對化 因統(tǒng)計(jì)結(jié)論具有概率性質(zhì),故“肯定”、“一定”、“必定”等詞不要使用。在報(bào)告結(jié)論時(shí),最好列出檢驗(yàn)統(tǒng)計(jì)量的值,盡量寫出具體的P值或P值的確切范圍,如寫成P=0.040或0.02<P<0.05,而不簡單寫成P<0.05,以便讀者與同類研究進(jìn)行比較或進(jìn)行循證醫(yī)學(xué)時(shí)采用Meta分析。,(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論