版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基本內(nèi)容,,相關(guān)與回歸,第九章,用于研究和解釋變量之間相互關(guān)系的,掌握:積差相關(guān)等級(jí)相關(guān)線性回歸的概念線性回歸方程的計(jì)算回歸系數(shù)的假設(shè)檢驗(yàn)相關(guān)與回歸的區(qū)別與聯(lián)系了解:曲線擬合,教學(xué)目的和要求,重點(diǎn)講解積差相關(guān)等級(jí)相關(guān)線性回歸的概念回歸系數(shù)的假設(shè)檢驗(yàn)相關(guān)與回歸的區(qū)別與聯(lián)系介紹曲線擬合,教學(xué)內(nèi)容提要,第一節(jié) 兩變量相關(guān),,相關(guān)分析是研究客觀事物或現(xiàn)象之間關(guān)系的密切程度(不存在函數(shù)關(guān)系)。,線性相關(guān)是研究?jī)勺兞?/p>
2、之間是否存在線性關(guān)系。,為研究父親與成年兒子身高之間的關(guān)系,皮爾遜測(cè)量了1078對(duì)父子的身高。把1078對(duì)數(shù)字表示在坐標(biāo)上。X上的數(shù)代表父親身高,Y上的數(shù)代表兒子的身高。1078個(gè)點(diǎn)形成圖形是一個(gè)散點(diǎn)圖。,一、積差相關(guān),1、散點(diǎn)圖,一、積差相關(guān) 1、散點(diǎn)圖,2、 積差相關(guān)系數(shù),定量描述X與Y兩變量間直線相關(guān)方向和相關(guān)密切程度的統(tǒng)計(jì)指標(biāo)。,Pearson相關(guān)系數(shù),簡(jiǎn)稱相關(guān)系數(shù),適用于x、y都服從正態(tài)分布(稱為雙變量正態(tài)分布)的資料。
3、,積差相關(guān)系數(shù)的計(jì)算,,r 沒(méi)有單位取值范圍:-1≤r≤1,Lxy=∑XY- (∑X)(∑Y)/nLxx= ∑X2- (∑X)2/nLyy= ∑Y2- (∑Y)2/n,r的特點(diǎn)沒(méi)有單位-1≤ r ≤1 r=-1 完全負(fù)相關(guān),-1≤ r <0 負(fù)相關(guān) r= 1 完全正相關(guān), 0< r ≤1 正相關(guān) r= 0 零相關(guān),散點(diǎn)圖,【例9-1】一個(gè)產(chǎn)科醫(yī)師發(fā)現(xiàn)孕婦尿中雌三醇含量與產(chǎn)兒的體重有關(guān)。于是設(shè)想,通過(guò)測(cè)量待產(chǎn)婦尿中雌三醇
4、含量,可以預(yù)測(cè)產(chǎn)兒體重,以便對(duì)低出生體重進(jìn)行預(yù)防。因此收集了31例待產(chǎn)婦24小時(shí)的尿,測(cè)量其中的雌三醇含量,同時(shí)記錄產(chǎn)兒的體重。問(wèn)尿中雌三醇含量與產(chǎn)兒體重之間是否存在相關(guān)關(guān)系?是正相關(guān)還是負(fù)相關(guān)?,,3、積差相關(guān)分析,13,待產(chǎn)婦尿雌三醇含量與產(chǎn)兒體重關(guān)系,,,,1)繪制散點(diǎn)圖,2)積差相關(guān)系數(shù)的計(jì)算,∑X=534;∑Y=99.2;∑X2=9876 ∑Y2=324.8;∑XY=1750;,3) 相關(guān)系數(shù)的假設(shè)檢驗(yàn),上例中r =0.6
5、1,說(shuō)明了31例樣本中雌三醇含量與出生體重之間存在相關(guān)關(guān)系。但是,這31例只是總體中的一個(gè)樣本,由此得到的相關(guān)系數(shù)會(huì)存在抽樣誤差。?=0時(shí),由于抽樣誤差,可能導(dǎo)致r≠0。對(duì)r進(jìn)行假設(shè)檢驗(yàn),判斷r ≠0是由于抽樣誤差所致,還是兩個(gè)變量之間確實(shí)存在相關(guān)關(guān)系。,3) 相關(guān)系數(shù)的假設(shè)檢驗(yàn),,總體相關(guān)系數(shù)ρ=0表示總體中兩變量x和y無(wú)直線相關(guān)關(guān)系,,r 的標(biāo)準(zhǔn)誤為sr=,,,用r和自由度v=n-2,查附表18,相關(guān)系數(shù)界值表,H0:ρ=0
6、 H1:ρ≠0 ν= n-2=31-2=29查附表7, t0.0005/2,28=3.9351, t0.0002/2,28=4.2754, 0.0002< P<0.0005,拒絕H0,接受H1,認(rèn)為待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間有正相關(guān)關(guān)系。,第二節(jié) 直線回歸
7、,一、回歸方程二、回歸系數(shù)三、回歸系數(shù)的假設(shè)檢驗(yàn)四、直線回歸的應(yīng)用,一個(gè)人的快樂(lè),不是因?yàn)樗麚碛械亩?,而是因?yàn)樗?jì)較的少,休息,二、等級(jí)相關(guān)(秩相關(guān)),①不服從正態(tài)分布的資料;②總體分布類型不知的資料;③用等級(jí)或相對(duì)數(shù)表示的資料;④數(shù)據(jù)一端或兩端有不確定值的資料 用等級(jí)相關(guān)(或稱秩相關(guān))分析(屬非參數(shù)統(tǒng)計(jì)法)。,秩相關(guān)系數(shù),Spearman相關(guān)系數(shù)(rs)Kendall相關(guān)系數(shù)(rk),,用等級(jí)相關(guān)系數(shù)表示兩個(gè)變
8、量間直線關(guān)系密切程度和方向。,先分別將兩個(gè)變量按原始數(shù)值由小到大編秩(遇相同觀察值時(shí)取平均秩),計(jì)算每對(duì)觀察值的秩之差d。,n為對(duì)子數(shù);d為配對(duì)秩次之差;Tx(或Ty)=Σ(tj3-tj)/12;tj為x(或y)中第j個(gè)相同秩次的個(gè)數(shù)。查附表19確定P的大小。,1)Spearman相關(guān)系數(shù)(rs),【例9-2】 12名2~7歲急性白血病患兒的血小板數(shù)與出血癥狀資料見(jiàn)下表,分析兩者之間有無(wú)直線關(guān)系:,H0:ρ=0,H1:ρ≠0,查統(tǒng)計(jì)用
9、附表19,r0.05/2 (12)=0.587,P>0.05不能以?=0.05水準(zhǔn)拒絕H0,不能認(rèn)為2~7歲急性白血病患兒的血小板數(shù)與出血癥狀之間有直線相關(guān)關(guān)系。,2)Kendall相關(guān)系數(shù),在X的秩從小到大排列后,計(jì)算配對(duì)的Y每個(gè)秩下面更大者的個(gè)數(shù),合計(jì)值記為S,計(jì)算rK并在相同秩次較多時(shí)校正:,,其中,n為對(duì)子數(shù),Ux或Uy=∑(tj2-tj)/2,tj為第j個(gè)相同秩次的個(gè)數(shù)。查附表20確定P的大小。,三、相關(guān)系數(shù)應(yīng)用注意事項(xiàng)
10、有實(shí)際意義在兩個(gè)變量的變化范圍內(nèi)進(jìn)行相關(guān)不是因果關(guān)系,但可做為進(jìn)一步考證有無(wú)因果關(guān)系的基礎(chǔ),四、直線相關(guān)的應(yīng)用,一般說(shuō)來(lái),當(dāng)n>100,并對(duì)r進(jìn)行假設(shè)檢驗(yàn),有統(tǒng)計(jì)學(xué)意義時(shí):∣r∣>0.7,則表示兩個(gè)變量高度相關(guān);0.4<∣r∣≤0.7時(shí),則表示兩個(gè)變量之間中度相關(guān);0.2<∣r∣≤0.4時(shí),則兩個(gè)變量低度相關(guān)。,,待產(chǎn)婦尿中雌三醇含量和產(chǎn)兒體重之間成正相關(guān)。那么,如果我們知道了一位待產(chǎn)婦的尿雌三醇含量,能推斷出產(chǎn)兒的體重
11、嗎?或產(chǎn)兒的體重可能在什么范圍內(nèi)呢?身高與體重之間也成正相關(guān)關(guān)系。那么,身高每增加1厘米,體重增加多少克呢?上面的相關(guān)關(guān)系分析不能提供給我們需要的答案。這些要用直線回歸的方法來(lái)解決。,某保險(xiǎn)公司承保汽車5萬(wàn)量,平均每量保費(fèi)收入為1000元,則該保險(xiǎn)公司汽車承??偸杖霝?000萬(wàn)元。 承??偸杖耄?Y 承保汽車量數(shù): X Y=1000X X與Y兩
12、個(gè)變量間完全表現(xiàn)為一種確定性關(guān)系,即函數(shù)關(guān)系。,第二節(jié) 一元回歸,銀行的1年期存款利息年息為2.25%,存入的本金用X表示,到期的本息用Y表示,則 Y=X+2.25%X 這里Y與X仍表現(xiàn)為一種線性函數(shù)關(guān)系。,另外一種情況: 兩事物之間有著密切的聯(lián)系,但密切的程度并沒(méi)有達(dá)到由一個(gè)可以完全
13、確定另一個(gè)的程度。例如: ?生長(zhǎng)發(fā)育階段動(dòng)物體重增量與食量 ? 廣告費(fèi)支出與商品銷售額,由于其它因素的干擾,許多雙變量之間的關(guān)系并不是嚴(yán)格的函數(shù)關(guān)系,不能用函數(shù)方程反映,為了區(qū)別于兩變量間的函數(shù)方程,我們稱這種關(guān)系式為一元回歸方程,這種關(guān)系為一元回歸。,第二節(jié) 一元回歸,一、直線回歸分析,繪制散點(diǎn)圖求直線回歸方程繪制回歸直線回歸系數(shù)的假設(shè)檢驗(yàn),用直線方程描述兩個(gè)變量間的數(shù)量依存關(guān)系。,① 一般
14、形式: a:截距 b:回歸系數(shù)(回歸直線斜率),1. 直線回歸方程的求法,b>0 x↑ y↑;b<0 x↑ y↓ b:意義為x每變化一個(gè)單位,y變化的平均值 x:自變量,要求容易測(cè)定、容易控制 :y 的估計(jì)值,y稱因變量,要求在不同的x的 時(shí)候其分布為正態(tài)分布,②a、b的計(jì)算(用最小二乘法原理估計(jì)b)
15、n:對(duì)子數(shù)(數(shù)據(jù)對(duì)),剩余誤差,殘差:各實(shí)測(cè)值y至回歸直線縱向距離。剩余平方和或殘差平方和最小。,SSe=Σ( y- )2,SS總= SSR +SSe,決定系數(shù)(determining coefficient,R2):回歸平方和在總平方和中所占的比例。,R2 = SS回 /SS總,R2是評(píng)價(jià)回歸強(qiáng)度的一個(gè)重要指標(biāo)。 0≤R2 ≤ 1, → 1,回歸效果越好,強(qiáng)度↑。 臨床研究中,R2≥0.7認(rèn)為回歸效果不
16、錯(cuò)。,2. 回歸方程擬合效果評(píng)價(jià)(決定系數(shù)),,,(1) 繪制散點(diǎn)圖(2) 求直線回歸方程,(3)繪制回歸直線,在自變量的變化范圍內(nèi)選兩點(diǎn)做直線 (0,a)(X,Y)這兩點(diǎn)可以用來(lái)核對(duì)圖線繪制是否正確。,,,例題中得到的直線回歸方程一定經(jīng)過(guò)(0,2.15)(17.23,3.2)兩點(diǎn)。,直線回歸方程從樣本資料計(jì)算而得,有抽樣誤差。需要對(duì)樣本的回歸系數(shù)b進(jìn)行假設(shè)檢驗(yàn),以判斷b是否從回歸系數(shù)為零的總體中抽得???/p>
17、體的回歸系數(shù)一般用β表示。,是否能說(shuō)明雌三醇與產(chǎn)兒體重之間一定存在回歸關(guān)系?,t-檢驗(yàn) H0:β=0 (直線回歸方程不成立) H1:β≠0 (直線回歸方程成立),進(jìn)行β=0的假設(shè)檢驗(yàn)(即X與Y間無(wú)直線回歸關(guān)系) t 檢驗(yàn)或F檢驗(yàn) 相關(guān)系數(shù)的檢驗(yàn)代替,(4) 回歸系數(shù)的假設(shè)檢驗(yàn),υ=n-2,H0:β=0H1:β≠0 α=0.05,,υ=31-2=29,查表 t0.0005/2,28=3.9351,
18、P<0.0005拒絕H0,接受H1,認(rèn)為待產(chǎn)婦尿中雌三醇含量與產(chǎn)兒體重之間存在直線回歸關(guān)系。,二、直線回歸方程的應(yīng)用,估計(jì):描述兩變量間的依存關(guān)系 通過(guò)回歸系數(shù)的假設(shè)檢驗(yàn),若認(rèn)為兩變量之間存在直線回歸關(guān)系,則可用直線回歸來(lái)描述。 利用回歸方程進(jìn)行預(yù)測(cè)把自變量代入回歸方程,對(duì)應(yīng)變量進(jìn)行估計(jì)。例如,已知某待產(chǎn)婦的尿雌三醇濃度,估計(jì)產(chǎn)兒的體重范圍。利用回歸方程進(jìn)行統(tǒng)計(jì)控制胰島素與血糖制定正常值范圍血細(xì)胞,
19、血紅蛋白等,三、曲線擬合,對(duì)呈曲線關(guān)系的資料,可用散點(diǎn)圖分析曲線的類型,建立曲線回歸方程。常用曲線的類型:對(duì)數(shù): =a+blnX 指數(shù):ln =a+bX 冪函數(shù):ln =a+blnX Logistic:,,四、相關(guān)與回歸分析注意事項(xiàng),1. 實(shí)際意義 進(jìn)行相關(guān)回歸分析要有實(shí)際意義,不可把毫無(wú)關(guān)系的兩個(gè)事物或現(xiàn)象用來(lái)作相關(guān)回歸分析。 2. 相關(guān)關(guān)系 相
20、關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,并不能證明事物間有內(nèi)在聯(lián)系。例如,同一父母生的兄弟,往往哥高弟也高,這主要與遺傳因素及生活條件相關(guān),而不能說(shuō)哥高是弟高的原因。但如果事物之間存在因果關(guān)系,則兩者必然是相關(guān)的。,3.利用散點(diǎn)圖 對(duì)于性質(zhì)不明確的兩組數(shù)據(jù),可先做散點(diǎn)圖,在圖上看它們有無(wú)關(guān)系、關(guān)系的密切程度、是正相關(guān)還是負(fù)相關(guān),然后再進(jìn)行相關(guān)回歸分析。4.變量范圍 相關(guān)分析和回歸方程僅適用于樣本的原始
21、數(shù)據(jù)范圍之內(nèi),出了這個(gè)范圍,我們不能得出兩變量的相關(guān)關(guān)系和原來(lái)的回歸關(guān)系。,資料要求直線回歸要求應(yīng)變量Y是服從正態(tài)分布的隨機(jī)變量,X是可以精確測(cè)量和嚴(yán)格控制的變量,一般稱為I型回歸;直線相關(guān)要求X和Y服從雙變量正態(tài)分布,二者間若進(jìn)行回歸分析,則稱為II型回歸。參與相關(guān)分析的兩個(gè)變量無(wú)主次之分,參與回歸分析的兩個(gè)變量則有自變量和應(yīng)變量之分。,★五、相關(guān)與回歸的區(qū)別,應(yīng)用說(shuō)明兩變量間的關(guān)聯(lián)關(guān)系用相關(guān)分析;說(shuō)明兩者數(shù)量上的依存關(guān)系則用回
22、歸分析。意義b表示X每改變一個(gè)單位,Y平均改變b個(gè)單位;r說(shuō)明具有線性關(guān)聯(lián)的兩個(gè)變量間關(guān)系的密切程度和相關(guān)方向。 r的絕對(duì)值越大,散點(diǎn)圖中的點(diǎn)越趨向于一條直線,表明兩變量的關(guān)系越密切,相關(guān)程度越高。b的絕對(duì)值越大,回歸直線越陡,說(shuō)明當(dāng)X變化一個(gè)單位時(shí),Y的平均變化就越大。,★五、相關(guān)與回歸的區(qū)別,計(jì)算方法取值范圍單位 r無(wú)量綱;b有量綱。,★五、相關(guān)與回歸的區(qū)別,六、相關(guān)與回歸的聯(lián)系,關(guān)系:
23、 能進(jìn)行回歸分析的變量之間存在相關(guān)關(guān)系。所以,對(duì)于兩組新數(shù)據(jù)(兩個(gè)變量)可先做散點(diǎn)圖,求出它們的相關(guān)系數(shù),對(duì)于確有相關(guān)關(guān)系的變量再進(jìn)行回歸分析,求出回歸方程。,六、相關(guān)與回歸的聯(lián)系,相關(guān)系數(shù)r與回歸系數(shù)b : 1)r與b的符號(hào)一致。r為正時(shí),b也為正,表示兩變量是正相關(guān),是同向變化。r為負(fù)時(shí),b也為負(fù),表示兩變量是負(fù)相關(guān),是反向變化?!。玻﹔與b的假設(shè)檢驗(yàn)結(jié)果一致 ,可用r的顯著檢驗(yàn)代替b的顯著性檢驗(yàn)?!。常┮阎獂、y的標(biāo)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 統(tǒng)計(jì)學(xué)一元線性回歸課后習(xí)題答案
- 管理統(tǒng)計(jì)學(xué)第11章-一元線性回歸
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)logistic回歸
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)-logistic回歸
- 統(tǒng)計(jì)學(xué)相關(guān)與回歸分析
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)16-logistic回歸
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)相關(guān)分析
- 統(tǒng)計(jì)學(xué)a第9章--相關(guān)與回歸分析
- 8-應(yīng)用統(tǒng)計(jì)學(xué)(教案)相關(guān)與回歸分析
- 醫(yī)學(xué) 統(tǒng)計(jì)學(xué)
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)
- 衛(wèi)生統(tǒng)計(jì)學(xué) 醫(yī)學(xué)統(tǒng)計(jì)學(xué) 習(xí)題
- 醫(yī)學(xué) 統(tǒng)計(jì)學(xué)
- 統(tǒng)計(jì)學(xué)--第九章直線回歸與相關(guān)
- 應(yīng)用統(tǒng)計(jì)學(xué)--第8章-相關(guān)分析與回歸分析
- 《統(tǒng)計(jì)學(xué)》線性回歸模型
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)復(fù)習(xí)
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)13
- 診斷醫(yī)學(xué)統(tǒng)計(jì)學(xué)
- 醫(yī)學(xué)統(tǒng)計(jì)學(xué)任
評(píng)論
0/150
提交評(píng)論