高級(jí)統(tǒng)計(jì)方法簡(jiǎn)介_(kāi)第1頁(yè)
已閱讀1頁(yè),還剩20頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、高級(jí)統(tǒng)計(jì)方法簡(jiǎn)介,匯報(bào)提綱,數(shù)據(jù)的分類統(tǒng)計(jì)方法的分類體系各種統(tǒng)計(jì)方法簡(jiǎn)介推薦書目,1 數(shù)據(jù)的分類,定類變量(名義數(shù)據(jù))定序變量(等級(jí)數(shù)據(jù))定距變量(間距數(shù)據(jù))定比變量(比例數(shù)據(jù)),,非測(cè)量型,,測(cè)量型,2 統(tǒng)計(jì)方法的分類體系,關(guān)系類型?,因果模型,,,因變量數(shù)?,非測(cè)量型,,,,A:截面數(shù)據(jù),2 統(tǒng)計(jì)方法的分類體系,事件史分析,B:時(shí)間序列數(shù)據(jù),連續(xù)時(shí)間模型,離散時(shí)間模型,Cox比例風(fēng)險(xiǎn)模型,Logit 模型,,

2、,事件歷史分析的主要目的是研究某一事件發(fā)生的方式和它的決定因素。,指數(shù)模型,Gompertz模型,Weibull模型,加速失效時(shí)間模型,,3.1 因子分析,主要功能:縮減變量數(shù)(降維)基本步驟:計(jì)算所有變量相關(guān)矩陣,判別是否適合因子分析(相關(guān)矩陣大部分相關(guān)系數(shù)大于0.3適合;反映像相關(guān)矩陣很多元素值較大不適合;Bartlett test of sphericity顯著;KMO0.7以上)提取公共因子(常用主成分分析法)因子旋轉(zhuǎn)

3、(便于為公共因子命名,常用Varimax)一種重要用法:評(píng)價(jià),3.2 聚類分析,主要功能:對(duì)研究對(duì)象進(jìn)行分類基本步驟:選擇變量(注意克服“加入盡可能多的變量”的傾向;所選變量之間不應(yīng)高度相關(guān))計(jì)算相似性(相關(guān)測(cè)度——pearson相關(guān)系數(shù);距離測(cè)度——?dú)W式距離**、絕對(duì)值距離、明科夫斯基距離、馬氏距離;關(guān)聯(lián)測(cè)度*——簡(jiǎn)單匹配系數(shù)、雅克比系數(shù)、果瓦系數(shù))聚類(層次聚類——聚集法、分解法;迭代聚類/快速聚類)聚類結(jié)果的解釋與證

4、實(shí),3.3 對(duì)應(yīng)分析,主要功能:揭示定性/非測(cè)量變量之間的聯(lián)系基本步驟:對(duì)定性/非測(cè)量型變量進(jìn)行交叉匯總,得到對(duì)應(yīng)分析要求的匯總表(注意檢查Crosstabs中是否有頻數(shù)為零的單元格)運(yùn)行程序(Analyse?Data reduction? correspondence)檢查運(yùn)行結(jié)果和各種統(tǒng)計(jì)圖,看是否已反映變量關(guān)系;若否,調(diào)整參數(shù)重新運(yùn)行解釋分析結(jié)果,3.4 多元線性回歸,主要功能:分析一個(gè)測(cè)量型因變量與多個(gè)自變量之間的線

5、性關(guān)系注意事項(xiàng):因變量必須是測(cè)量型隨機(jī)變量若自變量為非測(cè)量型,則需設(shè)置虛擬變量重點(diǎn)是回歸模型的各項(xiàng)檢驗(yàn)(整體線性擬合度檢驗(yàn)——方差分析+判定系數(shù)R^2;回歸系數(shù)的檢驗(yàn)——T檢驗(yàn);多重共線性的檢驗(yàn)——容忍度和方差膨脹系數(shù);殘差項(xiàng)異方差檢驗(yàn)和自相關(guān)檢驗(yàn))難點(diǎn):多重共線性、異方差和自相關(guān)的診斷和排除,3.5 Logistic回歸,主要功能:分析一個(gè)定性因變量與多個(gè)自變量之間的關(guān)系注意事項(xiàng):因變量是非測(cè)量型二值變量;若自變量為

6、非測(cè)量型,也需設(shè)置虛擬變量重點(diǎn)是回歸模型的各項(xiàng)檢驗(yàn)(整體檢驗(yàn)——對(duì)數(shù)似然比的卡方檢驗(yàn);回歸系數(shù)的檢驗(yàn)——Wald統(tǒng)計(jì)量的卡方檢驗(yàn);系數(shù)子集的聯(lián)合假設(shè)檢驗(yàn)——對(duì)數(shù)似然比的卡方檢驗(yàn))難點(diǎn):回歸系數(shù)的解釋(以logit p方程的線性表達(dá)式來(lái)解釋;以發(fā)生比的指數(shù)表達(dá)式解釋√),3.6 鑒別分析,主要功能:進(jìn)行統(tǒng)計(jì)鑒別和分組(根據(jù)一些已經(jīng)分組的已知案例建立鑒別函數(shù),然后根據(jù)鑒別函數(shù)對(duì)所有案例重新分組)注意事項(xiàng):因變量是非測(cè)量型的分組變量

7、;自變量是用以分組的特征變量稱為鑒別變量重點(diǎn)掌握鑒別分析模型即鑒別函數(shù)的各參數(shù)指標(biāo)及統(tǒng)計(jì)檢驗(yàn)(非標(biāo)準(zhǔn)化鑒別系數(shù)、標(biāo)準(zhǔn)化鑒別系數(shù);結(jié)構(gòu)系數(shù)/鑒別負(fù)載;鑒別力指數(shù)/方差百分比、殘余鑒別力——Wilk’S lambda;Fisher鑒別系數(shù)),3.7 對(duì)數(shù)線性模型,主要功能:通過(guò)數(shù)學(xué)方法來(lái)描述多個(gè)分類變量的交互頻數(shù)分布;可以在控制其他變量的情況下研究任意兩個(gè)變量之間的關(guān)聯(lián)注意事項(xiàng):對(duì)數(shù)線性模型包括三類分析程序:分層模型分析(從飽和模型

8、入手得到簡(jiǎn)約模型)、一般模型分析(檢驗(yàn)簡(jiǎn)約模型能否準(zhǔn)確擬合觀測(cè)數(shù)據(jù)并推斷總體)和logit 模型分析(直接服務(wù)于分類變量之間的因果關(guān)系)運(yùn)用不同的模型,變量設(shè)置、項(xiàng)目設(shè)置均不同,能夠提供的功能類型也不同(整體檢驗(yàn)、分層檢驗(yàn)、單項(xiàng)偏關(guān)聯(lián)檢驗(yàn)、自動(dòng)篩選、參數(shù)估計(jì)、Z值、置信區(qū)間、觀測(cè)頻數(shù)、期望頻數(shù)、殘差),3.8 典型相關(guān)分析,主要功能:兩組變量之間的相關(guān)分析注意事項(xiàng):它描述的是兩個(gè)變量組之間的整體的相關(guān)形式;要求兩組變量之間為線

9、性關(guān)系,即每對(duì)典型變量之間為線性關(guān)系;每個(gè)典型變量與本組所有觀測(cè)變量的關(guān)系也是線性關(guān)系。如果不是線性關(guān)系,可先線性化(如取對(duì)數(shù));所有觀測(cè)變量為定量數(shù)據(jù),定性數(shù)據(jù)按照一定形式設(shè)為虛擬變量后也可放入典型相關(guān)模型中進(jìn)行分析,3.9 多元方差分析,主要功能:同時(shí)分析和檢驗(yàn)不同類別在多個(gè)測(cè)量型變量上是否存在顯著差別注意事項(xiàng):因變量有多個(gè)且必須是測(cè)量型變量,自變量是非測(cè)量型變量因變量應(yīng)為正態(tài)分布且方差相等,而且需要存在一定程度的線性相關(guān)

10、例:Income、EduRatio、Natinality、Rural可構(gòu)建單因素二元模型、雙因素二元飽和模型、雙因素二元非飽和模型,3.10 路徑分析,主要功能:確定多個(gè)變量之間的因果關(guān)系是否存在或因果關(guān)系強(qiáng)弱程度注意事項(xiàng):實(shí)質(zhì)內(nèi)容就是計(jì)算路徑系數(shù)(=標(biāo)準(zhǔn)回歸系數(shù),可通過(guò)回歸分析得到)、殘值項(xiàng)路徑系數(shù)(=根號(hào)下1-R^2,通過(guò)回歸分析得到的R^2手工計(jì)算)更重要的功用是通過(guò)對(duì)變量間的簡(jiǎn)單相關(guān)系數(shù)進(jìn)行分解(=直接效應(yīng)+間接效應(yīng)+虛

11、假相關(guān)+未析部分),從而獲得變量間相互作用的更深刻認(rèn)知路徑分析的檢驗(yàn)是通過(guò)回歸分析中對(duì)標(biāo)準(zhǔn)回歸系數(shù)的T檢驗(yàn)實(shí)現(xiàn)的,3.11 結(jié)構(gòu)方程模型,主要功能:確定多個(gè)變量之間的因果關(guān)系是否存在或因果關(guān)系強(qiáng)弱程度基本步驟:模型設(shè)定(應(yīng)根據(jù)理論或以往研究成果設(shè)定初始模型)模型識(shí)別(判定模型能否求出參數(shù)估計(jì)的唯一解:數(shù)據(jù)點(diǎn)的數(shù)目不能少于自由參數(shù)的數(shù)目)模型估計(jì)(最大似然估計(jì)、廣義最小二乘估計(jì))模型評(píng)價(jià)(GFI、AGFI、NFI、NNFI、

12、IFI、CFI、RMSEA)模型修正軟件:LISREL?AMOS,3.12 離散時(shí)間Logit模型,主要功能:研究離散時(shí)間單位下的某一事件的發(fā)生與否及其決定因素注意事項(xiàng):首先要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,建立人年(person year)數(shù)據(jù)文件然后運(yùn)用Logistic回歸模型分析例:晉升否、進(jìn)入公司時(shí)間長(zhǎng)短、進(jìn)入前有否工作經(jīng)驗(yàn)、性別,3.13 Cox比例風(fēng)險(xiǎn)模型,主要功能:研究連續(xù)時(shí)間單位下的某一事件的發(fā)生與否及其決定因素

13、注意事項(xiàng):首先要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,建立人年(person year)數(shù)據(jù)文件然后利用“分析——生存——Cox regeression”進(jìn)行分析例:已婚婦女初育間隔、學(xué)歷、結(jié)婚年齡,3.14 其他一些連續(xù)時(shí)間模型,指數(shù)模型 常被稱為單純模型,因?yàn)樗僭O(shè)事件發(fā)生的概率為常數(shù),Weibull模型 b3被限制為必須大于1,Gompertz模型 隨機(jī)變量t服從Gompertz分布,加速失效時(shí)間模型

14、 隨機(jī)擾動(dòng)u有四種分布:正態(tài)分布、logistic分布、極端值分布、對(duì)數(shù)伽瑪分布,故T得分布也有四種,如果研究者認(rèn)為研究方案中的時(shí)間單位最好按離散方式描述,就采用離散時(shí)間logit模型對(duì)于連續(xù)時(shí)間模型,如果可以認(rèn)為風(fēng)險(xiǎn)函數(shù)是隨時(shí)間單調(diào)變化的,可以考慮選用Weibull模型或Gompertz模型;若果認(rèn)為風(fēng)險(xiǎn)函數(shù)不是單調(diào)變化的,可以考慮對(duì)數(shù)正態(tài)、對(duì)數(shù)logistic或Cox比例風(fēng)險(xiǎn)模型,事件史模型的選擇,4 推薦書目,郭志剛、社會(huì)統(tǒng)計(jì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論