版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、高級統(tǒng)計方法簡介,匯報提綱,數(shù)據(jù)的分類統(tǒng)計方法的分類體系各種統(tǒng)計方法簡介推薦書目,1 數(shù)據(jù)的分類,定類變量(名義數(shù)據(jù))定序變量(等級數(shù)據(jù))定距變量(間距數(shù)據(jù))定比變量(比例數(shù)據(jù)),,非測量型,,測量型,2 統(tǒng)計方法的分類體系,關(guān)系類型?,因果模型,,,因變量數(shù)?,非測量型,,,,A:截面數(shù)據(jù),2 統(tǒng)計方法的分類體系,事件史分析,B:時間序列數(shù)據(jù),連續(xù)時間模型,離散時間模型,Cox比例風(fēng)險模型,Logit 模型,,
2、,事件歷史分析的主要目的是研究某一事件發(fā)生的方式和它的決定因素。,指數(shù)模型,Gompertz模型,Weibull模型,加速失效時間模型,,3.1 因子分析,主要功能:縮減變量數(shù)(降維)基本步驟:計算所有變量相關(guān)矩陣,判別是否適合因子分析(相關(guān)矩陣大部分相關(guān)系數(shù)大于0.3適合;反映像相關(guān)矩陣很多元素值較大不適合;Bartlett test of sphericity顯著;KMO0.7以上)提取公共因子(常用主成分分析法)因子旋轉(zhuǎn)
3、(便于為公共因子命名,常用Varimax)一種重要用法:評價,3.2 聚類分析,主要功能:對研究對象進行分類基本步驟:選擇變量(注意克服“加入盡可能多的變量”的傾向;所選變量之間不應(yīng)高度相關(guān))計算相似性(相關(guān)測度——pearson相關(guān)系數(shù);距離測度——歐式距離**、絕對值距離、明科夫斯基距離、馬氏距離;關(guān)聯(lián)測度*——簡單匹配系數(shù)、雅克比系數(shù)、果瓦系數(shù))聚類(層次聚類——聚集法、分解法;迭代聚類/快速聚類)聚類結(jié)果的解釋與證
4、實,3.3 對應(yīng)分析,主要功能:揭示定性/非測量變量之間的聯(lián)系基本步驟:對定性/非測量型變量進行交叉匯總,得到對應(yīng)分析要求的匯總表(注意檢查Crosstabs中是否有頻數(shù)為零的單元格)運行程序(Analyse?Data reduction? correspondence)檢查運行結(jié)果和各種統(tǒng)計圖,看是否已反映變量關(guān)系;若否,調(diào)整參數(shù)重新運行解釋分析結(jié)果,3.4 多元線性回歸,主要功能:分析一個測量型因變量與多個自變量之間的線
5、性關(guān)系注意事項:因變量必須是測量型隨機變量若自變量為非測量型,則需設(shè)置虛擬變量重點是回歸模型的各項檢驗(整體線性擬合度檢驗——方差分析+判定系數(shù)R^2;回歸系數(shù)的檢驗——T檢驗;多重共線性的檢驗——容忍度和方差膨脹系數(shù);殘差項異方差檢驗和自相關(guān)檢驗)難點:多重共線性、異方差和自相關(guān)的診斷和排除,3.5 Logistic回歸,主要功能:分析一個定性因變量與多個自變量之間的關(guān)系注意事項:因變量是非測量型二值變量;若自變量為
6、非測量型,也需設(shè)置虛擬變量重點是回歸模型的各項檢驗(整體檢驗——對數(shù)似然比的卡方檢驗;回歸系數(shù)的檢驗——Wald統(tǒng)計量的卡方檢驗;系數(shù)子集的聯(lián)合假設(shè)檢驗——對數(shù)似然比的卡方檢驗)難點:回歸系數(shù)的解釋(以logit p方程的線性表達(dá)式來解釋;以發(fā)生比的指數(shù)表達(dá)式解釋√),3.6 鑒別分析,主要功能:進行統(tǒng)計鑒別和分組(根據(jù)一些已經(jīng)分組的已知案例建立鑒別函數(shù),然后根據(jù)鑒別函數(shù)對所有案例重新分組)注意事項:因變量是非測量型的分組變量
7、;自變量是用以分組的特征變量稱為鑒別變量重點掌握鑒別分析模型即鑒別函數(shù)的各參數(shù)指標(biāo)及統(tǒng)計檢驗(非標(biāo)準(zhǔn)化鑒別系數(shù)、標(biāo)準(zhǔn)化鑒別系數(shù);結(jié)構(gòu)系數(shù)/鑒別負(fù)載;鑒別力指數(shù)/方差百分比、殘余鑒別力——Wilk’S lambda;Fisher鑒別系數(shù)),3.7 對數(shù)線性模型,主要功能:通過數(shù)學(xué)方法來描述多個分類變量的交互頻數(shù)分布;可以在控制其他變量的情況下研究任意兩個變量之間的關(guān)聯(lián)注意事項:對數(shù)線性模型包括三類分析程序:分層模型分析(從飽和模型
8、入手得到簡約模型)、一般模型分析(檢驗簡約模型能否準(zhǔn)確擬合觀測數(shù)據(jù)并推斷總體)和logit 模型分析(直接服務(wù)于分類變量之間的因果關(guān)系)運用不同的模型,變量設(shè)置、項目設(shè)置均不同,能夠提供的功能類型也不同(整體檢驗、分層檢驗、單項偏關(guān)聯(lián)檢驗、自動篩選、參數(shù)估計、Z值、置信區(qū)間、觀測頻數(shù)、期望頻數(shù)、殘差),3.8 典型相關(guān)分析,主要功能:兩組變量之間的相關(guān)分析注意事項:它描述的是兩個變量組之間的整體的相關(guān)形式;要求兩組變量之間為線
9、性關(guān)系,即每對典型變量之間為線性關(guān)系;每個典型變量與本組所有觀測變量的關(guān)系也是線性關(guān)系。如果不是線性關(guān)系,可先線性化(如取對數(shù));所有觀測變量為定量數(shù)據(jù),定性數(shù)據(jù)按照一定形式設(shè)為虛擬變量后也可放入典型相關(guān)模型中進行分析,3.9 多元方差分析,主要功能:同時分析和檢驗不同類別在多個測量型變量上是否存在顯著差別注意事項:因變量有多個且必須是測量型變量,自變量是非測量型變量因變量應(yīng)為正態(tài)分布且方差相等,而且需要存在一定程度的線性相關(guān)
10、例:Income、EduRatio、Natinality、Rural可構(gòu)建單因素二元模型、雙因素二元飽和模型、雙因素二元非飽和模型,3.10 路徑分析,主要功能:確定多個變量之間的因果關(guān)系是否存在或因果關(guān)系強弱程度注意事項:實質(zhì)內(nèi)容就是計算路徑系數(shù)(=標(biāo)準(zhǔn)回歸系數(shù),可通過回歸分析得到)、殘值項路徑系數(shù)(=根號下1-R^2,通過回歸分析得到的R^2手工計算)更重要的功用是通過對變量間的簡單相關(guān)系數(shù)進行分解(=直接效應(yīng)+間接效應(yīng)+虛
11、假相關(guān)+未析部分),從而獲得變量間相互作用的更深刻認(rèn)知路徑分析的檢驗是通過回歸分析中對標(biāo)準(zhǔn)回歸系數(shù)的T檢驗實現(xiàn)的,3.11 結(jié)構(gòu)方程模型,主要功能:確定多個變量之間的因果關(guān)系是否存在或因果關(guān)系強弱程度基本步驟:模型設(shè)定(應(yīng)根據(jù)理論或以往研究成果設(shè)定初始模型)模型識別(判定模型能否求出參數(shù)估計的唯一解:數(shù)據(jù)點的數(shù)目不能少于自由參數(shù)的數(shù)目)模型估計(最大似然估計、廣義最小二乘估計)模型評價(GFI、AGFI、NFI、NNFI、
12、IFI、CFI、RMSEA)模型修正軟件:LISREL?AMOS,3.12 離散時間Logit模型,主要功能:研究離散時間單位下的某一事件的發(fā)生與否及其決定因素注意事項:首先要對原始數(shù)據(jù)進行預(yù)處理,建立人年(person year)數(shù)據(jù)文件然后運用Logistic回歸模型分析例:晉升否、進入公司時間長短、進入前有否工作經(jīng)驗、性別,3.13 Cox比例風(fēng)險模型,主要功能:研究連續(xù)時間單位下的某一事件的發(fā)生與否及其決定因素
13、注意事項:首先要對原始數(shù)據(jù)進行預(yù)處理,建立人年(person year)數(shù)據(jù)文件然后利用“分析——生存——Cox regeression”進行分析例:已婚婦女初育間隔、學(xué)歷、結(jié)婚年齡,3.14 其他一些連續(xù)時間模型,指數(shù)模型 常被稱為單純模型,因為它假設(shè)事件發(fā)生的概率為常數(shù),Weibull模型 b3被限制為必須大于1,Gompertz模型 隨機變量t服從Gompertz分布,加速失效時間模型
14、 隨機擾動u有四種分布:正態(tài)分布、logistic分布、極端值分布、對數(shù)伽瑪分布,故T得分布也有四種,如果研究者認(rèn)為研究方案中的時間單位最好按離散方式描述,就采用離散時間logit模型對于連續(xù)時間模型,如果可以認(rèn)為風(fēng)險函數(shù)是隨時間單調(diào)變化的,可以考慮選用Weibull模型或Gompertz模型;若果認(rèn)為風(fēng)險函數(shù)不是單調(diào)變化的,可以考慮對數(shù)正態(tài)、對數(shù)logistic或Cox比例風(fēng)險模型,事件史模型的選擇,4 推薦書目,郭志剛、社會統(tǒng)計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 科研統(tǒng)計方法簡介
- 中國工業(yè)統(tǒng)計調(diào)查方法簡介
- 中國工業(yè)統(tǒng)計調(diào)查方法簡介
- 能源統(tǒng)計知識簡介
- spss統(tǒng)計軟件簡介
- 曲靖麒麟高級中學(xué)簡介
- 統(tǒng)計學(xué)知識簡介
- 心理統(tǒng)計學(xué)簡介
- 高級統(tǒng)計師考試高級統(tǒng)計實務(wù)與案例分析試卷答案
- 中國能源統(tǒng)計簡介
- 汾陽第四高級中學(xué)簡介
- 地理統(tǒng)計(geo-statistics)簡介
- 醫(yī)學(xué)統(tǒng)計學(xué)課程簡介
- 數(shù)學(xué)與統(tǒng)計學(xué)院簡介
- 統(tǒng)計學(xué)研究方向簡介
- 數(shù)學(xué)與統(tǒng)計學(xué)院簡介
- 測試方法簡介
- 測試方法簡介
- 2017年高級統(tǒng)計師考試高級統(tǒng)計實務(wù)與案例分析試卷答案
- 衛(wèi)生統(tǒng)計學(xué)課程簡介
評論
0/150
提交評論