復雜隨機抽樣數(shù)據(jù)的多重線性與多重logistic回歸分析方法及其應用.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-07 格式：pdf 頁數(shù)：179 大小：7.64MB 人氣指數(shù)：12 舉報 版權申訴

復雜隨機抽樣數(shù)據(jù)的多重線性與多重logistic回歸分析方法及其應用.pdf_第1頁

已閱讀1頁，還剩178頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、目的：針對目前大部分研究者在進行復雜隨機抽樣調查資料的回歸分析時常采用基于單純隨機抽樣（即不考慮抽樣權重）的一般多重線性回歸分析以及多重logistic回歸分析的現(xiàn)狀，通過比較不考慮權重、僅考慮抽樣權重、僅考慮觀測權重和考慮綜合權重的四種不同建模策略，發(fā)現(xiàn)在原理以及模擬研究結果上彼此的不同，進而引起研究者的重視。同時，創(chuàng)造性地提出“觀測權重”與“綜合權重”的概念并闡述其計算原理，模擬并探討其在復雜隨機抽樣調查資料多重線性與多重logis

2、tic回歸分析建模中的作用。
　　內容：首先大量搜集、閱讀、歸納和整理文獻，對復雜隨機抽樣調查資料的多重線性與多重logistic回歸分析的原理進行研究。而后借助綜合評價中的權重系數(shù)的思想，在回歸分析中，定義了反映各個體或觀測對總體的重要性的量—觀測權重。從而構建并完善觀測權重及其衍生的綜合權重的概念并闡述其計算原理。
　　基于蒙特卡洛隨機模擬思想，假設所得到的完整資料為抽樣總體，在抽樣總體中進行不同抽樣率下的分層隨機抽樣。

3、而后按考慮抽樣權重、觀測權重、綜合權重與未考慮權重的分析策略（以下簡稱四種分析策略）對抽樣資料進行多重線性與多重logistic回歸建模，比較并探討納入不同權重時模型擬合結果的準確性、穩(wěn)健性以及靈敏性。而后將資料視為抽樣樣本，賦予每個觀測不同抽樣率下的抽樣權重，在不同的分析策略下對上述所得結果進行驗證分析。
　　方法：
　　(1)通過大量搜集、閱讀、歸納和整理文獻，對復雜隨機抽樣調查資料的多重線性與多重logistic回歸分

4、析的原理進行研究。
　　(2)對于觀測權重和綜合權重的構建，通過大量搜集、閱讀、學習、歸納和整理相關文獻，所用的數(shù)據(jù)庫包括Pubmed、Embase、中國知網(wǎng)、萬方、維普等，運用現(xiàn)有的統(tǒng)計學知識和創(chuàng)新性思維，提出觀測權重和綜合權重的理論構想，在導師的指導下，并與研究室?guī)熒M行反復討論和多次修改，使其進一步完善、合理。
　　(3)模擬研究:采用美國營養(yǎng)與健康研究中心在2009～2013年期間調查獲得的兩組數(shù)據(jù)（有效樣本含量N1

5、=6756，N2=5440），按照年齡段（10歲）分層。假定N=6756/5440例的調查資料就是一個“抽樣總體”，基于此總體，構建分層隨機抽樣率分別為5％～95％（10％步長）的分層隨機抽樣數(shù)據(jù)集，而后分別運用上述的四種分析策略進行多重線性回歸分析與多重logistic回歸分析，并將分析結果進行比較，考察在不同分析策略與不同抽樣率下模型擬合的效果。而后，假設該數(shù)據(jù)(N=6756/5440)為在分層隨機抽樣率分別為5％～95％（10％步

6、長）的分層隨機抽樣下得到的數(shù)據(jù)集（即每次都是樣本含量為n=6756/5440例的一個樣本），運用前述的四種分析策略對該固定樣本進行多重線性與多重logistic回歸分析，并將分析結果進行比較，對上述所得結果進行驗證。
　　結果：
　　(1)對復雜隨機抽樣調查所得的數(shù)據(jù)進行多重線性與多重logistic回歸分析的模型構建和參數(shù)估計方法進行了歸納和總結，比較了最小二乘法、加權最小二乘法、極大似然法、擬極大似然法的數(shù)學原理及需滿足

7、的條件。從原理上得知復雜隨機抽樣調查資料的多重線性與多重logistic回歸分析中應當考慮其研究所采用的抽樣方法，并依據(jù)抽樣方法選擇適當?shù)膮?shù)估計方法，否則會產(chǎn)生較大的偏差。
　　(2)澄清了“權重”與“抽樣權重”中一些模糊概念，提出并構建了“觀測權重”以及“綜合權重”的新概念及其確定方法。為接下來的研究提供了理論支持，也為未來關于“權重”的研究提供了一定的參考。
　　(3)通過對所得到的數(shù)據(jù)(N1=6756)進行抽樣調查數(shù)

8、據(jù)的多重線性回歸分析的模擬研究，得到以下結果:在不考慮權重的分析策略下建模，回歸模型所納入的自變量數(shù)目在不同抽樣率下波動較大且比應當納入模型的數(shù)目要少，同時其標準誤也最大。檢驗模型擬合的統(tǒng)計量均方根誤差較大，決定系數(shù)較小，其模型擬合結果的準確性、精確性以及靈敏性較差;在僅考慮抽樣權重的分析策略下建模，回歸模型在不同抽樣率下納入自變量數(shù)目波動較大，當抽樣率達到85％時才達到穩(wěn)定。同時其模型擬合的均方根誤差和決定系數(shù)與未考慮權重的分析策略的

9、一樣大，因此與不考慮任何權重的分析策略相比，僅考慮抽樣權重的分析策略的準確性、穩(wěn)健性以及靈敏性有所提高，但還未達到研究者預期的目標;在僅考慮觀測權重的分析策略下建模，當抽樣率達到25％時模型納入自變量即達到穩(wěn)定，其模型參數(shù)估計值較為穩(wěn)定，模型擬合的均方根誤差與前兩種分析策略相比大大減小，決定系數(shù)大大增加到接近1，因此其模型擬合結果的準確性、精確性以及靈敏性大大提高。但是其建模原理是建立在單純隨機抽樣的前提下，因此筆者并不推薦此法;在考慮

10、綜合權重的分析策略下建模，當抽樣率達到35％時模型納入自變量即達到穩(wěn)定，其模型參數(shù)估計值較為穩(wěn)定，模型擬合的均方根誤差最小，決定系數(shù)接近1，因此其模型擬合結果的準確性、精確性以及靈敏性最高。
　　(4)通過對所得到的完整數(shù)據(jù)(N2=5440)進行抽樣調查數(shù)據(jù)的多重logistic回歸分析的模擬研究，得到以下結果:在不考慮權重的分析策略下建模，回歸模型所納入的自變量數(shù)目在不同抽樣率下波動較大，當達到85％抽樣率時才達到穩(wěn)定。同時評價

11、其模型擬合的統(tǒng)計量AIC值、SC值較大，決定系數(shù)較小，其模型擬合的準確性、穩(wěn)健性以及靈敏性較差;在僅考慮抽樣權重的分析策略下建模，回歸模型在不同抽樣率下納入自變量數(shù)目波動較大，當達到65％抽樣率時達到穩(wěn)定。同時其模型對應的AIC值、SC值較大，決定系數(shù)較小，其模型擬合的準確性、穩(wěn)健性以及靈敏性較不考慮權重時有所提高，但未達到研究者預期的目標;在僅考慮觀測權重的分析策略下建模，當抽樣率達到35％時模型納入自變量即達到穩(wěn)定，其模型參數(shù)估計值

12、較為穩(wěn)定，模型對應的AIC值、SC值與前兩種分析策略相比大大減小，決定系數(shù)大大增加到接近1，因此其模型擬合結果的準確性精確性以及靈敏性大大提高，但是其建模原理是建立在單純隨機抽樣的前提下，因此筆者并不推薦此法;在考慮綜合權重的分析策略下建模，當抽樣率達到25％時模型納入自變量即達到穩(wěn)定，其模型參數(shù)估計值較為穩(wěn)定，模型對應的AIC值、SC值最小，決定系數(shù)接近1，因此其模型擬合結果的準確性、精確性以及靈敏性最高。
　　結論：在進行復雜

眾賞文庫> 全部分類> 畢業(yè)設計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

復雜隨機抽樣數(shù)據(jù)的多重線性與多重logistic回歸分析方法及其應用.pdf

文檔簡介

溫馨提示

最新文檔

評論

復雜隨機抽樣數(shù)據(jù)的多重線性與多重logistic回歸分析方法及其應用.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載