基于判別分析的多重插補影響因素研究——基于河北省小康建設(shè)滿意度調(diào)查問卷研究.pdf_第1頁
已閱讀1頁,還剩45頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、在進行統(tǒng)計調(diào)查的過程中,往往基于各種不同的原因?qū)е抡{(diào)查數(shù)據(jù)存在不同程度的缺失。近年來,隨著大數(shù)據(jù)的發(fā)展和大型數(shù)據(jù)庫的成熟,無論從數(shù)據(jù)的樣本量和數(shù)據(jù)的維度的擴增角度還是數(shù)據(jù)記錄在時間維度的精細化程度加深,缺失值產(chǎn)生的概率越來越難以避免,并且數(shù)據(jù)缺失的形式也更加多樣化。然而,缺失值的存在對統(tǒng)計分析具有很大的影響。一方面來講,缺失值的存在增加了統(tǒng)計分析過程的難度,其原因在于成熟的數(shù)據(jù)分析方法都是基于完整數(shù)據(jù)集的前提假設(shè)。另一方面則是缺失數(shù)據(jù)的

2、存在會影響數(shù)據(jù)分析的結(jié)果,進而導(dǎo)致分析的結(jié)論有可能因為數(shù)據(jù)不具有代表性而喪失實用的價值。因此,研究缺失值的插補具有很重要的意義。目前,國內(nèi)外對缺失值插補的關(guān)注度比較高,尤其是多重插補思想的提出及其在實踐中表現(xiàn)出的優(yōu)點,更加成為各學(xué)者研究的重點。
  在數(shù)據(jù)調(diào)查中,調(diào)查問卷內(nèi)容的不同往往也會導(dǎo)致調(diào)查數(shù)據(jù)的缺失值表現(xiàn)出不同的形態(tài)。缺失值的缺失機制、缺失模式、缺失程度及與其他相關(guān)變量的情況等都會對缺失值的插補方法和缺失效果產(chǎn)生一定的影響

3、。本文研究了隨機缺失模式下單變量隨機缺失和多變量的插補情況,重點討論了多重插補的插補情況。分別分析樣本量、缺失率程度及相關(guān)負責(zé)輔助變量等對基于判別分析模型下的多重插補插補效果的影響情況。
  全文共分五個章節(jié),文章在第一個章節(jié)首先介紹選題背景和研究意義,總結(jié)了國內(nèi)外關(guān)于缺失值插補,尤其是多重插補的研究現(xiàn)狀及研究成果。第2章則主要闡述了缺失值產(chǎn)生的原因和缺失機制,并指出雖然缺失值插補可以彌補部分數(shù)據(jù)缺失的不足但事前控制不可缺少。第3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論