經(jīng)驗似然縱向數(shù)據(jù)的似然.pdf_第1頁
已閱讀1頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、本文主要對如何充分利用縱向數(shù)據(jù)的組內(nèi)相關(guān)性來提高對縱向數(shù)據(jù)半?yún)⒛P偷墓烙嬀纫约案呔S數(shù)據(jù)的變量選擇問題進行研究。縱向數(shù)據(jù)是對多個觀測主體的響應(yīng)變量和相應(yīng)的多個協(xié)變量進行重復(fù)觀測形成的數(shù)據(jù)。對每個主體的觀測數(shù)據(jù)稱為一組數(shù)據(jù)。縱向數(shù)據(jù)最主要的特征是組內(nèi)數(shù)據(jù)相關(guān)而組間數(shù)據(jù)獨立。對縱向數(shù)據(jù)進行分析的難點就是如何充分利用組內(nèi)數(shù)據(jù)的相關(guān)性來提高統(tǒng)計推斷的精度。在第二章,我們將利用經(jīng)驗似然方法對縱向數(shù)據(jù)的半?yún)⒛P偷幕貧w參數(shù)構(gòu)造置信域。眾所周知,與基于

2、漸近正態(tài)的方法或基于Bootstrap的方法相比較,經(jīng)驗似然方法在構(gòu)造置信域時有很大的優(yōu)越性。本章的主要貢獻是充分利用了縱向數(shù)據(jù)的組內(nèi)相關(guān)性來提高估計精度。我們的方法是:首先,我們?yōu)槊總€主體的觀測數(shù)據(jù)的誤差假設(shè)一個半?yún)⒌膮f(xié)方差結(jié)構(gòu)。然后,我們同時利用觀測數(shù)據(jù)的一階矩和二階矩條件來構(gòu)造估計方程。其中的討厭參數(shù)被profile掉了。由于在估計方程中插入了未知分量的非參估計,我們采用了under-smoothing技術(shù)來保證所得到的對數(shù)經(jīng)驗似

3、然比統(tǒng)計量漸近收斂于標準卡方分布。我們還做了大量的統(tǒng)計模擬來驗證我們提出的方法的優(yōu)越性。受很多實際應(yīng)用的激勵,近年來人們對高維數(shù)據(jù)的研究有了很大的進展。一些為傳統(tǒng)的低維數(shù)據(jù)設(shè)計的統(tǒng)計方法已經(jīng)無法適應(yīng)現(xiàn)代統(tǒng)計學(xué)的要求。進行高維數(shù)據(jù)分析的重點是如何利用數(shù)據(jù)結(jié)構(gòu)的特征進行降維。如果在高維數(shù)據(jù)中,有很多的預(yù)測變量是冗余的,也就是說這些變量根本不含有響應(yīng)變量的信息,那么,有效地分辨出哪些預(yù)測變量是重要的,哪些是冗余的,可以幫助我們建立一個解釋性更

4、強、更有用的模型。在第三章,我們將考慮似然情況下的變量選擇問題。Dantzig方法自提出就受到了廣泛的關(guān)注。Dantzig方法主要適應(yīng)于參數(shù)是高維且稀疏情形的線性模型:Y=Xβ+∈,其中Y是n×1響應(yīng)變量,X是n×p預(yù)測變量的矩陣,β是p維且稀疏的參數(shù)向量,∈是n×1的零均值、獨立同分布的誤差項。Dantzig的原理是:假設(shè)∈是正態(tài)分布,在將得分函數(shù)的取值控制在一定的范圍內(nèi)的同時,找尋那個使參數(shù)β的e1范數(shù)達到最小的參數(shù)值,此向量即為我

5、們的解。在第三章,我們將Dantzig方法的思想推廣到了一般的似然情況。我們的方法是:首先得到未知參數(shù)的極大似然估計βmle,然后,將得分函數(shù)在βmle點Taylor展開,得到得分函數(shù)的一個線性近似,然后我們就可以利用Dantzig已有的分析方法討論它的統(tǒng)計性質(zhì)了。我們的方法在參數(shù)維數(shù)隨樣本容量一起趨于無窮時也表現(xiàn)良好。我們研究了解的存在唯一性,并且得到了解的相合和漸近正態(tài)性。為了確保模型選擇的相合性,我們提出了基于似然的Adaptiv

6、e Dantzig方法并得到其Oracle性質(zhì)。最后,我們做了大量的統(tǒng)計模擬來驗證我們所提出的方法的優(yōu)良特性。
   在實際應(yīng)用中,高維問題的參數(shù)經(jīng)常具有某種分組結(jié)構(gòu),即,每組參數(shù)同時為零或同時非零。通常的例子就是多元的ANOVA問題以及非參成分的可加模型。在以上的情況中,進行變量選擇等同于對一組變量進行選擇而非選擇單個的變量。在這類變量選擇問題中如何充分利用這種結(jié)構(gòu)是我們要加以考慮的重要問題。在第四章中,考慮到每組中元素的個數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論