版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、在過去的幾十年里,隨著計(jì)算機(jī)的計(jì)算速度和存儲能力的提高,人們能夠收集、存儲和分析在金融市場、醫(yī)學(xué)診斷、生命科學(xué)、環(huán)境調(diào)查等各個(gè)領(lǐng)域大量涌現(xiàn)的復(fù)雜數(shù)據(jù)集。這些數(shù)據(jù)集往往有下面的特征:包含異常值,有觀測誤差,縱向抽樣,維數(shù)超高(大“p”,小“n”)等等。為了能夠處理各個(gè)科學(xué)領(lǐng)域出現(xiàn)的復(fù)雜數(shù)據(jù),一方面我們需要拓展傳統(tǒng)的統(tǒng)計(jì)方法,另一方面我們更加迫切需要提出全新的統(tǒng)計(jì)方法。 本文主要考察兩類數(shù)據(jù)集:混雜了同一個(gè)協(xié)變量的數(shù)據(jù)集和含有異常值
2、的數(shù)據(jù)集。我們對前者做了回歸分析的研究,對后者做了判別分析和構(gòu)造穩(wěn)健擬似然框架的研究。Kaysen et a1.(2003)給出了一個(gè)“混雜了同一個(gè)協(xié)變量的數(shù)據(jù)”的例子--血液透析病人的纖維蛋白原的數(shù)據(jù).在該數(shù)據(jù)中人們感興趣的是纖維蛋白原水平和鐵傳遞蛋白水平的回歸關(guān)系.而這兩類蛋白水平都依賴于BMI(body mass index,weight/height2),那么BMI必然會對回歸關(guān)系造成一定的扭曲.為了刻畫回歸中的這種扭曲并給出相
3、應(yīng)的調(diào)整方法,Sentürk和Müller(2005)建立了協(xié)變調(diào)整的線性回歸模型(CALR),同時(shí)通過將該模型轉(zhuǎn)化成變系數(shù)模型得到了模型中參數(shù)的估計(jì).在第二章中,我們給出了另一種直接估計(jì)參數(shù)的方法:第一步,用設(shè)計(jì)變量和響應(yīng)變量對協(xié)變量做回歸,從而得到扭曲函數(shù)的核平滑估計(jì),繼而得到關(guān)于不可觀測的設(shè)計(jì)變量的估計(jì)和不可觀測的響應(yīng)變量的估計(jì);第二步,利用估計(jì)的設(shè)計(jì)變量和響應(yīng)變量可得到參數(shù)的最小二乘估計(jì)。我們證明了新的估計(jì)方法所得估計(jì)的√n 一
4、致性和漸近正態(tài)性。同時(shí)我們給出了一個(gè)我們的方法具有更小的漸近方差的充分必要條件。與第二章所討論的數(shù)據(jù)類型相同,在第三章中,我們建立了協(xié)變調(diào)整的非線性模型(CANLR)并考察了該模型的性質(zhì)。同樣地,在該模型中,設(shè)計(jì)變量和響應(yīng)變量不能夠直接觀測到,觀測到的是被一些乘積因子混淆后的版本.由于非線性性的存在,Sentürk和Müller(2005)的估計(jì)方法不能直接用到CANLR模型的參數(shù)估計(jì)上.為此,我們沿用第二章中的估計(jì)方法可得設(shè)計(jì)變量和響
5、應(yīng)變量的估計(jì),進(jìn)而利用非線性最小二乘得到參數(shù)的估計(jì)。同樣地,我們考察了√n一致性和漸近正態(tài)性。然而由于漸近方差的結(jié)構(gòu)非常復(fù)雜并且含有很多未知待估的項(xiàng),我們?nèi)绻谩罢龖B(tài)近似”的方法去構(gòu)造參數(shù)的置信域,效率會很低。為了避免估計(jì)漸近方差,我們采用經(jīng)驗(yàn)似然的方法來構(gòu)造置信域.盡管在構(gòu)造的經(jīng)驗(yàn)似然比中有無窮維的討厭參數(shù)的估計(jì)(扭曲函數(shù)的估計(jì))插入,經(jīng)驗(yàn)似然比的漸近分布仍然是卡方的。這就保證了用經(jīng)驗(yàn)似然比建立置信域是可行的。異常值很有可能是一些含有
6、重要信息的數(shù)據(jù)點(diǎn),像污染區(qū)域之于環(huán)境數(shù)據(jù),或者不規(guī)則情形之于病人的在線監(jiān)護(hù)數(shù)據(jù).人們希望統(tǒng)計(jì)方法做到既能夠充分利用這些異常值信息又不要對異常值過于敏感.對于此類數(shù)據(jù),我們在第四章中主要研究了穩(wěn)健的非參判別分析。首先我們定義了推廣的投影深度(EPD),然后給出了判別準(zhǔn)則一未來的觀測值關(guān)于哪個(gè)總體具有最大EPD,則認(rèn)為它來自那個(gè)總體。我們討論了基于EPD的判別準(zhǔn)則的穩(wěn)健性質(zhì)及其誤判概率的漸近性質(zhì)。進(jìn)一步地,當(dāng)所考察總體的分布是橢球?qū)ΨQ時(shí),基
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 一類特殊縱向數(shù)據(jù)模型的統(tǒng)計(jì)分析.pdf
- 數(shù)據(jù)的統(tǒng)計(jì)分析
- 缺失數(shù)據(jù)情形兩類統(tǒng)計(jì)模型的統(tǒng)計(jì)推斷.pdf
- 縱向數(shù)據(jù)混合效應(yīng)模型的統(tǒng)計(jì)分析.pdf
- 考試相關(guān)數(shù)據(jù)標(biāo)準(zhǔn)和統(tǒng)計(jì)分析.pdf
- matlab數(shù)據(jù)的統(tǒng)計(jì)分析
- 統(tǒng)計(jì)分析相關(guān)問題
- 一類模糊回歸模型的統(tǒng)計(jì)分析.pdf
- 舍入數(shù)據(jù)的統(tǒng)計(jì)分析.pdf
- 兩類統(tǒng)計(jì)模型的檢驗(yàn).pdf
- 污染數(shù)據(jù)的統(tǒng)計(jì)分析.pdf
- 缺失數(shù)據(jù)半?yún)?shù)模型統(tǒng)計(jì)分析.pdf
- 臨床治療數(shù)據(jù)的統(tǒng)計(jì)分析
- 模糊數(shù)據(jù)的統(tǒng)計(jì)分析方法.pdf
- 資產(chǎn)定價(jià)模型的統(tǒng)計(jì)分析及應(yīng)用.pdf
- 大數(shù)據(jù)的統(tǒng)計(jì)分析方法
- 帶有混合相關(guān)結(jié)構(gòu)的縱向數(shù)據(jù)的統(tǒng)計(jì)分析.pdf
- 對稱可識別模型及統(tǒng)計(jì)分析.pdf
- 房屋截面數(shù)據(jù)的統(tǒng)計(jì)分析.pdf
- 異方差模型的統(tǒng)計(jì)分析.pdf
評論
0/150
提交評論