版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、近年來,隨著我國醫(yī)療信息化技術(shù)不斷發(fā)展,大量的醫(yī)學(xué)信息原始數(shù)據(jù)得以記錄和保存下來,如流行病學(xué)的調(diào)查數(shù)據(jù)、醫(yī)院的信息化數(shù)據(jù)等。這些醫(yī)學(xué)數(shù)據(jù)在數(shù)量迅速增加的同時,其質(zhì)量和準確度也在不斷提高。如何借助恰當?shù)慕y(tǒng)計分析方法,來挖掘這些海量的數(shù)據(jù)信息,以更好的為醫(yī)療衛(wèi)生行業(yè)的管理、醫(yī)院的診療、科研和教學(xué)服務(wù),從而進一步為醫(yī)療決策提供支撐,已經(jīng)成為國內(nèi)外統(tǒng)計學(xué)界較為關(guān)注的熱點問題。然而,在實際研究中,此類計數(shù)數(shù)據(jù)常常會出現(xiàn)零過多的現(xiàn)象,這種現(xiàn)象在流行
2、病學(xué)調(diào)查數(shù)據(jù)中尤為常見。所謂零過多現(xiàn)象是指在計數(shù)數(shù)據(jù)中零的個數(shù)明顯多于按照泊松分布、二項分布或負二項分布等標準離散分布隨機產(chǎn)生的零的個數(shù)的現(xiàn)象。計數(shù)數(shù)據(jù)中取值為零的數(shù)量過多,會導(dǎo)致數(shù)據(jù)過度離散。對于該類零過多的計數(shù)數(shù)據(jù),如果仍使用普通的計數(shù)模型去擬合,將會導(dǎo)致參數(shù)估計的偏差過大,甚至做出錯誤的推斷。為了解決零過多計數(shù)數(shù)據(jù)的過離散問題,針對該類數(shù)據(jù)的特點,分成零計數(shù)(零點的退化分布)和非零計數(shù)(取值為泊松分布)兩個部分建立混合回歸模型,即
3、零膨脹泊松回歸模型(Zero-inflated model,ZIP)。
研究目的:
本研究針對醫(yī)學(xué)研究中普遍存在的零過多的計數(shù)數(shù)據(jù)的問題,構(gòu)建零膨脹模型,對于小樣本資料,引進貝葉斯的方法,構(gòu)建貝葉斯零膨脹模型并與傳統(tǒng)模型比較,模擬不同樣本量和不同零過多比例等多種數(shù)據(jù)情境,從準確性、精確性和模型的擬合優(yōu)度等多個方面對構(gòu)建的模型進行評價,探索不同的數(shù)據(jù)情境下最優(yōu)的參數(shù)估計模型。同時,為了增加模型估計的可靠性,引入Boot
4、strap統(tǒng)計技術(shù)。本研究可以為今后流行病學(xué)調(diào)查數(shù)據(jù)中零過多數(shù)據(jù)的統(tǒng)計分析提供方法學(xué)支持。
研究方法:
首先進行原始數(shù)據(jù)的模擬,數(shù)據(jù)模擬設(shè)置不同的樣本量,分別為1000、500、100,同時考慮不同的離散程度,設(shè)置不同的零比例,分別為0.9、0.8、0.7、0.6,模擬不同的數(shù)據(jù)情境下的最優(yōu)模型。
1.模型構(gòu)建
基于大樣本的情況下,構(gòu)建零膨脹泊松回歸模型(ZIP)、零膨脹負二項泊松回歸模型(Zer
5、o-inflated negative binomial,ZINB)并與傳統(tǒng)的泊松回歸和負二項回歸進行比較;基于小樣本的情況下,構(gòu)建貝葉斯零膨脹泊松回歸模型(Bayesianzeroinflated Poisson)、零膨脹負二項泊松回歸模型(Bayesianzero-inflated negativebinomial model)并與貝葉斯泊松回歸模型、貝葉斯負二項回歸模型進行比較。同時,模型構(gòu)建的過程中引進Bootstrap統(tǒng)計技術(shù)
6、,根據(jù)原始樣本量大小進行有放回等樣本重復(fù)抽樣,每次抽樣200次,然后對這200個復(fù)樣本進行統(tǒng)計分析。
2.模型評價
分別從準確性、精確性和和模型擬合度三個方面,使用絕對偏倚、置信區(qū)間覆蓋率、標準誤、置信區(qū)間寬度和模型擬合度五個指標對模擬的結(jié)果進行全面、客觀科學(xué)的評價。綜合以上五個指標可全面評價模型模擬的結(jié)果,為今后醫(yī)學(xué)數(shù)據(jù)不同模型評價提供了方法學(xué)參考。
3.實例分析
將構(gòu)建的零膨脹模型應(yīng)用于衛(wèi)生服
7、務(wù)調(diào)查實例研究中,大樣本的實例分析選擇對上海市居民患慢性病數(shù)的影響因素進行分析;小樣本的實例分析選擇對上海市浦東新區(qū)農(nóng)業(yè)戶口居民年住院次數(shù)的影響因素進行分析。實例分析中構(gòu)建不同的模型進行統(tǒng)計分析,并對模擬研究的結(jié)果進行實例驗證。
研究結(jié)果:
本研究的結(jié)果分成兩個部分,分別是基于大樣本和小樣本兩個不同的部分?;诖髽颖緲?gòu)建四個模型。先從準確度和精確度方面進行比較,然后比較所有模型的擬合優(yōu)度指標AIC值。當樣本量為100
8、0、500時,我們發(fā)現(xiàn)這兩個傳統(tǒng)計數(shù)模型隨著零比例的增加,在準確度方面,其絕對偏倚的值是不斷增加的,置信區(qū)間的覆蓋率也越來越低;在精確度方面,標準誤也是增大的趨勢,其置信區(qū)間的寬度不斷增加。由此可見,傳統(tǒng)計數(shù)模型模擬結(jié)果的準確性和精確性并不高,傳統(tǒng)計數(shù)模型對于零過多數(shù)據(jù)的模擬結(jié)果并不是很理想。然而,相同條件下零膨脹模型的模擬結(jié)果比傳統(tǒng)計數(shù)模型要好很多?;A(chǔ)零膨脹模型的AIC值,普遍比基礎(chǔ)計數(shù)模型的AIC值小,即基礎(chǔ)零膨脹模型的擬合度比基
9、礎(chǔ)計數(shù)模型要好,而負二項回歸擬合度優(yōu)于泊松回歸。在零比例為0.6、0.7時,模型擬合度比較分別為:零膨脹泊松回歸模型優(yōu)于零膨脹負二項回歸優(yōu)于負二項回歸優(yōu)于泊松回歸;零比例在0.8、0.9時,零膨脹泊松回歸與零膨脹負二項回歸的擬合度基本一致,均優(yōu)于負二項回歸,負二項回歸又優(yōu)于泊松回歸。
基于小樣本構(gòu)建四個模型。在樣本量為100,零比例為0.8、0.7、0.6時,貝葉斯泊松回歸和貝葉斯負二項回歸這兩種模型的準確度和精確度。我們發(fā)現(xiàn)
10、這兩個模型在隨著零所占的比例增加,在準確度方面和精確度方面以及模型的擬合度方面均不是很理想。在比例為0.9時,貝葉斯泊松模型和貝葉斯負二項模型無法擬合,可見貝葉斯傳統(tǒng)計數(shù)模型對于小樣本零過多計數(shù)數(shù)據(jù)的模擬結(jié)果并不是很理想。在零比例為0.6、0.7、0.8時,從模型準確度、精確度和擬合度方面比較分別為:零膨脹泊松回歸模型與零膨脹負二項回歸模型模擬結(jié)果相差不大,貝葉斯負二項回歸模型優(yōu)于貝葉斯零膨脹模型優(yōu)于貝葉斯泊松回歸模型;零比例在0.9時
11、,貝葉斯零膨脹泊松回歸與貝葉斯零膨脹負二項回歸的模擬結(jié)果基本一致,均優(yōu)于貝葉斯傳統(tǒng)計數(shù)回歸模型。
實例分析中基于大樣本的統(tǒng)計分析結(jié)果與模型數(shù)據(jù)模擬的結(jié)果較一致,驗證了對于零過多數(shù)據(jù)零膨脹模型優(yōu)于傳統(tǒng)計數(shù)模型,并得到了影響上海市居民患慢性病數(shù)的一系列危險因素?;谛颖镜慕y(tǒng)計分析結(jié)果與模型數(shù)據(jù)模擬的結(jié)果也比較一致。
研究結(jié)論:
根據(jù)衛(wèi)生服務(wù)調(diào)查數(shù)據(jù)不同的零過多計數(shù)數(shù)據(jù)特點,選擇合適的零膨脹模型分析方法優(yōu)于傳統(tǒng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 嵌套logit模型及其在衛(wèi)生服務(wù)利用分析中的應(yīng)用.pdf
- 改進的零膨脹二項分布模型及其應(yīng)用.pdf
- 零膨脹數(shù)據(jù)的幾種模型及應(yīng)用.pdf
- 零膨脹模型在車險理賠次數(shù)中的應(yīng)用與研究.pdf
- 匯率波動模型構(gòu)建及其在風(fēng)險價值測度應(yīng)用中的研究.pdf
- 復(fù)雜網(wǎng)絡(luò)模型構(gòu)建及其在知識系統(tǒng)中的應(yīng)用.pdf
- 服務(wù)劇場模型的改進及其在飯店管理中的應(yīng)用.pdf
- 社區(qū)衛(wèi)生服務(wù)建設(shè)進程中的居民滿意度調(diào)查研究.pdf
- 領(lǐng)域本體構(gòu)建及其在專利信息服務(wù)中的研究與應(yīng)用.pdf
- 微信在中學(xué)班級管理中應(yīng)用的調(diào)查研究.pdf
- 個性化健康信息服務(wù)在移動客戶端中應(yīng)用的調(diào)查研究
- 聚類分析算法的研究及其在社區(qū)衛(wèi)生服務(wù)系統(tǒng)中的應(yīng)用.pdf
- 淺談?wù){(diào)查研究方法在保險專業(yè)研究中的應(yīng)用
- 淺談?wù){(diào)查研究方法在保險專業(yè)研究中的應(yīng)用
- 混合潛變量模型的構(gòu)建及其在基因關(guān)聯(lián)分析中的應(yīng)用.pdf
- 轉(zhuǎn)基因細胞模型的構(gòu)建及其在致癌活性檢測中的應(yīng)用.pdf
- 不同統(tǒng)計模型在公共衛(wèi)生研究中的應(yīng)用.pdf
- 個性化健康信息服務(wù)在移動客戶端中應(yīng)用的調(diào)查研究.pdf
- 物聯(lián)網(wǎng)技術(shù)在設(shè)施農(nóng)業(yè)中應(yīng)用的調(diào)查研究.pdf
- 關(guān)于加速膨脹宇宙中f_引力模型構(gòu)建的研究.pdf
評論
0/150
提交評論