基于匿名的隱私保護(hù)方法研究.pdf_第1頁
已閱讀1頁,還剩131頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、近幾年來,伴隨著信息技術(shù)和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,社會(huì)各行業(yè)及領(lǐng)域需要收集和分析的數(shù)據(jù)也迅速增長(zhǎng),這些龐大數(shù)據(jù)背后所包含的知識(shí)是醫(yī)學(xué)探索、經(jīng)濟(jì)發(fā)展以及理論研究的寶貴資源,人們希望從這些海量并且不斷在高速增長(zhǎng)的數(shù)據(jù)中找到潛在的規(guī)則及其商業(yè)模式,挖掘出數(shù)據(jù)真正的價(jià)值。然而,在實(shí)現(xiàn)這些需求的同時(shí)可能會(huì)牽涉到個(gè)人的隱私信息,由此引發(fā)了對(duì)數(shù)據(jù)發(fā)布中的隱私保護(hù)問題的研究。為了保護(hù)個(gè)體的隱私信息不泄露,需對(duì)數(shù)據(jù)發(fā)布中的技術(shù)和方法進(jìn)行研究,使得發(fā)布的數(shù)據(jù)

2、既能保護(hù)其隱私性又能保持較高的數(shù)據(jù)可用性,以實(shí)現(xiàn)隱私保護(hù)與數(shù)據(jù)可用性間的折衷平衡。另外,由于不同類型的數(shù)據(jù)所面臨的隱私泄露問題不盡相同,因此,本文立足于隱私保護(hù)中所面臨的各種泄露問題,在保護(hù)數(shù)據(jù)可用性的前提下,對(duì)不同類型數(shù)據(jù)的隱私匿名方法進(jìn)行了全面的研究。
  首先,針對(duì)分類型敏感屬性的隱私保護(hù)問題,在傳統(tǒng)t-closeness模型的基礎(chǔ)上,對(duì)其采用的EMD距離進(jìn)行改進(jìn),由于EMD距離沒有考慮等價(jià)類與數(shù)據(jù)表間敏感屬性分布穩(wěn)定性的問

3、題,在分布間穩(wěn)定差異過大時(shí),會(huì)大大提高隱私泄露的風(fēng)險(xiǎn),由此提出了一種EMD距離與KL散度結(jié)合的距離度量標(biāo)準(zhǔn)。同時(shí)根據(jù)分類型敏感屬性的層次樹結(jié)構(gòu),對(duì)數(shù)據(jù)表進(jìn)行桶分組劃分,然后提出一種基于敏感屬性值劃分的t-closeness原則,采用自頂向下和自底向上的貪心思想獲取滿足該原則的最小等價(jià)類大小,運(yùn)用k-近鄰的思想來選取準(zhǔn)標(biāo)識(shí)符屬性值相似的元組生成等價(jià)類。最后實(shí)驗(yàn)結(jié)果表明,提出的模型在犧牲少量時(shí)間的前提下減少了信息損失,能在有效地保護(hù)敏感信息

4、不泄露的同時(shí)保持較高的數(shù)據(jù)效用。
  其次,針對(duì)將分類型敏感屬性的隱私保護(hù)方法直接運(yùn)用于數(shù)值型敏感屬性的隱私保護(hù)上不能保證隱私信息安全性的局限,在考慮數(shù)值型屬性自身特性的基礎(chǔ)上,對(duì)面向數(shù)值型敏感屬性的隱私匿名方法進(jìn)行了研究。近鄰泄露是數(shù)值型敏感屬性隱私保護(hù)問題中通常會(huì)出現(xiàn)的泄露風(fēng)險(xiǎn)之一,當(dāng)分組中個(gè)體敏感值差異過小時(shí),攻擊者能以較高置信度推理出個(gè)體的敏感值處于某個(gè)較小的區(qū)間范圍內(nèi),由此帶來了近鄰泄露風(fēng)險(xiǎn)。針對(duì)此類泄露風(fēng)險(xiǎn),提出一種面

5、向近鄰泄露的數(shù)值型敏感屬性隱私保護(hù)方法,該方法首先在保護(hù)準(zhǔn)標(biāo)識(shí)符屬性和數(shù)值型敏感屬性內(nèi)在關(guān)系的前提下,將數(shù)值型敏感屬性進(jìn)行離散化劃分;然后,提出一種面向近鄰泄露的隱私保護(hù)原則,并且設(shè)計(jì)了最大鄰域優(yōu)先算法來實(shí)現(xiàn)該原則。實(shí)驗(yàn)結(jié)果表明,提出的方法能在有效地保護(hù)數(shù)值型敏感信息不泄露的同時(shí)保持較高的數(shù)據(jù)效用,并且保護(hù)了數(shù)據(jù)間的關(guān)系。
  再次,針對(duì)多維敏感屬性數(shù)據(jù)在發(fā)布過程中所面臨的隱私泄露問題,對(duì)于傳統(tǒng)的l-多樣性進(jìn)行改進(jìn),給出一種l-m

6、aximum原則用以滿足多敏感屬性l-多樣性要求,該原則控制了等價(jià)類中敏感值出現(xiàn)的頻率,避免了概率攻擊的風(fēng)險(xiǎn),并且通過理論證明了該原則的安全性;然后,為了保護(hù)屬性間的相關(guān)性以及避免基于有損分解方法中所帶來的屬性泄露問題,提出一種基于屬性相關(guān)性的隱私保護(hù)方法,采用平均互信息作為屬性間的依賴度,根據(jù)屬性間的依賴度對(duì)屬性進(jìn)行劃分,使得高依賴度的屬性在同一簇中;最后設(shè)計(jì)并實(shí)現(xiàn)了基于多維敏感屬性的l-maximum算法。實(shí)驗(yàn)結(jié)果表明,提出的模型在

7、保護(hù)隱私不泄露的同時(shí),減少了元組的隱匿率,并且保護(hù)了數(shù)據(jù)間的關(guān)系。
  最后,針對(duì)數(shù)據(jù)流具有持續(xù)時(shí)間長(zhǎng)、變化迅速、快速到達(dá)等不同于靜態(tài)數(shù)據(jù)而特有的性質(zhì),以及靜態(tài)數(shù)據(jù)上的隱私匿名方法直接用于數(shù)據(jù)流上往往不能達(dá)到較好執(zhí)行效率的局限,提出一種基于時(shí)間密度的數(shù)據(jù)流匿名算法。首先,采用k-中心點(diǎn)思想對(duì)元組進(jìn)行聚類,對(duì)于信息損失滿足要求的簇輸出;考慮數(shù)據(jù)流的強(qiáng)時(shí)態(tài)性,提出時(shí)間權(quán)重和時(shí)間密度概念,當(dāng)已發(fā)布簇的個(gè)數(shù)達(dá)到上限時(shí),刪除時(shí)間密度最小的簇

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論