面向數(shù)據(jù)發(fā)布的隱私保護(hù)方法研究.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-09 格式：pdf 頁數(shù)：137 大小：5.17MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

面向數(shù)據(jù)發(fā)布的隱私保護(hù)方法研究.pdf_第1頁

已閱讀1頁，還剩136頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著數(shù)據(jù)分析和互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展，越來越多的組織部門和科研機(jī)構(gòu)將收集到的大量數(shù)據(jù)公之于眾，以實(shí)現(xiàn)數(shù)據(jù)的共享、統(tǒng)計(jì)和挖掘。然而，這些發(fā)布數(shù)據(jù)中大多含有個體的敏感信息，如個體的疾病、工資、興趣偏好等信息，攻擊者能夠從發(fā)布數(shù)據(jù)中獲得較高的信息增益。通常情況下，數(shù)據(jù)發(fā)布的過程中也會增加用戶隱私泄露的風(fēng)險(xiǎn)。同時，數(shù)據(jù)發(fā)布中的隱私泄露將阻礙整個社會信息發(fā)布和信息共享，不利于維護(hù)社會的和諧、穩(wěn)定發(fā)展。因此，在向公眾發(fā)布數(shù)據(jù)前，數(shù)據(jù)發(fā)布者需要對涉及個

2、體隱私的數(shù)據(jù)進(jìn)行保護(hù)，以降低惡意攻擊者獲得用戶敏感信息的幾率。本文分別從面向保護(hù)效果和面向數(shù)據(jù)效用兩方面對隱私保護(hù)方法開展研究，在保護(hù)發(fā)布數(shù)據(jù)的隱私安全的前提下，通過數(shù)據(jù)匿名技術(shù)和數(shù)據(jù)擾動技術(shù)對原始數(shù)據(jù)進(jìn)行隱私保護(hù)處理，以滿足發(fā)布數(shù)據(jù)的不同應(yīng)用需求，從而實(shí)現(xiàn)發(fā)布數(shù)據(jù)的可用性和數(shù)據(jù)隱私安全間的平衡。本文的研究內(nèi)容主要包括以下四個部分：
　　首先，針對傳統(tǒng)匿名模型無法抵御相關(guān)性攻擊，易形成敏感值高度相關(guān)的等價(jià)類的問題，在傳統(tǒng) l-多樣

3、性模型的基礎(chǔ)上，提出了一種約束等價(jià)類中敏感值相關(guān)性的(s,l)-多樣性模型。該模型以敏感集合中非敏感屬性值的分布度量敏感值的相關(guān)性，通過等價(jià)類中敏感值相關(guān)性的約束來降低高相關(guān)性敏感值產(chǎn)生的信息泄露。同時，使用屬性值間相關(guān)性作為距離度量基準(zhǔn)，提出了一種(s,l)-多樣性聚類算法（SLCA）來實(shí)現(xiàn)該匿名模型，以降低數(shù)據(jù)泛化過程中的信息損失。對比實(shí)驗(yàn)表明，SLCA算法具有較低的時間開銷，且能夠有效降低發(fā)布的等價(jià)類中敏感值的相關(guān)性，較好地抵御攻

4、擊者的相關(guān)性攻擊。
　　其次，針對 t-相近性模型實(shí)現(xiàn)方法的性能較低，且無法較好的抵御敏感性攻擊的問題，在傳統(tǒng) t-相近性模型基礎(chǔ)上定義了(l,t)-相近性模型，該模型放寬了t-相近性模型對等價(jià)類的約束，要求敏感等級在等價(jià)類中的分布與數(shù)據(jù)集中的分布之間的Hellinger距離不大于閾值 t。同時，使用敏感值的自信息來度量敏感度以實(shí)現(xiàn)敏感屬性的敏感等級劃分，并提出了一種基于聚類的(l,t)-相近性匿名算法（(l,t)-CCA），該算

5、法通過在敏感等級桶中抽取距離最近的元組形成等價(jià)類來實(shí)現(xiàn)該匿名模型，以降低等價(jià)類中元組的敏感值間敏感程度的差異，并抵御攻擊者的敏感性攻擊。對比實(shí)驗(yàn)結(jié)果表明，(l,t)-CCA算法具有較小的信息損失和較低的時間代價(jià)，能夠更加有效的實(shí)現(xiàn)數(shù)據(jù)發(fā)布中數(shù)據(jù)的可用性與隱私安全間的平衡。
　　再次，針對多敏感屬性數(shù)據(jù)發(fā)布中的隱私泄露及攻擊者的敏感性攻擊，在傳統(tǒng) l-多樣性的基礎(chǔ)上，提出了一種基于屬性分解，以逆聚類方法構(gòu)造敏感組的多敏感屬性(l1,

6、l2,…,ld)-多樣性的隱私保護(hù)方法，在滿足數(shù)據(jù)表多敏感屬性值多樣性的同時，有效地降低了多敏感屬性數(shù)據(jù)表的敏感性，增強(qiáng)了數(shù)據(jù)的可用性。最后，通過仿真實(shí)驗(yàn)驗(yàn)證了同等條件下，該算法能夠有效的抵御攻擊者的敏感性攻擊，且具有較低的信息隱匿率，雖然在執(zhí)行時間上與對比算法相比略高，但該算法所處理的發(fā)布數(shù)據(jù)集具有較好的隱私保護(hù)效果和數(shù)據(jù)可用性，略高的執(zhí)行時間是能夠被接受的。
　　最后，針對現(xiàn)有數(shù)據(jù)擾動方法不能較好地維持原始數(shù)據(jù)的聚類可用性問題

7、，提出一種面向聚類挖掘，基于數(shù)據(jù)擾動技術(shù)的隱私保護(hù)方法。該方法將具有d維屬性的數(shù)據(jù)集抽象為d維空間，根據(jù)節(jié)點(diǎn)的k鄰域分布計(jì)算節(jié)點(diǎn)的鄰域拓?fù)鋭蒽兀⑻岢隽擞晒?jié)點(diǎn)的鄰域拓?fù)鋭蒽貙⒐?jié)點(diǎn)劃分為鄰域分散型節(jié)點(diǎn)和鄰域緊密型節(jié)點(diǎn)的方法。同時，還提出一種根據(jù)節(jié)點(diǎn)的不同類型分別執(zhí)行不同擾動策略的數(shù)據(jù)擾動算法DPTPE，對于鄰域分散型節(jié)點(diǎn)，使用其k鄰域節(jié)點(diǎn)的均值替換該節(jié)點(diǎn)，對于鄰域緊密型節(jié)點(diǎn)，則在其安全鄰域中隨機(jī)抽取一個節(jié)點(diǎn)替換該節(jié)點(diǎn)。通過仿真實(shí)驗(yàn)表明，D

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

面向數(shù)據(jù)發(fā)布的隱私保護(hù)方法研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

面向數(shù)據(jù)發(fā)布的隱私保護(hù)方法研究.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費(fèi)下載