面向?qū)傩耘c關(guān)系的隱私保護數(shù)據(jù)挖掘理論研究.pdf_第1頁
已閱讀1頁,還剩172頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、大數(shù)據(jù)時代的到來使得人們迫切希望從海量的數(shù)據(jù)中挖掘出潛在的規(guī)律和知識,來指導人們創(chuàng)造新的價值。大數(shù)據(jù)結(jié)合數(shù)據(jù)挖掘分析技術(shù),已經(jīng)在商業(yè)、醫(yī)療、能源、交通、安全和娛樂等領(lǐng)域產(chǎn)生了深刻的影響。然而,傳統(tǒng)作用于原始數(shù)據(jù)之上的數(shù)據(jù)挖掘分析面臨著一個重要的問題即數(shù)據(jù)的隱私問題。由于原始數(shù)據(jù)中通常包含有關(guān)個人或群體的敏感信息,這些敏感數(shù)據(jù)的泄露會給人們的聲譽、財產(chǎn)和安全等帶來嚴重的威脅?,F(xiàn)有簡單的數(shù)據(jù)處理方法無法滿足隱私保護的需求,并且現(xiàn)有的法律法規(guī)

2、已經(jīng)制約了數(shù)據(jù)挖掘技術(shù)的應用和發(fā)展。因此,有必要從技術(shù)的角度出發(fā),尋找可以同時解決隱私保護和知識發(fā)現(xiàn)的方法。
  通過結(jié)合相關(guān)的數(shù)據(jù)挖掘分析算法,本文分別針對面向?qū)傩院兔嫦蜿P(guān)系的兩個層面研究隱私保護數(shù)據(jù)挖掘問題。社會實體本身的屬性所包含的敏感信息保護構(gòu)成了面向?qū)傩缘碾[私保護問題;由社會實體之間的相互作用關(guān)系所生成的網(wǎng)絡(luò)拓撲結(jié)構(gòu)成為隱私信息的另一來源,這種隱私信息的保護則構(gòu)成了面向關(guān)系的隱私保護問題。本文將上述研究內(nèi)容細分為四個研究

3、點,主要貢獻和創(chuàng)新點如下:
  (1)個性化隱私保護:現(xiàn)有頻繁項集挖掘的敏感數(shù)據(jù)保護算法,并沒有考慮不同商品或項的個性化隱私保護需求。而現(xiàn)實中,人們不會在意別人知道自己購買了日常用品,卻對敏感商品比較在乎?;谏唐返倪@種個性化隱私需求,提出了不同商品或項的個性化隱私問題,并基于隨機響應技術(shù)對不同項的敏感數(shù)據(jù)實施不同水平的隱私保護。然后,給出方法從擾動后的數(shù)據(jù)中重構(gòu)出項集在原始數(shù)據(jù)中的支持度。最后通過修改經(jīng)典的Apriori算法從擾

4、動后的數(shù)據(jù)中重現(xiàn)原始數(shù)據(jù)的頻繁項集。這種方法在滿足不同商品的個性化隱私保護需求的同時,可更好地重構(gòu)出原始數(shù)據(jù)中的頻繁項集。
  (2)頻繁模式隱私保護:通常公司在共享數(shù)據(jù)之前希望隱藏掉數(shù)據(jù)中具有競爭優(yōu)勢的潛在知識,而針對關(guān)聯(lián)規(guī)則分析,它們希望隱藏某些頻繁模式,即“約束模式”。為解決此問題,首先提出了項沖突度的概念,并基于此設(shè)計了一種新的啟發(fā)式數(shù)據(jù)清理算法。該算法在隱藏約束模式時,在所有事務(wù)中迭代地選擇出具有最大項沖突度的項,并從其

5、所在的事務(wù)中移除該項。算法迭代地更新所有項的沖突度并使用倒排文件索引來提升算法的查詢速度。與相關(guān)算法對比,所提算法在隱藏約束模式的同時可以更少地隱藏合法模式,并減少對原始事務(wù)數(shù)據(jù)的修改。
  (3)分布式隱私保護:針對數(shù)據(jù)水平分割的分布式環(huán)境,研究了不同合作方協(xié)同構(gòu)建共享數(shù)據(jù)挖掘模型的隱私保護問題。通過結(jié)合數(shù)據(jù)隨機化方法和安全多方計算協(xié)議,提出了一種新的混合式隱私保護算法,在保護數(shù)據(jù)隱私的同時,實現(xiàn)了旋轉(zhuǎn)無關(guān)數(shù)據(jù)挖掘結(jié)果準確性的零

6、丟失。此外,為給參與方提供更高的隱私保護,針對隨機正交變換技術(shù)給出了相對最大化隱私水平的策略,并在分布式環(huán)境下設(shè)計了一種效率更高的安全內(nèi)積協(xié)議。最后,通過結(jié)合協(xié)同過濾推薦算法,給出了分布式隱私保護數(shù)據(jù)挖掘的具體實例。
  (4)面向關(guān)系的隱私保護:針對面向關(guān)系的社會網(wǎng)絡(luò)發(fā)布中的隱私保護問題,對攻擊者背景進行建模并提出了共同好友攻擊模型。為預防此種攻擊,提出了k-NMF匿名化隱私保護模型,并設(shè)計了兩種原始網(wǎng)絡(luò)的匿名化算法以使發(fā)布的網(wǎng)

7、絡(luò)滿足k-NMF匿名化。由于算法在匿名化時考慮了網(wǎng)絡(luò)的結(jié)構(gòu)拓撲特性,實驗結(jié)果證明所提算法在保護隱私的同時,可以有效地保留原有網(wǎng)絡(luò)的結(jié)構(gòu)特性。另外,為使發(fā)布的網(wǎng)絡(luò)同時滿足k-degree匿名化和k-NMF匿名化,提出了新的匿名化算法并實驗驗證了所提算法可以較好地保持原始網(wǎng)絡(luò)的結(jié)構(gòu)信息。
  上述前三個方面的工作主要解決了面向?qū)傩缘碾[私保護數(shù)據(jù)挖掘中的問題,從而在滿足用戶對隱私保護需求的條件下,更有效地減少了屬性數(shù)據(jù)中的信息丟失。最后

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論