分布式環(huán)境中保護隱私數(shù)據(jù)挖掘方法的研究.pdf_第1頁
已閱讀1頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著信息技術(shù)的迅猛發(fā)展,海量級、分布式的數(shù)據(jù)規(guī)模對傳統(tǒng)的數(shù)據(jù)挖掘方法提出了新的挑戰(zhàn)。如何融入分布式環(huán)境,在保證持有方數(shù)據(jù)隱私的前提下得到準(zhǔn)確的挖掘結(jié)果成為數(shù)據(jù)挖掘領(lǐng)域新的研究熱點。由于聚類挖掘和分類挖掘是應(yīng)用較為廣泛的數(shù)據(jù)挖掘方法。本文對常用的K-means聚類算法和ID3分類算法進行改進,提出了兩種保護隱私的數(shù)據(jù)挖掘算法。
  本文首先介紹了數(shù)據(jù)挖掘的基本概念和實現(xiàn)步驟,在闡述數(shù)據(jù)挖掘常見技術(shù)類別的基礎(chǔ)上,重點介紹了常見的聚類挖

2、掘算法和分類挖掘算法,描述了這些算法的基本原理和實現(xiàn)過程,通過比較分析了各種算法的優(yōu)勢和不足之處。然后介紹了隱私的概念,綜述了數(shù)據(jù)挖掘中保護隱私的常見方法,其中重點介紹了限制發(fā)布技術(shù)、加密技術(shù)和安全多方計算技術(shù),最后綜述了保護隱私數(shù)據(jù)挖掘的研究進展。在此基礎(chǔ)上,本文分別針對聚類挖掘和分類挖掘中的隱私保護做了如下工作:
  (1)本文在K-means聚類算法的基礎(chǔ)上,結(jié)合分布式環(huán)境,使用基于整數(shù)的同態(tài)加密方法,對水平分布的各站點進行

3、秘密聚類挖掘,并考慮了中間結(jié)果在通信過程中的安全問題。由于聚類過程在密文狀態(tài)中進行,公鑰加密使得計算過程的中間結(jié)果得到密碼保護,因此本算法能在保護隱私的前提下得到準(zhǔn)確的聚類結(jié)果。理論分析和實驗驗證都證明了這一點。
 ?。?)對于垂直分割數(shù)據(jù)的存儲環(huán)境,本文設(shè)計了一種新的針對決策樹分類的保護隱私ID3分類算法。該算法基于Pillier的同態(tài)加密方案和數(shù)字信封技術(shù),能夠?qū)⒎诸惸P蜕蛇^程放在密文中進行,再通過差分比較法進行秘密比較,最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論