分布式數(shù)據(jù)挖掘中的隱私保護問題研究.pdf_第1頁
已閱讀1頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、高新信息技術和數(shù)據(jù)分析手段的出現(xiàn)大大降低了數(shù)據(jù)采集、加工和發(fā)布的難度,各類組織希望從數(shù)據(jù)中獲取有用的知識而使用最廣泛的分析手段就是數(shù)據(jù)挖掘方法。該項技術的潛在負面作用就是對隱私信息的過分搜集、濫用或買賣。因此,對組織或個人隱私的保護日益受到各界重視并提上了研究日程。 首先,數(shù)據(jù)挖掘研究和相關從業(yè)人員希望更高的數(shù)據(jù)可用性和精確性、信息越詳細越好,這樣可以減少前期工作量并極大縮小結(jié)果的失真和偏差;從用戶的角度來說,則不希望暴露隱私細

2、節(jié),從而更傾向于使用各種數(shù)據(jù)扭曲方法來保護自有隱私信息。這類對立行為的現(xiàn)實后果就是使得研究人員必須花費更多的時間和工作來彌補由此導致的數(shù)據(jù)實用性和精確度的損耗。本文著眼于建立考慮隱私保護的數(shù)據(jù)挖掘平臺,將有助于在完成挖掘任務的同時保護參與者的隱私信息并防止其被濫用,從而緩和此類矛盾。 其次,在分布式的數(shù)據(jù)存儲環(huán)境中,各個數(shù)據(jù)庫所有者都傾向于以最大的可能來保護本方隱私(商業(yè)模式、戰(zhàn)略行為等)。文中設計了一種可以在保護個體隱私的基礎

3、上展開全局合作的數(shù)據(jù)挖掘工作平臺和算法,以保證此過程中安全地交換統(tǒng)計信息而不涉及具體隱私細節(jié),從而更好地滿足現(xiàn)代企業(yè)和商務發(fā)展的隱私性需求。 本文介紹分析了前人的各種方法思想及各自優(yōu)缺點,并從兩個方面入手展開研究。首先,分析了快速分布式關聯(lián)規(guī)則挖掘算法(FDM),指出在復雜甚至惡意的環(huán)境中保留可置信的第三方(TIP)一般認為是不安全的做法;將安全多方計算(SMC)的思想引入數(shù)據(jù)挖掘任務進而實現(xiàn)了各站點的平等合作(無需第三方介入)

4、。其次,在設計防串謀的隱私保護平臺時,定義了分布式合作數(shù)據(jù)挖掘任務中的一類惡意威脅,放松了半誠實假設并在預防此類惡意行為的基礎上實現(xiàn)了解決算法平臺——RPA。 文章最后,設計仿真實驗將RPA與另外兩種代表性的分布式數(shù)據(jù)挖掘算法(FDM快速算法和CER加密算法)進行了比較。實驗結(jié)果表明RPA平臺具有較好的挖掘計算效率和效果:(1)該方法僅增加線性通訊次數(shù),是一種輕量級的解決方案;(2)所有的站點都可以得到有力的保護,避免了站點子集

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論