

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著大數據時代的到來,Internet時時刻刻都在釋放出海量數據。信息的日積月累,無論是圍繞著企業(yè)的商業(yè)決策,還是個人的生活消費習慣等信息,都變成了以各種各樣形式存儲的數據。大數據的背后隱藏著大量政治和經濟利益的同時,也到處涉及到各種隱私。隨著人們隱私保護意識的提高與k-匿名隱私保護模型的日趨完善,該模型已經逐漸成為了個人和機構發(fā)布數據前的可信賴隱私保護手段。k-匿名數據屬于一種特殊的不確定數據,它的元組中準標識符屬性對應的泛化值取每個
2、可能值的概率是相等的,并且每條元組至少和k-1條其它元組在準標識符屬性上的值是相同的。K-匿名數據是通過泛化樹對精確數據進行泛化處理來實現k-匿名化的,具有均勻分布的特性,這一特性不利于精確查詢,并且,已存在的數據挖掘算法也無法有效的應用于k-匿名數據的挖掘。因此,如何挖掘k-匿名數據以及增加其可用性是一個亟待解決的問題。
關聯規(guī)則挖掘是數據挖掘領域最基本的分析方法,其可從大量數據中發(fā)現項集或屬性間有價值的關聯關系。目前已經有
3、很多學者針對不確定數據做了專門的研究,也提出了許多優(yōu)良的不確定數據挖掘算法。但是,這些算法幾乎都是基于元組在還原成可能的確定元組時概率不等的前提下挖掘的,而k-匿名數據的均勻分布特性使得這些已存在的算法在應用時要么效率低下,要么挖掘得到的結果價值很低。為了解決該問題,結合聚類和樹的優(yōu)點,我們提出了針對k-匿名數據的關聯規(guī)則挖掘算法。它包括了擴展分層聚類算法、k-頻繁樹構造算法和關聯規(guī)則生成算法,分別用于對k-匿名數據進行預處理、挖掘頻繁
4、項集和生成強關聯規(guī)則。
數據的查詢可以從另一方面有效提高數據的可用性。K-匿名數據的特殊性使得挖掘得到的關聯規(guī)則體左邊依舊為泛化值,現有的查詢算法無法對其進行變粒度查詢,以得到非原始泛化值的對應關聯規(guī)則及其置信度。抓住k-匿名數據均勻分布的特點,我們結合R*樹的空間查詢優(yōu)勢,把粒度轉換方法應用到查詢中去,提出了變粒度關聯規(guī)則查詢算法——基于新提出的4點粒度轉換特性,實現了對關聯規(guī)則挖掘的結果查詢對用戶透明化,可有效滿足不同用戶
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于泛化樹的k-匿名數據集的挖掘算法研究.pdf
- K-匿名數據的查詢方法研究.pdf
- 針對k-匿名數據的OLAP技術研究.pdf
- 針對K-匿名數據的top-k查詢問題研究.pdf
- 基于k-匿名隱私數據挖掘研究.pdf
- 用于k-匿名數據的關聯規(guī)則集化簡與可視化技術.pdf
- 時空K-匿名集的關聯規(guī)則概率化挖掘方法.pdf
- 時空K-匿名集數據的關聯規(guī)則和序列模式挖掘研究.pdf
- 防范歷史攻擊的k-匿名算法的研究.pdf
- 隱私保護中K-匿名算法和匿名技術研究.pdf
- 針對k-匿名隱私數據的判定樹和關聯規(guī)則算法的研究.pdf
- 基于k-匿名的云計算隱私保護算法研究.pdf
- 基于熵的k-匿名屬性泛化算法研究.pdf
- 基于K-匿名的隱私保護模型和算法研究.pdf
- 支持安全數據發(fā)布的K-匿名技術的研究.pdf
- 海量查詢下基于K-匿名的隱私保護算法研究.pdf
- 基于k-對稱匿名算法的社會網絡隱私保護研究.pdf
- 數據挖掘k-均值算法實現開題報告、文獻綜述
- 數據挖掘k-均值算法實現開題報告、文獻綜述
- 基于K-匿名技術的數據發(fā)布隱私保護方法研究.pdf
評論
0/150
提交評論