基于聚類的隱私匿名方法研究.pdf_第1頁
已閱讀1頁,還剩142頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、近年來,隨著信息技術(shù)、移動(dòng)通信技術(shù)、位置感知技術(shù)和互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,各領(lǐng)域產(chǎn)生了海量的用戶數(shù)據(jù),尤其是個(gè)人位置和軌跡數(shù)據(jù),對(duì)其進(jìn)行數(shù)據(jù)分析、挖掘,能獲得數(shù)據(jù)潛在的規(guī)則及商業(yè)價(jià)值。然而數(shù)據(jù)是把雙刃劍,只要有數(shù)據(jù),就必然存在安全與隱私的問題。為了對(duì)數(shù)據(jù)進(jìn)行分析,常常需要對(duì)存儲(chǔ)在服務(wù)器上的數(shù)據(jù)進(jìn)行發(fā)布,這無疑會(huì)給心懷惡意的用戶(稱為攻擊者)帶來可趁之機(jī),威脅用戶的隱私。針對(duì)用戶信息的推理性攻擊可能導(dǎo)致個(gè)人的興趣愛好、行為模式、社會(huì)習(xí)慣等隱

2、私信息暴露,嚴(yán)重威脅到用戶的個(gè)人生命、財(cái)產(chǎn)安全。因此,為了保護(hù)發(fā)布數(shù)據(jù)中個(gè)人的隱私信息,需研究數(shù)據(jù)發(fā)布的技術(shù)和方法,使得發(fā)布的數(shù)據(jù)既能保護(hù)其隱私性又能保持較高的數(shù)據(jù)效用。
  本文以隱私保護(hù)領(lǐng)域的兩種典型數(shù)據(jù)類型——關(guān)系數(shù)據(jù)和軌跡數(shù)據(jù)為研究背景,對(duì)隱私匿名方法展開研究,在保證數(shù)據(jù)安全性的前提下,通過相應(yīng)的匿名技術(shù),以適當(dāng)?shù)男畔p失為代價(jià),換取匿名數(shù)據(jù)更高的可用性,最終達(dá)到平衡數(shù)據(jù)可用性和隱私保護(hù)度的目的。本文的研究?jī)?nèi)容主要包括以下

3、四個(gè)部分:
  首先,現(xiàn)有的許多基于限制發(fā)布的技術(shù)在實(shí)現(xiàn)k匿名算法時(shí),采用基于分治策略的泛化技術(shù),減少了潛在的匿名組數(shù)量;雖然基于取整劃分函數(shù)的劃分策略,避免了“可能減少潛在匿名組數(shù)量”這一情況的發(fā)生,但是沒有考慮臨時(shí)匿名組中相鄰數(shù)據(jù)點(diǎn)的距離,在劃分過程中極易產(chǎn)生許多不必要的信息損失,從而影響發(fā)布的匿名數(shù)據(jù)集的可用性。同時(shí),在p-敏感 k-匿名模型中,存在由于敏感屬性值在聚類結(jié)果中分布不均勻,而遭到背景知識(shí)攻擊,泄露敏感信息的情況

4、。針對(duì)上述問題,本文提出基于投影區(qū)域密度劃分的k匿名算法和基于敏感屬性熵的微聚集算法,分別從數(shù)據(jù)可用性和隱私保護(hù)度兩方面解決k匿名模型存在的問題。
  其次,在軌跡數(shù)據(jù)中,最大的隱私威脅就是“敏感位置泄露”,如果攻擊者能夠了解某人在哪些時(shí)間訪問了哪些位置,那么攻擊者就能夠確定此人在發(fā)布數(shù)據(jù)庫中的真實(shí)記錄,并且能夠了解此人的其他軌跡信息,進(jìn)而推理得到此人的行為模式、生活習(xí)慣等敏感信息,造成個(gè)人隱私信息的泄露。對(duì)此,本文提出了一種新的

5、軌跡相似性度量模型,和基于軌跡位置形狀相似性的隱私保護(hù)算法,在軌跡聚類過程中使用貪心的思想,最大限度地提高了聚類內(nèi)部軌跡之間的相似性;并且在位置聚類過程中,使用真實(shí)的原始位置信息形成數(shù)據(jù)“面罩”,滿足了軌跡k-匿名,在保護(hù)軌跡數(shù)據(jù)的同時(shí),有效地提高了軌跡數(shù)據(jù)的可用性。
  再次,在現(xiàn)實(shí)應(yīng)用中,不同的移動(dòng)用戶對(duì)個(gè)人隱私需求的定位是不同的,例如:有的用戶將自己的住址看作是個(gè)人隱私,而有的人則不這么認(rèn)為。簡(jiǎn)單地將所有移動(dòng)用戶的隱私保護(hù)級(jí)

6、別視為等同是不合理的。滿足移動(dòng)對(duì)象個(gè)性化的隱私需求,不僅會(huì)提高移動(dòng)對(duì)象的隱私保護(hù)程度,還能有效地降低匿名過程中不必要的信息損失。同時(shí),現(xiàn)有的軌跡匿名算法在計(jì)算軌跡相似性時(shí)還存在沒有充分考慮軌跡內(nèi)外在特征信息的情況。針對(duì)上述問題,本文提出了個(gè)性化軌跡k-匿名的概念,和軌跡結(jié)構(gòu)相似性度量模型,并提出了基于稀疏化最小生成樹聚類的個(gè)性化隱私保護(hù)算法,通過貪婪的策略生成一個(gè)近似最優(yōu)的軌跡k-匿名集合,顯著地提高了軌跡數(shù)據(jù)的可用性。
  最后

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論