2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩150頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著信息技術(shù)的不斷發(fā)展,數(shù)字圖書館的資源日益豐富和各項(xiàng)服務(wù)不斷創(chuàng)新,用戶隱私問題也日益突出。面向各種應(yīng)用的數(shù)據(jù)共享和分析服務(wù)的數(shù)據(jù)匿名發(fā)布技術(shù)一方面具有較好的適用性、通用性和實(shí)用性等優(yōu)勢,另一方面又能夠充分尊重用戶的隱私,有利于數(shù)字圖書館應(yīng)用數(shù)據(jù)的充分利用和信息共享,從而促進(jìn)圖書館開展各項(xiàng)服務(wù)工作。然而,數(shù)字圖書館的應(yīng)用數(shù)據(jù)有一定的具體領(lǐng)域特征,隱私保護(hù)訴求和數(shù)據(jù)形式存在多樣性。本文通過對現(xiàn)有各種匿名模型及匿名化技術(shù)的研究和分析后,指出

2、目前通常的數(shù)據(jù)匿名發(fā)布技術(shù)不足以解決數(shù)字圖書館敏感數(shù)據(jù)發(fā)布多種場景下的隱私保護(hù)問題。因而,本文對數(shù)字圖書館敏感數(shù)據(jù)匿名發(fā)布的若干關(guān)鍵技術(shù)進(jìn)行了一些研究,論文的主要工作如下:
   (1)面向應(yīng)用的敏感數(shù)據(jù)匿名發(fā)布框架的研究
   針對當(dāng)前敏感數(shù)據(jù)隱私保護(hù)中所面臨的種種挑戰(zhàn),創(chuàng)新地提出了一種適應(yīng)應(yīng)用需求的數(shù)據(jù)發(fā)布體系結(jié)構(gòu)框架方案--基于領(lǐng)域知識面向應(yīng)用的敏感數(shù)據(jù)匿名發(fā)布框架,并對框架模塊進(jìn)行了初步介紹,同時(shí)還給出了一個個性

3、化自適應(yīng)的隱私保護(hù)數(shù)據(jù)發(fā)布算法。該框架嘗試使用自適應(yīng)的機(jī)制,不但能滿足不同的數(shù)據(jù)應(yīng)用需求而且又能滿足數(shù)據(jù)所有者不同的隱私保護(hù)需求。在自適應(yīng)數(shù)據(jù)發(fā)布算法中,聯(lián)合采用了準(zhǔn)標(biāo)識屬性QI泛化和敏感屬性SA泛化以獲得符合匿名發(fā)布原則的匿名數(shù)據(jù)表,從而在滿足隱私保護(hù)需求的同時(shí)減少了發(fā)布數(shù)據(jù)的信息損失,即盡可能地提高了發(fā)布數(shù)據(jù)的信息精度。
   (2)基于泛化的個性化匿名數(shù)據(jù)發(fā)布技術(shù)的研究
   本文結(jié)合匿名模型的最新發(fā)展,提出了一個

4、可以應(yīng)用于數(shù)字圖書館敏感數(shù)據(jù)發(fā)布的個性化敏感數(shù)據(jù)發(fā)布模型--(P,α,k)-匿名模型和基于泛化技術(shù)的數(shù)據(jù)匿名化實(shí)現(xiàn)算法,從面向個體和敏感屬性值角度出發(fā),充分考慮了圖書館特殊用戶隱私保護(hù)訴求和大眾用戶的普遍性隱私保護(hù)需求。文中首先介紹了相關(guān)工作并在分析現(xiàn)有個性化匿名原則的基礎(chǔ)上對個性化隱私約束參數(shù)進(jìn)行了建模,并提出了(P,α,k)-匿名模型;接著提出了一個基于泛化技術(shù)的啟發(fā)式TopDown-LA算法,并介紹了該算法應(yīng)用的局部重編碼和特化處

5、理技術(shù),保證了算法獲取最小k-泛化,最大限度地提高匿名化表精度,而后還分析了算法復(fù)雜性和正確性。最后通過真實(shí)數(shù)據(jù)實(shí)驗(yàn),驗(yàn)證了這種啟發(fā)式的個性化匿名算法可行性。該算法能充分滿足個性化隱私保護(hù)需求進(jìn)行匿名發(fā)布數(shù)據(jù),相比Basic Incognito和IMondrian算法信息損失少,算法性能良好。
   (3)用戶身份保留的匿名數(shù)據(jù)發(fā)布技術(shù)的研究
   本文提出了三種具體的身份保留匿名化原則,并重點(diǎn)介紹了基于聚類的匿名發(fā)布和

6、有損分解IDAnatomy兩種數(shù)據(jù)發(fā)布方法的實(shí)現(xiàn)。數(shù)字圖書館應(yīng)用數(shù)據(jù)的分析在絕大多數(shù)情況下不僅需要發(fā)布的數(shù)據(jù)保留用戶身份,而且還需要考慮用戶的個體隱私保護(hù)需求。針對此種情況,本文首先考慮數(shù)字圖書館領(lǐng)域應(yīng)用數(shù)據(jù)通常存在單一個體對應(yīng)多條記錄的情況,特別分析了此情況下用戶敏感數(shù)據(jù)的侵犯情況,并提出了三種具體的身份保留匿名化原則。接著介紹了應(yīng)用加權(quán)層次距離信息損失評估方式實(shí)現(xiàn)數(shù)據(jù)匿名的基于聚類的(P,α,β)-clustering算法,并分析了

7、算法復(fù)雜度;另外還介紹了有損分解IDAnatomy數(shù)據(jù)發(fā)布方法,其通過將原始關(guān)系的準(zhǔn)標(biāo)識符屬性和敏感屬性以兩個不同的關(guān)系發(fā)布,利用它們之間的有損連接來保護(hù)隱私數(shù)據(jù)的安全,并且給出了基本的IDAnatomy算法保證發(fā)布的數(shù)據(jù)滿足隱私保護(hù)和實(shí)用性要求。最后在實(shí)驗(yàn)環(huán)境中從多個方面比較了原有匿名方法和身份保留的匿名化方法,檢驗(yàn)了方法的有效性。
   (4)敏感數(shù)據(jù)圖發(fā)布相關(guān)技術(shù)的研究
   本文主要提出了一種新的圖聚類安全分組策

8、略和兩種不同實(shí)現(xiàn)策略的匿名數(shù)據(jù)發(fā)布算法。文中首先分析了數(shù)字圖書館復(fù)雜個體交互關(guān)系數(shù)據(jù)發(fā)布的隱私保護(hù)問題,同時(shí)根據(jù)背景知識對圖攻擊問題進(jìn)行了增量式知識查詢建模和量化。接著在建立二分圖圖模型和相關(guān)定義的基礎(chǔ)上,初步對圖的數(shù)據(jù)匿名集成和數(shù)據(jù)匿名化問題進(jìn)行了探討,同時(shí)介紹了簡單匿名化、列舉和劃分等二分圖基本數(shù)據(jù)匿名發(fā)布方法。而后結(jié)合最新研究成果,提出了一種新的圖聚類安全分組策略來提高二分圖發(fā)布數(shù)據(jù)的可用性,并從實(shí)現(xiàn)策略上比較了先聚后分的CKG算

9、法和邊分邊聚的KGC算法,其間還重點(diǎn)分析了兩個關(guān)鍵問題--圖泛化信息損失和聚類分組超頂點(diǎn)的描述。最后通過實(shí)驗(yàn)表明,基于聚類安全分組策略匿名方法能為圖中的個體提供隱私保護(hù)的同時(shí)還能在一定程度上提高匿名圖數(shù)據(jù)的可用性。
   本文研究了數(shù)字圖書館領(lǐng)域幾個常見應(yīng)用場景下的數(shù)據(jù)發(fā)布若干關(guān)鍵技術(shù),給出了一些可行解決方案,并且對提出的各種算法不僅都作了詳細(xì)的性能分析,而且使用數(shù)字圖書館運(yùn)行的實(shí)際數(shù)據(jù)集或綜合數(shù)據(jù)集對算法進(jìn)行了詳細(xì)實(shí)驗(yàn)。經(jīng)實(shí)驗(yàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論