大數(shù)據分布式在線學習算法研究及其隱私保護.pdf_第1頁
已閱讀1頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、在當今這個大數(shù)據的時代,越來越多的生產和活動被數(shù)據化到網絡和數(shù)據庫上。這些大數(shù)據記錄了人們生活的方方面面,研究這些數(shù)據會發(fā)現(xiàn)許多有價值的信息。諸如沃爾瑪超市將尿布啤酒放在一起買的例子就不多說了。大數(shù)據在醫(yī)療和商品推薦方面的應用更是具有極大的商業(yè)價值。在使用大數(shù)據之前我們需要了解到現(xiàn)今數(shù)據表現(xiàn)出來的一些特征。由于現(xiàn)今互聯(lián)網的普及,數(shù)據顯示出分布廣泛、更新快速、高維度和隱私性的特點。為了解決這幾點問題,本文提出了一個具有隱私保護的分布式在線

2、學習框架來對這些數(shù)據進行挖掘學習。
  本文假設在這樣一個場景下:數(shù)據的收集與存儲是分布在不同的數(shù)據中心;由于隱私保護的原因,不同數(shù)據庫是不能進行原始樣本數(shù)據的交換;但是為了充分發(fā)掘數(shù)據中的價值,各個數(shù)據中心必須協(xié)同合作完成研究。
  為了解決在上述場景下的數(shù)據研究,那我們必須賦予每個節(jié)點(數(shù)據中心)根據本地數(shù)據進行獨立學習處理數(shù)據的能力。節(jié)點之間只能交換計算中的中間變量。本文首先研究的就是如何在有限交流的情況下是的整體節(jié)點

3、目標優(yōu)化函數(shù)收斂大一起。伴隨著數(shù)據交流必有隱私泄露的風險,因此我們有考慮在分布式計算引用差分隱私來保護數(shù)據的安全。本文主要的貢獻在于理論上數(shù)學證明的這種分布式計算的可行性和安全隱私保護的級別。并且做了大量的實驗驗證理論推導的正確性。最后,本文根據實際場景,對我們的算法提出了兩點拓展應用。一是將分布式在線學習的計算結果可以轉化為相應的離線算法收斂結果;二是采用mini-batch的方法增加每次迭代使用的數(shù)據樣本數(shù)量,加快計算效率并提升隱私

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論