含地理位置信息的社交媒體挖掘及應(yīng)用.pdf_第1頁
已閱讀1頁,還剩123頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、近年來,隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的發(fā)展和智能移動(dòng)終端的普及,人們越來越習(xí)慣于通過智能移動(dòng)終端上的應(yīng)用隨時(shí)隨地獲取或分享信息。在用于信息獲取和分享的移動(dòng)應(yīng)用中,基于用戶地理位置的服務(wù)已成為主流。人們在使用此類應(yīng)用的過程中,產(chǎn)生了海量的含有地理位置信息的社交媒體數(shù)據(jù),并且此類數(shù)據(jù)的規(guī)模呈爆炸性增長。這一類新型的海量媒體數(shù)據(jù)的出現(xiàn),為許多研究領(lǐng)域帶來了新的機(jī)遇和挑戰(zhàn),吸引了研究人員的興趣和廣泛關(guān)注。
  與傳統(tǒng)的媒體數(shù)據(jù)相比,含地理位置信息的

2、社交媒體數(shù)據(jù)具有獨(dú)特性質(zhì),主要表現(xiàn)在以下三個(gè)方面:異構(gòu)的地理信息表達(dá)和組成方式;強(qiáng)調(diào)移動(dòng)性、時(shí)效性和交互性;包含空間、時(shí)間、社交等豐富上下文信息和多模態(tài)媒體內(nèi)容。本論文針對(duì)含地理位置信息的社交媒體的上述三個(gè)特性所帶來的科學(xué)問題,研究此類媒體的挖掘和推薦算法,包括:異構(gòu)地理信息社交媒體融合挖掘算法;面向移動(dòng)應(yīng)用的高效在線推薦算法;以及融合多種上下文信息的個(gè)性化推薦算法。
  論文的主要研究工作和創(chuàng)新成果如下:
  1.提出了一

3、種異構(gòu)地理信息社交媒體融合挖掘算法以及基于二部圖結(jié)構(gòu)的重排序算法。
  論文針對(duì)點(diǎn)評(píng)網(wǎng)站等基于地理位置的服務(wù)中,結(jié)構(gòu)化數(shù)據(jù)缺乏語義信息而難以應(yīng)對(duì)特定信息需求的問題,提出了結(jié)構(gòu)化和非結(jié)構(gòu)化社交媒體數(shù)據(jù)的融合挖掘算法,用來對(duì)結(jié)構(gòu)化數(shù)據(jù)的語義信息進(jìn)行補(bǔ)充。在此基礎(chǔ)上,又提出了一種基于二部圖的排序算法對(duì)基于地理位置的服務(wù)中的商戶進(jìn)行重排序。實(shí)驗(yàn)結(jié)果表明:與僅使用點(diǎn)評(píng)網(wǎng)站中結(jié)構(gòu)化信息的挖掘算法相比,論文所提出的融合挖掘算法的平均準(zhǔn)確率均值相

4、對(duì)提升了73%;相比于僅使用點(diǎn)評(píng)網(wǎng)站中結(jié)構(gòu)信息的排序算法,以及僅使用商戶在點(diǎn)評(píng)網(wǎng)站中原始評(píng)分的排序算法,論文提出的基于二部圖結(jié)構(gòu)并融合多種因素對(duì)商戶進(jìn)行重排序的算法更能滿足用戶的特定信息需求。
  2.提出了一種面向移動(dòng)應(yīng)用的高效在線推薦算法。
  論文針對(duì)移動(dòng)應(yīng)用場景中的在線地點(diǎn)推薦問題,提出了一種基于前綴樹結(jié)構(gòu)的可變記憶馬爾科夫模型。論文所提出的算法從用戶的歷史地點(diǎn)序列中挖掘頻繁序列模式,并以此構(gòu)建前綴樹結(jié)構(gòu),從而能夠根

5、據(jù)用戶當(dāng)前的地點(diǎn)高效地向用戶推薦下一個(gè)地點(diǎn),并根據(jù)用戶的反饋動(dòng)態(tài)調(diào)整模型。對(duì)于長度為l的地點(diǎn)序列,論文所提出的算法相比于傳統(tǒng)的可變記憶馬爾科夫模型:概率后綴樹算法,將時(shí)間復(fù)雜度從O(Dl)降低至O(l),因此可以滿足推薦的實(shí)時(shí)性要求。在提升算法效率的同時(shí),實(shí)驗(yàn)結(jié)果表明,論文所提出的帶有平滑模型的可變記憶馬爾科夫模型能獲得更高的推薦準(zhǔn)確率。與固定階數(shù)馬爾科夫模型所能取得的最好結(jié)果相比,論文所提出的算法的平均準(zhǔn)確率均值相對(duì)提升了69%;與概

6、率后綴樹算法相比,論文所提出的算法的平均準(zhǔn)確率均值相對(duì)提升了36%。此外,論文所提出的在線地點(diǎn)推薦算法僅依賴于用戶當(dāng)前地點(diǎn)信息,所以該算法能夠以很少的代價(jià)嵌入現(xiàn)有的各類基于地理位置服務(wù)的移動(dòng)應(yīng)用中。另外如果將“地點(diǎn)”的概念進(jìn)行推廣,該算法可以應(yīng)用于地點(diǎn)推薦以外的其它問題,例如網(wǎng)頁中用戶點(diǎn)擊行為預(yù)測、搜索引擎查詢詞推薦等。
  3.提出了一種融合多種上下文信息的個(gè)性化推薦算法。
  論文針對(duì)照片分享網(wǎng)站中海量社交媒體數(shù)據(jù)及其包

7、含的豐富上下文信息,研究個(gè)性化的地點(diǎn)推薦算法。論文所提出的算法首先充分挖掘了照片分享網(wǎng)站中各種上下文信息,包括GPS位置信息、照片拍攝時(shí)間、用戶信息、文本信息、照片視覺信息。在此基礎(chǔ)上,該算法從多個(gè)方面計(jì)算地點(diǎn)與用戶興趣的匹配程度,并把融合多種上下文信息進(jìn)行個(gè)性化推薦的問題建模為排序?qū)W習(xí)的問題,從而融合多種地點(diǎn)與用戶興趣度評(píng)分進(jìn)行個(gè)性化的地點(diǎn)推薦。實(shí)驗(yàn)結(jié)果表明,論文所提出的算法能有效提高推薦的準(zhǔn)確率,特別是在用戶的歷史信息比較稀少的情況

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論