

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、社會化標簽是指互聯(lián)網(wǎng)用戶自由地對文檔、圖片、視頻等資源對象定義的一個或多個描述,由于其個性化特點被廣泛應(yīng)用于各大網(wǎng)站系統(tǒng)。社會化標簽對用戶有著至關(guān)重要的意義,用戶可以通過標簽對資源進行儲存、組織、管理、共享等。然而隨著用戶及標簽規(guī)模的不斷擴大,大多數(shù)標簽變成冗余信息,要從大量信息中通過標簽檢索獲取相關(guān)信息變得越來越困難,因此如何獲得對用戶有意義的標簽變得尤為重要。另外,社會化標簽的語義異構(gòu)問題也日益加劇,通過對標簽的聚類可以將語義上相似
2、的標簽聚集,從而有效解決標簽的語義異構(gòu)問題,并且在此基礎(chǔ)上實現(xiàn)的社會關(guān)系網(wǎng)絡(luò)發(fā)現(xiàn),可以實現(xiàn)好友推薦。除此之外,目前的社會化標簽系統(tǒng)往往是單語言的,在對多語言標簽聚類的基礎(chǔ)上實現(xiàn)多語言標簽的映射,可以解決標簽語言異構(gòu)問題。
本文采用不同的標簽自動抽取算法分別對博文正文信息進行標簽抽取,在標簽抽取的基礎(chǔ)上形成復(fù)合標簽,并與用戶給定的標簽進行比較分析。實驗結(jié)果表明自動抽取的標簽可以作為用戶標注標簽的有效補充,對用戶標注的標簽有一
3、定參考價值。
在標簽聚類方面,采用分裂式層次聚類算法分別對用戶標注的標簽以及機器抽取的標簽進行聚類,比較兩種不同來源下的標簽聚類結(jié)果。實驗結(jié)果表明用戶標注的標簽聚類效果明顯好于機器抽取標簽的聚類結(jié)果。
在中英文標簽聚類的基礎(chǔ)上,采用先聚類后翻譯的映射策略及基于機器翻譯的映射方法進行中英文標簽的映射研究。并將映射的研究用于標簽的具體應(yīng)用上。
在標簽聚類的應(yīng)用方面,我們選擇與某一產(chǎn)品相關(guān)聯(lián)的微博信息
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 多語言社會化標簽聚類及可視化研究.pdf
- 支持多語言標簽優(yōu)先的元搜索引擎結(jié)果聚類研究.pdf
- 多語言微博Hashtag生成及其應(yīng)用研究.pdf
- 基于多語言話題發(fā)現(xiàn)的聚類算法改進.pdf
- 多語言Web服務(wù)研究與應(yīng)用.pdf
- CMS研究及其在多語言門戶系統(tǒng)中的應(yīng)用.pdf
- 全文檢索在“2008奧運多語言系統(tǒng)”中的應(yīng)用研究與實現(xiàn).pdf
- 多語言語音識別技術(shù)研究.pdf
- unicode和多語言信息處理
- spreadjs前端表格控件加載多語言模板-
- 歐盟多語言環(huán)境下的法律翻譯研究.pdf
- 多語言智能信息服務(wù)系統(tǒng)項目計劃研究.pdf
- 多語言和多文化主義的教育
- 多語言智能移動終端的研究與開發(fā).pdf
- 基于AST的多語言代碼抄襲檢測研究.pdf
- 碰撞與介入——多語言文字共存設(shè)計研究
- 多語言在線招聘系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 引力聚類及其應(yīng)用研究.pdf
- 基于Symbian OS的多語言視頻通話系統(tǒng).pdf
- 聚類技術(shù)及其應(yīng)用研究.pdf
評論
0/150
提交評論