科研社交網(wǎng)站中的學(xué)者推薦研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩74頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Web2.0時(shí)代,社交網(wǎng)絡(luò)用戶可以自由的發(fā)布信息、交流思想,吸引了人們?cè)谠擃惼脚_(tái)上建立社區(qū)、交流知識(shí),由于一般社交網(wǎng)絡(luò)缺乏專業(yè)學(xué)術(shù)氛圍,2007年起出現(xiàn)了專門面向?qū)W術(shù)工作者的科研社交網(wǎng)站,如國(guó)外的ResearchGate、Academia.edu,國(guó)內(nèi)的百度學(xué)術(shù)、科研之友等。他們?cè)诰W(wǎng)站中瀏覽彼此主頁(yè)、尋找感興趣的文獻(xiàn)與學(xué)者、參與學(xué)術(shù)話題討論、相互提問(wèn)解答,這使得全球各領(lǐng)域科研人員能夠方便地進(jìn)行即時(shí)學(xué)術(shù)探討、尋求潛在合作機(jī)會(huì)。發(fā)現(xiàn)相似研究

2、學(xué)者與潛在合作者是科研工作者使用網(wǎng)站的重要理由之一。
  但是,科研社交網(wǎng)絡(luò)存在與大眾社交網(wǎng)絡(luò)相同的信息過(guò)載、信息不對(duì)稱的問(wèn)題,基于學(xué)者的學(xué)術(shù)知識(shí)與科研合作網(wǎng)絡(luò)構(gòu)建個(gè)性化推薦模型是有效的解決手段。進(jìn)一步地,目前信息處理與檢索系統(tǒng)的一個(gè)新趨勢(shì)是對(duì)情境化數(shù)據(jù)的獲取,將其考慮進(jìn)信息處理中,有助于提高推薦精確度,緩解信息過(guò)載,更好的適應(yīng)與用戶已有歷史記錄相獨(dú)立的特殊需求。為此,本文分析了科研社交網(wǎng)站中學(xué)者的社交動(dòng)機(jī),得出推薦場(chǎng)景差異,認(rèn)為

3、學(xué)者主要對(duì)同一研究領(lǐng)域、具有相似研究偏好的學(xué)者感興趣,并與他們建立長(zhǎng)期的社交關(guān)系,除此外,很多學(xué)者具有情境化特征,希望尋找具有特定要求限制下的合作者,如已有研究主題的項(xiàng)目或者論文。因此,本文提出了兩個(gè)學(xué)者推薦模型,即基于相似研究興趣的學(xué)者推薦模型,和基于特定情境的合作者推薦模型。針對(duì)兩種推薦情境,本文分別設(shè)計(jì)了合理對(duì)應(yīng)的解決策略。
  在基于相似研究興趣的學(xué)者推薦模型中,本文構(gòu)造了兩個(gè)子模型:學(xué)者檔案模型與學(xué)術(shù)行為網(wǎng)絡(luò)模型。在學(xué)者

4、檔案模型中,采用語(yǔ)言模型,依據(jù)學(xué)者的專業(yè)、研究領(lǐng)域、研究成果等信息表征學(xué)者知識(shí),使用基于貝葉斯分解的生成概率計(jì)算學(xué)者知識(shí)的相似度;在學(xué)術(shù)行為網(wǎng)絡(luò)模型中,通過(guò)挖掘?qū)W者學(xué)術(shù)行為網(wǎng)絡(luò)中的關(guān)系,采用Adamic-Adar方法和最短路徑方法分別測(cè)量合作者網(wǎng)絡(luò)中的學(xué)者節(jié)點(diǎn)相似度和路徑距離,從全局學(xué)術(shù)領(lǐng)域和局部研究領(lǐng)域兩個(gè)角度采用Jaccard系數(shù)表示研究學(xué)者所在單位間的合作網(wǎng)絡(luò)關(guān)系度;最后,應(yīng)用Comb策略整合以上測(cè)量,預(yù)測(cè)相似度較高的學(xué)者為推薦學(xué)

5、者。在基于特定情境下的合作者推薦模型中,本文設(shè)計(jì)了兩個(gè)標(biāo)準(zhǔn)評(píng)定潛在合作者的質(zhì)量:學(xué)者學(xué)術(shù)質(zhì)量評(píng)價(jià)與學(xué)術(shù)社會(huì)網(wǎng)絡(luò)質(zhì)量評(píng)價(jià)。在學(xué)者學(xué)術(shù)質(zhì)量評(píng)價(jià)中,同時(shí)引入情境預(yù)過(guò)濾和情境后過(guò)濾到推薦方法中,使用學(xué)者的學(xué)術(shù)成果質(zhì)量(成果數(shù)量、發(fā)表刊物級(jí)別、被引用量)、職稱、G指數(shù)來(lái)為學(xué)者的學(xué)術(shù)能力評(píng)分,對(duì)情境信息進(jìn)行預(yù)處理、提取特征詞,首先采用情境預(yù)過(guò)濾策略選出含有情境內(nèi)容特征的學(xué)者構(gòu)成初步候選合作者集,然后采用調(diào)整的潛狄利克雷分配方法對(duì)情景主題分配關(guān)鍵詞,

6、運(yùn)用Kullback-Leibler差異計(jì)算初步候選合作者集中的學(xué)者與目標(biāo)學(xué)者間的知識(shí)匹配,并將MNZ標(biāo)準(zhǔn)化后的學(xué)者學(xué)術(shù)能力評(píng)分作為匹配計(jì)算中的權(quán)重值;在學(xué)術(shù)社會(huì)網(wǎng)絡(luò)質(zhì)量評(píng)價(jià)中,構(gòu)建了多元關(guān)系網(wǎng)絡(luò),包括四種關(guān)系類型:論文合作、項(xiàng)目合作、專利合作、出席相同會(huì)議,先計(jì)算學(xué)者間四種關(guān)系的數(shù)量,再引入關(guān)系年限修正得到合作質(zhì)量評(píng)分;最后對(duì)兩項(xiàng)評(píng)分進(jìn)行整合得到合作意向評(píng)分。兩個(gè)推薦模型的具體構(gòu)建方法見(jiàn)于論文第四章。
  同時(shí),為了模型應(yīng)用的清

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論