基于遞歸神經(jīng)網(wǎng)絡(luò)的廣告點擊率預(yù)估.pdf_第1頁
已閱讀1頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、伴隨著互聯(lián)網(wǎng)而生的在線廣告,在過去幾十年里,得到飛速發(fā)展。廣告點擊率作為計算廣告的重要研究內(nèi)容,越來越受到人們的關(guān)注。借助機器學(xué)習(xí),根據(jù)歷史數(shù)據(jù)預(yù)估廣告點擊率是目前的主要方法,憑借準(zhǔn)確的廣告點擊率預(yù)估可以使廣告投放得更加精準(zhǔn),提高真實的點擊率,增加收益。雖然使用線性模型可以簡單地預(yù)估廣告點擊率,但是線性模型的學(xué)習(xí)能力有限,對于越來越多的數(shù)據(jù)特征,無法更有效得學(xué)習(xí),而且在學(xué)習(xí)的過程中容易出現(xiàn)過度擬合的情況,影響模型對特征的學(xué)習(xí)?;谏窠?jīng)網(wǎng)

2、絡(luò)算法的模型采用非線性激勵函數(shù)以及多層節(jié)點結(jié)構(gòu)可以更好得學(xué)習(xí)大量非線性特征之間復(fù)雜的關(guān)系,從而提高模型的預(yù)估能力。其中,遞歸神經(jīng)網(wǎng)絡(luò)是一種網(wǎng)絡(luò)中存在環(huán)結(jié)構(gòu)、能存儲神經(jīng)元前一時刻的輸出并且具有較強的優(yōu)化計算能力的神經(jīng)網(wǎng)絡(luò)。本文主要工作包括以下三個方面:
  (1)本文針對不同的模型進行相應(yīng)的特征處理,邏輯回歸模型采用拼接顯性特征組合提取隱藏用戶屬性,再通過哈希映射,將原來不同類型的特征值轉(zhuǎn)換成相同類型的特征值。隨機森林模型采用建立特

3、征字典,過濾頻次過低的樣本數(shù),然后進行one-hot編碼去處理特征。基于神經(jīng)網(wǎng)絡(luò)的模型,本文采用首先計算特征的頻次,并建立特征頻次字典,將字符型特征轉(zhuǎn)變成整型特征,然后將轉(zhuǎn)化后的特征進行離差標(biāo)準(zhǔn)化,使每個特征的特征值范圍在[0,1]之間。
  (2)遞歸神經(jīng)網(wǎng)絡(luò)雖然已經(jīng)應(yīng)用于廣告點擊率的預(yù)估,但是遞歸神經(jīng)網(wǎng)絡(luò)模型采用梯度下降,在趨近最小值時,可能會出現(xiàn)梯度爆發(fā)或消失,從而影響預(yù)估效果。本文采用基于LSTM(long short t

4、erm memory)改進的遞歸神經(jīng)網(wǎng)絡(luò)預(yù)估廣告點擊率,利用LSTM去修正RNN,來防止梯度的爆發(fā)或消失。實驗結(jié)果表明基于LSTM改進的遞歸神經(jīng)網(wǎng)絡(luò)模型在預(yù)估廣告點擊率方面取得了較好的效果。
  (3)本文采用python語言編寫邏輯回歸模型,隨機森林模型、BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)模型、遞歸神經(jīng)網(wǎng)絡(luò)模型和基于LSTM(Area Under roc Curve)改進的遞歸神經(jīng)網(wǎng)絡(luò)模型。并分別采用sigmoid

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論