

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于通信數(shù)據(jù)的移動(dòng)用戶(hù)行為分析基于通信數(shù)據(jù)的移動(dòng)用戶(hù)行為分析[摘要]認(rèn)為分析移動(dòng)用戶(hù)行為特征與分類(lèi),對(duì)移動(dòng)應(yīng)用個(gè)性化服務(wù)的改進(jìn)具有重要的參考價(jià)值。基于國(guó)內(nèi)電信運(yùn)營(yíng)商隨機(jī)抽取某市一萬(wàn)移動(dòng)用戶(hù)一周的日志記錄,其中含有4萬(wàn)余條通話(huà)記錄和200余萬(wàn)條網(wǎng)絡(luò)請(qǐng)求,每條請(qǐng)求包含對(duì)應(yīng)的基站標(biāo)號(hào)以及基站地理位置。本研究從消費(fèi)能力、通話(huà)量、網(wǎng)絡(luò)請(qǐng)求量、位移量四個(gè)維度從這批數(shù)據(jù)中提取14種基本特征指標(biāo)。利用KMeans聚類(lèi)方法將移動(dòng)用戶(hù)區(qū)分成規(guī)律通話(huà)型、隨機(jī)
2、上網(wǎng)型、居家節(jié)約型和隨機(jī)高消費(fèi)型等四類(lèi)用戶(hù)模型。[關(guān)鍵詞]用戶(hù)行為分析移動(dòng)用戶(hù)研究聚類(lèi)分析數(shù)據(jù)挖掘[分類(lèi)號(hào)]G351引言引言隨著移動(dòng)通信技術(shù)的迅猛發(fā)展和廣泛應(yīng)用,移動(dòng)終端大量普及于民眾,也產(chǎn)生了大量用戶(hù)信息記錄,如何利用大數(shù)據(jù)來(lái)了解移動(dòng)用戶(hù)行為與習(xí)慣特征的研究不斷涌現(xiàn)。通過(guò)對(duì)移動(dòng)用戶(hù)的分析與了解,許多企業(yè)與政府部門(mén)可以依據(jù)結(jié)果提供各式各樣的服務(wù)與應(yīng)用方案。移動(dòng)用戶(hù)行為分析通常是指基于地理信息涉及用戶(hù)訪(fǎng)問(wèn)網(wǎng)絡(luò)、通話(huà)的行為規(guī)律與活動(dòng)研究。電
3、信運(yùn)營(yíng)商通過(guò)獲取用戶(hù)訪(fǎng)問(wèn)移動(dòng)互聯(lián)網(wǎng)、使用移動(dòng)應(yīng)用及通話(huà)的行為規(guī)律能夠有效地配置網(wǎng)絡(luò)資源并提供具有針對(duì)性的服務(wù)。近年來(lái),針對(duì)桌面端日志挖掘的研究層出不窮,[151617]都是針對(duì)桌面端web服務(wù)的后臺(tái)日志挖掘入手,通過(guò)分析用戶(hù)訪(fǎng)問(wèn)頁(yè)面的占比、用戶(hù)訪(fǎng)問(wèn)的頁(yè)面順序等對(duì)用戶(hù)的行為進(jìn)行建模。而針對(duì)移動(dòng)用戶(hù)的行為分析研究則在很多方面借鑒了桌面端的研究,同時(shí)利用移動(dòng)端設(shè)備的地理位置位置記錄,挖掘出用戶(hù)移動(dòng)軌跡模式,找出軌跡中重要的位置并結(jié)合通信數(shù)據(jù)、
4、互聯(lián)網(wǎng)日志數(shù)據(jù)以及移動(dòng)應(yīng)用數(shù)據(jù)作為研究的基礎(chǔ),分析挖掘移動(dòng)用戶(hù)的需求、行為、興趣,甚至是通過(guò)預(yù)測(cè)用戶(hù)的目的地、推測(cè)用戶(hù)下一步即將到達(dá)的位置以便提供針對(duì)性的推薦服務(wù)[1,13]。傳統(tǒng)的移動(dòng)用戶(hù)軌跡分析,多數(shù)利用軟件采集仿真數(shù)據(jù),屬于細(xì)時(shí)空粒度下的數(shù)據(jù),即可以采集到用戶(hù)一天中連續(xù)時(shí)間段的位置數(shù)據(jù)。Y.Zhu等作者著眼于用戶(hù)位置數(shù)據(jù)中經(jīng)常出現(xiàn)的地點(diǎn),并根據(jù)出現(xiàn)時(shí)間來(lái)推測(cè)用戶(hù)所處的位置是家還是公司[2]。此外,S.Akoush和A.Sameh則
5、通過(guò)指定時(shí)間粒度,聚類(lèi)用戶(hù)在多日同一時(shí)間段的行動(dòng)軌跡,利用稀疏數(shù)據(jù)擬合出用戶(hù)在這時(shí)間段移動(dòng)軌跡的目的[3]。研究用戶(hù)的移動(dòng)軌跡,實(shí)現(xiàn)預(yù)測(cè)用戶(hù)下一步位置目的的方法,包括利用貝葉斯算法、聚類(lèi)、數(shù)據(jù)挖掘方法等。實(shí)際上,電信運(yùn)營(yíng)商服務(wù)器上的數(shù)據(jù)是粗時(shí)間粒度的,唯有請(qǐng)求通信或上網(wǎng)時(shí)才會(huì)被記錄,因此用戶(hù)位置變化是不連貫的,具有隨機(jī)性、稀疏性的特點(diǎn),不能支持用戶(hù)行為軌跡直接且連續(xù)的刻畫(huà)描述。譚均元等人提出了生活熵概念作為用戶(hù)移動(dòng)軌跡規(guī)律程度的度量[4
6、],采用了個(gè)人多天時(shí)段移動(dòng)序列的算法來(lái)彌補(bǔ)實(shí)際數(shù)據(jù)的這種不足,即通過(guò)對(duì)多天數(shù)據(jù)的分析來(lái)獲得更準(zhǔn)確的用戶(hù)移動(dòng)軌跡。S.A.Shad則結(jié)合地理信息與用戶(hù)提供的上下文語(yǔ)義信息來(lái)增加預(yù)測(cè)準(zhǔn)確性[5]。梁鵬等作者則透過(guò)在WAP網(wǎng)關(guān)進(jìn)行數(shù)據(jù)采集,并對(duì)數(shù)據(jù)進(jìn)行數(shù)值分析和擬合最后得到用析處理的類(lèi)庫(kù)Numpy、Pas[14]等大大降低了的我們的工作難度。3特征選取特征選取本研究通過(guò)特征選取與統(tǒng)計(jì)結(jié)果來(lái)挖掘移動(dòng)用戶(hù)的特征,并利用這特征作為聚類(lèi)的參數(shù),將移動(dòng)
7、用戶(hù)行為分類(lèi)。本研究利用消費(fèi)能力、通話(huà)量、網(wǎng)絡(luò)請(qǐng)求量、位移量四個(gè)維度作為分析用戶(hù)行為的基礎(chǔ)。根據(jù)這四個(gè)維度的特征從該批數(shù)據(jù)中提取相關(guān)的評(píng)價(jià)指標(biāo),分別包含。消費(fèi)能力:通過(guò)客戶(hù)品牌、系統(tǒng)、話(huà)費(fèi)三種來(lái)綜合用戶(hù)的消費(fèi)階層;通話(huà)量:利用每日通話(huà)次數(shù)、通話(huà)時(shí)長(zhǎng)、每次通話(huà)時(shí)長(zhǎng)、以及各時(shí)間段通話(huà)時(shí)長(zhǎng)分布等作為用戶(hù)通話(huà)習(xí)慣的評(píng)價(jià)指標(biāo);網(wǎng)絡(luò)請(qǐng)求量:利用網(wǎng)絡(luò)請(qǐng)求次數(shù)、各時(shí)間段的網(wǎng)絡(luò)請(qǐng)求分布等統(tǒng)計(jì)結(jié)果作為描述用戶(hù)上網(wǎng)習(xí)慣的特征參數(shù);位移量:使用每日出現(xiàn)的基站數(shù)
8、、位置位移量與生活熵的統(tǒng)計(jì)和計(jì)算結(jié)果來(lái)描述用戶(hù)一天中位置變化參數(shù)。3.1消費(fèi)能力本研究通過(guò)客戶(hù)品牌、手機(jī)系統(tǒng)、話(huà)費(fèi)三種特征來(lái)綜合評(píng)價(jià),評(píng)量用戶(hù)的消費(fèi)階層。該批數(shù)據(jù)的電信運(yùn)營(yíng)商提供主要三個(gè)客戶(hù)品牌:動(dòng)感地帶、全球通和神州行,動(dòng)感地帶是面向年輕群體的客戶(hù)品牌,目標(biāo)用戶(hù)是每月月話(huà)費(fèi)值低,但是數(shù)據(jù)業(yè)務(wù)比重高的用戶(hù)。全球通則面向中高端用戶(hù),較早地推出國(guó)際漫游和手機(jī)銀行等加值服務(wù)。神州行則是面向大眾用戶(hù),客戶(hù)群的職業(yè)、年齡等跨度都較大,資費(fèi)注重實(shí)惠
9、、大眾化。由此可知,客戶(hù)品牌作為用戶(hù)個(gè)人消費(fèi)能力的一種特征。該批數(shù)據(jù)中,屬于“動(dòng)感地帶”客戶(hù)品牌的用戶(hù)占全部的66%,使用“全球通”的用戶(hù)占全部的13%,而“神州行”的用戶(hù)占全部的21%。因此,主要手機(jī)移動(dòng)用戶(hù)以年輕用戶(hù)為居多,并數(shù)據(jù)業(yè)務(wù)比重高的需求大。由于每個(gè)用戶(hù)移動(dòng)裝置的具體消費(fèi)型號(hào)無(wú)法取得,本研究通過(guò)該用戶(hù)手機(jī)的品牌與操作系統(tǒng)作為該用戶(hù)的手機(jī)消費(fèi)喜好參考特征之一,依據(jù)用戶(hù)使用的系統(tǒng)與品牌主要分成安卓(roid)、蘋(píng)果(iOS)、微
10、軟(Windows)、黑莓(Blackberry)以及其他(Other)。由于安卓系統(tǒng)占很大比例,而且該系統(tǒng)的手機(jī)消費(fèi)分布廣泛,因此在切分成三星(Samsung)、小米魅族,以及其他安卓(Othersofroid)。小米手機(jī)和魅族在價(jià)位及使用的用戶(hù)群方面類(lèi)似,因此本研究將其歸為一類(lèi)。盡管黑莓系統(tǒng)手機(jī)數(shù)量很少,但較多專(zhuān)業(yè)人員使用,本研究仍單獨(dú)劃為一類(lèi)。經(jīng)統(tǒng)計(jì)使用系統(tǒng)的用戶(hù)比例分別為:蘋(píng)果,22.02%。微軟,2.32%。黑莓,0.25%。
11、三星,19.39%。小米魅族,7.92%。其他安卓,20.12%。其它系統(tǒng),27.93%。由此可知,多數(shù)用戶(hù)仍選用安卓與蘋(píng)果系統(tǒng)的手機(jī)。用戶(hù)在使用移動(dòng)服務(wù)的過(guò)程中,消費(fèi)主要分為三類(lèi):通話(huà)費(fèi)、流量費(fèi)和增值業(yè)務(wù)費(fèi)。本研究將這三種消費(fèi)的總和作為移動(dòng)用戶(hù)的消費(fèi)金額。統(tǒng)計(jì)發(fā)現(xiàn),用戶(hù)月話(huà)費(fèi)額的均值為51.01元,中位數(shù)為33.20元,并且半數(shù)的用戶(hù)話(huà)費(fèi)介于12.77至66.52元之間。3.2通話(huà)量利用平均每日通話(huà)次數(shù)、平均通話(huà)時(shí)長(zhǎng)、每次平均通話(huà)時(shí)長(zhǎng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于數(shù)據(jù)挖掘的移動(dòng)用戶(hù)投訴行為研究.pdf
- 移動(dòng)用戶(hù)行為分析算法與平臺(tái)研究
- 基于3G網(wǎng)絡(luò)的移動(dòng)用戶(hù)行為分析.pdf
- 移動(dòng)用戶(hù)漫游通信實(shí)現(xiàn)研究
- 基于行為分析的移動(dòng)通信用戶(hù)細(xì)分——以某地市公司移動(dòng)用戶(hù)為研究對(duì)象.pdf
- 數(shù)據(jù)挖掘在電信移動(dòng)用戶(hù)行為分析中的應(yīng)用研究.pdf
- 移動(dòng)用戶(hù)行為分析算法與平臺(tái)研究.pdf
- 基于移動(dòng)用戶(hù)行為的挖掘及推薦算法研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的移動(dòng)用戶(hù)消費(fèi)行為模式研究與應(yīng)用.pdf
- 基于數(shù)據(jù)挖掘的移動(dòng)用戶(hù)穩(wěn)定性研究.pdf
- 移動(dòng)用戶(hù)上網(wǎng)行為審計(jì)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 移動(dòng)用戶(hù)感知數(shù)據(jù)監(jiān)控分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 移動(dòng)用戶(hù)上網(wǎng)行為分析系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 移動(dòng)用戶(hù)軌跡與行為模式挖掘方法研究.pdf
- 淺談移動(dòng)用戶(hù)界面設(shè)計(jì)
- 移動(dòng)用戶(hù)定量預(yù)測(cè)方法的研究.pdf
- 數(shù)據(jù)挖掘在移動(dòng)用戶(hù)離網(wǎng)預(yù)警分析中的應(yīng)用.pdf
- 基于電信大數(shù)據(jù)挖掘的高價(jià)值移動(dòng)用戶(hù)預(yù)測(cè)研究.pdf
- 面向移動(dòng)用戶(hù)數(shù)據(jù)的情境識(shí)別與挖掘(1)
- 基于時(shí)序分析的移動(dòng)用戶(hù)情感預(yù)測(cè)研究與應(yīng)用.pdf
評(píng)論
0/150
提交評(píng)論