

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、BIG DATA,--Prepared By xindong,不知道BIG DATA? 你out了!,前瞻來(lái)看,隨著互聯(lián)網(wǎng)對(duì)網(wǎng)民的理解,網(wǎng)民對(duì)網(wǎng)絡(luò)的反作用,互聯(lián)網(wǎng)將變得越來(lái)越智能。它在滿足你需求的同時(shí),也在創(chuàng)造新的需求。前者的代表是Google,后者的典型則是Facebook。谷歌的盈利在于所有的軟件應(yīng)用都是在線的。用戶在免費(fèi)使用這些產(chǎn)品的同時(shí),把個(gè)人的行為、喜好等信息也免費(fèi)的送給了Google。因此Google的產(chǎn)品線越豐富,他對(duì)用
2、戶的理解就越深入,他的廣告就越精準(zhǔn)。廣告的價(jià)值就越高。這是正向的循環(huán),谷歌好用的、免費(fèi)得軟件產(chǎn)品,換取對(duì)用戶的理解;通過(guò)精準(zhǔn)的廣告,找到生財(cái)之道。顛覆了微軟賣(mài)軟件拷貝賺錢(qián)的模式。成為互聯(lián)網(wǎng)的巨擘。,互聯(lián)網(wǎng)越來(lái)越智能,Google精確掌握用戶行為、獲取需求,微博為新浪帶來(lái)巨大價(jià)值,馬云的判斷來(lái)自于數(shù)據(jù)分析,“2008年初,阿里巴巴平臺(tái)上整個(gè)買(mǎi)家詢盤(pán)數(shù)急劇下滑,歐美對(duì)中國(guó)采購(gòu)在下滑。海關(guān)是賣(mài)了貨,出去以后再獲得數(shù)據(jù);而我們提前半年時(shí)間從詢
3、盤(pán)上推斷出世界貿(mào)易發(fā)生變化了?!?馬云對(duì)未來(lái)的預(yù)測(cè),是建立在對(duì)用戶行文分析的基礎(chǔ)上。通常而言,買(mǎi)家在采購(gòu)商品前,會(huì)比較多家供應(yīng)商的產(chǎn)品,反映到阿里巴巴網(wǎng)站統(tǒng)計(jì)數(shù)據(jù)中,就是查詢點(diǎn)擊的數(shù)量和購(gòu)買(mǎi)點(diǎn)擊的數(shù)量會(huì)保持一個(gè)相對(duì)的數(shù)值,綜合各個(gè)維度的數(shù)據(jù)可建立用戶行為模型。因?yàn)閿?shù)據(jù)樣本巨大,保證用戶行為模型的準(zhǔn)確性。因此在這個(gè)案例中,詢盤(pán)數(shù)據(jù)的下降,自然導(dǎo)致買(mǎi)盤(pán)的下降。騰訊在天津投資建立亞洲最大的數(shù)據(jù)中心;百度也在投資建立大數(shù)據(jù)處理中心;新浪推出
4、企業(yè)微博產(chǎn)品,提供精準(zhǔn)的數(shù)據(jù)分析服務(wù)。,Gartner 2011年技術(shù)成熟度曲線,大數(shù)據(jù)處?kù)陡咚侔l(fā)展期,技術(shù)演進(jìn)歷史揭示未來(lái)是大數(shù)據(jù)驅(qū)動(dòng)的智慧型經(jīng)濟(jì)模式,什麼才是大數(shù)據(jù)?,指數(shù)型增長(zhǎng)的海量數(shù)據(jù),海量數(shù)據(jù)就是大數(shù)據(jù)嗎?,大數(shù)據(jù)就是雲(yún)計(jì)算嗎?,大數(shù)據(jù)的4V特性,體量Volume,多樣性Variety,價(jià)值密度Value,速度Velocity,非結(jié)構(gòu)化數(shù)據(jù)的超大規(guī)模和增長(zhǎng)總數(shù)據(jù)量的80~90%比結(jié)構(gòu)化數(shù)據(jù)增長(zhǎng)快10倍到50倍是傳統(tǒng)數(shù)據(jù)倉(cāng)
5、庫(kù)的10倍到50倍,大數(shù)據(jù)的異構(gòu)和多樣性很多不同形式(文本、圖像、視頻、機(jī)器數(shù)據(jù))無(wú)模式或者模式不明顯不連貫的語(yǔ)法或句義,大量的不相關(guān)信息對(duì)未來(lái)趨勢(shì)與模式的可預(yù)測(cè)分析深度復(fù)雜分析(機(jī)器學(xué)習(xí)、人工智能Vs傳統(tǒng)商務(wù)智能(咨詢、報(bào)告等),實(shí)時(shí)分析而非批量式分析數(shù)據(jù)輸入、處理與丟棄立竿見(jiàn)影而非事后見(jiàn)效,Value 價(jià)值,挖掘大數(shù)據(jù)的價(jià)值類(lèi)似沙里淘金,從海量數(shù)據(jù)中挖掘稀疏但珍貴的信息.價(jià)值密度低,是大數(shù)據(jù)的一個(gè)典型特征.,Var
6、iety 多樣性,企業(yè)內(nèi)部的經(jīng)營(yíng)交易信息;物聯(lián)網(wǎng)世界中商品,物流信息;互聯(lián)網(wǎng)世界中人與人交互信息,位置信息等是大數(shù)據(jù)的主要來(lái)源. 能夠在不同的數(shù)據(jù)類(lèi)型中,進(jìn)行交叉分析的技術(shù),是大數(shù)據(jù)的核心技術(shù)之一.語(yǔ)義分析技術(shù),圖文轉(zhuǎn)換技術(shù),模式識(shí)別技術(shù),地理信息技術(shù)等,都會(huì)在大數(shù)據(jù)分析時(shí)獲得應(yīng)用.,Velocity 速度,1s 是臨界點(diǎn).對(duì)于大數(shù)據(jù)應(yīng)用而言,必須要在1秒鐘內(nèi)形成答案,否則處理結(jié)果就是過(guò)時(shí)和無(wú)效的.實(shí)時(shí)處理的要求,是區(qū)別
7、大數(shù)據(jù)引用和傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)技術(shù),BI技術(shù)的關(guān)鍵差別之一.,Volume 數(shù)據(jù)量,PB是大數(shù)據(jù)層次的臨界點(diǎn). KB->MB->GB->TB->PB->EB->ZB->YB->NB->DB,對(duì)大數(shù)據(jù)的進(jìn)一步理解,大數(shù)據(jù)比云計(jì)算更為落地,商業(yè)模式驅(qū)動(dòng),應(yīng)用需求驅(qū)動(dòng),,云計(jì)算本身也是大數(shù)據(jù)的一種業(yè)務(wù)模式,大數(shù)據(jù)不僅僅是“大”,多大?PB 級(jí),比大更重要的是數(shù)據(jù)的復(fù)雜性,有時(shí)甚至大數(shù)據(jù)中的小數(shù)
8、據(jù)如一條微博就具有顛覆性的價(jià)值,軟件是大數(shù)據(jù)的引擎,和數(shù)據(jù)中心(Data Center) 一樣,軟件是大數(shù)據(jù)的驅(qū)動(dòng)力.軟件改變世界!,大數(shù)據(jù)生態(tài):軟件是引擎,,大數(shù)據(jù)的應(yīng)用不僅僅是精準(zhǔn)營(yíng)銷(xiāo),通過(guò)用戶行為分析實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)是大數(shù)據(jù)的典型應(yīng)用,但是大數(shù)據(jù)在各行各業(yè)特別是公共服務(wù)領(lǐng)域具有廣闊的應(yīng)用前景,消費(fèi)行業(yè),金融服務(wù),食品安全,醫(yī)療衛(wèi)生,軍事,交通環(huán)保,電子商務(wù),氣象,管理大數(shù)據(jù)“易”,理解大數(shù)據(jù)“難”,目前大數(shù)據(jù)管理多從架構(gòu)和并行等方
9、面考慮,解決高并發(fā)數(shù)據(jù)存取的性能要求及數(shù)據(jù)存儲(chǔ)的橫向擴(kuò)展,但對(duì)非結(jié)構(gòu)化數(shù)據(jù)的內(nèi)容理解仍缺乏實(shí)質(zhì)性的突破和進(jìn)展,這是實(shí)現(xiàn)大數(shù)據(jù)資源化、知識(shí)化、普適化的核心.非結(jié)構(gòu)化海量信息的智能化處理:自然語(yǔ)言理解、多媒體內(nèi)容理解、機(jī)器學(xué)習(xí)等.,大數(shù)據(jù)為什么重要?,更高一層數(shù)據(jù)層面整合企業(yè)內(nèi)外部,更高數(shù)據(jù)層面整合,利用用戶”行為指紋”創(chuàng)造新商機(jī),用戶在線的每一次點(diǎn)擊,每一次評(píng)論,每一個(gè)視頻點(diǎn)播,就是大數(shù)據(jù)的典型來(lái)源?;ヂ?lián)網(wǎng)企業(yè)之所以取得令人矚目的成
10、績(jī),其核心的本質(zhì)就是包括用戶網(wǎng)絡(luò)操作的大數(shù)據(jù),進(jìn)行記錄和分析,形成用戶“行為指紋”,從而洞悉用戶的潛在的、真實(shí)的需求,形成預(yù)判。這是傳統(tǒng)企業(yè)花費(fèi)重金都難以企及的夢(mèng)想。所有傳統(tǒng)的產(chǎn)品公司都只能淪為這種新型用戶平臺(tái)級(jí)公司的附庸。,大數(shù)據(jù)組成和展現(xiàn)方式?,,,,基于SQL語(yǔ)言: 面對(duì)OLAP的傳統(tǒng)行和列,不基于SQL或map-reduce的: 由谷歌率先發(fā)起,數(shù)據(jù)流: 基于運(yùn)行商數(shù)據(jù)直接生成任意圖形,,,,,,數(shù)據(jù)入口/匯聚,數(shù)據(jù)平臺(tái),分
11、析,,,,,傳統(tǒng)交付模式 - 單片或基于設(shè)備的解決方案,,云: 能夠充分利用物理設(shè)施的彈性,以實(shí)現(xiàn)處理快速增長(zhǎng)數(shù)據(jù)的能力,“數(shù)據(jù)庫(kù)將演變成一個(gè)虛擬的,基于云計(jì)算,超級(jí)可擴(kuò)展的分布式平臺(tái)?!? Forrester analyst Jim Kobielus,新模式和新技術(shù),展現(xiàn)方式:大型控制中心、移動(dòng)終端,在多樣性、體量、速度三大主要特征的指引下,大數(shù)據(jù)將有新型的展現(xiàn)方式:大型控制中心和移動(dòng)終端,實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)處理和快
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2017中國(guó)大數(shù)據(jù)應(yīng)用大會(huì)介紹
- 中國(guó)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展評(píng)估報(bào)告 2018年
- 2015中國(guó)大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)發(fā)展報(bào)告
- 中國(guó)大學(xué)交通運(yùn)輸學(xué)院運(yùn)輸服務(wù)大數(shù)據(jù)
- 人口紅利能否中國(guó)大數(shù)據(jù)征信實(shí)現(xiàn)彎道超車(chē)?
- 美國(guó)大數(shù)據(jù)研究與發(fā)展計(jì)劃
- 中國(guó)大數(shù)據(jù)行業(yè)深度研究與發(fā)展規(guī)劃分析報(bào)告(-2019)24
- 我國(guó)大數(shù)據(jù)產(chǎn)業(yè)鏈及戰(zhàn)略地位分析
- 我國(guó)大數(shù)據(jù)反腐的進(jìn)程、困境及對(duì)策研究.pdf
- 大數(shù)據(jù)大數(shù)據(jù)的實(shí)際應(yīng)用
- 用大數(shù)據(jù)打造誠(chéng)信中國(guó)圈
- 大數(shù)據(jù)時(shí)代下的中國(guó)市場(chǎng)
- tesco中國(guó)用大數(shù)據(jù)對(duì)抗電商
- 大數(shù)據(jù)數(shù)據(jù)挖掘
- 大數(shù)據(jù)數(shù)據(jù)挖掘
- 大數(shù)據(jù)數(shù)據(jù)挖掘
- 中國(guó)出版業(yè)適合應(yīng)用“大數(shù)據(jù)”嗎?
- 中國(guó)“互聯(lián)網(wǎng)紅包”大數(shù)據(jù)報(bào)告
- 中國(guó)家庭健康大數(shù)據(jù)報(bào)告2018
- 大數(shù)據(jù)挖掘外文翻譯—大數(shù)據(jù)挖掘研究
評(píng)論
0/150
提交評(píng)論