2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、計算機與信息學(xué)院計算機與信息學(xué)院本科畢業(yè)論文(設(shè)計)文獻綜述本科畢業(yè)論文(設(shè)計)文獻綜述淺談數(shù)據(jù)挖掘淺談數(shù)據(jù)挖掘0前言隨著網(wǎng)絡(luò)的迅猛發(fā)展,依托于網(wǎng)絡(luò)的網(wǎng)絡(luò)購物做為一種新型的消費方式脫穎而出,在全國乃至全球范圍內(nèi)都在迅猛的發(fā)展。網(wǎng)絡(luò)購物行業(yè)也越來越得到更多人的關(guān)注,與此同時,各種研究方法、數(shù)據(jù)分析方法也被運用到了關(guān)于網(wǎng)絡(luò)購物的研究當(dāng)中。數(shù)據(jù)挖掘技術(shù)作為一種新的數(shù)據(jù)分析方法逐步應(yīng)用到網(wǎng)絡(luò)購物的分析中,獲取數(shù)據(jù)、抽取規(guī)律、預(yù)測趨勢、建立模式,

2、這對促進網(wǎng)絡(luò)購物行業(yè)的健康、有序發(fā)展是十分有益的。本研究使用數(shù)據(jù)挖掘的方法,借助SAS工具,以阿里巴巴大數(shù)據(jù)競賽的真實數(shù)據(jù)為基礎(chǔ),對天貓用戶購物行為進行了研究分析。1什么是數(shù)據(jù)挖掘數(shù)據(jù)挖掘(英語:Datamining),又譯為資料探勘、數(shù)據(jù)采礦。它是數(shù)據(jù)庫知識發(fā)現(xiàn)(英語:KnowledgeDiscoveryinDatabases,簡稱:KDD)中的一個步驟。數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中信息的過程。數(shù)據(jù)挖掘通常與計

3、算機科學(xué)有關(guān),并通過統(tǒng)計、在線分析處理、情報檢索、機器學(xué)習(xí)、專家系統(tǒng)(依靠過去的經(jīng)驗法則)和模式識別等諸多方法來實現(xiàn)上述目標(biāo)。在較淺的層次上,它利用現(xiàn)有數(shù)據(jù)庫管理系統(tǒng)的查詢、檢索及數(shù)據(jù)挖掘功能,與多維分析、統(tǒng)計分析方法相結(jié)合,進行聯(lián)機運算分析處理,從而得出可供決策參考的統(tǒng)計分析數(shù)據(jù)的一個有商業(yè)意義的結(jié)果,這個結(jié)果可以出售給需要的賣家,這就是所謂的大數(shù)據(jù)分析。在深層次上,則從數(shù)據(jù)庫中發(fā)現(xiàn)前所未有的、隱含的知識。例如:在大街上川流不息的車流

4、量,在普通人眼里,當(dāng)你通過一個十字路口時,可能會看到除了塞車就是車禍,亦或者沒有事的安全通行,沒有其他的信息可能會有,如果是一個數(shù)據(jù)挖掘人員就會發(fā)現(xiàn)其中的數(shù)據(jù)信息,一小時會有橫向會有多少車流量,豎向會有多少車流量,這樣可以得到一組數(shù)據(jù),通過數(shù)據(jù)挖掘分析后得到更有的結(jié)果,十字路口的紅綠燈就可以根據(jù)車流量設(shè)置時間長短。而從另一個角度,如果在十字路口進行路線測繪的話,就可以得到類似地圖的數(shù)據(jù),手機中的導(dǎo)航軟件就是通過這樣實現(xiàn)的,所以我們生活中

5、數(shù)據(jù)挖掘無處不在,只是在我們不認識數(shù)據(jù)挖掘時,不會去發(fā)現(xiàn)。2數(shù)據(jù)挖掘的任務(wù)數(shù)據(jù)挖掘的兩個高層目標(biāo)是建立模型和預(yù)測。前者指用一些變量或數(shù)據(jù)庫的若干已知字段通過相應(yīng)的數(shù)據(jù)挖掘分析軟件,以及某些情況下需要實地考察,再結(jié)合團隊間的分析,結(jié)合數(shù)們需要將預(yù)測的結(jié)果整理成一份通俗易懂的報告,最好附上圖表,讓上司或領(lǐng)導(dǎo)更易理解,這也是十分關(guān)鍵的一步,一個好的結(jié)論沒有表述好,可能就會被拋棄。5天貓用戶數(shù)據(jù)挖掘的分析及作用數(shù)據(jù)挖掘如果運用到天貓、淘寶上,那

6、么他就目的只有一個就是盈利。我們都知道雙十一網(wǎng)購狂歡節(jié),今年2014年1分鐘就交易額突破了1億,如此巨大的交易額,不光需要他龐大的用戶量,還需要就是分析他們的需求信息。天貓用戶那么多,首先一點就是需要明確每一個用戶需要買什么東西,這就是我們數(shù)據(jù)挖掘需要做的,在我們上網(wǎng)點擊的過程,其實就是他們數(shù)據(jù)采集的過程,他們通過你點擊瀏覽的網(wǎng)站就預(yù)測你的喜好及可能還會去點擊的網(wǎng)站,并在一個欄目對你播放相對應(yīng)的廣告,促使你更有欲望去購買這些東西。6數(shù)據(jù)

7、挖掘的應(yīng)用領(lǐng)域及前景與國外相比,國內(nèi)對DMKD的研究稍晚,1993年國家自然科學(xué)基金首次開始支持對該領(lǐng)域的研究項目。近年來發(fā)展迅速,進行的大多數(shù)研究項目是由政府資助進行的,如國家自然科學(xué)基金、863計劃、“九五”計劃等。所涉及的研究領(lǐng)域很多,一般集中于學(xué)習(xí)算法的研究、數(shù)據(jù)挖掘的實際應(yīng)用以及有關(guān)數(shù)據(jù)挖掘理論方面的研究。國內(nèi)從事數(shù)據(jù)挖掘研究的機構(gòu)主要在大學(xué),也有部分在研究所或公司。當(dāng)前數(shù)據(jù)挖掘應(yīng)用主要集中在電信、零售、農(nóng)業(yè)、網(wǎng)絡(luò)日志、銀行、

8、電力、生物、天體、化工、醫(yī)藥等方面。5結(jié)論數(shù)據(jù)挖掘技術(shù)是一個讓你從無知到有知的探索,商業(yè)利益的強大驅(qū)動力將會不停地促進它的發(fā)展,每年都有新的數(shù)據(jù)挖掘方法和模型問世,人們對它的研究正日益廣泛和深入,他也將變得更加具有交互性、可視性。[參考文獻][1]彭劍芳.基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)購物行為的分析[D].云南:云南大學(xué),2011.5.1.[2]毛國君.數(shù)據(jù)挖掘技術(shù)與關(guān)聯(lián)規(guī)則挖掘算法研究[D].北京:北京工業(yè)大學(xué),2003.5.1.[3]李菁菁,邵

9、培基,黃亦瀟,等.數(shù)據(jù)挖掘在中國的現(xiàn)狀和發(fā)展研究[J].管理工程學(xué)報,2004(03):10~15.[4]毛國君,等.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社2005.[5]PangNingTan,MichaelSteinbach,VipinKum.數(shù)據(jù)挖掘?qū)д揫M]北京:人民郵電出版社2010.12.10[6]DavidH,HelkkiMannila,PadhraicSmyth.數(shù)據(jù)挖掘原理[J]北京:機械工業(yè)出版社200909

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論