數據分析與可視化_第1頁
已閱讀1頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數據分析與可視化數據分析與可視化1.1.什么是數據分析?什么是數據分析?數據分析是基于商業(yè)目的,有目的的進行收集、整理、加工和分析數據,提煉有價信息的一個過程。其過程概括起來主要包括:明確分析目的與框架、數據收集、數據處理、數據分析、數據展現(xiàn)和撰寫報告等6個階段。1、明確分析目的與框架一個分析項目,你的數據對象是誰?商業(yè)目的是什么?要解決什么業(yè)務問題?數據分析師對這些都要了然于心。基于商業(yè)的理解,整理分析框架和分析思路。例如,減少新客戶

2、的流失、優(yōu)化活動效果、提高客戶響應率等等。不同的項目對數據的要求,使用的分析手段也是不一樣的。2、數據收集數據收集是按照確定的數據分析和框架內容,有目的的收集、整合相關數據的一個過程,它是數據分析的一個基礎。3、數據處理數據處理是指對收集到的數據進行加工、整理,以便開展數據分析,它是數據分析前必不可少的階段。這個過程是數據分析整個過程中最占據時間的,也在一定程度上取決于數據倉庫的搭建和數據質量的保證。數據處理主要包括數據清洗、數據轉化等

3、處理方法。4、數據分析數據分析是指通過分析手段、方法和技巧對準備好的數據進行探索、分析,從中發(fā)現(xiàn)因果關系、內部聯(lián)系和業(yè)務規(guī)律,為商業(yè)目提供決策參考。到了這個階段,要能駕馭數據、開展數據分析,就要涉及到工具和方法的使用。其一要熟悉常規(guī)數據分析方法,最基本的要了解例如方差、回歸、因子、聚類、分類、時間序列等多元和數據分析方法的原理、使用范圍、優(yōu)缺點和結果的解釋;其二是熟悉11種數據分析工具,Excel是最常見,一般的數據分析我們可以通過Ex

4、cel完成,后而要熟悉一個專業(yè)的分析軟件,如數據分析工具SPSSSASRMatlab等,便于進行一些專業(yè)的統(tǒng)計分析、數據建模等。中,人們不必事先給出一個分類的標準,聚類分析能夠從樣本數據出發(fā),自動進行分類。聚類分析所使用方法的不同,常常會得到不同的結論。不同研究者對于同一組數據進行聚類分析,所得到的聚類數未必一致。2、因子分析(、因子分析(FactFactAnalysisAnalysis)因子分析是指研究從變量群中提取共性因子的統(tǒng)計技術

5、。因子分析就是從大量的數據中尋找內在的聯(lián)系,減少決策的困難。因子分析的方法約有10多種,如重心法、影像分析法,最大似然解、最小平方法、阿爾發(fā)抽因法、拉奧典型抽因法等等。這些方法本質上大都屬近似方法,是以相關系數矩陣為基礎的,所不同的是相關系數矩陣對角線上的值,采用不同的共同性□2估值。在社會學研究中,因子分析常采用以主成分分析為基礎的反覆法。3、相關分析(、相關分析(CrelationCrelationAnalysisAnalysis)

6、相關分析(crelationanalysis),相關分析是研究現(xiàn)象之間是否存在某種依存關系,并對具體有依存關系的現(xiàn)象探討其相關方向以及相關程度。相關關系是一種非確定性的關系,例如,以X和Y分別記一個人的身高和體重,或分別記每公頃施肥量與每公頃小麥產量,則X與Y顯然有關系,而又沒有確切到可由其中的一個去精確地決定另一個的程度,這就是相關關系。4、對應分析(、對應分析(CrespondenceCrespondenceAnalysisAnal

7、ysis)對應分析(Crespondenceanalysis)也稱關聯(lián)分析、RQ型因子分析,通過分析由定性變量構成的交互匯總表來揭示變量間的聯(lián)系??梢越沂就蛔兞康母鱾€類別之間的差異,以及不同變量各個類別之間的對應關系。對應分析的基本思想是將一個聯(lián)列表的行和列中各元素的比例結構以點的形式在較低維的空間中表示出來。5、回歸分析、回歸分析研究一個隨機變量Y對另一個(X)或一組(X1,X2,…,Xk)變量的相依關系的統(tǒng)計分析方法?;貧w分析(r

8、egressionanalysis)是確定兩種或兩種以上變數間相互依賴的定量關系的一種統(tǒng)計分析方法。運用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關系類型,可分為線性回歸分析和非線性回歸分析。6、方差分析、方差分析(ANOVAAnalysis(ANOVAAnalysisofofVariance)Variance)又稱“變異數分析”或“F檢驗”,是R.A.Fisher發(fā)明的,用于兩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論