版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第4章樣本描述與數(shù)據(jù)準備樣本數(shù)據(jù)采集到以后,不能立即用于數(shù)據(jù)分析,因為樣本可能存在錯誤數(shù)據(jù)、缺失數(shù)據(jù)或者異常數(shù)據(jù),或者采集的數(shù)據(jù)不符合要求,不具有代表性,這些情況會直接影響到分析結果的準確性和準確性。所以,進行數(shù)據(jù)分析以前,需要首先了解一下樣本數(shù)據(jù)的基本特征,并對缺失值和異常值等進行適當?shù)奶幚?。第一?jié)樣本的描述一、基本數(shù)學知識一、基本數(shù)學知識樣本數(shù)據(jù)采集到以后,常用一些統(tǒng)計量描述原始數(shù)據(jù)的集中程度和離散狀況,對數(shù)據(jù)的總體特征進行歸納。(
2、1)描述中心趨勢的統(tǒng)計量算術平均數(shù)算術平均數(shù):樣本數(shù)據(jù)的總和除以數(shù)據(jù)個數(shù)得到算術平均數(shù),算術平均數(shù)是描述樣本數(shù)據(jù)中心趨勢最常用的統(tǒng)計量,因為具有計算簡便、穩(wěn)定的優(yōu)點。中位數(shù)中位數(shù):將樣本數(shù)據(jù)(假設有個數(shù))按照升序或者降序排列,如果為奇數(shù),NN則數(shù)列中間的數(shù)為中位數(shù);如果為偶數(shù),則中位數(shù)為居中兩數(shù)的均值。中位數(shù)不如算N術平均數(shù)穩(wěn)定,即在同一總體中取相同大小的不同樣本時,中位數(shù)的變化比算術平均數(shù)大。但是中位數(shù)不受極值的影響,因而在經(jīng)濟統(tǒng)計中
3、應用較多。眾數(shù)眾數(shù):樣本數(shù)據(jù)中出現(xiàn)頻數(shù)最大的那個數(shù)稱為眾數(shù)。眾數(shù)容易理解,但是不容易確定,與中位數(shù)一樣,不受極值的影響。截尾平均數(shù)截尾平均數(shù):將樣本數(shù)據(jù)進行排序后,按照一定的比率去掉兩端的某些數(shù),對剩下的數(shù)據(jù)求平均值,得到截尾平均數(shù)。常用的截尾平均數(shù)有5%截尾平均數(shù),即兩端去掉5%的數(shù)據(jù)以后剩余的數(shù)求平均數(shù)。截尾平均數(shù)與算術平均數(shù)相比,較少受極值的影響。幾何平均數(shù)幾何平均數(shù):個非負數(shù)的幾何平均數(shù)可以表示為:N12...Nxxx12...
4、NgNMxxx?幾何平均數(shù)應用于任何兩個相鄰數(shù)之比為常數(shù)或者接近常數(shù)的數(shù)據(jù)資料。調和平均數(shù)調和平均數(shù):個數(shù)的調和平均數(shù)可以表示為:N12...Nxxx12111...NhxxxNM????其它中心趨向的度量還有某種四分數(shù)、十分數(shù)和百分數(shù)的平均值。其中,分位數(shù)是隨機變量的一種數(shù)字特征,假設連續(xù)型隨機變量的密度函數(shù)是,給定常數(shù)X()fxp,若滿足:(01)p??pV()pVfxdxp????變量名列表框變量名列表框:對話框左側的變量名列出了
5、當前數(shù)據(jù)文件中所有的變量的變量名。Variable(s)Variable(s):在變量名列表框中單擊文件名之后,單擊對話框中間的箭頭按鈕,將變量名移到該列表框中。選定變量名后,將對選定變量的數(shù)據(jù)進行頻數(shù)分析。DisplayDisplayfrequencyfrequencytablestables:選定此項,將在查看器中顯示頻數(shù)分析表,否則只顯示直方圖,不顯示頻數(shù)表。StatisticsStatistics按鈕:單擊該按鈕,打開Frequ
6、encies:Statistics對話框,如下圖所示,該對話框中各個選項的意義如下:1.PercentileValues方框:選擇方框內的選項,計算并顯示分位數(shù)。※Quartiles核選框計算并顯示四方位數(shù)。※CutPoints核選框在后面的窗口中輸入數(shù)值,假設為(為2到100pp之間的整數(shù)字),則計算并顯示分位數(shù)。p※Percentile(s)核選框在后面的窗口中輸入數(shù)值,可以有選擇的顯示百分位數(shù)。在窗口中可以輸入0到100之間的數(shù)字
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 第4章信源編碼與數(shù)據(jù)壓縮_tell
- 第4章 數(shù)據(jù)表的創(chuàng)建與管理
- 第4章信源編碼與數(shù)據(jù)壓縮_tell
- 第3章 數(shù)據(jù)與數(shù)據(jù)運算
- 第4章 數(shù)據(jù)庫設計基礎
- 第4章_審計數(shù)據(jù)分析
- 第10章_數(shù)據(jù)的收集、整理與描述單元測試(1)及答案.doc
- 第4章數(shù)據(jù)庫設計基礎
- 醫(yī)學統(tǒng)計學第4章-計數(shù)資料的統(tǒng)計描述
- 第2章習題測試信號的描述與分析
- 4 數(shù)據(jù)庫第3章第3、4、5題解答
- 中國傳統(tǒng)色彩樣本與描述
- 第1章第2節(jié):運動的描述
- 第4章 用編程讀入數(shù)據(jù)建立sas數(shù)據(jù)集
- 第4章 基礎數(shù)據(jù)管理模塊建模
- 第十章數(shù)據(jù)的收集、整理與描述
- 數(shù)據(jù)庫習題答案第1~4章
- 第4章能源與化學
- 管理統(tǒng)計學第2章-樣本數(shù)據(jù)特征的初步分析
- 第4章供電與用電
評論
0/150
提交評論