統(tǒng)計(jì)學(xué)第二章描述_第1頁
已閱讀1頁,還剩106頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Chapter 2,描述,本章重點(diǎn),尺度,形態(tài),分位數(shù),箱線圖,位置,,,,,詹姆斯,杜蘭特,詹姆斯,杜蘭特,詹姆斯,分布形態(tài),鐘型分布(bell shaped),鐘型分布中間觀測值分布多,越往兩側(cè)分布越少。因其形狀像鐘而得名。根據(jù)分布的對稱性,鐘型分布又可分為對稱分布、左偏分布和右偏分布,對稱分布(symmetry),對稱分布,,,,左偏(left skewed),左偏,,,,右偏(right skewed),右偏,,,,正態(tài)分布

2、(normal distribution),也叫高斯分布(gaussian distribution)是一種完美的、對稱的鐘型分布,可以用函數(shù)精確地表達(dá)出來實(shí)踐中大量的變量逼近正態(tài)分布,換而言之,一個變量大約成正態(tài)分布才是正常(normal)的,杜蘭特,對比,雙直方圖( bi-histogram),對比,描述,位置(location):中心(center) 尺度(scale):差異(variability)或離散(spread

3、)形態(tài)(shape),第一節(jié) 位置,均值(mean)眾數(shù) (mode)中位數(shù) (median)分位數(shù) (quantile),均值,,,觀測值之和除以觀測值數(shù)目,中位數(shù),中間位置上的數(shù)觀測值從小到大排列中間位置:(n-1)/2+1,中位數(shù),排序:中間位置:(n-1)/2+1=(101-1)/2+1=51中位數(shù):31,,眾數(shù),分布次數(shù)(頻數(shù))最多的觀測值次數(shù)分布找到分布最多的觀測值眾數(shù)不一

4、定存在,也不一定唯一事實(shí)上,連續(xù)型變量很難精確地找到眾數(shù),眾數(shù)位置,分布,,眾數(shù),位置:最多分布為9眾數(shù):33,分位數(shù),q分位數(shù):觀測值從小到大排序后,q等分,處于分界點(diǎn)上的數(shù)二分位數(shù)(中位數(shù))三分位數(shù)(tertiles)四分位數(shù)(quartiles)五分位數(shù)(quintiles)六分位數(shù)(sextiles)十分位數(shù)(deciles)十二分位數(shù)(duo-deciles)二十分位數(shù)(vigintiles)百分位

5、數(shù)(percentiles)千分位數(shù)(permilles),四分位數(shù),觀測值按大小順序排列后,均分為四部分,處于分界點(diǎn)上的數(shù)2/4位置:中位數(shù)1/4位置:下四分位數(shù)3/4位置:上四分位數(shù),四分位數(shù),詹姆斯:杜蘭特:,月薪,從某公司隨機(jī)抽取13位職工,調(diào)查他們的月薪如下: 2000 2600 3500 1800 2500 4800 2800 3000 2200 3300 5200 4600

6、 4000,四分位數(shù)位置,,,,,,,,,,,,,,,1,,,,,,,7,6,5,4,3,2,13,12,11,10,9,8,4,7,10,十分位數(shù)位置,,,,,,,,,,,,,,,1,,,,7,6,5,4,3,2,13,12,11,10,9,8,2.2,,,,,,,,,,3.4,4.6,5.8,7,8.2,9.4,10.6,11.8,分位數(shù)位置,第k個q分位數(shù)的位置:,位置匯總,均值:27.13中位數(shù):26眾數(shù):25下四分位數(shù):

7、22上四分位數(shù):32,均值:31.62中位數(shù):31眾數(shù):33下四分位數(shù):27上四分位數(shù):36,,,,,,練習(xí),求30家經(jīng)銷商銷量均值、中位數(shù)、眾數(shù)、四分位數(shù)、十分位數(shù),第二節(jié) 尺度,絕對平均差(average absolute deviation)方差(variance)標(biāo)準(zhǔn)差(standard deviation)全距(range)四分位距(inter-quartile range) 絕對中位差(median

8、absolute deviation),散點(diǎn)圖,,均值,差異( 離散),中心化( centering),,中心化,合計(jì),,,合計(jì)不為0,絕對值,絕對平均差,,平方,方差,,自由度,計(jì)算樣本方差時應(yīng)除以n-1,而不是n,這里n-1叫自由度(degree of freedom),表示樣本可自由取值的數(shù)目,,自由度?,如果某班只有1位學(xué)生,身高為172,如果從某班抽取1位學(xué)生調(diào)查其身高為172,總體無差異,無法獲知總體差異,標(biāo)準(zhǔn)差,,變異系數(shù)

9、( coefficient of variation),標(biāo)準(zhǔn)差只能度量絕對差異,而不能度量相對差異變異系數(shù),全距,,四分位距,,絕對中位差,,尺度匯總,絕對平均差: 6.31方差: 67.3標(biāo)準(zhǔn)差: 8.20變異系數(shù):0.302全距: 54四分位距: 10絕對中位差:5,,,,,絕對平均差: 5.96方差: 59.0標(biāo)準(zhǔn)差: 7.68變異系數(shù):0.243全距: 41四分位距: 9絕對中位差:5,總體均值和方差

10、,假設(shè)知道總體的數(shù)據(jù),則可計(jì)算總體均值和方差因?yàn)榭傮w是唯一的,總體均值和方差也是唯一的,故也稱總體參數(shù)(parameter)實(shí)際中只能用樣本均值和方差去估計(jì)總體,,練習(xí),求10家經(jīng)銷商銷量的絕對平均差、方差、標(biāo)準(zhǔn)差、變異系數(shù)、全距、四分位距、絕對中位差,極端值(extremes),也叫離群值(outliers),指明顯偏離主體數(shù)據(jù)的值。極端值應(yīng)給予特別關(guān)注:觀測錯誤特殊情況,判定,3倍標(biāo)準(zhǔn)差1.5倍四分位距

11、,準(zhǔn)則,,,,,,,,,,,極小值,極大值,,,,,標(biāo)準(zhǔn)化(無尺度化),,,,,,,,,,,極小值,極大值,,,準(zhǔn)則,,,,,,,,,極小值,極大值,,,,,,討論,判斷30家經(jīng)銷商銷量的極端值,月薪,正常數(shù)據(jù)有極大值數(shù)據(jù),,右偏,正常,右偏,月薪,正常數(shù)據(jù)有極小值數(shù)據(jù),,左偏,正常,左偏,月薪,正常數(shù)據(jù)既有極大值,又有極小值數(shù)據(jù),,,尖峰(厚尾),正常,尖峰(厚尾),銷量,正常數(shù)據(jù)有極大值數(shù)據(jù),,位置描

12、述,均值:50.1中位數(shù):48.5眾數(shù):47,均值:63.9中位數(shù):50眾數(shù):47,正常,,,極大值,尺度描述,正常,,,極大值,絕對平均差: 9.87方差: 171.4標(biāo)準(zhǔn)差: 13.1變異系數(shù):0.26全距: 58四分位距: 10絕對中位差:6.5,絕對平均差: 28.85方差: 5768.5標(biāo)準(zhǔn)差: 76.0變異系數(shù):1.19全距: 440四分位距: 10絕對中位差:8.5,穩(wěn)?。╮obus

13、t),諸如中位數(shù)、四分位距、絕對中位差的只受主體數(shù)據(jù)影響不受極端值影響的統(tǒng)計(jì)量成為穩(wěn)健統(tǒng)計(jì)量穩(wěn)健統(tǒng)計(jì)量意味著缺乏敏感性,調(diào)整均值,中間均值(mid-mean):用25%——75%分位數(shù)之間的數(shù)據(jù)計(jì)算均值切尾均值(trimmed mean):用5%——95%分位數(shù)之間的數(shù)據(jù)計(jì)算均值縮尾均值(winsorized mean):將5%分位數(shù)之前的數(shù)據(jù)替為5%分位數(shù),95%之后的數(shù)據(jù)替為95%分位數(shù),再計(jì)算均值,,討論,求30家經(jīng)銷

14、商銷量均值、中間均值、切尾均值、縮尾均值,第三節(jié) 形態(tài),偏度(skewness)峰度(kurtosis),中心化數(shù)據(jù)(一次方),二次方,三次方,四次方,匯總圖,中心矩(central moment),二階中心矩即為方差三階中心矩可度量偏度四階中心矩可度量峰度,偏度,標(biāo)準(zhǔn)化(無尺度化)三階中心矩偏度大于0為右偏,小于0為左偏,峰度,標(biāo)準(zhǔn)化(無尺度化)四階中心矩正態(tài)分布的峰度為3,因此峰度大于3為尖峰(厚尾),

15、小于3為平峰(薄尾)。超額峰度(excess kurtosis):,形態(tài),偏度:0.705峰度:4.99超額峰度:1.99,偏度:0.249峰度:3.29超額峰度:0.29,,,,,,討論,求10家經(jīng)銷商銷量的偏度和峰度,箱線圖(box plot),5點(diǎn):P1:P2:P3:P4:P5:,繪圖,P1,P2,P3,P4,P5,箱線圖可以看出,位置(中心)尺度(差異或離散)偏態(tài)和峰態(tài)極端值,對比,練習(xí) 相對濕

16、度(%),濕度,第四節(jié) 其它,分組數(shù)據(jù)(grouped data)質(zhì)量變量的描述,分組數(shù)據(jù),,∑,30,20—2930—3940—4950—5960—6970—79,—,2410842,24.534.544.554.564.574.5,分組數(shù)據(jù),加權(quán)平均,均值方差其中,x為組中值,f為權(quán)數(shù),加權(quán)平均,∑,計(jì)算,加權(quán)的意義,較之簡單(simple)平均,加權(quán)(weighted)平均意味著觀測值在

17、均值中的重要性會隨著權(quán)數(shù)調(diào)整簡單平均可看作加權(quán)平均的特例,,眾數(shù),,,,,,,,,,30,,,6,1,,中位數(shù),,,,,40,50,,,,,,練習(xí),,,求工資的平均數(shù)、標(biāo)準(zhǔn)差、眾數(shù)、中位數(shù)、四分位數(shù),質(zhì)量變量的描述,位置:眾數(shù)。定序變量還可以計(jì)算中位數(shù)。尺度:異眾比率(variation ratio),討論,,,計(jì)算我國人口受教育程度的眾數(shù)、中位數(shù)、異眾比率,回顧,均值、眾數(shù)、中位數(shù)分位數(shù)方差、標(biāo)準(zhǔn)差四分位距偏度、峰度

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論