管理統(tǒng)計學(xué)第2章-樣本數(shù)據(jù)特征的初步分析_第1頁
已閱讀1頁,還剩113頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第2章 樣本數(shù)據(jù)特征的初步分析,2.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率2.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖方法2.3 樣本數(shù)據(jù)的位置特征:對數(shù)據(jù)中心的描述2.4 樣本數(shù)據(jù)的離散特征2.5 樣本數(shù)據(jù)特征的綜合表達:箱形圖,2.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率,數(shù)據(jù)集合的最基本的結(jié)構(gòu)特征:頻次與頻率主要方法:表格法、條形圖和餅圖法,2.1.1 頻次與頻率的基本概念,頻次:在有限的樣本數(shù)據(jù)集合中,同樣的數(shù)據(jù)值

2、(樣本值)出現(xiàn)的次數(shù)。,某樣本值的頻率=該樣本值出現(xiàn)的頻次/該數(shù)據(jù)集合的數(shù)據(jù)總數(shù),,使列出來的價格數(shù)據(jù)看得更清楚些。,例2.1.2 在對某小區(qū)的家庭家具的抽樣調(diào)查后,得到客戶家具的基色調(diào)的數(shù)據(jù):,本例中數(shù)據(jù)是名義級的,它們自身不存在大小排序的問題。,大致可看清楚樣本數(shù)據(jù)(家具基色調(diào))結(jié)構(gòu)的特點,例2.1.3:抽樣調(diào)查某單位16人的受教育程度的數(shù)據(jù),按照受教育程度排序,統(tǒng)計出各個樣本值出現(xiàn)的頻次和頻率,可以較為清楚地看到“受教育程度”樣本

3、數(shù)據(jù)集合的結(jié)構(gòu)特征。,2.1.2 觀察樣本數(shù)據(jù)基本特征(頻次與頻率)的圖形方法,餅圖表示頻次與頻度適用于所有測度等級的數(shù)據(jù)。但要求不同樣本值的個數(shù)(不重復(fù)的樣本值個數(shù))不能很多。,表示頻度與頻次的餅圖繪制的方法:(1)畫一個大小適當?shù)膱A圈,給每一個不同的樣本值一個與其頻次(頻率)相當?shù)膱A心角,就像切割的一塊餅。(2)每個不同的樣本值所占據(jù)的圓心角的大小由下式計算:,條形圖適用于不重復(fù)的樣本值的個數(shù)不多的情況。,一般情況,條形圖只適

4、用于順序級以上的樣本集合。人們也可“強行”抹去橫坐標的從左向右的順序概念,“規(guī)定”橫坐標沒有大小之分。,2.1.3 樣本數(shù)據(jù)集合的基本特征的延伸:累積頻率,順序級以上的樣本數(shù)據(jù)(包括順序級數(shù)據(jù)),才存在累積頻率。,例2.1.3的樣本數(shù)據(jù)集合的累積概率,例2.1.3的樣本數(shù)據(jù)集合的累積概率,2.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖方法,2.2.1 莖葉圖的概念與作法,莖葉圖適用于刻度級的樣本數(shù)據(jù)的頻率結(jié)構(gòu)。不適用名義級。順序

5、級的樣本數(shù)據(jù)本質(zhì)上是半定量的。也可使用莖葉圖。最好使用條形圖。,如果對某個樣本數(shù)據(jù)集合規(guī)定,所有的樣本值的百位數(shù)為“莖節(jié)”(莖節(jié)的寬度為100),所有的十位數(shù)和個位數(shù)為“葉”。,2.2 觀察刻度級樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖方法,2.2.1 莖葉圖的概念與作法,樣本值=“莖節(jié).葉”表達ד莖節(jié)”的寬度一個樣本數(shù)據(jù)集合中的所有不相同的莖節(jié),從小到大連接起來,構(gòu)成了樣本數(shù)據(jù)的”莖“。確定”莖“的位數(shù)基本依據(jù)是樣本數(shù)據(jù)的分布范

6、圍。莖節(jié)的寬度,就是莖的寬度。確定”莖節(jié)”的寬度的原則:樣本數(shù)據(jù)集合中的”莖節(jié)“必須是有變化的。,(1)依據(jù)樣本數(shù)據(jù)集合中數(shù)字的大小范圍,確定”莖“的數(shù)字位和”葉“的數(shù)字位;(2)把樣本數(shù)據(jù)集合中的所有的樣本數(shù)據(jù),分成”莖節(jié)“、”葉“兩部分;(3)把樣本數(shù)據(jù)集合中的所有的”莖節(jié)“,從小到大,從上到下縱向排列,并在”莖節(jié)“后標出小數(shù)點,小數(shù)點要縱向?qū)R;(4)按照”莖節(jié)“的從小到大的順序,依次把樣本數(shù)據(jù)集合中的所有”莖節(jié)“相同的

7、數(shù)據(jù)取出來,把這些數(shù)據(jù)的”葉“,按照從小到大的順序,寫在這個”莖節(jié)“后小數(shù)點的右邊,從左到右橫向排列,直至把樣本數(shù)據(jù)集合中的所有數(shù)據(jù)處理完。,2.莖葉圖的作法,,常見的細分莖節(jié)的方法之一,是把莖節(jié)分成兩個子莖節(jié),也就是把該“莖節(jié)”右側(cè)的“葉”,處于0-4的,歸為“L”子莖節(jié)(低段子莖節(jié));“葉”的數(shù)字處于“5-9”的,歸為“H”子莖節(jié)(高段子莖節(jié))。,例如:可把每個“莖節(jié)”分解成相等的5個“子莖節(jié)”,即每個“子莖節(jié)”所覆蓋的“葉”的依次

8、為0-1,2-3,4-5,6-7,8-9.這樣,每個子莖節(jié)的長度,就是原來每個莖節(jié)長度的1/5。,莖節(jié)長度的概念:莖葉圖中,每個“莖節(jié)”所允許覆蓋的“葉”的數(shù)字范圍。,莖節(jié)長度=允許覆蓋最大值-允許覆蓋最小值+1,練習1:,某籃球運動員在某賽季各場得分情況如下:12,15,24,25,31,31,36,36,37,39,44,49,50.試分析該運動員的整體水平及發(fā)揮的穩(wěn)定程度?,,解:上述運動員的得分可用下面莖葉圖來表示。頻次

9、 莖 葉2 1 . 252 2 . 45 6 3 . 1166792 4 . 49 1 5 . 0,結(jié)論:該運動員平均得分在30到40之間,且分布較對稱,集中程度高,說明其發(fā)

10、揮比較穩(wěn)定。,練習2,某賽季,兩籃球運動員本賽季每場比賽的得分如下,試比較這兩位運動員的得分水平。  甲:9,17,18,25,28,32,35,36,37,36,32,40,50.乙:11,9,13,16,22,23,22,24,32,33,38,41,52.,,,解:畫出甲、乙兩人得分的莖葉圖,為便于對比分析,可將莖放在中間共用,葉分列左、右兩側(cè)。 甲

11、 乙 葉 莖 葉 9 . 0 . 0 78 . 1 . 136 58 . 2 . 2234225667 . 3 . 238 0

12、. 4 . 1 0 . 5 . 2,甲運動員的得分大致對稱,平均得分30多分;乙運動員的得分也大致對稱,平均得分是20多分。但甲運動員總體得分情況比乙好。,從全年級的兩個班考試成績中每班任意抽取20名的數(shù)學(xué)成績?nèi)缦拢偡?50分)甲班:,乙班:,試用莖葉圖分析,哪個班成績比較穩(wěn)定。,解:畫出甲、乙兩班成績的莖葉圖。 甲

13、 乙 葉 莖 葉 2588 . 9 . 67 388 . 10 . 47 028 . 11 . 457 0

14、16 . 12 . 014456789 245 . 13 . 245 0268 . 14 . 7,甲班成績波動較大,乙班成績總體集中在120-130分之間,且分布大致對稱,因此乙班成績比較穩(wěn)定,總體情況比甲班好。,總結(jié):(莖葉圖的特征),1. 用莖葉圖刻畫數(shù)據(jù)有兩個

15、優(yōu)點:一是從統(tǒng)計圖上沒有原始數(shù)據(jù)信息的損失,所有的信息都可以從這個莖葉圖中得到;二是莖葉圖便于記錄和表示。2. 但莖葉圖表示三位數(shù)以上的數(shù)據(jù)時不夠方便。,2.2.2 直方圖的概念與作法,這就是直方圖。區(qū)間長度為5厘米,區(qū)間個數(shù)為7,起點為160,終點為195。,2. 直方圖的基本作法:,(1)按照樣本值的大小,選擇恰當?shù)膮^(qū)間長度(通常要求區(qū)間是等長度的),對所有的樣本值分組;(2)統(tǒng)計所有組(區(qū)間)內(nèi)的樣本值的頻次或頻率;(3)用

16、橫坐標,按照順序表示不同的區(qū)間(組),用豎立于區(qū)間上的矩形條,表示相應(yīng)區(qū)間的樣本值的頻次或頻率。,3. 直方圖的使用范圍,當刻度級樣本數(shù)據(jù)很多或者精度相對高,使得數(shù)據(jù)集合中重復(fù)出現(xiàn)的樣本值過少時,就需要對數(shù)據(jù)分組,用直方圖觀察不同組數(shù)據(jù)的頻次與頻率。,4. 直方圖與條形圖的區(qū)別,直方圖要對數(shù)據(jù)分組;而條形圖不對數(shù)據(jù)分組,直接統(tǒng)計不同樣本值的重復(fù)次數(shù)。直方圖適用于大量不重復(fù)樣本值的數(shù)據(jù)集合;條形圖適用于不重復(fù)的樣本值的個數(shù)不多的情況。

17、直方圖只適用于刻度級的樣本數(shù)據(jù);條形圖主要適用于順序級以上的樣本數(shù)據(jù)。,5. 直方圖的具體作法,(1)數(shù)據(jù)分組數(shù)據(jù)分組,一般采取等區(qū)間長度的原則。數(shù)據(jù)分組,一般先確定區(qū)間長度,然后按下式確定組的個數(shù):,式中,R表示用四舍五入法,把括號中的數(shù)據(jù)表達為整數(shù)。,(2)確定分組區(qū)間長度,討論例2.2.1的數(shù)據(jù)分組的區(qū)間長度問題。首先,確定區(qū)間長度的量綱。定為“米” or ”分米“ or ”厘米“?,分米(即10厘米),組的個數(shù)=R((19

18、0-160)/10)+1=4組太少,區(qū)間長度減半組的個數(shù)=R((190-160)/5)+1=7確定出:分組的區(qū)間長度為5厘米,區(qū)間個數(shù)為7。,(3)確定分組區(qū)間起點位置的方法,確定第一個區(qū)間(最左邊的區(qū)間)起點位置的方法① 取出樣本數(shù)據(jù)集合中的最小數(shù)據(jù)(量綱為確定區(qū)間長度時所選定的量綱),記為y1。例如在3.2.1中,y1=16(分米),② 確定備選的第一個區(qū)間起點的位置:a.當分組區(qū)間長度為0.2(某量綱單位)時,備選的第

19、一個區(qū)間的起點位置(坐標x1)可能是:[y1]+0, [y1]+0.2, [y1]+0.4, [y1]+0.6, [y1]+0.8。式中,[y1]表示對y1取整。例,[16.1]=16,[16.9]=16,等。b.當分組區(qū)間長度為0.25(某量綱單位)時,備選的第一個區(qū)間的起點位置(坐標x1)可能是:[y1]+0, [y1]+0.25, [y1]+0.5, [y1]+0.75。c.當分組區(qū)間長度為0.5(某量綱單位)時,備選的第一個

20、區(qū)間的起點位置(坐標x1)可能是:[y1]+0, [y1]+0.5。d.當分組區(qū)間長度為1(某量綱單位)時,備選的起始區(qū)間的起點位置(坐標x1)可能是:[y1]+0。,確定備選的第一個區(qū)間的起點位置可概括為:備選的x1=[y1]+k×區(qū)間長度,k=0,1,…,同時, k×區(qū)間長度<1,③ 包含最小值在內(nèi),哪個備選區(qū)間的起點位置x1與y1最近,就確定該位置為第一個區(qū)間的起始位置。例如3.2.1的身高數(shù)據(jù)的分

21、組問題。已選定分組區(qū)間長度為0.5分米,而[y1]=16,備選的第一個區(qū)間的起點坐標可能是: [y1]+0=16分米,或者 [y1]+0.5=16.5分米。顯然,第一個坐標離y1最近。所以,確定第一個區(qū)間是[16,16.5)。注意:若某樣本數(shù)據(jù)正好處于兩個區(qū)間的分界點上,一般應(yīng)把它歸為右邊的區(qū)間。,直方圖中的一些概念,組中值:區(qū)間中心位置的坐標x。x=(組上界+組下界)/2組頻次:組內(nèi)數(shù)據(jù)出現(xiàn)的次數(shù)。組距:組區(qū)間的長度。組頻

22、率:組頻次/樣本數(shù)據(jù)集合中的樣本個數(shù)。頻次直方圖(頻數(shù)直方圖):縱坐標表示頻次(頻數(shù))的直方圖。頻率直方圖:縱坐標表示頻率的直方圖。,(4)繪制直方圖,在橫坐標上,從小到大,依次標出分組區(qū)間的邊界;在縱軸方向,按照各個區(qū)間的組頻次或組頻率的大小,繪制不同高度的矩形。,區(qū)間長度為5厘米,區(qū)間個數(shù)為7,起點為160,終點為195。,男生身高頻次直方圖,練習:,某中學(xué)為了了解本校學(xué)生的身體發(fā)育情況,對同年齡的40名女生的身高進行了測量,

23、結(jié)果如下(數(shù)據(jù)均為整數(shù),單位:cm):168,160,157,161,158,153,158,164,158,163,158,157,167,154,159,166,159,156,162,158,159,160,164,164,170,163,162,154,151,146,151,160,165,158,149,157,162,159,165,157.請對上述數(shù)據(jù)分組,確定出數(shù)據(jù)的分組個數(shù)、組距、分組區(qū)間起點位置,畫出頻次直方圖

24、。并根據(jù)所畫的直方圖說明:大部分同學(xué)處于哪個身高段?身高的整體分布情況如何?,解:(1)根據(jù)題意,選定初始區(qū)間長度為10cm。數(shù)據(jù)中最小的為146cm,最大的為170cm。則,組的個數(shù)=R((170-146)/10)+1=3,組數(shù)少,區(qū)間長度減半,則,組的個數(shù)= R((170-146)/5)+1=6,組數(shù)合適,由此,確定出區(qū)間長度為5cm,組的個數(shù)為6組。(2)確定起始區(qū)間位置由題意知,[y1]=14,備選的第一個區(qū)間起始坐標可能是

25、: [y1]=14, [y1]+0.5=14.5。由此可確定第一個區(qū)間是[14.5,15)。,女生身高直方圖,大部分學(xué)生處于155cm到165cm之間,占抽查人數(shù)的67.5%,低于155cm和高于165cm的學(xué)生比較少,分別占17.5%和15%,學(xué)生身高分布大致成正態(tài)分布。,2.3 樣本數(shù)據(jù)的位置特征:對數(shù)據(jù)中心的描述,樣本數(shù)據(jù)集合的另一個重要特征,就是樣本數(shù)據(jù)集合中心所處的位置,它在一定程度上反映了樣本數(shù)據(jù)集合的位置。,2.3.1 樣

26、本眾數(shù),單一眾數(shù):一個樣本數(shù)據(jù)集合中出現(xiàn)頻次最高的樣本值只有一個,簡稱為該樣本數(shù)據(jù)集合的(樣本)眾數(shù)。復(fù)眾數(shù):在一個樣本數(shù)據(jù)集合中,有多個“出現(xiàn)頻次最高的數(shù)據(jù)”。無眾數(shù):一個樣本數(shù)據(jù)集合中,所有不同的樣本值出現(xiàn)頻次都相同的。,樣本眾數(shù)的例子(1)順序級的樣本數(shù)據(jù)的眾數(shù):頻次統(tǒng)計表、條形圖、餅圖,樣本的眾數(shù):“大學(xué)”這個眾數(shù)可以在一定程度上表示數(shù)據(jù)集合的“位置”,(2)名義級的樣本數(shù)據(jù)的眾數(shù):頻次統(tǒng)計表、條形圖、餅圖,樣本的眾數(shù)

27、:“Y”這個眾數(shù)對樣本數(shù)據(jù)集合的“位置”的表示意義,就比較弱。名義級的數(shù)據(jù)只有相同與否的區(qū)別,沒有順序位置的區(qū)別。不同樣本值的位置是可以任意排列的。,(3)刻度級的樣本數(shù)據(jù)的眾數(shù):頻次統(tǒng)計表、條形圖、餅圖,樣本的眾數(shù):9.99,10.00,10.01,刻度級的數(shù)據(jù)當不重復(fù)的數(shù)據(jù)大多數(shù)是等距離分開的,并且重復(fù)出現(xiàn)的數(shù)據(jù)較多,適宜用定義1確定眾數(shù)。當數(shù)據(jù)集合的數(shù)據(jù)精度高,不重復(fù)的數(shù)據(jù)量非常大,不適宜用定義1確定眾數(shù)。,樣本眾數(shù)定義2

28、及其例子,通過條形圖確定眾數(shù),遠沒有直方圖更能反映數(shù)據(jù)集合的特征。,如:,眾數(shù)。,2.3.2 樣本中位數(shù),在對樣本數(shù)據(jù)集合中的所有數(shù)據(jù)排序后,樣本中位數(shù)Me由下式確定:,當樣本個數(shù)為奇數(shù)時,樣本中位數(shù)適用于順序級以上的數(shù)據(jù)集合;當樣本個數(shù)為偶數(shù)時,樣本中位數(shù)僅適用于刻度級的數(shù)據(jù)集合(順序級的數(shù)據(jù)不能做加減)。,分奇偶個數(shù),2.3.3 樣本均值,2.4 樣本數(shù)據(jù)的離散特征,一、點狀描述,二、區(qū)間描述,2.4.1 對樣本數(shù)據(jù)離散特征的點狀

29、描述:極值、四分點與百分位點,適用于順序級以上的數(shù)據(jù)。,極大值是數(shù)據(jù)集合中的最大值,極小值是數(shù)據(jù)集合中的最小值。,2.4.1 對樣本數(shù)據(jù)離散特征的點狀描述:極值、四分點與百分位點,中位數(shù)所在的“正中間位置”,把排序后的樣本數(shù)據(jù)集合分成左右兩部分,使左右兩部分包含的樣本數(shù)據(jù)的個數(shù)相等,即都包含50%的樣本總數(shù)。,該位置的左邊,有n×0.25個數(shù)據(jù),占總數(shù)的25%。,該位置的左邊,有n×0.5個數(shù)據(jù),占總數(shù)的50%。,該

30、位置的左邊,有n×0.75個數(shù)據(jù),占總數(shù)的75%。,當Q1、Q2、Q3的位置為整數(shù)時,相應(yīng)整數(shù)位置上的樣本值,就是Q1、Q2、Q3的值。,當Q1、Q2、Q3的位置不為整數(shù)時,Q2= Q2位置左邊的樣本值+(Q2位置右邊的樣本值- Q2位置左邊的樣本值)×Q2位置的小數(shù)部分,Q2= Q2位置左邊的樣本值+(Q2位置右邊的樣本值- Q2位置左邊的樣本值)×{(n+1) ×0.5-[(n+1)×

31、;0.5]},練習1,下面的數(shù)據(jù)是某一天20位工人收割麻黃草的數(shù)量,1.求收獲量的上四分位數(shù)值和下四分位數(shù)值。2.求中位數(shù)值。,解:(1)對數(shù)據(jù)從小到大排序,結(jié)果示于下表。,(2)設(shè)Q1為下四分點、 Q3為上四分點、 Q2為中位數(shù)。計算Q1, Q2, Q3的位置。由題意知,n=20,則:Q1的位置=(n+1) ×0.25=(20+1) ×0.25=5.25Q2的位置=(n+1) ×0.5=(20+1

32、) ×0.5=10.5Q3的位置=(n+1) ×0.75=(20+1) ×0.75=15.75(3)計算Q1, Q2, Q3的值Q1=3.7+(3.9-3.7) ×0.25=3.75Q2=4.8+(4.8-4.8) ×0.5=4.8Q3=5.6+(5.8-5.6) ×0.75=5.75,練習2,如果計算出下四分點在數(shù)據(jù)13.6與數(shù)據(jù)15之間,且下四分點的位置是12.7

33、5,求下四分點的值。,解:設(shè)Q1為下四分點,根據(jù)Q1= Q1位置左邊的樣本值+( Q1位置右邊的樣本值- Q1位置左邊的樣本值)× Q1位置的小數(shù)部分可得,Q1=13.6+(15-13.6) ×0.75=14.65,上下百分位點1)下百分點:把排序后的樣本數(shù)據(jù)集合,分成了左右兩部分,使左邊部分包含10%的樣本總個數(shù),右邊部分包含90%的樣本總個數(shù)。2)上百分點:把排序后的樣本數(shù)據(jù)集合,分成了左右兩部分,使左

34、邊部分包含90%的樣本總個數(shù),右邊部分包含10%的樣本總個數(shù)。上、下百分點也在一定意義上反映了樣本數(shù)據(jù)的離散情況。,2.4.2 對樣本數(shù)據(jù)離散特征的區(qū)間描述:極差、四分位距與離差,2.4.3 離散狀況的統(tǒng)計值描述:樣本方差,樣本方差:,樣本標準差:,數(shù)據(jù)特征的度量指標,樣本數(shù)據(jù)集中趨勢的三種度量指標:,眾數(shù)、中位數(shù)、均值,樣本數(shù)據(jù)離散趨勢的三種區(qū)間描述度量指標:,極差、四分位距、方差(標準差),練習,1. 從學(xué)院學(xué)生中隨機地挑選

35、15名學(xué)生,問到他們昨晚睡眠的小時數(shù)。得到的樣本數(shù)據(jù)是:5,6,6,8,7,7,9,5,4,8,11,6,7,8,7。求出以下各值: a.均值 b.中位數(shù) c.眾數(shù) d.方差 e.標準差,解:對上述數(shù)據(jù)排序后,如表所示。,,=(4+5×2+6×3+7×4+8×3+9+11)/15=6.93,Me=x8=7眾數(shù)是7S=1.75,2. 以下是一組兒童首次牙科檢查的年齡的樣

36、本: 首次牙科檢查的年齡x: 1 2 3 4 5 兒童的數(shù)目 f: 9 11 23 16 21a.求對這些兒童首次牙科檢查年齡的均值。b.求中位數(shù)年齡。c.求標準差。,解:由題意可知,n= 9+11+23+16+21=80 ,根據(jù),Me=(x40+x41)/2=(3+3)/2=3,2.5 樣本數(shù)據(jù)特征的綜合表達:箱形圖,2.5.1 箱形圖的基本構(gòu)造,箱形圖的繪制步驟,

37、1.將樣本數(shù)據(jù)值由小到大的順序排列。2.求出中位數(shù)Me。3.求Q1 和Q3。4.將Q1,Me及Q3,繪成一長方形。5. 找出樣本數(shù)據(jù)中的極小、極大值,畫出左、右胡須。,當胡須特別長時(外圍值的范圍分布很大時),特別是由于個別過大或過小值出現(xiàn)在樣本數(shù)據(jù)集合中時,需對箱形圖進行修正,來“剔除”特別大或特別小的數(shù)據(jù)對箱形圖的影響,從而較為恰當?shù)乇磉_樣本數(shù)據(jù)集合的基本特征。,3.5.2 修正的箱形圖,回到上頁,修正箱形

38、圖中的一些概念,外圍值:處在胡須上的、離箱體的距離大于1.5倍的四分位距(1.5Iqr)的樣本值。近外圍值:處在胡須上的、離箱體的距離大于1.5倍的四分位距(1.5Iqr)、但小于3倍的四分位距(3Iqr)的樣本值。遠外圍值(極端值):處在胡須上的、離箱體的距離大于3倍的四分位距(3Iqr)的樣本值。,修正箱形圖的繪制步驟,1.將樣本數(shù)據(jù)值由小到大的順序排列。2.求出中位數(shù)Me。3.求Q1 和Q3。4.求四分位距Iqr

39、,“非外圍值”上邊界Q3+1.5Iqr,“非外圍值”下邊界Q1-1.5Iqr。5. 將Q1,Me及Q3,繪成一長方形。6. 找出樣本數(shù)據(jù)中“非外圍值”范圍內(nèi)的最小值、最大值,畫出左、右胡須。,修正箱形圖的主要作用,可了解數(shù)據(jù)分布,是否為對稱性;可清楚指出中位數(shù)的位置;可判斷數(shù)據(jù)有無離群值(奇異值)存在。,2.5.3 箱形圖示例,1. 例2.2.1身高數(shù)據(jù)的箱形圖,由表2.5.2知,n=22,極大值為190cm,極小值

40、為160cm。中位數(shù)的位置=(n+1) ×0.5=23×0.5=11.5Me=Q2=176+(177-176) ×0.5=176.5Q1的位置=(n+1) ×0.25=23×0.25=5.75Q1=170+(171-170)×0.75=170.75Q3的位置=(n+1) ×0.75=23×0.75=17.25Q3=181+(182-181)

41、15;0.25=181.25,由圖可知,箱形圖上箱體短、上胡須短,所以,數(shù)據(jù)向高端傾斜。,例3.2.1箱形圖,2. 假設(shè)在例2.2.1中,該班級轉(zhuǎn)來1名身高213厘米的巨人,則該班級男生的身高數(shù)據(jù)如表2.5.3所示。畫出此時的箱形圖。,由表2.5.4知,n=23。中位數(shù)的位置=(n+1) ×0.5=24×0.5=12Me=Q2=177Q1的位置=(n+1) ×0.25=24×0.25=6Q

42、1=171Q3的位置=(n+1) ×0.75=24×0.75=18Q3=182四分位距Iqr=182-171=11由此可知,“非外圍值”的上邊界為:182+11×1.5=198.5,下邊界為:171-11×1.5=154.5在“非外圍值”的上下邊界內(nèi),數(shù)據(jù)集合的最小值為160,最大值為190。,例2.2.1修正箱形圖,由圖可知,除去“外圍值”213cm外,修正箱形圖上箱體短、上胡須短,所

43、以,數(shù)據(jù)向高端傾斜。,離群值,例:下面給出某醫(yī)院21個病人的住院時間(以天計),試畫出修正箱型圖1 2 3 3 4 4 5 6 6 7 7 9 9 10 12 12 13 15 18 23 55以下是22個病人的血壓(收縮壓,mmHg)數(shù)據(jù)已排序,試畫出箱型圖。102 110 140 142 147 117 118 122 123 132 150142 146 148 147 129 132 137 142 145 147

44、 138,箱形圖給出了一個數(shù)據(jù)集合的哪些量?(A)極小值、極大值(B)極差、中位數(shù)(C)上四分點、下四分點(D)四分位距,√,√,√,√,試述以下基本概念: 1.總體(或母體),個體,變量(或指標),變量值(指標值),或數(shù)據(jù)。2.數(shù)據(jù)測度分為幾個類別?試舉例說明。,3.企業(yè)質(zhì)量管理員在生產(chǎn)線上某環(huán)節(jié)隨機地抽取被加工的部件,并檢驗記錄所抽取的部件的下列信息: A:有缺陷還是無缺陷 B:加工此部件工人的工

45、號 C:部件的重量。問: a.被研究對象的總體是什么? b.此總體是有限總體還是無限總體? c.樣本是什么? d上述三個變量是屬性變量還是數(shù)值變量?總體是生產(chǎn)某環(huán)節(jié)所有加工部件無限總體樣本是抽取部件A是屬性變量,BC是數(shù)值變量,5. 學(xué)生上學(xué)時所帶書本的重量,是什么測度類型的變量?刻度級類型,6. 分層抽樣(分類抽樣)的作法和適用條件是什么?,1. 哪些測度等級的數(shù)據(jù)集合,適合于做頻

46、次(Frequency)與頻率(Percentage)的餅圖(Pie chart)? 都可以,只要不重復(fù)的樣本值的個數(shù)不能太多。2. 哪些測度等級的數(shù)據(jù)集合,適合于做頻次與頻率的條形圖? 都可以,只要不重復(fù)的樣本值的個數(shù)不能太多。3. 頻次與頻率的餅圖有差異嗎? 沒有,4.頻次與頻率的條形圖有差異嗎?為什么? 沒有 5.對于一個數(shù)據(jù)集合而言,什么是累積頻率?

47、 6.能夠用餅圖來表示一個數(shù)據(jù)集合的累積頻率嗎? 不能 7.哪些測度等級的數(shù)據(jù)集合,才能計算累積頻率? 順序級以上 8.除了表格法以外,還可以用 圖來表示一個數(shù)據(jù)集合的 累積頻率分布狀況? 條形圖,9.直方圖與條形圖的區(qū)別是什么? 直方圖要對數(shù)據(jù)分組,而條形圖不對數(shù)據(jù)分組。10.什么測度級別的數(shù)據(jù),適宜作直方圖? 刻度級11.作直

48、方圖時,一般是先確定區(qū)間長度,還是先確定區(qū)間個數(shù)?哪個更好一些? 先確定區(qū)間長度12. 作直方圖時,在區(qū)間長度確定后,如何確定區(qū)間個數(shù)?,13.箱形圖給出了一個數(shù)據(jù)集合的哪幾個量? 極小值、極大值、極差、上四分點、下四分點、四分位 距、中位數(shù),(四)我們對某少兒旅行團的年齡進行了數(shù)據(jù)調(diào)查,以下是調(diào)查結(jié)果:12,10,11,10,11,12,9,12,8,10,9,9,14,8,10,13,7,9,11,16,10

49、,12,9試計算該旅行團成員年齡的眾數(shù),中位數(shù),上下四分點和均值,141 148 132 138 154 142 150 146 155 158 150 140 147 148 144150 149 145 149 158 143 141 144 144 126 140 144 142 141 140145 135 147 146 141 136 140 146 142 137 148 154 137 139 143140 13

50、1 143 141 149 148 135 148 152 143 144 141 143 147 146150 132 142 142 143 153 149 146 149 138 142 149 142 137 134144 146 147 140 142 140 137 152 145,(五)某班管理統(tǒng)計學(xué)課程的考試成績,請構(gòu)造直方圖。,(六)下面分別給出了25名男子和25名女子的肺活量(以升計)女子組 2.7 2.8 2

51、.9 3.1 3.1 3.1 3.2 3.4 3.4 3.4 3.4 3.4 3.5 3.5 3.5 3.6 3.7 3.7 3.7 3.8 3.8 4.0 4.1 4.2 4.2男子組 4.1 4.1 4.3 4.3 4.5 4.6 4.7 4.8 4.8 5.1 5.3 5.3 5.3 5.4 5.4 5.5 5.6 5.7 5.8 5.8 6.0 6.1 6.3 6.7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論