2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩113頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第2章 樣本數(shù)據(jù)特征的初步分析,2.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率2.2 觀察刻度級(jí)樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖方法2.3 樣本數(shù)據(jù)的位置特征:對(duì)數(shù)據(jù)中心的描述2.4 樣本數(shù)據(jù)的離散特征2.5 樣本數(shù)據(jù)特征的綜合表達(dá):箱形圖,2.1 樣本數(shù)據(jù)結(jié)構(gòu)的基本特征:頻次與頻率,數(shù)據(jù)集合的最基本的結(jié)構(gòu)特征:頻次與頻率主要方法:表格法、條形圖和餅圖法,2.1.1 頻次與頻率的基本概念,頻次:在有限的樣本數(shù)據(jù)集合中,同樣的數(shù)據(jù)值

2、(樣本值)出現(xiàn)的次數(shù)。,某樣本值的頻率=該樣本值出現(xiàn)的頻次/該數(shù)據(jù)集合的數(shù)據(jù)總數(shù),,使列出來(lái)的價(jià)格數(shù)據(jù)看得更清楚些。,例2.1.2 在對(duì)某小區(qū)的家庭家具的抽樣調(diào)查后,得到客戶家具的基色調(diào)的數(shù)據(jù):,本例中數(shù)據(jù)是名義級(jí)的,它們自身不存在大小排序的問(wèn)題。,大致可看清楚樣本數(shù)據(jù)(家具基色調(diào))結(jié)構(gòu)的特點(diǎn),例2.1.3:抽樣調(diào)查某單位16人的受教育程度的數(shù)據(jù),按照受教育程度排序,統(tǒng)計(jì)出各個(gè)樣本值出現(xiàn)的頻次和頻率,可以較為清楚地看到“受教育程度”樣本

3、數(shù)據(jù)集合的結(jié)構(gòu)特征。,2.1.2 觀察樣本數(shù)據(jù)基本特征(頻次與頻率)的圖形方法,餅圖表示頻次與頻度適用于所有測(cè)度等級(jí)的數(shù)據(jù)。但要求不同樣本值的個(gè)數(shù)(不重復(fù)的樣本值個(gè)數(shù))不能很多。,表示頻度與頻次的餅圖繪制的方法:(1)畫一個(gè)大小適當(dāng)?shù)膱A圈,給每一個(gè)不同的樣本值一個(gè)與其頻次(頻率)相當(dāng)?shù)膱A心角,就像切割的一塊餅。(2)每個(gè)不同的樣本值所占據(jù)的圓心角的大小由下式計(jì)算:,條形圖適用于不重復(fù)的樣本值的個(gè)數(shù)不多的情況。,一般情況,條形圖只適

4、用于順序級(jí)以上的樣本集合。人們也可“強(qiáng)行”抹去橫坐標(biāo)的從左向右的順序概念,“規(guī)定”橫坐標(biāo)沒(méi)有大小之分。,2.1.3 樣本數(shù)據(jù)集合的基本特征的延伸:累積頻率,順序級(jí)以上的樣本數(shù)據(jù)(包括順序級(jí)數(shù)據(jù)),才存在累積頻率。,例2.1.3的樣本數(shù)據(jù)集合的累積概率,例2.1.3的樣本數(shù)據(jù)集合的累積概率,2.2 觀察刻度級(jí)樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖方法,2.2.1 莖葉圖的概念與作法,莖葉圖適用于刻度級(jí)的樣本數(shù)據(jù)的頻率結(jié)構(gòu)。不適用名義級(jí)。順序

5、級(jí)的樣本數(shù)據(jù)本質(zhì)上是半定量的。也可使用莖葉圖。最好使用條形圖。,如果對(duì)某個(gè)樣本數(shù)據(jù)集合規(guī)定,所有的樣本值的百位數(shù)為“莖節(jié)”(莖節(jié)的寬度為100),所有的十位數(shù)和個(gè)位數(shù)為“葉”。,2.2 觀察刻度級(jí)樣本數(shù)據(jù)結(jié)構(gòu)的莖葉圖與直方圖方法,2.2.1 莖葉圖的概念與作法,樣本值=“莖節(jié).葉”表達(dá)ד莖節(jié)”的寬度一個(gè)樣本數(shù)據(jù)集合中的所有不相同的莖節(jié),從小到大連接起來(lái),構(gòu)成了樣本數(shù)據(jù)的”莖“。確定”莖“的位數(shù)基本依據(jù)是樣本數(shù)據(jù)的分布范

6、圍。莖節(jié)的寬度,就是莖的寬度。確定”莖節(jié)”的寬度的原則:樣本數(shù)據(jù)集合中的”莖節(jié)“必須是有變化的。,(1)依據(jù)樣本數(shù)據(jù)集合中數(shù)字的大小范圍,確定”莖“的數(shù)字位和”葉“的數(shù)字位;(2)把樣本數(shù)據(jù)集合中的所有的樣本數(shù)據(jù),分成”莖節(jié)“、”葉“兩部分;(3)把樣本數(shù)據(jù)集合中的所有的”莖節(jié)“,從小到大,從上到下縱向排列,并在”莖節(jié)“后標(biāo)出小數(shù)點(diǎn),小數(shù)點(diǎn)要縱向?qū)R;(4)按照”莖節(jié)“的從小到大的順序,依次把樣本數(shù)據(jù)集合中的所有”莖節(jié)“相同的

7、數(shù)據(jù)取出來(lái),把這些數(shù)據(jù)的”葉“,按照從小到大的順序,寫在這個(gè)”莖節(jié)“后小數(shù)點(diǎn)的右邊,從左到右橫向排列,直至把樣本數(shù)據(jù)集合中的所有數(shù)據(jù)處理完。,2.莖葉圖的作法,,常見的細(xì)分莖節(jié)的方法之一,是把莖節(jié)分成兩個(gè)子莖節(jié),也就是把該“莖節(jié)”右側(cè)的“葉”,處于0-4的,歸為“L”子莖節(jié)(低段子莖節(jié));“葉”的數(shù)字處于“5-9”的,歸為“H”子莖節(jié)(高段子莖節(jié))。,例如:可把每個(gè)“莖節(jié)”分解成相等的5個(gè)“子莖節(jié)”,即每個(gè)“子莖節(jié)”所覆蓋的“葉”的依次

8、為0-1,2-3,4-5,6-7,8-9.這樣,每個(gè)子莖節(jié)的長(zhǎng)度,就是原來(lái)每個(gè)莖節(jié)長(zhǎng)度的1/5。,莖節(jié)長(zhǎng)度的概念:莖葉圖中,每個(gè)“莖節(jié)”所允許覆蓋的“葉”的數(shù)字范圍。,莖節(jié)長(zhǎng)度=允許覆蓋最大值-允許覆蓋最小值+1,練習(xí)1:,某籃球運(yùn)動(dòng)員在某賽季各場(chǎng)得分情況如下:12,15,24,25,31,31,36,36,37,39,44,49,50.試分析該運(yùn)動(dòng)員的整體水平及發(fā)揮的穩(wěn)定程度?,,解:上述運(yùn)動(dòng)員的得分可用下面莖葉圖來(lái)表示。頻次

9、 莖 葉2 1 . 252 2 . 45 6 3 . 1166792 4 . 49 1 5 . 0,結(jié)論:該運(yùn)動(dòng)員平均得分在30到40之間,且分布較對(duì)稱,集中程度高,說(shuō)明其發(fā)

10、揮比較穩(wěn)定。,練習(xí)2,某賽季,兩籃球運(yùn)動(dòng)員本賽季每場(chǎng)比賽的得分如下,試比較這兩位運(yùn)動(dòng)員的得分水平。  甲:9,17,18,25,28,32,35,36,37,36,32,40,50.乙:11,9,13,16,22,23,22,24,32,33,38,41,52.,,,解:畫出甲、乙兩人得分的莖葉圖,為便于對(duì)比分析,可將莖放在中間共用,葉分列左、右兩側(cè)。 甲

11、 乙 葉 莖 葉 9 . 0 . 0 78 . 1 . 136 58 . 2 . 2234225667 . 3 . 238 0

12、. 4 . 1 0 . 5 . 2,甲運(yùn)動(dòng)員的得分大致對(duì)稱,平均得分30多分;乙運(yùn)動(dòng)員的得分也大致對(duì)稱,平均得分是20多分。但甲運(yùn)動(dòng)員總體得分情況比乙好。,從全年級(jí)的兩個(gè)班考試成績(jī)中每班任意抽取20名的數(shù)學(xué)成績(jī)?nèi)缦拢偡?50分)甲班:,乙班:,試用莖葉圖分析,哪個(gè)班成績(jī)比較穩(wěn)定。,解:畫出甲、乙兩班成績(jī)的莖葉圖。 甲

13、 乙 葉 莖 葉 2588 . 9 . 67 388 . 10 . 47 028 . 11 . 457 0

14、16 . 12 . 014456789 245 . 13 . 245 0268 . 14 . 7,甲班成績(jī)波動(dòng)較大,乙班成績(jī)總體集中在120-130分之間,且分布大致對(duì)稱,因此乙班成績(jī)比較穩(wěn)定,總體情況比甲班好。,總結(jié):(莖葉圖的特征),1. 用莖葉圖刻畫數(shù)據(jù)有兩個(gè)

15、優(yōu)點(diǎn):一是從統(tǒng)計(jì)圖上沒(méi)有原始數(shù)據(jù)信息的損失,所有的信息都可以從這個(gè)莖葉圖中得到;二是莖葉圖便于記錄和表示。2. 但莖葉圖表示三位數(shù)以上的數(shù)據(jù)時(shí)不夠方便。,2.2.2 直方圖的概念與作法,這就是直方圖。區(qū)間長(zhǎng)度為5厘米,區(qū)間個(gè)數(shù)為7,起點(diǎn)為160,終點(diǎn)為195。,2. 直方圖的基本作法:,(1)按照樣本值的大小,選擇恰當(dāng)?shù)膮^(qū)間長(zhǎng)度(通常要求區(qū)間是等長(zhǎng)度的),對(duì)所有的樣本值分組;(2)統(tǒng)計(jì)所有組(區(qū)間)內(nèi)的樣本值的頻次或頻率;(3)用

16、橫坐標(biāo),按照順序表示不同的區(qū)間(組),用豎立于區(qū)間上的矩形條,表示相應(yīng)區(qū)間的樣本值的頻次或頻率。,3. 直方圖的使用范圍,當(dāng)刻度級(jí)樣本數(shù)據(jù)很多或者精度相對(duì)高,使得數(shù)據(jù)集合中重復(fù)出現(xiàn)的樣本值過(guò)少時(shí),就需要對(duì)數(shù)據(jù)分組,用直方圖觀察不同組數(shù)據(jù)的頻次與頻率。,4. 直方圖與條形圖的區(qū)別,直方圖要對(duì)數(shù)據(jù)分組;而條形圖不對(duì)數(shù)據(jù)分組,直接統(tǒng)計(jì)不同樣本值的重復(fù)次數(shù)。直方圖適用于大量不重復(fù)樣本值的數(shù)據(jù)集合;條形圖適用于不重復(fù)的樣本值的個(gè)數(shù)不多的情況。

17、直方圖只適用于刻度級(jí)的樣本數(shù)據(jù);條形圖主要適用于順序級(jí)以上的樣本數(shù)據(jù)。,5. 直方圖的具體作法,(1)數(shù)據(jù)分組數(shù)據(jù)分組,一般采取等區(qū)間長(zhǎng)度的原則。數(shù)據(jù)分組,一般先確定區(qū)間長(zhǎng)度,然后按下式確定組的個(gè)數(shù):,式中,R表示用四舍五入法,把括號(hào)中的數(shù)據(jù)表達(dá)為整數(shù)。,(2)確定分組區(qū)間長(zhǎng)度,討論例2.2.1的數(shù)據(jù)分組的區(qū)間長(zhǎng)度問(wèn)題。首先,確定區(qū)間長(zhǎng)度的量綱。定為“米” or ”分米“ or ”厘米“?,分米(即10厘米),組的個(gè)數(shù)=R((19

18、0-160)/10)+1=4組太少,區(qū)間長(zhǎng)度減半組的個(gè)數(shù)=R((190-160)/5)+1=7確定出:分組的區(qū)間長(zhǎng)度為5厘米,區(qū)間個(gè)數(shù)為7。,(3)確定分組區(qū)間起點(diǎn)位置的方法,確定第一個(gè)區(qū)間(最左邊的區(qū)間)起點(diǎn)位置的方法① 取出樣本數(shù)據(jù)集合中的最小數(shù)據(jù)(量綱為確定區(qū)間長(zhǎng)度時(shí)所選定的量綱),記為y1。例如在3.2.1中,y1=16(分米),② 確定備選的第一個(gè)區(qū)間起點(diǎn)的位置:a.當(dāng)分組區(qū)間長(zhǎng)度為0.2(某量綱單位)時(shí),備選的第

19、一個(gè)區(qū)間的起點(diǎn)位置(坐標(biāo)x1)可能是:[y1]+0, [y1]+0.2, [y1]+0.4, [y1]+0.6, [y1]+0.8。式中,[y1]表示對(duì)y1取整。例,[16.1]=16,[16.9]=16,等。b.當(dāng)分組區(qū)間長(zhǎng)度為0.25(某量綱單位)時(shí),備選的第一個(gè)區(qū)間的起點(diǎn)位置(坐標(biāo)x1)可能是:[y1]+0, [y1]+0.25, [y1]+0.5, [y1]+0.75。c.當(dāng)分組區(qū)間長(zhǎng)度為0.5(某量綱單位)時(shí),備選的第一個(gè)

20、區(qū)間的起點(diǎn)位置(坐標(biāo)x1)可能是:[y1]+0, [y1]+0.5。d.當(dāng)分組區(qū)間長(zhǎng)度為1(某量綱單位)時(shí),備選的起始區(qū)間的起點(diǎn)位置(坐標(biāo)x1)可能是:[y1]+0。,確定備選的第一個(gè)區(qū)間的起點(diǎn)位置可概括為:備選的x1=[y1]+k×區(qū)間長(zhǎng)度,k=0,1,…,同時(shí), k×區(qū)間長(zhǎng)度<1,③ 包含最小值在內(nèi),哪個(gè)備選區(qū)間的起點(diǎn)位置x1與y1最近,就確定該位置為第一個(gè)區(qū)間的起始位置。例如3.2.1的身高數(shù)據(jù)的分

21、組問(wèn)題。已選定分組區(qū)間長(zhǎng)度為0.5分米,而[y1]=16,備選的第一個(gè)區(qū)間的起點(diǎn)坐標(biāo)可能是: [y1]+0=16分米,或者 [y1]+0.5=16.5分米。顯然,第一個(gè)坐標(biāo)離y1最近。所以,確定第一個(gè)區(qū)間是[16,16.5)。注意:若某樣本數(shù)據(jù)正好處于兩個(gè)區(qū)間的分界點(diǎn)上,一般應(yīng)把它歸為右邊的區(qū)間。,直方圖中的一些概念,組中值:區(qū)間中心位置的坐標(biāo)x。x=(組上界+組下界)/2組頻次:組內(nèi)數(shù)據(jù)出現(xiàn)的次數(shù)。組距:組區(qū)間的長(zhǎng)度。組頻

22、率:組頻次/樣本數(shù)據(jù)集合中的樣本個(gè)數(shù)。頻次直方圖(頻數(shù)直方圖):縱坐標(biāo)表示頻次(頻數(shù))的直方圖。頻率直方圖:縱坐標(biāo)表示頻率的直方圖。,(4)繪制直方圖,在橫坐標(biāo)上,從小到大,依次標(biāo)出分組區(qū)間的邊界;在縱軸方向,按照各個(gè)區(qū)間的組頻次或組頻率的大小,繪制不同高度的矩形。,區(qū)間長(zhǎng)度為5厘米,區(qū)間個(gè)數(shù)為7,起點(diǎn)為160,終點(diǎn)為195。,男生身高頻次直方圖,練習(xí):,某中學(xué)為了了解本校學(xué)生的身體發(fā)育情況,對(duì)同年齡的40名女生的身高進(jìn)行了測(cè)量,

23、結(jié)果如下(數(shù)據(jù)均為整數(shù),單位:cm):168,160,157,161,158,153,158,164,158,163,158,157,167,154,159,166,159,156,162,158,159,160,164,164,170,163,162,154,151,146,151,160,165,158,149,157,162,159,165,157.請(qǐng)對(duì)上述數(shù)據(jù)分組,確定出數(shù)據(jù)的分組個(gè)數(shù)、組距、分組區(qū)間起點(diǎn)位置,畫出頻次直方圖

24、。并根據(jù)所畫的直方圖說(shuō)明:大部分同學(xué)處于哪個(gè)身高段?身高的整體分布情況如何?,解:(1)根據(jù)題意,選定初始區(qū)間長(zhǎng)度為10cm。數(shù)據(jù)中最小的為146cm,最大的為170cm。則,組的個(gè)數(shù)=R((170-146)/10)+1=3,組數(shù)少,區(qū)間長(zhǎng)度減半,則,組的個(gè)數(shù)= R((170-146)/5)+1=6,組數(shù)合適,由此,確定出區(qū)間長(zhǎng)度為5cm,組的個(gè)數(shù)為6組。(2)確定起始區(qū)間位置由題意知,[y1]=14,備選的第一個(gè)區(qū)間起始坐標(biāo)可能是

25、: [y1]=14, [y1]+0.5=14.5。由此可確定第一個(gè)區(qū)間是[14.5,15)。,女生身高直方圖,大部分學(xué)生處于155cm到165cm之間,占抽查人數(shù)的67.5%,低于155cm和高于165cm的學(xué)生比較少,分別占17.5%和15%,學(xué)生身高分布大致成正態(tài)分布。,2.3 樣本數(shù)據(jù)的位置特征:對(duì)數(shù)據(jù)中心的描述,樣本數(shù)據(jù)集合的另一個(gè)重要特征,就是樣本數(shù)據(jù)集合中心所處的位置,它在一定程度上反映了樣本數(shù)據(jù)集合的位置。,2.3.1 樣

26、本眾數(shù),單一眾數(shù):一個(gè)樣本數(shù)據(jù)集合中出現(xiàn)頻次最高的樣本值只有一個(gè),簡(jiǎn)稱為該樣本數(shù)據(jù)集合的(樣本)眾數(shù)。復(fù)眾數(shù):在一個(gè)樣本數(shù)據(jù)集合中,有多個(gè)“出現(xiàn)頻次最高的數(shù)據(jù)”。無(wú)眾數(shù):一個(gè)樣本數(shù)據(jù)集合中,所有不同的樣本值出現(xiàn)頻次都相同的。,樣本眾數(shù)的例子(1)順序級(jí)的樣本數(shù)據(jù)的眾數(shù):頻次統(tǒng)計(jì)表、條形圖、餅圖,樣本的眾數(shù):“大學(xué)”這個(gè)眾數(shù)可以在一定程度上表示數(shù)據(jù)集合的“位置”,(2)名義級(jí)的樣本數(shù)據(jù)的眾數(shù):頻次統(tǒng)計(jì)表、條形圖、餅圖,樣本的眾數(shù)

27、:“Y”這個(gè)眾數(shù)對(duì)樣本數(shù)據(jù)集合的“位置”的表示意義,就比較弱。名義級(jí)的數(shù)據(jù)只有相同與否的區(qū)別,沒(méi)有順序位置的區(qū)別。不同樣本值的位置是可以任意排列的。,(3)刻度級(jí)的樣本數(shù)據(jù)的眾數(shù):頻次統(tǒng)計(jì)表、條形圖、餅圖,樣本的眾數(shù):9.99,10.00,10.01,刻度級(jí)的數(shù)據(jù)當(dāng)不重復(fù)的數(shù)據(jù)大多數(shù)是等距離分開的,并且重復(fù)出現(xiàn)的數(shù)據(jù)較多,適宜用定義1確定眾數(shù)。當(dāng)數(shù)據(jù)集合的數(shù)據(jù)精度高,不重復(fù)的數(shù)據(jù)量非常大,不適宜用定義1確定眾數(shù)。,樣本眾數(shù)定義2

28、及其例子,通過(guò)條形圖確定眾數(shù),遠(yuǎn)沒(méi)有直方圖更能反映數(shù)據(jù)集合的特征。,如:,眾數(shù)。,2.3.2 樣本中位數(shù),在對(duì)樣本數(shù)據(jù)集合中的所有數(shù)據(jù)排序后,樣本中位數(shù)Me由下式確定:,當(dāng)樣本個(gè)數(shù)為奇數(shù)時(shí),樣本中位數(shù)適用于順序級(jí)以上的數(shù)據(jù)集合;當(dāng)樣本個(gè)數(shù)為偶數(shù)時(shí),樣本中位數(shù)僅適用于刻度級(jí)的數(shù)據(jù)集合(順序級(jí)的數(shù)據(jù)不能做加減)。,分奇偶個(gè)數(shù),2.3.3 樣本均值,2.4 樣本數(shù)據(jù)的離散特征,一、點(diǎn)狀描述,二、區(qū)間描述,2.4.1 對(duì)樣本數(shù)據(jù)離散特征的點(diǎn)狀

29、描述:極值、四分點(diǎn)與百分位點(diǎn),適用于順序級(jí)以上的數(shù)據(jù)。,極大值是數(shù)據(jù)集合中的最大值,極小值是數(shù)據(jù)集合中的最小值。,2.4.1 對(duì)樣本數(shù)據(jù)離散特征的點(diǎn)狀描述:極值、四分點(diǎn)與百分位點(diǎn),中位數(shù)所在的“正中間位置”,把排序后的樣本數(shù)據(jù)集合分成左右兩部分,使左右兩部分包含的樣本數(shù)據(jù)的個(gè)數(shù)相等,即都包含50%的樣本總數(shù)。,該位置的左邊,有n×0.25個(gè)數(shù)據(jù),占總數(shù)的25%。,該位置的左邊,有n×0.5個(gè)數(shù)據(jù),占總數(shù)的50%。,該

30、位置的左邊,有n×0.75個(gè)數(shù)據(jù),占總數(shù)的75%。,當(dāng)Q1、Q2、Q3的位置為整數(shù)時(shí),相應(yīng)整數(shù)位置上的樣本值,就是Q1、Q2、Q3的值。,當(dāng)Q1、Q2、Q3的位置不為整數(shù)時(shí),Q2= Q2位置左邊的樣本值+(Q2位置右邊的樣本值- Q2位置左邊的樣本值)×Q2位置的小數(shù)部分,Q2= Q2位置左邊的樣本值+(Q2位置右邊的樣本值- Q2位置左邊的樣本值)×{(n+1) ×0.5-[(n+1)×

31、;0.5]},練習(xí)1,下面的數(shù)據(jù)是某一天20位工人收割麻黃草的數(shù)量,1.求收獲量的上四分位數(shù)值和下四分位數(shù)值。2.求中位數(shù)值。,解:(1)對(duì)數(shù)據(jù)從小到大排序,結(jié)果示于下表。,(2)設(shè)Q1為下四分點(diǎn)、 Q3為上四分點(diǎn)、 Q2為中位數(shù)。計(jì)算Q1, Q2, Q3的位置。由題意知,n=20,則:Q1的位置=(n+1) ×0.25=(20+1) ×0.25=5.25Q2的位置=(n+1) ×0.5=(20+1

32、) ×0.5=10.5Q3的位置=(n+1) ×0.75=(20+1) ×0.75=15.75(3)計(jì)算Q1, Q2, Q3的值Q1=3.7+(3.9-3.7) ×0.25=3.75Q2=4.8+(4.8-4.8) ×0.5=4.8Q3=5.6+(5.8-5.6) ×0.75=5.75,練習(xí)2,如果計(jì)算出下四分點(diǎn)在數(shù)據(jù)13.6與數(shù)據(jù)15之間,且下四分點(diǎn)的位置是12.7

33、5,求下四分點(diǎn)的值。,解:設(shè)Q1為下四分點(diǎn),根據(jù)Q1= Q1位置左邊的樣本值+( Q1位置右邊的樣本值- Q1位置左邊的樣本值)× Q1位置的小數(shù)部分可得,Q1=13.6+(15-13.6) ×0.75=14.65,上下百分位點(diǎn)1)下百分點(diǎn):把排序后的樣本數(shù)據(jù)集合,分成了左右兩部分,使左邊部分包含10%的樣本總個(gè)數(shù),右邊部分包含90%的樣本總個(gè)數(shù)。2)上百分點(diǎn):把排序后的樣本數(shù)據(jù)集合,分成了左右兩部分,使左

34、邊部分包含90%的樣本總個(gè)數(shù),右邊部分包含10%的樣本總個(gè)數(shù)。上、下百分點(diǎn)也在一定意義上反映了樣本數(shù)據(jù)的離散情況。,2.4.2 對(duì)樣本數(shù)據(jù)離散特征的區(qū)間描述:極差、四分位距與離差,2.4.3 離散狀況的統(tǒng)計(jì)值描述:樣本方差,樣本方差:,樣本標(biāo)準(zhǔn)差:,數(shù)據(jù)特征的度量指標(biāo),樣本數(shù)據(jù)集中趨勢(shì)的三種度量指標(biāo):,眾數(shù)、中位數(shù)、均值,樣本數(shù)據(jù)離散趨勢(shì)的三種區(qū)間描述度量指標(biāo):,極差、四分位距、方差(標(biāo)準(zhǔn)差),練習(xí),1. 從學(xué)院學(xué)生中隨機(jī)地挑選

35、15名學(xué)生,問(wèn)到他們昨晚睡眠的小時(shí)數(shù)。得到的樣本數(shù)據(jù)是:5,6,6,8,7,7,9,5,4,8,11,6,7,8,7。求出以下各值: a.均值 b.中位數(shù) c.眾數(shù) d.方差 e.標(biāo)準(zhǔn)差,解:對(duì)上述數(shù)據(jù)排序后,如表所示。,,=(4+5×2+6×3+7×4+8×3+9+11)/15=6.93,Me=x8=7眾數(shù)是7S=1.75,2. 以下是一組兒童首次牙科檢查的年齡的樣

36、本: 首次牙科檢查的年齡x: 1 2 3 4 5 兒童的數(shù)目 f: 9 11 23 16 21a.求對(duì)這些兒童首次牙科檢查年齡的均值。b.求中位數(shù)年齡。c.求標(biāo)準(zhǔn)差。,解:由題意可知,n= 9+11+23+16+21=80 ,根據(jù),Me=(x40+x41)/2=(3+3)/2=3,2.5 樣本數(shù)據(jù)特征的綜合表達(dá):箱形圖,2.5.1 箱形圖的基本構(gòu)造,箱形圖的繪制步驟,

37、1.將樣本數(shù)據(jù)值由小到大的順序排列。2.求出中位數(shù)Me。3.求Q1 和Q3。4.將Q1,Me及Q3,繪成一長(zhǎng)方形。5. 找出樣本數(shù)據(jù)中的極小、極大值,畫出左、右胡須。,當(dāng)胡須特別長(zhǎng)時(shí)(外圍值的范圍分布很大時(shí)),特別是由于個(gè)別過(guò)大或過(guò)小值出現(xiàn)在樣本數(shù)據(jù)集合中時(shí),需對(duì)箱形圖進(jìn)行修正,來(lái)“剔除”特別大或特別小的數(shù)據(jù)對(duì)箱形圖的影響,從而較為恰當(dāng)?shù)乇磉_(dá)樣本數(shù)據(jù)集合的基本特征。,3.5.2 修正的箱形圖,回到上頁(yè),修正箱形

38、圖中的一些概念,外圍值:處在胡須上的、離箱體的距離大于1.5倍的四分位距(1.5Iqr)的樣本值。近外圍值:處在胡須上的、離箱體的距離大于1.5倍的四分位距(1.5Iqr)、但小于3倍的四分位距(3Iqr)的樣本值。遠(yuǎn)外圍值(極端值):處在胡須上的、離箱體的距離大于3倍的四分位距(3Iqr)的樣本值。,修正箱形圖的繪制步驟,1.將樣本數(shù)據(jù)值由小到大的順序排列。2.求出中位數(shù)Me。3.求Q1 和Q3。4.求四分位距Iqr

39、,“非外圍值”上邊界Q3+1.5Iqr,“非外圍值”下邊界Q1-1.5Iqr。5. 將Q1,Me及Q3,繪成一長(zhǎng)方形。6. 找出樣本數(shù)據(jù)中“非外圍值”范圍內(nèi)的最小值、最大值,畫出左、右胡須。,修正箱形圖的主要作用,可了解數(shù)據(jù)分布,是否為對(duì)稱性;可清楚指出中位數(shù)的位置;可判斷數(shù)據(jù)有無(wú)離群值(奇異值)存在。,2.5.3 箱形圖示例,1. 例2.2.1身高數(shù)據(jù)的箱形圖,由表2.5.2知,n=22,極大值為190cm,極小值

40、為160cm。中位數(shù)的位置=(n+1) ×0.5=23×0.5=11.5Me=Q2=176+(177-176) ×0.5=176.5Q1的位置=(n+1) ×0.25=23×0.25=5.75Q1=170+(171-170)×0.75=170.75Q3的位置=(n+1) ×0.75=23×0.75=17.25Q3=181+(182-181)

41、15;0.25=181.25,由圖可知,箱形圖上箱體短、上胡須短,所以,數(shù)據(jù)向高端傾斜。,例3.2.1箱形圖,2. 假設(shè)在例2.2.1中,該班級(jí)轉(zhuǎn)來(lái)1名身高213厘米的巨人,則該班級(jí)男生的身高數(shù)據(jù)如表2.5.3所示。畫出此時(shí)的箱形圖。,由表2.5.4知,n=23。中位數(shù)的位置=(n+1) ×0.5=24×0.5=12Me=Q2=177Q1的位置=(n+1) ×0.25=24×0.25=6Q

42、1=171Q3的位置=(n+1) ×0.75=24×0.75=18Q3=182四分位距Iqr=182-171=11由此可知,“非外圍值”的上邊界為:182+11×1.5=198.5,下邊界為:171-11×1.5=154.5在“非外圍值”的上下邊界內(nèi),數(shù)據(jù)集合的最小值為160,最大值為190。,例2.2.1修正箱形圖,由圖可知,除去“外圍值”213cm外,修正箱形圖上箱體短、上胡須短,所

43、以,數(shù)據(jù)向高端傾斜。,離群值,例:下面給出某醫(yī)院21個(gè)病人的住院時(shí)間(以天計(jì)),試畫出修正箱型圖1 2 3 3 4 4 5 6 6 7 7 9 9 10 12 12 13 15 18 23 55以下是22個(gè)病人的血壓(收縮壓,mmHg)數(shù)據(jù)已排序,試畫出箱型圖。102 110 140 142 147 117 118 122 123 132 150142 146 148 147 129 132 137 142 145 147

44、 138,箱形圖給出了一個(gè)數(shù)據(jù)集合的哪些量?(A)極小值、極大值(B)極差、中位數(shù)(C)上四分點(diǎn)、下四分點(diǎn)(D)四分位距,√,√,√,√,試述以下基本概念: 1.總體(或母體),個(gè)體,變量(或指標(biāo)),變量值(指標(biāo)值),或數(shù)據(jù)。2.數(shù)據(jù)測(cè)度分為幾個(gè)類別?試舉例說(shuō)明。,3.企業(yè)質(zhì)量管理員在生產(chǎn)線上某環(huán)節(jié)隨機(jī)地抽取被加工的部件,并檢驗(yàn)記錄所抽取的部件的下列信息: A:有缺陷還是無(wú)缺陷 B:加工此部件工人的工

45、號(hào) C:部件的重量。問(wèn): a.被研究對(duì)象的總體是什么? b.此總體是有限總體還是無(wú)限總體? c.樣本是什么? d上述三個(gè)變量是屬性變量還是數(shù)值變量?總體是生產(chǎn)某環(huán)節(jié)所有加工部件無(wú)限總體樣本是抽取部件A是屬性變量,BC是數(shù)值變量,5. 學(xué)生上學(xué)時(shí)所帶書本的重量,是什么測(cè)度類型的變量?刻度級(jí)類型,6. 分層抽樣(分類抽樣)的作法和適用條件是什么?,1. 哪些測(cè)度等級(jí)的數(shù)據(jù)集合,適合于做頻

46、次(Frequency)與頻率(Percentage)的餅圖(Pie chart)? 都可以,只要不重復(fù)的樣本值的個(gè)數(shù)不能太多。2. 哪些測(cè)度等級(jí)的數(shù)據(jù)集合,適合于做頻次與頻率的條形圖? 都可以,只要不重復(fù)的樣本值的個(gè)數(shù)不能太多。3. 頻次與頻率的餅圖有差異嗎? 沒(méi)有,4.頻次與頻率的條形圖有差異嗎?為什么? 沒(méi)有 5.對(duì)于一個(gè)數(shù)據(jù)集合而言,什么是累積頻率?

47、 6.能夠用餅圖來(lái)表示一個(gè)數(shù)據(jù)集合的累積頻率嗎? 不能 7.哪些測(cè)度等級(jí)的數(shù)據(jù)集合,才能計(jì)算累積頻率? 順序級(jí)以上 8.除了表格法以外,還可以用 圖來(lái)表示一個(gè)數(shù)據(jù)集合的 累積頻率分布狀況? 條形圖,9.直方圖與條形圖的區(qū)別是什么? 直方圖要對(duì)數(shù)據(jù)分組,而條形圖不對(duì)數(shù)據(jù)分組。10.什么測(cè)度級(jí)別的數(shù)據(jù),適宜作直方圖? 刻度級(jí)11.作直

48、方圖時(shí),一般是先確定區(qū)間長(zhǎng)度,還是先確定區(qū)間個(gè)數(shù)?哪個(gè)更好一些? 先確定區(qū)間長(zhǎng)度12. 作直方圖時(shí),在區(qū)間長(zhǎng)度確定后,如何確定區(qū)間個(gè)數(shù)?,13.箱形圖給出了一個(gè)數(shù)據(jù)集合的哪幾個(gè)量? 極小值、極大值、極差、上四分點(diǎn)、下四分點(diǎn)、四分位 距、中位數(shù),(四)我們對(duì)某少兒旅行團(tuán)的年齡進(jìn)行了數(shù)據(jù)調(diào)查,以下是調(diào)查結(jié)果:12,10,11,10,11,12,9,12,8,10,9,9,14,8,10,13,7,9,11,16,10

49、,12,9試計(jì)算該旅行團(tuán)成員年齡的眾數(shù),中位數(shù),上下四分點(diǎn)和均值,141 148 132 138 154 142 150 146 155 158 150 140 147 148 144150 149 145 149 158 143 141 144 144 126 140 144 142 141 140145 135 147 146 141 136 140 146 142 137 148 154 137 139 143140 13

50、1 143 141 149 148 135 148 152 143 144 141 143 147 146150 132 142 142 143 153 149 146 149 138 142 149 142 137 134144 146 147 140 142 140 137 152 145,(五)某班管理統(tǒng)計(jì)學(xué)課程的考試成績(jī),請(qǐng)構(gòu)造直方圖。,(六)下面分別給出了25名男子和25名女子的肺活量(以升計(jì))女子組 2.7 2.8 2

51、.9 3.1 3.1 3.1 3.2 3.4 3.4 3.4 3.4 3.4 3.5 3.5 3.5 3.6 3.7 3.7 3.7 3.8 3.8 4.0 4.1 4.2 4.2男子組 4.1 4.1 4.3 4.3 4.5 4.6 4.7 4.8 4.8 5.1 5.3 5.3 5.3 5.4 5.4 5.5 5.6 5.7 5.8 5.8 6.0 6.1 6.3 6.7

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論