簡(jiǎn)介:第4章數(shù)據(jù)的概括性度量,41集中趨勢(shì)的度量42離散程度的度量43偏態(tài)與峰態(tài)的度量,數(shù)據(jù)的概括性度量,41集中趨勢(shì)的度量,集中趨勢(shì)CENTRALTENDENCY是指一組數(shù)據(jù)向某一中心值靠攏的傾向和程度,集中趨勢(shì)可以反映一組數(shù)據(jù)的中心值或代表值,不同數(shù)據(jù)類(lèi)型可選用不同的集中趨勢(shì)測(cè)度值低層次數(shù)據(jù)的測(cè)度值適用于高層次的測(cè)量數(shù)據(jù),但高層次數(shù)據(jù)的測(cè)度值并不適用于低層次的測(cè)量數(shù)據(jù),411分類(lèi)數(shù)據(jù)眾數(shù),一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值稱(chēng)為眾數(shù)MODE,用M0表示不受極端值的影響眾數(shù)主要用于測(cè)度分類(lèi)數(shù)據(jù)的集中趨勢(shì)也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)一組數(shù)據(jù)可以沒(méi)有眾數(shù),也可以有幾個(gè)眾數(shù),眾數(shù)的特性,1一組數(shù)據(jù)可以沒(méi)有眾數(shù)假定一組數(shù)據(jù)如下12345則這組數(shù)據(jù)沒(méi)有眾數(shù),,,,,,,,,1,1,2,3,4,5,2一組數(shù)據(jù)可以有多個(gè)眾數(shù)假定一組數(shù)據(jù)如下1223445那么這組數(shù)據(jù)有兩個(gè)眾數(shù),,,,,,,,1,1,2,3,4,5,,,2,圖41眾數(shù)示意圖,,,,無(wú)眾數(shù)一個(gè)眾數(shù)多于一個(gè)眾數(shù),例41,根據(jù)第3章表34的數(shù)據(jù),計(jì)算“飲料品牌”的眾數(shù),表34不同品牌飲料的頻數(shù)分布,解這里的變量為“飲料品牌”,是分類(lèi)變量,不同類(lèi)型的飲料就是變量值在所調(diào)查的50人中,購(gòu)買(mǎi)可口可樂(lè)的人數(shù)最多,為15人,占總被調(diào)查人數(shù)的30,因此眾數(shù)為“可口可樂(lè)”這一品牌即可口可樂(lè),例42,表36甲城市家庭對(duì)住房狀況的評(píng)價(jià),根據(jù)第3章表36的數(shù)據(jù),計(jì)算甲城市對(duì)住房狀況滿(mǎn)意度評(píng)價(jià)的眾數(shù),解這里的變量是回答類(lèi)別,是順序變量甲城市所調(diào)查的300戶(hù)家庭中,對(duì)目前住房不滿(mǎn)意的戶(hù)數(shù)最多,有108戶(hù)所以這組數(shù)據(jù)的眾數(shù)為“不滿(mǎn)意”這一類(lèi)別即不滿(mǎn)意,例43,在某城市中隨機(jī)抽取9戶(hù)家庭,調(diào)查得每戶(hù)家庭的人均月收入數(shù)據(jù)如下單位元要求計(jì)算人均月收入的眾數(shù)108075010801080850960200012501630解人均月收入1080的家庭最多,即元,一個(gè)由CLAREMONT學(xué)院本科學(xué)生組成的“莎士比亞診所”,用統(tǒng)計(jì)分析對(duì)58個(gè)與莎士比亞同時(shí)代的作家進(jìn)行分析,以確定誰(shuí)的寫(xiě)作風(fēng)格與莎士比亞的作品風(fēng)格最相近。他們從58個(gè)作家的作品中選取片段,并將其分成500字一段的小段,對(duì)區(qū)組中的一些變量進(jìn)行計(jì)數(shù)統(tǒng)計(jì),例如,考察52個(gè)關(guān)鍵字的出現(xiàn)情況,并找出其眾數(shù),由此得出各個(gè)作家的主要特征。結(jié)果,58個(gè)備選者中沒(méi)有一個(gè)能通過(guò)眾數(shù)檢驗(yàn)。因此證明,是莎士比亞寫(xiě)下了他本人的詩(shī)篇。,莎士比亞著作中的眾數(shù),412順序數(shù)據(jù)中位數(shù)和分位數(shù),1中位數(shù)MEDIAN,一組數(shù)據(jù)按從小到大排列時(shí),處于中間位置上的變量值稱(chēng)為中位數(shù),用ME表示中位數(shù)主要用于測(cè)度順序數(shù)據(jù)的集中趨勢(shì)中位數(shù)當(dāng)然也適用于數(shù)值型數(shù)據(jù),但不適用于分類(lèi)數(shù)據(jù)顯然,中位數(shù)作為位置代表值,其數(shù)值不受極大值和極小值的影響,中位數(shù)的位置,對(duì)未分組數(shù)據(jù)中位數(shù)的位置=即未分組數(shù)據(jù)的中位數(shù)是1,2,,N這N個(gè)位置的平均而對(duì)于分組數(shù)據(jù),則中位數(shù)的位置=,41,中位數(shù)的計(jì)算,例44,根據(jù)第3章表36的數(shù)據(jù),計(jì)算甲城市家庭對(duì)住房狀況滿(mǎn)意程度評(píng)價(jià)的中位數(shù),表36甲城市家庭對(duì)住房狀況的評(píng)價(jià),解已知N300,從而中位數(shù)的位置為,從累積頻數(shù)可知,中位數(shù)在“一般”這一類(lèi)中,因此,一般,例45,在某城市中隨機(jī)抽取9個(gè)家庭,調(diào)查得各個(gè)家庭的人均月收入數(shù)據(jù)如下單位元,試計(jì)算人均月收入的中位數(shù)15007507801080850960200012501630解把數(shù)據(jù)排序得75078085096010801250150016302000而中位數(shù)的位置91/25,于是,例45續(xù),假定例45中隨機(jī)抽取10個(gè)家庭,各個(gè)家庭的人均月收入數(shù)據(jù)如下66075078085096010801250150016302000從而中位數(shù)的位置101/255,于是,例,根據(jù)第3章表312的數(shù)據(jù),計(jì)算電腦銷(xiāo)售量的中位數(shù)解由于N120,則中位數(shù)的位置為,中位數(shù)為,2四分位數(shù)(QUARTILE),與中位數(shù)類(lèi)似的還有四分位數(shù)。一組數(shù)據(jù)按從小到大排列時(shí),處于位置上的變量值稱(chēng)為第一個(gè)四分位數(shù)(下四分位數(shù)),處于位置上的變量值稱(chēng)為第三個(gè)四分位數(shù)(上四分位數(shù)),而中位數(shù)就是第二個(gè)四分位數(shù)。,四分位數(shù)的位置,對(duì)未分組時(shí)下四分位數(shù)的位置=上四分位數(shù)的位置=而對(duì)于分組數(shù)據(jù),則下四分位數(shù)的位置=上四分位數(shù)的位置=,43,例,例46,對(duì)例45的數(shù)據(jù),計(jì)算人均月收入的下四分位數(shù)和上四分位數(shù)解已知N9,得下四分位數(shù)和上四分位數(shù)的位置,于是,例,解QL位置300/475QU位置3300/4225從累計(jì)頻數(shù)看,QL在“不滿(mǎn)意”這一組別中;QU在“一般”這一組別中。因此QL不滿(mǎn)意QU一般,413數(shù)值型數(shù)據(jù)平均數(shù),平均數(shù)也稱(chēng)均值MEAN,是最常用的集中趨勢(shì)測(cè)度值,易受極端值的影響主要適用于數(shù)值型數(shù)據(jù),但不適用于分類(lèi)數(shù)據(jù)和順序數(shù)據(jù),1簡(jiǎn)單平均數(shù)與加權(quán)平均數(shù),1根據(jù)未分組的數(shù)據(jù)計(jì)算簡(jiǎn)單平均數(shù),設(shè)一組數(shù)據(jù)為則平均數(shù)的計(jì)算公式為,例如,根據(jù)例45的數(shù)據(jù),計(jì)算9個(gè)家庭人均月收入的平均數(shù)為,元,44,2根據(jù)分組的數(shù)據(jù)計(jì)算加權(quán)平均數(shù),設(shè)一組數(shù)據(jù)分為K組,各組的組中值和組頻數(shù)分別為則平均數(shù)的計(jì)算公式為,45,例47,根據(jù)第3章表313中的數(shù)據(jù),計(jì)算電腦銷(xiāo)售量的平均數(shù),表41某電腦公司銷(xiāo)售量數(shù)據(jù)平均數(shù)計(jì)算表,解根據(jù)45式,得,臺(tái),加權(quán)平均數(shù)權(quán)數(shù)對(duì)平均數(shù)的影響,甲乙兩組各有10名學(xué)生,他們的考試成績(jī)及其分布數(shù)據(jù)如下甲組考試成績(jī)(X)020100人數(shù)分布(F)118乙組考試成績(jī)(X)020100人數(shù)分布(F)811,,,2調(diào)和平均數(shù)(HARMONICMEAN),均值的另一種表現(xiàn)形式,易受極端值的影響計(jì)算公式為,原來(lái)只是計(jì)算時(shí)使用了不同的數(shù)據(jù),調(diào)和平均數(shù)例題分析,【例】某蔬菜批發(fā)市場(chǎng)三種蔬菜的日成交數(shù)據(jù)如表,計(jì)算三種蔬菜該日的平均批發(fā)價(jià)格。,,3一種特殊的平均數(shù)幾何平均數(shù),幾何平均數(shù)GEOMETRICMEAN是平均數(shù)的另一種類(lèi)型,主要用于比率或速度的平均1根據(jù)未分組的數(shù)據(jù)計(jì)算幾何平均數(shù)設(shè)一組數(shù)據(jù)為則幾何平均數(shù)為,46,2根據(jù)分組的數(shù)據(jù)計(jì)算幾何平均數(shù)設(shè)一組數(shù)據(jù)分為K組,各組的組中值和組頻數(shù)分別為,則幾何平均數(shù)的計(jì)算公式為,平均增長(zhǎng)率,對(duì)逐年增長(zhǎng)率平均增長(zhǎng)率應(yīng)滿(mǎn)足,48,即,或,49,幾何平均數(shù)例題分析,【例】某水泥生產(chǎn)企業(yè)1999年的水泥產(chǎn)量為100萬(wàn)噸,2000年與1999年相比增長(zhǎng)率為9,2001年與2000年相比增長(zhǎng)率為16,2002年與2001年相比增長(zhǎng)率為20。求各年的年平均增長(zhǎng)率。,年平均增長(zhǎng)率=1149111491,幾何平均數(shù)例題分析,【例】某企業(yè)生產(chǎn)某種產(chǎn)品要經(jīng)過(guò)三個(gè)連續(xù)作業(yè)車(chē)間才能完成。若某月份第一車(chē)間粗加工產(chǎn)品的合格率為95,第二車(chē)間精加工產(chǎn)品的合格率為93,第三車(chē)間最后裝配的合格率為90,則該產(chǎn)品的車(chē)間平均合格率為多少,即該產(chǎn)品的車(chē)間平均合格率為9264。,例48,一位投資者持有一種股票,20012004年的收益率分別為45,21,255和19計(jì)算該投資者在這四年內(nèi)的平均收益率解根據(jù)46,得,即該投資者的投資平均收益率為108078710080787,414眾數(shù)、中位數(shù)和平均數(shù)的比較,1眾數(shù)、中位數(shù)和平均數(shù)的關(guān)系,圖42不同分布的眾數(shù)、中位數(shù)和平均數(shù),A對(duì)稱(chēng)分布,B左偏分布,C右偏分布,,2眾數(shù)、中位數(shù)和平均數(shù)的特點(diǎn),1眾數(shù)是一組數(shù)據(jù)出現(xiàn)次數(shù)最多的數(shù)值,不受極端值的影響,但可能沒(méi)有眾數(shù),也可能有兩個(gè)或兩個(gè)以上眾數(shù)。眾數(shù)主要適用于分類(lèi)數(shù)據(jù)的集中趨勢(shì)測(cè)度2中位數(shù)是一組數(shù)據(jù)處于中間位置上的數(shù)值,不受極端值的影響,主要適用于順序數(shù)據(jù)的集中趨勢(shì)測(cè)度3平均數(shù)具有優(yōu)良的統(tǒng)計(jì)性質(zhì),是實(shí)際應(yīng)用最廣泛的集中趨勢(shì)測(cè)度值主要適用于數(shù)值型數(shù)據(jù)的集中趨勢(shì)測(cè)度.,3眾數(shù)、中位數(shù)和平均數(shù)的應(yīng)用場(chǎng)合,例從一家公司中選取一個(gè)20名工人的樣本,將他們每周除去所有費(fèi)用后的凈收入近似為整數(shù)并按升序排列如下(元)240,240,240,240,240,240,240,240,255,255,265,265,280,280,290,300,305,325,330,340。計(jì)算(1)、平均數(shù),中位數(shù),眾數(shù);,中位數(shù)260元,眾數(shù)240元(2)、從偏斜度的角度描述這組工資數(shù)據(jù);由于平均數(shù)大于中位數(shù),所以這個(gè)分布是右偏分布。,3眾數(shù)、中位數(shù)和平均數(shù)的應(yīng)用場(chǎng)合,(3)、假如你是這家公司負(fù)責(zé)勞資問(wèn)題的副總經(jīng)理,你會(huì)采用哪個(gè)測(cè)度值代表公司中所有員工的收入水平因?yàn)闃颖酒骄鶖?shù)是這三個(gè)平均數(shù)測(cè)度值中的最大值,所以你可能傾向于采用它作為平均數(shù)。事實(shí)上,使用它非常合適,因?yàn)檫@里牽涉到統(tǒng)計(jì)推斷,而樣本平均數(shù)是可用的最穩(wěn)定的統(tǒng)計(jì)量。(4)、假設(shè)你是推選出的工會(huì)主席,你會(huì)采用哪個(gè)測(cè)度值代表公司中所有員工的收入水平從你在工資問(wèn)題談判中所處的位置出發(fā),你可能傾向于選擇眾數(shù),或者至少是中位數(shù),而決不會(huì)選用平均數(shù)。為了說(shuō)明你選擇的測(cè)度值是合理的,你應(yīng)該指出眾數(shù)代表了樣本中大部分人的凈收入,或者可以指出從樣本中可以看出樣本平均數(shù)受到極少數(shù)高工資的影響。然而,無(wú)論是眾數(shù)還是中位數(shù)都會(huì)隨樣本不同而產(chǎn)生很大變化,所以比起平均數(shù)都是不穩(wěn)定的總體估計(jì)值。,數(shù)據(jù)類(lèi)型與集中趨勢(shì)測(cè)度值,42離散程度的度量,離散程度或分散程度是數(shù)據(jù)分布的另一個(gè)重要特征,離散程度的測(cè)度值反映數(shù)據(jù)的分散程度數(shù)據(jù)的分散程度越大,則集中趨勢(shì)測(cè)度值的代表性就越差;分散程度越小,則集中趨勢(shì)測(cè)度值的代表性就越好不同數(shù)據(jù)類(lèi)型有不同的離散程度測(cè)度值,421分類(lèi)數(shù)據(jù)異眾比率,異眾比率VARIATIONRATIO是非眾數(shù)組的頻數(shù)所占的比例,即,異眾比率用于衡量眾數(shù)的代表程度1異眾比率大,說(shuō)明眾數(shù)的代表性差2異眾比率小,說(shuō)明眾數(shù)的代表性好,410,例49,根據(jù)第3章表3–4的數(shù)據(jù),計(jì)算異眾比率,表34不同品牌飲料的頻數(shù)分布,解根據(jù)410式,得異眾比率,在所調(diào)查的50人當(dāng)中,購(gòu)買(mǎi)其他品牌飲料的人數(shù)占70由于異眾比率比較大,因此用“可口可樂(lè)”代表消費(fèi)者購(gòu)買(mǎi)飲料品牌的狀況,其代表性不是很好,422順序數(shù)據(jù)四分位差,四分位差QUARTILEDEVIATION是上四分位數(shù)與下四分位數(shù)之差,即,411,四分位差反映了下四分位數(shù)至上四分位數(shù)之間即中間的50數(shù)據(jù)的離散程度或變動(dòng)范圍.四分位差越大,說(shuō)明中間這部分?jǐn)?shù)據(jù)越分散,而四分位差越小,則說(shuō)明中間這部分?jǐn)?shù)據(jù)越集中四分位差在一定程度上可用于衡量中位數(shù)的代表程度,四分位差例題分析,解為了計(jì)算順序數(shù)據(jù)的四分位差,需要把各類(lèi)別數(shù)量化。設(shè)非常不滿(mǎn)意為1,不滿(mǎn)意為2,一般為3,滿(mǎn)意為4,非常滿(mǎn)意為5,已知QL不滿(mǎn)意2QU一般3四分位差QDQUQL3–21,例410,根據(jù)例46的數(shù)據(jù),已求得,從而四分位差為,臺(tái),423數(shù)值型數(shù)據(jù)方差和標(biāo)準(zhǔn)差,測(cè)度數(shù)值型數(shù)據(jù)離散程度的主要方法有極差、平均差、方差和標(biāo)準(zhǔn)差,但最常用的是方差和標(biāo)準(zhǔn)差,1極差,極差RANGE是一組數(shù)據(jù)的最大值與最小值之差,即未分組數(shù)據(jù)R=最大值-最小值分組數(shù)據(jù)R≈最后一組的上限-第一組的下限412極差計(jì)算簡(jiǎn)單,是描述數(shù)據(jù)離散程度的最簡(jiǎn)單的測(cè)值.但極差易受極端值的影響,并且不能反映中間數(shù)據(jù)的分散程度。例如,根據(jù)例45的數(shù)據(jù),得9個(gè)家庭人均月收入的極差為R=2000-750=1250元,2平均差,平均差MEANDEVIATION是各變量值與均值離差絕對(duì)值的平均平均差雖然能全面反映一組數(shù)據(jù)的分散程度,但由于離差取了絕對(duì)值,這給計(jì)算和統(tǒng)計(jì)性質(zhì)的討論帶來(lái)不便,因而實(shí)際工作中應(yīng)用較少計(jì)算公式為,未分組數(shù)據(jù),組距分組數(shù)據(jù),413,414,例411,含義每一天的銷(xiāo)售量與平均數(shù)相比,平均相差17臺(tái),3方差和標(biāo)準(zhǔn)差,方差和標(biāo)準(zhǔn)差VARIANCEANDSTANDARDDEVIATION是最常用的離散程度測(cè)度值根據(jù)總體數(shù)據(jù)計(jì)算的稱(chēng)為總體方差或總體標(biāo)準(zhǔn)差,而根據(jù)樣本數(shù)據(jù)計(jì)算的則稱(chēng)為樣本方差或樣本標(biāo)準(zhǔn)差,(1)總體方差和標(biāo)準(zhǔn)差,方差的計(jì)算公式未分組數(shù)據(jù)組距分組數(shù)據(jù),標(biāo)準(zhǔn)差的計(jì)算公式未分組數(shù)據(jù)組距分組數(shù)據(jù),,總體標(biāo)準(zhǔn)差(例題分析),某車(chē)間50名工人日加工零件的標(biāo)準(zhǔn)差計(jì)算表,解計(jì)算過(guò)程列于表,根據(jù)計(jì)算公式得,(個(gè)),(2)樣本方差和標(biāo)準(zhǔn)差,未分組數(shù)據(jù),組距分組數(shù)據(jù),未分組數(shù)據(jù),組距分組數(shù)據(jù),方差的計(jì)算公式,標(biāo)準(zhǔn)差的計(jì)算公式,,(415),(417),(418),自由度的說(shuō)明,1、一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)2、當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為N時(shí),若樣本均值?X確定后,只有N1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)不能自由取值3、例如,樣本有3個(gè)數(shù)值,即X12,X24,X39,則?X5。當(dāng)?X5確定后,X1,X2和X3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如X16,X27,那么X3則必然取2,而不能取其他值4、樣本方差用自由度去除,其原因可從多方面來(lái)解釋?zhuān)瑥膶?shí)際應(yīng)用角度看,在抽樣估計(jì)中,當(dāng)用樣本方差去估計(jì)總體方差Σ2時(shí),它是Σ2的無(wú)偏估計(jì)量,例412樣本標(biāo)準(zhǔn)差的計(jì)算,含義每一天的銷(xiāo)售量與平均數(shù)相比,平均相差2158臺(tái),方差的展開(kāi)公式,在實(shí)際計(jì)算時(shí),也可按展開(kāi)公式計(jì)算方差,,1.,2.,3.,4.,4相對(duì)位置的測(cè)量,1標(biāo)準(zhǔn)分?jǐn)?shù),標(biāo)準(zhǔn)分?jǐn)?shù)性質(zhì),標(biāo)準(zhǔn)分?jǐn)?shù)性質(zhì),標(biāo)準(zhǔn)分?jǐn)?shù)只是將原始數(shù)據(jù)進(jìn)行了線(xiàn)性變換,它并沒(méi)有改變一個(gè)數(shù)據(jù)在該組數(shù)據(jù)中的位置,也沒(méi)有改變?cè)摻M數(shù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標(biāo)準(zhǔn)差為1。,例413,根據(jù)例45的數(shù)據(jù),計(jì)算每個(gè)家庭的人均月收入的標(biāo)準(zhǔn)分?jǐn)?shù)解根據(jù)例45的數(shù)據(jù)求可得,由419式得每個(gè)家庭的人均月收入的標(biāo)準(zhǔn)分?jǐn)?shù)如下表44表449個(gè)家庭人均月收入標(biāo)準(zhǔn)分?jǐn)?shù)計(jì)算表,可以看出,收入最低的家庭其人均收入與平均數(shù)相比低1042個(gè)標(biāo)準(zhǔn)差;而收入最高的家庭人均收入比平均數(shù)高1853個(gè)標(biāo)準(zhǔn)差。,標(biāo)準(zhǔn)分?jǐn)?shù)例題分析,前NBA巨星MICHAELJORDAN身高78英寸,而WNBA運(yùn)動(dòng)員RLOBO身高76英寸,很明顯JORDAN高出2英寸,但誰(shuí)相對(duì)來(lái)說(shuō)高一些呢(男性平均身高69英寸,標(biāo)準(zhǔn)差為28英寸;女性平均身高636英寸,標(biāo)準(zhǔn)差為25英寸),JORDAN的身高高于平均數(shù)321個(gè)標(biāo)準(zhǔn)差,而LOBO的身高高于平均數(shù)496個(gè)標(biāo)準(zhǔn)差。,2經(jīng)驗(yàn)法則,經(jīng)驗(yàn)法則表明當(dāng)一組數(shù)據(jù)對(duì)稱(chēng)分布時(shí)▽約有68的數(shù)據(jù)在均值加減1個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)▽約有95的數(shù)據(jù)在均值加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)▽約有99的數(shù)據(jù)在均值加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi),(415),3切比雪夫不等式CHEBYSHEVINEQUALITY,對(duì)于K2,3,4,該不等式的含義是▽至少有75的數(shù)據(jù)在平均數(shù)加減2個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)▽至少有89的數(shù)據(jù)在平均數(shù)加減3個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi)▽至少有94的數(shù)據(jù)在平均數(shù)加減4個(gè)標(biāo)準(zhǔn)差的范圍之內(nèi),1)如果一組數(shù)據(jù)不是對(duì)稱(chēng)分布,經(jīng)驗(yàn)法則就不再使用,這時(shí)可使用切比雪夫不等式,它對(duì)任何分布形狀的數(shù)據(jù)都適用2)切比雪夫不等式提供的是“下界”,也就是“所占比例至少是多少”3)對(duì)于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有11/的數(shù)據(jù)落在K個(gè)標(biāo)準(zhǔn)差之內(nèi)。其中K是大于1的任意值,但不一定是整數(shù),424相對(duì)離散程度離散系數(shù),方差或標(biāo)準(zhǔn)差都反映了數(shù)據(jù)分散程度的絕對(duì)值,而影響方差或標(biāo)準(zhǔn)差數(shù)值大小有2個(gè)方面的原因1與這組數(shù)據(jù)的平均數(shù)大小有關(guān)2與這組數(shù)據(jù)的計(jì)量單位有關(guān)例設(shè)一組數(shù)據(jù)為1,2,3N3,則而另一組數(shù)據(jù)為100,200,300N3,則從而對(duì)于不同平均水平或不同計(jì)量單位的兩組數(shù)據(jù),不能通過(guò)直接比較方差或標(biāo)準(zhǔn)差來(lái)表明數(shù)據(jù)離散程度的大小為消除平均水平與計(jì)量單位的影響,需要計(jì)算離散系數(shù),420,例414,表45某管理局所屬8家企業(yè)的產(chǎn)品銷(xiāo)售數(shù)據(jù),某管理局抽查了8家企業(yè),其產(chǎn)品銷(xiāo)售數(shù)據(jù)見(jiàn)表45試比較產(chǎn)品銷(xiāo)售額與銷(xiāo)售利潤(rùn)的離散程度,,,例414的解,解由于銷(xiāo)售額與利潤(rùn)額的平均數(shù)大小不同,不能直接按標(biāo)準(zhǔn)差進(jìn)行比較,需計(jì)算離散系數(shù)根據(jù)表45數(shù)據(jù),得,由于,說(shuō)明銷(xiāo)售額的離散程度小于銷(xiāo)售利潤(rùn)的離散程度,數(shù)據(jù)類(lèi)型與離散程度測(cè)度值,43偏態(tài)與峰態(tài)的測(cè)度,偏態(tài)與峰度是對(duì)數(shù)據(jù)分布形狀的測(cè)度,431偏態(tài)及其測(cè)度,1未分組樣本數(shù)據(jù)的偏態(tài)系數(shù),2分組樣本數(shù)據(jù)的偏態(tài)系數(shù),設(shè)一組數(shù)據(jù)分為K組,各組的組中值和組頻數(shù)分別為則偏態(tài)系數(shù)的計(jì)算公式為,422,1,為對(duì)稱(chēng)分布,2,為右偏分布,3,為左偏分布,4越大,則偏斜程度就越大,例415,根據(jù)表39的數(shù)據(jù),計(jì)算電腦銷(xiāo)售量的偏態(tài)系數(shù),表46某電腦公司銷(xiāo)售量偏態(tài)與峰度系數(shù)計(jì)算表,例415的解,已知,根據(jù)422式,得,偏態(tài)系數(shù)為正值,且數(shù)值較小,說(shuō)明電腦銷(xiāo)售量為輕微右偏分布,即銷(xiāo)售量較少的天數(shù)占據(jù)多數(shù),而銷(xiāo)售量較多的天數(shù)則占少數(shù),432峰態(tài)及其測(cè)度,1未分組樣本數(shù)據(jù)的峰態(tài)系數(shù),峰態(tài)KURTOSIS是對(duì)分布尖峭或平緩程度的測(cè)度設(shè)一組數(shù)據(jù),則峰態(tài)系數(shù)KURTOSISCOEFFICIENT的計(jì)算公式為,423,2分組樣本數(shù)據(jù)的峰態(tài)系數(shù),峰態(tài)是與正態(tài)分布相比較而言的,由于正態(tài)分布的峰度系數(shù)等于0,所以Ⅰ,峰態(tài)適中Ⅱ,比正態(tài)分布更尖峭,為尖峰分布Ⅲ,比正態(tài)分布更平緩,為平峰分布,設(shè)一組數(shù)據(jù)分為K組,各組的組中值和組頻數(shù)分別為則峰態(tài)系數(shù)的計(jì)算公式為,424,例416,根據(jù)表46的數(shù)據(jù),計(jì)算電腦銷(xiāo)售量的峰態(tài)系數(shù)解根據(jù)424式,得,由于,說(shuō)明電腦銷(xiāo)售量的分布為平峰分布,偏態(tài)與峰態(tài)從直方圖上觀察,按銷(xiāo)售量分組臺(tái),結(jié)論1為右偏分布2峰態(tài)適中,某電腦公司銷(xiāo)售量分布的直方圖,用EXCEL計(jì)算描述統(tǒng)計(jì)量,把第3章表39電腦公司的銷(xiāo)售量的數(shù)據(jù)輸入到EXCEL工作表中,然后按下列步驟操作1選擇【工具】下拉菜單,并選擇【數(shù)據(jù)分析】命令2在【數(shù)據(jù)分析】對(duì)話(huà)框中,選擇【描述統(tǒng)計(jì)】,并單擊【確定】3當(dāng)對(duì)話(huà)框出現(xiàn)時(shí)1在【輸入?yún)^(qū)域】方框內(nèi)鍵入數(shù)據(jù)區(qū)域2在【輸出選項(xiàng)】中選擇輸出區(qū)域3選擇【匯總統(tǒng)計(jì)】4選擇【確定】計(jì)算結(jié)果列于表47,表4–7EXCEL輸出的描述統(tǒng)計(jì)量,
下載積分: 4 賞幣
上傳時(shí)間:2024-01-06
頁(yè)數(shù): 78
大?。?0.73(MB)
子文件數(shù):