版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第二章 數據與數據的獲得,《管理統(tǒng)計學》謝湘生廣東工業(yè)大學管理學院,2.1 總體、個體、特征與數據,總體(Population or Universe)個體(Individual or Case)或成分(Elements)指標或變量(Variable)指標值(變量值)或數據(Data),2.2 數據類型 2.2.1 數據測度的分類,測度級(Scale)數據比率級(Ratio) 具有一定單位 0值非人為制定
2、 可以進行加減乘除運算間距級(interval) 具有一定單位 0值人為制定 可加減運算,不能乘除運算次序級(Ordinal)數據 用于區(qū)分對象的類別與次序名義級(Nominal)數據 用于區(qū)分對象的類別,2.2.2 不同類型數據的用途特點,不同測度級別的數據,應用范圍不同。等級越高,應用范圍越廣泛;等級越低應用范圍越受限。一般來說,等級高的數據可以兼有等級低的數據的功能;而等級低的
3、數據,不能兼有等級高的數據的功能。名義級的數據,通常是樣本分類(分組)的依據。,2.2.3 觀察數據和實驗數據,,數據,來源,,,直接來源,,,間接來源,,,試驗,,,出版物,(或者網上),,,,,,,,,,,問卷調查,,,觀察,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,間接來源(二手數據),每天翻開報紙或打開電視,就可以看到各種數據。比如高速公路通車里程、物價指數、股票
4、行情、外匯牌價、犯罪率、房價、流行病的有關數據(確診病例、疑似病例、死亡人數和出院人數等等);當然還有國家統(tǒng)計局定期發(fā)布的各種國家經濟數據、海關發(fā)布的進出口貿易數據等等。從中可以選取對自己有用的信息。這些間接得到的數據都是二手數據。,直接來源(第一手數據),獲得第一手數據并不象得到二手數據那么輕松。某些在華的外資企業(yè)每年至少要花三四千萬元來收集和分析數據。他們調查其產品目前在市場中的狀況和地位并確定其競爭對手的態(tài)勢;他們調查不同
5、地區(qū),不同階層的民眾對其產品的認知程度和購買意愿以改進產品或推出新品種爭取新顧客;他們還收集各地方的經濟交通等信息以決定如何保住現(xiàn)有市場和開發(fā)新市場。市場信息數據對企業(yè)是至關重要的。他們很舍得在這方面花錢。因為這是企業(yè)生存所必需的,絕不是可有可無的。,觀察數據:在獲得數據的過程中,不對被調查數據產生的條件施加任何控制所得到的數據。觀察數據通常是(但不一定是)眾多因素共同作用的結果。實驗數據:在獲得數據的過程中,對被調查數據產生的條
6、件實施了控制而得到的數據。實驗數據通常是(但不一定是)單一因素作用的結果。,數據產生過程,,觀察數據,數據產生過程,,,實驗數據,,,,2.3獲得數據的調查方法 與問卷設計,獲得數據的方法,,調查方法,實驗方法,,普查方法,抽樣調查方法,普查(Census):調查有限總體中每個個體的有關指標值抽樣調查(Sampling):在總體中抽取部分個體進行調查,從所了解的局部數據來了解總體情況樣本(Sample)集合:總體中部分個
7、體所組成的集合,觀察方法,與普查的方法比較,抽樣調查方法具有如下的意義,抽樣調查的成本要低得多(經濟性強)抽樣調查所用的時間要少得多(時效性高)在收集個體的信息方面,抽樣調查可以更為詳盡(深入性與廣泛性強)在收集個體的信息方面,抽樣調查可以做得更加準確(準確性高) 調查具有破壞性,,隨機抽樣(Random Sampling)或概率抽樣(Probability Sampling):按一定隨機規(guī)則(一定概率分配),從總體中抽取部分個
8、體。簡單隨機抽樣(Simple Random Sampling):在隨機抽樣的過程中,每個個體抽到的機會(概率)相等。,抽樣方法(Methods of Sampling),以廣州交通問題的調查為例,在簡單隨機抽樣的情況下,如果樣本容量(sample size,也就是樣本中個體的數目)在總體中的比例為1/5000,那么,無論在越秀區(qū)或者在從化區(qū),無論在白領階層還是外來民工被問到的人的比例都應該大體是1/5000。,非隨機抽樣或判斷性抽樣
9、(Judgment Sampling):依據對個體或總體特征的判斷,從總體中抽取個體的做法。 典型調查:指在分析總體特征的基礎上,有意識地選擇具有代表性的個體,做深入細致的調查。這里的“代表性”是主觀判斷得到的。 方便抽樣:指在難以獲得隨機樣本的情形,所采取的利用現(xiàn)有條件獲得盡可能具有代表性的個體的抽樣方式。,還以廣州的交通問題的調查為例。假定按照隨機選出的電話號碼進行調查。這樣肯定節(jié)省時間和資源,但這樣得到的就不是一
10、個隨機樣本了。如果按照隨機選擇的數字(無論號碼本上有沒有)打電話,那很多電話是空號或單位電話;顯然這種樣本也不是隨機樣本,它稱為方便樣本(convenience sample)。,常用的綜合抽樣方法,分層(分類)抽樣:按照總體中個體的某特征,把總體中的個體分為若干群(類);然后,對各個群中的個體進行簡單隨機抽樣。分層抽樣要求層之間的差異大于層的內部個體的差異。不同群體所抽取的個體個數,一般有三種方法確定等數分配法:對每一類分配同樣
11、的個體數等比分配法:讓每一類抽得的個體數與該類總體個數的比,都相等最優(yōu)分配法(方差分配法):從各類抽得的樣本數ni與所要抽得的總樣本數n之比,等于該類的方差與各類方差和之比,即,常用的綜合抽樣方法(續(xù)),整群抽樣:將總體中的各個個體,按照某一標志量分為若干群,然后以群為單位,對群進行(簡單)隨機抽樣,接著對抽出來的群進行普查。要求群與群之間具有相似性。等距抽樣:是按某一標志量,將總體中的個體排序,然后按一定的間隔,抽取個體多階段
12、抽樣:根據總體的層次結構特征,分層次(階段)進行(簡單)隨機抽樣。,在決定所抽取的群體個數時,常常需要考慮經費的限制,必須清楚抽樣的目的,抽取樣本往往是希望基于樣本得到的結論能適用于該樣本所屬的總體所以首先要求了解樣本是否確實來源于所關注的總體其次清楚樣本是否具有好的代表性.,2.3.2數據調查中的若干重要問題,作為自學材料,請課后認真學習補充獲得敏感問題誠實回答的統(tǒng)計方法(見《政治及有關模型》),對于調查中一些敏感問題,按通常的
13、方法可能難以得到得到誠實的回答。教材中介紹了若干通過適當地設立問題來獲得誠實回答的方法。作為補充這里介紹一種結合問題的設立與提問方式,利用統(tǒng)計計算來得到問題的誠實回答的方法。,例如要調查了解某班學生期末考試某門課程作弊學生的比例。顯然不能指望直接提問學生獲得誠實的回答。但可以通過如下方式得到相對真實的答案。,1 設立問題:,A 你考試作弊了嗎? B 你是廣東的考生嗎?,2 制作與抽取學生人數相等的簽,其中有記號A的比例為p,其
14、余有記號B。,3 每個抽到的學生隨機地抽取一個簽(只有本人知道抽得的是A還是B),然后按抽得的記號回答“是”或“否”。,4 若μ是回答“是”的學生的比例,則利用概率的性質應有,其中πA , πB分別是問題A,B回答“是”的比例。于是我們可以估計出該課程作弊的學生的比例為:,注:問題B應該是一個不敏感的問題,并且它的概率是已知或事先已經估計出來的。,調查方案設計,調查方案是指導整個調查過程的綱領性文件,大體包括調查目的、調查對象、調查項目
15、和調查表等內容。 1、調查目的:回答“為什么調查”; 2、調查對象:回答“向誰調查”; 3、調查項目和調查表:回答“調查什么” 4、其他內容:明確調查所采用的方法、調查時間、調查組織和實施的細節(jié),2.3.2 問卷與問卷設計,一、 問卷與問卷的組成,1 問卷與問卷設計的重要地位問卷是管理學科調查收集一手數據的最重要的工具之一。一項以一手數據為基礎的研究項目,其深度本質上由問卷的深度決定。
16、問卷設計時沒有想到的問題,在問卷調查完后再想研究,就不大可能了。,問卷設計步驟,,,,,,,,,,確定調查目的、來源與限制因素等,確定數據收集方法,評估內容與編排,確定問卷流程和編排,決定問題的用詞,確定問題形式,獲得各方面的認同,預調查與修訂,準備最后印刷,實施,,2 構成問卷的問題類型1)開放型問題與封閉型問題根據事先是否準備好了問題的答案可將問題分為:開放型問題與封閉型問題。開放型問題:沒有事先準備的答案,通常在問
17、卷形成階段使用,在最終問卷中應慎用。封閉型問題:事先準備了答案,應答者只能在事先準備的答案中選擇。封閉型問題的數據轉化工作量,大為減少。,2)回憶型問題與非回憶型問題回憶型問題要求應答者把自己的有關記憶表達出來。它可以是開放型的,沒有備選答案。也可以是封閉型的。有些回憶型問題需要查記錄可能才能回答。例如,貴公司去年的利潤有多少?但是如果將它轉化為封閉型問題:“貴公司去年的利潤屬于以下哪個區(qū)間?”(接下來列出所有可能的區(qū)間),問題的
18、回答將得到極大簡化。,3)封閉型問題中的單選問題與多選問題單選問題是指應答者只能在備選答案中選擇一個的問題。單選問題中的備選答案之間必須是互斥的。多選問題是指應答者能夠在備選答案中選擇多個答案的問題。多選問題的備選答案是相容的。,4)單選問題中的排序型和非排序型(1)排序問題 排序問題本質上是單選問題,要求對兩個以上的對象排序。例如對重要性排序:你認為在企業(yè)合并中如下三個因素,哪個最重要:企業(yè)文化的近似性,B. 企業(yè)技術的互補
19、性,C. 市場的互補性顯然要求排序的對象越多,排序的難度就越大。,(2)單選中的非排序問題。顯然,單選問題不一定是排序問題。但是排序問題可以轉化為如下的非排序的單選問題:請對企業(yè)合并中企業(yè)文化的近似性、技術的互補性、市場的互補性三個要素的重要地位打分:,依據眾多的應答者對上述問題的評分,計算出每個要素的平均分之后,就可以根據平均分值的大小,對三個要素的重要性排序。需要注意的是,這樣做的前提是各要素的平均分間存在顯著差異(顯著差異的
20、概念見第6章)。,構成問卷的問題類別一覽,3. 問卷中的一些常用量表,1)量表的概念量表是測量應答者對某個問題(特別是復合型的問題)的反應強度(或態(tài)度、看法)的工具。它是構成問卷的最主要成分之一。把單選問題的備選答案量化,就得到單問題量表。例如:你認為企業(yè)文化差異對企業(yè)合并的影響是:,這就是一個單項量表。單項在這里是指該量表僅僅反應了應答者對一個問題的態(tài)度。,2)連續(xù)評分量表上述量表的評分刻度僅從1到5,如果采用0到100的刻度
21、,則稱為連續(xù)評分量表。,3)分項評分量表:Likert量表如果量表涉及多個關聯(lián)的單選問題,就稱為分項評分量表(Itemized Rating Scale)。分項評分量表中的多個單選問題必須有關聯(lián),是某個總項(上一層的變量)的一個分解。下表給出了一個分項量表的例子。,高校合并問題的一個分項評分量表,這種分項評分量表由于由美國社會心理學家R. A. Likert于1932年提出而稱為Likert量表。Likert量表的度量級別:通常是5級
22、,但不一定是5級,在應用中7級,9級均可;但通常不低于5級,不高于9級。這與感覺辨析能力有關。,Likert量表的關鍵特點是:所有分項共同構成一個總項,分項的得分加總后,就得到總項的得分。所以Likert量表又稱為加總量表(或求和量表)。,4)比較型量表與排序量表量表又可分為比較型和非比較型。前面給出例子中的量表是非比較型量表。下面給出一個比較型量表的例子。,影響學校文化差異的主要因素的一個兩兩比較量表,請兩兩對比,如果i比j重要,則
23、在(i, j)的位置填入數字1,否則填入數字0。,這樣的比較量表也稱為兩兩比較量表或配對比較量表(Paired Comparison Scaling)。,在上述調查中,如果不明顯地列出兩兩依次對比的表格,僅僅要求對5個被比較對象對形成學校文化差異的重要性排序,就是所謂的等級順序量表(Rank-order Scaling)了。相應于上述問題的等級順序量表為:,等級順序量表的一個示例,請給出如下5個要素對形成學校文化差異的重要性順序:,進一
24、步閱讀:弗洛德 J. 福勒,Jr 《調查研究方法》重慶大學出版社 2004年 10月版,獲得數據的信度與效度的基本概念,一、測量誤差問卷是獲取數據的工具。進一步說,問卷是用來測量被研究對象的有關特征(變量)處于什么數值狀態(tài)的。無論是用問卷來測量變量值(由被研究對象自己來表述),還是由研究者來觀察變量值,都可能出現(xiàn)誤差。這就是測量誤差。,測量誤差由系統(tǒng)誤差(系統(tǒng)偏誤)和隨機誤差構成。其中系統(tǒng)誤差表現(xiàn)由測量工具的偏誤所導致;而隨機誤差則是
25、由眾多隨機因素導致的。,如果記測量到的變量值為X,變量的真值為T,系統(tǒng)偏誤為S,隨機誤差為R,則,X = T + S + R,二、測量的信度,1. 測量的信度(Reliability)的定義,測量的信度是指測量結果的穩(wěn)定性或一致性。當然這里是指對一個變量重復測量時表現(xiàn)出來的性質(一致性、穩(wěn)定性或不變性)。,在用三個要素T,S,R來表述變量X的測量值,即X=T+S+R時,只有隨機變量R會影響測量的一致性。如果R=0,多次測量一個結果都是不
26、變的,那么這個測量結果是完全可信的。反之如果第一次測量與第二次測量的結果差異大,那么你會感到測量的結果不可靠,也就是可信度低。,測量信度是對測量工具及其操作的整體質量的一種量度,是測驗性能的重要質量指標。信度高是良好測驗的必要條件,但不是充分條件。一個測驗只具有可靠性還不行,還必須具備有效性。,靶形圖說明穩(wěn)定性和準確性的關系:水平發(fā)揮不但要穩(wěn)定還要打得準,2. 重測信度(Test-retest Reliability),既然信度是測量
27、的可靠性(重復測量的穩(wěn)定性或一致性),檢查信度的一個簡單方法就是重新測量一次,看看兩次測量結果之間的關系。重測信度,就是在盡可能相同的條件下測量兩次,用兩次測量的相關程度來表示信度。其大小等于同一組應答者在兩次測量上所得分數的相關系數(相關系數見第9章)。,在測量涉及心理判斷過程(問卷調查的多數問題涉及這一過程)時,使用重測信度來檢驗測量的可靠性,有個前提,第一次測量應當對第二次測量沒有影響。所以一般要間隔20~30天再做第二次測量,計
28、算測量的重測信度才相對可靠些。當然間隔時間太長也不好,一些外在的因素也可能會影響測量結果。,間隔多久恰當呢?無固定標準,一般來說,在間隔時間內,被試的遺忘和練習的效果基本上相互抵消,即為適度的時間間隔。*適用于速度測量而不適應于難度測量的信度估計。*重測信度檢驗測量跨時間的穩(wěn)定性。*注意提高被試的積極性。,3. 復本信度(Alternate-form Reliability or Equivalent Form Reliabil
29、ity) 有些測量不適合施測兩次,這時我們可以編制兩份等值但并不相同的量表對被測對象施測(其時距盡量短,可短到兩次測驗接著進行),兩個平行測量來檢測同一批被試所得結果的一致性程度稱為復本信度,其大小等于同一批被試在兩個復本測驗上所得分數的相關系數。 所謂測量的等值(或平行)是指: & 問卷(量表)題型、題數、難度、指導語說明、施測要求等方面都相當 & 用來測量相同潛
30、在特質或屬性 & 量表問題不相同。 兩種方式:同一時間連續(xù)施測;間隔一段較短的時間后施測。,幾點說明:,在實際操作中,為了抵消順序效應,可以使半數被試先做 A本再做B本,使另一半被試先做B本再做A本;兩次測量的時距應盡可能短;由于復本在許多方面相似,所以信度系數有稍微偏高的傾向;注意被試的厭倦心理對測驗產生的影響; ※ 適用于難度測量,也適用于速度測量的信度估計。 ※ 構造兩份
31、真正的平行測驗很難!如果平行不能保證,則結論無價值。,4. 內部一致性信度(Internal Consistent Reliability or Inter-item Reliability),重測信度和復本信度在使用的方法上分別屬于跨時間和跨類型的,實際操作中存在困難,均需測量兩次,復本不易做到等值,很難用同一測驗對同一組被試重復進行測驗等,于是引入內部一致性信度來計算測驗的信度。內部一致性信度 也叫同質性信度,是指測量內
32、部所有題項間的一致性程度。題項間的一致性含有兩層意思:其一是指所有題項測的是同一種心理特質;其二是指所有題項得分之間都具有較高的正相關。 同質性信度基于的假設是:當一個測量具有較高的同質性信度時,說明測項主要測的是某一單個心理特質,由于眾多的題項測試了同一心理特質,那么實測結果就是該特質水平的反映。 估計同質性信度的方法主要有:分半信度、庫德-理查遜信度、克龍巴赫α系數、荷伊特信度。,估計內部一致性信度的方法之一
33、:折半信度(分半信度),折半信度 指的是將一個測量中的問題分成對等的兩半后,所有被試在這兩半上所得分數的一致性程度。 計算不難,把對等的兩半測驗看成是在最短時間距離內施測的兩個平行測驗。難的是,如何將測驗分成相等的兩半。 按題號的奇偶分半、按題目的 難易程度分半、按題目的內容分半等等。 實際應用中,由于題目一般依據難度大小排列,采用奇偶分半可使兩半測驗的題目在難度上基本相等,因此常被采納。
34、 如果一個測驗無法分成對等的兩半,則不宜使用分半信度。,5. 評價者信度(Inter-observer Reliability)含義:指多個評價者對某些人、事、物進行評價的一致性程度。 其基本思想是:如果測量工具本身較為規(guī)范,則(水平高,沒有偏見的)不同評價者的評價結果應該不應相差很大。當評價非常復雜時,評估評價者信度是非常重要的。評價者信度的計算 當評價者人數為兩人時,評價者信度等于兩個評價者給同一批被試對象所評分數
35、的相關系數,依據數據形式,采用不同的相關系數計算方法。當評分者人數多于兩人時,評分者信度可用肯德爾和諧系數進行估計。注意:如果各個評價者的評價寬嚴程度保持一致,則評價者的評價尺度變化不會對評價者信度產生影響。,三、測量的效度,1. 效度的概念測量的有效程度一個測驗或量表實際能測出其所要測量的特性或功能的程度任何測量都存在效度的問題效度是針對一定測量目的而言的效度是針對測量結果而言的效度只有程度上的差異評價一個測量是否
36、有效要多角度、多方面地收集證據,效度是指:一個測驗或量表實際能測出其所要測量的特性或功能的程度記為:效度的統(tǒng)計定義設 X=T+S+R有則:,2. 效度的類別,測量題目樣本對于應測內容與行為領域的代表性程度。側重于測量題目取樣的代表性,考查這些題目對所欲測量的內容和行為反應測量的有效程度,結構:心理學或社會學上的一種理論構想或特質側重于一個測量能夠量測到心理學或社會學的抽象概念或特質的程度,效標:檢驗測量效度的參照標準
37、,實際上是本測量所想量測或要預測的特性或功能測量分數與作為效標的另一獨立測量結果之間的一致性程度,內容效度( content validity)的概念內容效度:測驗內容對所要測量的特性、功能等的代表性程度。也就是說:一個測量要具備較好的內容效度必須滿足兩個條件:一是確定好內容范圍,并使測量的全部項目均在此范圍內。二是測量項目應是已界定的內容范圍的代表性樣本。換句話說,就是選出的項目能包含所測的內容范圍的主要方面,并且使各部分項目所
38、占比例適當。,內容效度的常用驗證方法邏輯分析法(定性的方法)依靠有關專家對測驗題目與應測內容范圍的吻合程度作出判斷量化分析方法將專家的判斷綜合為一個內容效度系數的統(tǒng)計方法專家在仔細審閱測驗目標的基礎上,獨立地對測驗每個題目作出判斷:該題目實際測到的內容與其欲測量的目標內容之間相關程度如何,表面效度表面效度:測量在表面上使被測對象直覺感到的有效程度。一個測量使被測對象從表面上看來,它能夠測量出它所欲測的屬性,則認為該測驗具有
39、表面效度內容效度與表面效度的關系:經?;煜?。表面效度是由非專業(yè)人士對測驗作表面上的檢查確定的,它不反映測驗實際測量的東西,只是指測驗表面上看來好像是所要測的東西;內容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對測驗作評價建立的。雖然二者都是根據測驗內容作出的主觀判斷,但判斷的標準不同。前者只考慮題目與測量目的之間的明顯的、直接的關系,后者則考慮到題目與測量目的和內容總體之間邏輯的微妙關系。如果測驗內容看起來與測量目標和要作的決定不
40、相干,就會使被試產生不配合、馬馬馬乎乎、應付了事等反應,而影響測驗的效度。相反,典型行為測驗卻要求較低的表面效度。如果被試很容易從測驗題目看出測驗的目的,就可能產生反應偏差(如掩飾等)。,結構效度(construct validity)的概念檢驗對于人的假設屬性或理論概念測量到的程度這些假設屬性或理論概念是決定人們外部行為的內隱或潛在的特性但這種特性不能予以操作性的定義,它所支配的行為也不能直接觀察到,比如:中學生數學能力的研
41、究數學能力由分析能力、綜合能力、歸納和演繹能力、運算能力、空間想象能力構成;數學能力與早期教育有關;數學能力與智力正相關。編制測驗題,進行測驗并收集測驗結果分析測驗結果,考查測試的結構效度,考查測驗結果是否支持理論構想,結構效度的建立過程① 對所欲測量的屬性根據某種理論提出假定的結構② 根據假定的結構擬定測量問題,編制量表③ 尋求測量分數與其它評定之間的關系④ 以檢驗結果為根據來驗證假設結構中的各種因素是否成立,驗
42、證的方法可以從差異性上尋求證據⑤ 將與假設結構相違背的問題題刪去,對測量進行修改之后,再重新實施第③和第④個步驟,調查問卷中的問題是調查者預先設計的,并且人為地歸結成幾個模塊,這稱為設計結構。而問卷調查的實際結果本身具有一定的潛結構,也就是說,可以通過數學方法,依據調查問卷結果,將原始問題歸納成幾個模塊,形成統(tǒng)計結構。統(tǒng)計結構與設計結構吻合的好壞就表明了調查問卷的結構效度。,例如嚴進等人在“履歷數據測評的效度分析”(心理學報,vol
43、. 42, no. 3, 423-433,2010)一文中將基本資料、高考成績、在校成績、計算機操作水平、獲得的獎勵情況、學生社團工作經歷作為履歷分析半結構化問卷的維度。利用因子分析方法,對 履歷數據中的11 個轉換后的指標(學生社團中工作內容,學生社團中職務高低,參加學生社團次數,累計學生社團時間,學生社團級別,在校成績,高考成績,計算機操作與應用,計算機技術資格,獲得獎勵次數,獲得獎勵級別), 提取出來 4 個公因子, 分別是
44、學生社團經歷、學習成績、計算機水平和獲得獎勵情況, 每一個指標變量的共性方差均在0.50以上, 四個維度對原 11 個指標的累計貢獻率達 71.09%, 解釋變異達到可以接受水平以上, 說明履歷數據量表的構思效度是良好的。,效標關聯(lián)效度( criterion-related validity)的驗證方法效標:檢驗測驗效度的外在的、客觀的標準,即效度的標準效標效度,也稱為效標關聯(lián)效度,也稱為實證效度驗證方法是指一個測量對處于
45、特定情境中的個體行為進行預測時的有效性例: 高考成績預測大學學習成績 通過能力傾向測量來預測工作成效分類:同時效度:測量分數與效標資料的取得約在同一時間內連續(xù)完成,這兩種資料的相關系數即為同時效度 目的:診斷現(xiàn)狀預測效度:測量分數取得一段時間后才獲得效標資料,計算這兩種資料間的相關系數 目的:預測某個個體將來的行為,效標關聯(lián)效度的估計方法,相關法直接計算測量分數與效標分數的相關系數積差相關、等級相關
46、、二列相關等顯著差異法根據效標測量將被測對象分為兩個極端組,檢驗這兩個組測量分數是否具有統(tǒng)計學上的差異顯著性,例如,某運動隊通過選拔錄取了一批運動員,過一段時間后,根據運動成績將他們分成合格的與不合格的兩組,然后回過頭來檢查他們的測驗分數,運用t 檢驗看兩組在測驗上的平均分數是否有顯著差異。總的說來,兩組平均分數的差異在統(tǒng)計上顯著,并不保證測驗效度就高。然而,假如測驗分數無法區(qū)分效標定義組,則測驗效度肯定很低。,四、信度與效
47、度的關系,信度是效度的必要條件。即 (1)信度低,效度不可能高。如果搜集的資料不可信,不可靠,那么它肯定不可能有效地說明所調查的指標。(2)信度高,效度未必高。(3)效度低,信度有可能很高。(4)效度高,信度必然也高。 由于信度的評估遠較效度的評估容易,因此在研究報告中評估了測量信度的要比評估了測量效度的多。嚴格地說,測量的信度與效度必須經過檢驗才能保證測量獲得信息的質量。如果測量的信度與效度不高,就應該設法改進測量工具。但這一改進
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數據清單、數據的排序與篩選
- 通過數據挖掘獲得客戶智能的應用研究.pdf
- 大數據與數據挖掘
- 【行業(yè)資料下載】從數據分析獲得滿意結果——emea保險數據分析研究
- 市場獲得、產業(yè)集聚與地區(qū)差距——基于滬蘇浙皖地區(qū)的數據.pdf
- 模擬數據與數字數據的比較
- 數據倉庫與數據挖掘中數據清洗的研究.pdf
- 基于ARM的數據監(jiān)測與數據融合.pdf
- 基于數據倉庫與數據挖掘的圖書借閱管理數據研究.pdf
- 數據倉庫與數據挖掘論文
- 數據挖掘的數據倉庫與olap技術
- 數據的力量——營銷數據分析與決策
- VTS數據交換與數據融合的研究.pdf
- 醫(yī)學信息數據庫的建立與數據挖掘
- 內存數據庫的數據同步與切換.pdf
- 數據倉庫元數據的管理與實現(xiàn).pdf
- 合同數據庫的建立與數據分析
- 數據更新與簡單的數據查詢實驗答案
- 基于社交網絡的數據過濾與數據推送.pdf
- 數據資源描述與組織的元數據方法.pdf
評論
0/150
提交評論