

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、統(tǒng)計分析軟件應(yīng)用,薛薇中國人民大學(xué)統(tǒng)計學(xué)院2015.7,第一章 SPSS 概述,SPSS概述,SPSS: Statistical Package for Social ScienceStatistical Product and Service SolutionsSPSS的發(fā)展:60年代:美國斯坦福大學(xué)三位研究生研制70年代:SPSS總部成立于芝加哥,推出SPSSX中小型機版80年代:SPSS公司(SPSS/PC+微
2、機版1~3)90年代:SPSS公司(SPSS WINDOWS版5~14),SPSS 主要特點,操作簡便。絕大多數(shù)操作是通過菜單、按鈕、對話框完成的。無需計算機編程、需記憶大量命令和參數(shù)。分析方法豐富、分析結(jié)果清晰、直觀??梢灾苯幼x取其他軟件格式的數(shù)據(jù)文件,如:dbf、xls、sas等。最新版本采用分布式分析系統(tǒng),適應(yīng)互聯(lián)網(wǎng),支持動態(tài)收集、分析數(shù)據(jù)和HTML報告與一般的辦公軟件直接兼容不方便,SPSS主要窗口:數(shù)據(jù)編輯窗口,窗
3、口標(biāo)題:data editor 功能:對SPSS的數(shù)據(jù)文件進行錄入、 修改、管理等基本操作的窗口。組成:窗口主菜單、工具欄、數(shù)據(jù)編輯區(qū)、狀態(tài)顯示區(qū)特點:SPSS運行過程中自動打開SPSS中各統(tǒng)計分析功能都是針對該窗口中的數(shù)據(jù)進行的窗口中的數(shù)據(jù)文件以.sav存于磁盤上兩個視圖:數(shù)據(jù)視圖和變量視圖,SPSS主要窗口:數(shù)據(jù)輸出窗口,窗口標(biāo)題:viewer功能:SPSS統(tǒng)計分析報表及圖形的輸出的窗口。組成:窗口主菜單、工具欄、
4、結(jié)果顯示區(qū)、狀態(tài)顯示區(qū)特點:在進行第一次分析時自動打開,也可手工打開可以手工打開若干個可相互切換的viewer窗口;狀態(tài)欄上的!表示當(dāng)前輸出窗口輸出窗口可以關(guān)閉,窗口內(nèi)容以.SPO存于磁盤上兩個視圖:目錄視圖和內(nèi)容視圖,SPSS主要窗口:數(shù)據(jù)輸出窗口,駕馭數(shù)據(jù)出輸出窗口一般操作結(jié)果文件的打開和保存加密保存窗口元素的移動和刪除標(biāo)準的拖放式操作在大綱視圖中操作最方便結(jié)果的導(dǎo)出以純文本格式導(dǎo)出、以HTML格式導(dǎo)出如
5、何在WORD中引用分析結(jié)果統(tǒng)計表格:拷貝或拷貝對象統(tǒng)計圖:拷貝對象,表格的編輯表格狀態(tài)的確定單元格內(nèi)容編輯行列轉(zhuǎn)置Autofit表格樣式的變換,SPSS基本運行方式,完全窗口菜單方式: 所有分析操作過程都是通過菜單和按鈕及對話框方式進行的.是經(jīng)常使用的一種運行方式,適用于一般分析和SPSS的初學(xué)者.,SPSS基本運行方式,程序運行方式:手工編寫SPSS命令程序一次性提交計算機運行適用于大規(guī)模的分析工作和熟練的SP
6、SS程序員.實現(xiàn)方法:(1)打開SYNTAX語句窗口并編寫和修改SPSS程序(2)點擊語句窗口中的RUN菜單項,選擇運行方式運行,利用SPSS進行數(shù)據(jù)分析的步驟,建立SPSS數(shù)據(jù)文件定義數(shù)據(jù)文件結(jié)構(gòu)錄入修改和編輯待分析數(shù)據(jù)數(shù)據(jù)的統(tǒng)計分析統(tǒng)計分析之前的預(yù)處理統(tǒng)計分析數(shù)據(jù)和分析結(jié)果的保存結(jié)果的說明和解釋,思考復(fù)習(xí),SPSS有哪兩個主要窗口?功能是什么?有哪些特點?SPSS有哪些運行方式?特點是什么?
7、,第二章 SPSS數(shù)據(jù)文件的建立和管理,一份簡單的調(diào)查問卷,單項選擇題提供幾個備選擇答案,從其中選擇一個答案變量類型:分類數(shù)據(jù)、定序數(shù)據(jù)數(shù)據(jù)類型:字符型填空題變量類型:定距數(shù)據(jù)數(shù)據(jù)類型:數(shù)值型,如何利用SPSS組織數(shù)據(jù),SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件,,,年級 性別問題1……問題n,11………. 422………2.……………………………,文件結(jié)構(gòu),數(shù)據(jù),,,,個案case,,變量名,,變量,,
8、用字符或數(shù)字表示字符型數(shù)據(jù)SPSS數(shù)據(jù)文件一般只能通過SPSS軟件打開,一份簡單的調(diào)查問卷,多項選擇題提供幾個備選擇答案,從其中選擇多個答案如:在下列品牌中您信任哪些品牌? 被診斷為高血壓要后你采取了以下哪些輔助治療手段?如:高考時報考學(xué)校(1)北京大學(xué) (2)清華大學(xué) (3)人民大學(xué) (4)北京理工大學(xué)(5)北京師范大學(xué) (6)北京外國語大學(xué)多項選擇題不能在SPSS中直接存儲,因為
9、SPSS的一個變量只能有一個取值,如何利用SPSS組織數(shù)據(jù),多項選擇題的處理方法思路:將一個問題定義成幾個變量,用這幾個變量來描述該問題的幾個可能被選擇的答案。編碼方式:多選項二分法或多重二分法(multiple dichotomize method)多選項分類法或多重分類法(multiple category method),多選項二分法 將每個答案作為一個變量,每個變量只有兩個取值(0或1)。例如:
10、,如何利用SPSS組織數(shù)據(jù),多選項分類法: 預(yù)先估計多選項問題可能被選擇的最多答案數(shù)(多項選擇最多選幾項就定義幾個變量).為每個答案建立一個變量,取值為多選項問題的可選答案編碼.例如:,如何利用SPSS組織數(shù)據(jù),頻數(shù)數(shù)據(jù):,如何利用SPSS組織數(shù)據(jù),設(shè)置三個變量:專業(yè)方向、性別、人數(shù),SPSS數(shù)據(jù)文件的結(jié)構(gòu),(一)變量名(Variable name):變量名是變量存取的唯一標(biāo)志。起名規(guī)則:不多于8個字符組成不區(qū)分
11、大小寫允許漢字作為變量名默認變量名為VARn,如:var00001,SPSS數(shù)據(jù)文件的結(jié)構(gòu),(二)變量的類型(type)和顯示寬度(width)1、數(shù)值型:標(biāo)準數(shù)值型(Numeric):默認類型 8.2如: 12345678、12345.67、-1234.56 帶逗號的數(shù)值型(Comma): 從個位開始三位一個逗號8.2如:1,234.56科學(xué)計數(shù)法(Scientific Notation):表示很大或很小的數(shù)
12、據(jù) 8.2如:1.2E+05帶美元符號(Dollar):表示貨幣格式很多,如:$12.30,SPSS數(shù)據(jù)文件的結(jié)構(gòu),2 、字符型(String): 存儲字符數(shù)據(jù) 8位如:beijing 處理時用雙引號擴起來3、日期型(Date):存儲日期數(shù)據(jù) 格式很多,如:20-AUG-19994、其他:如:圓點數(shù)值型(dot)、用戶自定義型(customer)注意:顯示寬度不影響數(shù)據(jù)的存儲,SPSS數(shù)據(jù)文件的結(jié)
13、構(gòu),(三)變量名標(biāo)簽(Variable label) :對變量名的一些解釋說明,增強分析結(jié)果的可視性??梢允÷浴#ㄋ模┳兞恐禈?biāo)簽(Value label)對變量所取值的一些解釋說明,增強分析結(jié)果的可視性。可以省略。一般用于品質(zhì)數(shù)據(jù) 如:1-男 2-女、1-高 2-中 3-低,SPSS數(shù)據(jù)文件的結(jié)構(gòu),(五)變量列格式(Column Format)對齊方式(Text Alignment)左對齊(Left):字符型默認
14、。右對齊(Right):數(shù)值型默認。居中對齊(Center)列寬度(Column Width)默認值為變量的總長度。,SPSS數(shù)據(jù)文件的結(jié)構(gòu),(六)缺失值(Missing Values)1、什么是缺失值?漏填數(shù)據(jù)明顯錯誤的數(shù)據(jù)2、對缺失值的一般處理事先指定:指定某個特定值為缺失值(用戶缺失值)其他處理方法,如:以均值、眾數(shù)替代等3、SPSS缺失值 用戶缺失值
15、 系統(tǒng)缺失值:數(shù)值型:點 (?) 字符型:空,SPSS數(shù)據(jù)文件的結(jié)構(gòu),(七)變量計量尺度(Measurement)scale: 定距數(shù)據(jù),一般為數(shù)值型數(shù)據(jù)。如:收入、人數(shù)。ordinal: 有固有順序的順序水準的數(shù)值型或字符型數(shù)據(jù)。如:職稱、年齡段nominal: 無固有順序的名義水準的數(shù)值型或字符型數(shù)據(jù)。如:性別、民族,定義SPSS數(shù)據(jù)文件結(jié)構(gòu),操作方法:利用變量視圖如何查看變量定義的
16、情況 菜單選項: Utilities -> Variables,SPSS數(shù)據(jù)的錄入與保存,錄入時應(yīng)注意:黑框確定當(dāng)前數(shù)據(jù)單元錄入帶有變量值標(biāo)簽的數(shù)據(jù):手工輸入代碼,屏幕顯示變量值標(biāo)簽凍結(jié)第一列數(shù)據(jù)保存:操作保存格式: (1)*.sav :SPSS數(shù)據(jù)文件(默認)。(2)*.dbf : dbase數(shù)據(jù)文件。(3)*.xls : Excel工作表文件。注意:有些信息會丟失,SPSS數(shù)據(jù)的編
17、輯,(一)打開數(shù)據(jù)文件菜單選項:File -> Open -> .sav(二)數(shù)據(jù)定位按個案號碼定位菜單: Data -> Go to case -> 輸入樣本號按值定位光標(biāo)定位到某列變量上 -> Edit -> Find...,SPSS數(shù)據(jù)的編輯,(三)插入和刪除一個個案插入:data->insert case刪除:選定待刪行,鼠標(biāo)右鍵找到Cut(四)插入和刪除一個變量
18、插入:光標(biāo)定位到某列變量上 -> Data -> Insert Variable (插到某列前) 或鼠標(biāo)右鍵刪除:選定列,鼠標(biāo)右鍵Cut項,SPSS數(shù)據(jù)的編輯,(五)數(shù)據(jù)移動、復(fù)制和刪除定義源數(shù)據(jù)塊鼠標(biāo)右鍵:cut copy clear確定目標(biāo)單元鼠標(biāo)右鍵:paste,數(shù)據(jù)文件的合并,目的: 將兩個SPSS數(shù)據(jù)文件合并到一個數(shù)據(jù)文件中文件合并的方式:縱向合并橫向合并,(一)縱向數(shù)據(jù)合并(1)含
19、義: 將磁盤上的一個SPSS數(shù)據(jù)文件追加到當(dāng)前data editor窗口中的數(shù)據(jù)文件中。(2)前提: 兩個SPSS數(shù)據(jù)文件應(yīng)可以合并的內(nèi)容,且最好有相同的變量名和變量類型。(3)菜單選項:data -> merge file -> add cases,數(shù)據(jù)文件的合并,數(shù)據(jù)文件的合并,(二)橫向數(shù)據(jù)合并(1)含義: 將磁盤上的一個SPSS數(shù)據(jù)文件中的若干個變量增加到當(dāng)前data editor窗口
20、的數(shù)據(jù)文件中。(2)前提:a.兩個數(shù)據(jù)文件必須有一個共同的變量名為關(guān)鍵字段---合并的依據(jù);b. 兩個數(shù)據(jù)文件應(yīng)事先按關(guān)鍵字段升序排序。,數(shù)據(jù)文件的合并,(二)橫向數(shù)據(jù)合并(3)菜單選項:data -> merge file -> add variable(4)選項說明:math cases on key variables in sorted files:以關(guān)鍵字作為合并標(biāo)志。 Both files
21、provide cases:合并后的文件的數(shù)據(jù)由兩個文件共同提供。External file is keyed table:以data editor的數(shù)據(jù)為基礎(chǔ)。Working data file is keyed table:以磁盤文件的數(shù)據(jù)為基礎(chǔ)。,與其他軟件數(shù)據(jù)共享,共享dbf和xls格式文件菜單選項: Data -> Open(1)*.dbf : dbase數(shù)據(jù)文件。字段名、字段類型自動轉(zhuǎn)成SPSS數(shù)據(jù)文件中的
22、變量名和類型。一條記錄為一個個案。(2)*.xls : Excel文件(Read variable name選項)共享數(shù)據(jù)庫文件建立ODBC數(shù)據(jù)源,第三章 SPSS數(shù)據(jù)文件的基本加工和處理,,SPSS數(shù)據(jù)文件的基本加工和處理,數(shù)據(jù)文件的整理 個案排序、個案選取數(shù)據(jù)加工 變量計算、計數(shù)數(shù)據(jù)分組 自動分組、手工分組數(shù)據(jù)文件的其他處理功能 指定加權(quán)變量,目的: 將所有個案按照用戶
23、指定的某一個或多個變量的變量值的升序或降序重新排列。菜單選項:data -> sort cases注意:(1)Ascending:升序、Descending:降序。(2)多重排序,選擇變量名的次序很關(guān)鍵。,個案排序,排序在數(shù)據(jù)分析中的作用?,個案選取,目的: 從現(xiàn)有數(shù)據(jù)中挑選出部分數(shù)據(jù)。菜單選項: data -> select cases選取個案的幾種不同方式(1)選擇符合一定條件的個案(If
24、condition is satisfied)(2)隨機選取個案(Random sample of cases)近似選取、精確選取(3)選取某一區(qū)域內(nèi)的個案(Based on time or case range)(4)使用過濾變量(use filter variable)注意:以后的操作和分析都在該個案選取的基礎(chǔ)上進行.,個案選取在數(shù)據(jù)分析中的作用?,變量計算,目的:產(chǎn)生新變量或?qū)υ兞窟M行必要的轉(zhuǎn)換處理 (如:預(yù)測
25、問題 產(chǎn)生比率數(shù)據(jù) 偏態(tài)數(shù)據(jù)的正態(tài)處理 時間序列的平穩(wěn)處理等)(1)含義: 根據(jù)用戶給出的SPSS算術(shù)表達式,對所有或部分樣本數(shù)據(jù)進行加工。(2)菜單選項: transform->compute if 按鈕(3)SPSS算術(shù)表達式(Numeric Expression): 由算術(shù)運算符(+ 、-、 *、 /、 **)、SPSS函數(shù)以及SPSS變量名組成的式子。,變量計算,算術(shù)函數(shù)統(tǒng)計函數(shù)分布
26、函數(shù)邏輯函數(shù)字符串函數(shù)缺失值函數(shù)日期時間函數(shù)其他函數(shù),(4) SPSS函數(shù),算術(shù)函數(shù)Abs():求絕對值sqrt():求平方根rnd():四舍五入后取整trunc():截取小數(shù)部分取整mod():取余Ln():自然對數(shù)Lg10():以10為底的對數(shù),(4) SPSS函數(shù),變量計算,統(tǒng)計函數(shù):mean():均值sd():標(biāo)準差sum():求總和cfvar():求變異系數(shù)max() min():求最大最小
27、值,(4) SPSS函數(shù),變量計算,分布函數(shù):normal():產(chǎn)生服從標(biāo)準正態(tài)分布的隨機數(shù)序列uniform():產(chǎn)生均勻分布的隨機數(shù)序列rv.():產(chǎn)生指定分布的隨機數(shù)序列,如:rv.t(10)cdf.():計算指定分布的累計概率值idf.():計算指定分布的臨界值,(4) SPSS函數(shù),變量計算,邏輯函數(shù):range():判斷變量值是否在指定的區(qū)間內(nèi)any():判斷變量值是否為指定的若干值字符串函數(shù):index(
28、S1,S2):判斷字符串S2在S1中首次出現(xiàn)的位置length():求字符串長度lower() upcase():字符串的大小寫轉(zhuǎn)換lpad():用指定字符補齊字符串為指定長度ltrim():壓縮字符串空格substr():取子串,(4) SPSS函數(shù),變量計算,缺失值函數(shù)missing():判斷變量是否取系統(tǒng)或用戶缺失值sysmis():判斷變量是否取系統(tǒng)缺失值其他函數(shù):Lag():便于進行差分計算,(4) SPSS
29、函數(shù),變量計算,變量轉(zhuǎn)換,(5)SPSS條件表達式:條件表達式:由SPSS關(guān)系運算符、邏輯運算符、SPSS函數(shù)以及SPSS變量名組成的式子。 關(guān)系運算符: > (大于)、 =(大于等于)、 32、sr<=700,邏輯運算符:&(AND):并且|(OR):或者~(NOT):非 如:(nl>32) and (sr700) not x
30、b=1,計數(shù),(1)含義: 對所有或部分個案,計算若干個變量中有幾個變量的值落在指定的區(qū)域內(nèi),并將結(jié)果存入新變量中。 (2)菜單選項: transform -> count -> define value,產(chǎn)生計數(shù)變量,(3)指定區(qū)域的定義Value:指定一個值system-missing:系統(tǒng)缺失值system-or user missing:系統(tǒng)或用戶缺失值range through:指定一個閉區(qū)
31、域,給出最大和最小值range: lowest through n:最小值到某個給定值range: n through highest:某個給定值到最大值,數(shù)據(jù)文件的分類匯總,(1)含義:按指定的分類變量的變量值對個案分組;計算每組個案的匯總變量的基本統(tǒng)計量; 將計算結(jié)果生成到一新文件中,即:在新文件中對應(yīng)分類變量的每一個分類值產(chǎn)生一個個案。,原始數(shù)據(jù),按性別變量匯總數(shù)據(jù),數(shù)據(jù)文件的分類匯總,(2)菜單選項: d
32、ata -> aggregate(3)說明:多重分組時,變量名的選擇順序。生成的新文件名默認為:aggr.sav??尚薷?。生成的新變量名默認為原變量名后加_1??尚薷?。可以在新文件中存貯個分組個案數(shù).,數(shù)據(jù)分組,目的:了解數(shù)據(jù)的總體分布狀況思路:指定按哪個變量分組,即:指定分組變量定義分組變量的分組區(qū)間(不重、不漏)指定一個存放分組結(jié)果的標(biāo)志變量分組方法:自動分組手工分組,數(shù)據(jù)分組,(一)自動分組單變量
33、值分組(1)含義: 分組變量值相同的個案分在同一組,同組中的標(biāo)志變量相同。標(biāo)志變量依照分組變量值的大小次序給定。(單變量分組,通常只適合于離散變量且變量值較少的情況)(2)菜單選項: transform -> automatic recode…分位值自動分組(1)含義:將定距型變量按分位數(shù)要求自動劃分成相應(yīng)類(2)菜單選項:transform->categorize variables,數(shù)據(jù)分組,(二)手工分組
34、(組距分組)(1)含義: 人工定義分組區(qū)域,對所有個案或符合一定條件的個案進行等距或非等距分組。(2)方法: 分組結(jié)果存入原變量、分組結(jié)果存入新變量,數(shù)據(jù)分組,(3)分組結(jié)果存入原變量:定義分組區(qū)域: 定義某一區(qū)間的原變量值分組后所對應(yīng)的新值是什么.未定義的原變量值保持不變。菜單選項:transform -> recode -> into same variables…說明: 可以指定對符
35、合一定條件的個案進行分組。,數(shù)據(jù)分組,(4)分組結(jié)果存入新變量:定義分組區(qū)域:定義某一區(qū)間的原變量值分組后所對應(yīng)的新值是什么.未定義的原變量值在新變量中為系統(tǒng)缺失值。菜單選項:transform -> recode -> into different variables…定義原變量分組后產(chǎn)生的相應(yīng)新變量(CHANGE鈕)可以指定對符合一定條件的個案進行分組。單值區(qū)間可以實現(xiàn)數(shù)據(jù)轉(zhuǎn)換(問卷分析中的反向題重新計分)
36、,問卷分析中的反向題重新計分舉例,性格打分(內(nèi)向、一般、外向)1、與生人交往會“自來熟” (1)從不 (2)偶爾 (3)有時 (4)經(jīng)常 2、與不熟悉的異性交往,會臉紅 (1)從不 (2)偶爾 (3)有時 (4)經(jīng)常3、 在公眾場合下你會大聲發(fā)表自己的意見 (1)從不 (2)偶爾 (3)有時 (4)經(jīng)常極為內(nèi)向:3分 較為內(nèi)向:6分 較為外向:9分 極為外向:12分,指定加權(quán)
37、變量,(1)含義: 指定某一變量為加權(quán)變量。如:平均蔬菜價格、男足打分(2)菜單選項:data -> weight case(3)說明 如果取消加權(quán)變量應(yīng)重新定義:data->weight casedo not weight cases,作業(yè),根據(jù)給定的兩個關(guān)于學(xué)生成績的SPSS數(shù)據(jù)文件做如下處理:合并兩個數(shù)據(jù)文件(數(shù)據(jù)不一定是一一對應(yīng)的)計算每個同學(xué)的總成績、平均成績、標(biāo)準差計算每個同學(xué)的
38、得優(yōu)率和得良率根據(jù)得優(yōu)率排名將各門課程的成績按優(yōu)、良、中、及格和不及格重新分組分別計算男生和女生的各科的平均成績、標(biāo)準差,并保存計算結(jié)果到SPSS數(shù)據(jù)文件。,第四章 SPSS的基本統(tǒng)計分析,,基本統(tǒng)計分析,頻數(shù)分析計算基本描述統(tǒng)計量(分布特征測度)圖形分析工具列聯(lián)分析,頻數(shù)分析,目的粗略把握變量值的分布狀況。例:研究被調(diào)查者的特征(如:性別、年齡、收入) 研究被調(diào)查者對某個問題的總體看法(如:教學(xué)方式、
39、選修課程) 研究被調(diào)查者某方面的狀態(tài)(如:購買家電的類型、居民月支出狀況)采用的方法計算頻分布表:包括計算頻數(shù)、百分比、累計百分比繪制統(tǒng)計圖形:條形圖、餅圖,頻數(shù)分析,基本操作步驟(1)菜單選項:analyze->descriptive statistics->frequencies(2)選擇幾個待分析的變量到variables框.(3)chart選項,選擇所需要的圖形,頻數(shù)分析,應(yīng)用舉例儲
40、戶的職業(yè)分析特點:定類數(shù)據(jù)頻數(shù)分布表輸出按頻數(shù)升降序輸出儲戶收入水平分析特點:定序數(shù)據(jù)除使用頻數(shù)、百分比、總數(shù)外,還可以充分使用累計百分比,頻數(shù)分析,頻數(shù)分析中的其他分析計算分位數(shù):適用于定距數(shù)據(jù)數(shù)據(jù)按升序排序后,找到若干個分位點上的變量值quartiles:計算四分位數(shù)25%(QL)、50%(中位數(shù))、75%(QU) cut points for n equal groups:n等份percentile:自定義百
41、分位點分位數(shù)的應(yīng)用 在排除極端值影響的條件下,通過計算分位數(shù)差,比較兩組樣本數(shù)據(jù)的離散程度例: ( QL=50,QU=80) 和 (QL=70,QU=75) 的比較分位數(shù)、中位數(shù)、眾數(shù)的應(yīng)用舉例不同戶口所在地的儲戶取款金額比較利用分位數(shù)(不顯示頻數(shù)分析表),計算描述統(tǒng)計量,目的精確把握變量的總體分布狀況,了解數(shù)據(jù)的集中趨勢、離散趨勢、對稱程度、陡峭程度?;痉椒ㄓ嬎慊久枋鼋y(tǒng)計量,計算描述統(tǒng)計量,描述集中趨勢的
42、統(tǒng)計量均值(mean):表示某變量所有變量值集中趨勢或平均水平的統(tǒng)計量。適用于定距數(shù)據(jù)。特點:利用了全部數(shù)據(jù),易受極端值的影響。描述離散程度的統(tǒng)計量標(biāo)準差(standard deviation--Std Dev):表示某變量的所有變量值離散程度的統(tǒng)計量。SPSS中計算的是樣本標(biāo)準差。方差(variance):標(biāo)準差的平方。SPSS中計算的是樣本方差。極差 (range):最大值(maximum)—最小值(minimum
43、),計算描述統(tǒng)計量,描述對稱程度的統(tǒng)計量 偏度(skewness):描述某變量分布形態(tài)的偏斜程度和方向的統(tǒng)計量.偏度為0表示對稱;大于0表示正偏差大(右偏),頻數(shù)最大的值比均值小,極值大于均值;小于0表示負偏差大(左偏),計算描述統(tǒng)計量,描述陡峭程度的統(tǒng)計量峰度(kurtosis):描述某變量所有變量值分布形態(tài)陡緩程度的統(tǒng)計量。峭度為0表示與標(biāo)準正態(tài)分布峭度相同。大于0表示比標(biāo)準正態(tài)分布陡,尖峰。小于0表示比標(biāo)
44、準正態(tài)分布緩;平峰。,計算描述統(tǒng)計量,其他統(tǒng)計量 標(biāo)準誤差(standard error S.E):抽樣分布中的標(biāo)準差,反映樣本誤差。 均值標(biāo)準誤差(means of S.E)中心極限定理認為:樣本均值~N(u,?2/n)反映樣本均值與總體真值間的平均離散程度樣本數(shù)越大,樣本均值的離散程度越小,對真值的估計越準確,計算描述統(tǒng)計量,基本操作步驟(1)菜單選項:analyze->descriptive st
45、atistics->descripive(2)選擇將參加計算的數(shù)值型變量名到variables框。分析比較不同戶口所在地儲戶取款情況比較集中趨勢比較離散趨勢比較偏斜程度比較陡峭程度實現(xiàn)方式:數(shù)據(jù)拆分,其他功能數(shù)據(jù)標(biāo)準化處理新變量的均值為0,標(biāo)準差為1;小于0表示在平均水平下,大于0反之.正態(tài)分布的數(shù)據(jù)標(biāo)準化后呈標(biāo)準正態(tài)分布(68.2%,95.4%,99.7%)save standardized value
46、s as variables選項將變量作標(biāo)準化后,結(jié)果存入名為“Z+原變量名”的新變量中.數(shù)據(jù)標(biāo)準化處理應(yīng)用舉例你能以較簡便的方法快速找到取款數(shù)目出眾的儲戶嗎?,計算描述統(tǒng)計量,基本統(tǒng)計分析的圖形工具,以制作條形圖為例,以制作條形圖為例第一種模式下的三種圖形:用于某變量在各分類情況的比較,基本統(tǒng)計分析的圖形工具,以制作條形圖為例第二種模式下的三種圖形:用于若干變量的統(tǒng)計量的比較,基本統(tǒng)計分析的圖形工具,箱線圖(箱線圖中以四
47、分位差的1.5倍為標(biāo)準剔除值),基本統(tǒng)計分析的圖形工具,直方圖和P-P圖,基本統(tǒng)計分析的圖形工具,交叉分組下的頻數(shù)分析,目的 了解不同變量在不同水平下的數(shù)據(jù)分布情況 例:學(xué)習(xí)成績與性別有關(guān)聯(lián)嗎?(兩變量)例:職業(yè)、性別、愛逛商店有關(guān)聯(lián)嗎?(三變量)分析的主要步驟產(chǎn)生交叉列聯(lián)表分析列聯(lián)表中變量間的關(guān)系,產(chǎn)生交叉列聯(lián)表,基本操作步驟(1)菜單選項: analyze->descriptive statistics-&
48、gt; crosstabs(2)選擇一個變量作為行變量到row框.(3)選擇一個變量作為列變量到column框.(4)可選一個或多個變量作為控制變量到layer框.控制變量的層次設(shè)置:同層為水平數(shù)加;不同層為水平數(shù)積.(5)是否顯示各分組的棒圖(display clustered bar charts ),產(chǎn)生交叉列聯(lián)表,應(yīng)用舉例戶口與收入水平有關(guān)聯(lián)嗎嗎?行變量:戶口;列變量:月收入不同戶口不同收入水平的儲戶對物價水平
49、的看法一致嗎?行變量:收入水平;列變量:物價水平;控制變量:戶口,產(chǎn)生交叉列聯(lián)表,應(yīng)用舉例,不同戶口不同收入水平的儲戶對物價水平水平的看法一致嗎?,產(chǎn)生交叉列聯(lián)表,進一步計算 cells選項:選擇在頻數(shù)分析表中輸出各種百分比.row:行百分比(Row pct);column:列百分比(Col pct);total:總百分比(Tot pct);,分析列聯(lián)表中變量間的關(guān)系,目的: 通過列聯(lián)表分析,檢驗行列
50、變量之間是否獨立。方法: 卡方檢驗:對品質(zhì)數(shù)據(jù)的相關(guān)性進行度量,分析列聯(lián)表中變量間的關(guān)系,卡方檢驗 年齡與工資收入交叉列聯(lián)表 低 中 高 青 400 00 中 0 5000
51、 老 0 0600 低 中 高 青 0 0500 中 0 6000 老 400
52、 00,分析列聯(lián)表中變量間的關(guān)系,卡方檢驗基本步驟(1)H0:行列變量之間無關(guān)聯(lián)或相互獨立(2)構(gòu)造卡方統(tǒng)計量統(tǒng)計量服從(r-1)*(c-1)個自由度的卡方分布count:觀察(實際)頻數(shù)expected count:期望頻數(shù)(期望頻數(shù)反映的是H0成立情況下的數(shù)據(jù)分布特征)Residual:剩余(觀察頻數(shù)-期望頻數(shù)),分析列聯(lián)表中變量間的關(guān)系,卡方檢驗基本步驟(3)計算卡方統(tǒng)計量的值,并得到該統(tǒng)計量值的概率P值
53、(4)決策。概率P與顯著性水平比較,小于等于則拒絕H0,否則不能拒絕實現(xiàn)步驟statistics選項cells選項,分析列聯(lián)表中變量間的關(guān)系,應(yīng)用舉例戶口對平均收入水平的分布會產(chǎn)生影響嗎?獨立性檢驗:從一個總體中隨機抽樣。按某兩個屬性變量將樣本進行分類不同行業(yè)人對的自己職業(yè)的選擇標(biāo)準是否存在差異?一致性檢驗:從兩個總體中獨立抽樣,根據(jù)一個屬性變量將樣本進行分類。
54、 制造業(yè) 服務(wù)業(yè) 物質(zhì)報酬 105 45 穩(wěn)定性 40 35,分析列聯(lián)表中變量間的關(guān)系,卡方檢驗的要求:一般要求列聯(lián)表中期望頻數(shù)小于5的格子數(shù)不超過20%,否則會夸大卡方值,容易得出拒絕結(jié)論,可以合并單元格??ǚ街禃軜颖緮?shù)的影響,分
55、析列聯(lián)表中變量間的關(guān)系,行列變量相關(guān)性的其他測度指標(biāo)phi系數(shù):適用于2×2列聯(lián)表當(dāng)行列變量獨立時: 有:當(dāng)行列變量完全相關(guān)時: 有:越接近于1,相關(guān)性越強。越接近0,相關(guān)性越弱,分析列聯(lián)表中變量間的關(guān)系,行列變量相關(guān)性的其他測度指標(biāo)列聯(lián)C系數(shù)(contingency coefficient), 通常為[0,1),取值受到行列數(shù)的
56、影響(見EXCEL)V系數(shù) [0,1]值越大表示行列變量的相關(guān)性越大,多選項分析,多選項分析的基本思路定義多選項變量集多選項頻數(shù)分析多選項交叉分組下的頻數(shù)分析,多選項分析,定義多選項變量集目的:將已分解的變量定義為一個集合,便于進行多選項分析菜單選項:analyze->multiple response->define sets從原變量中選取被分解的變量(數(shù)值型)到variables in sets框指定
57、被分解的變量是按多選項二分法(dichotomize)分解還是按多選項分類法(categories)分解的為變量集命名。系統(tǒng)自動在名字前加字符$.,多選項分析,多選項頻數(shù)分析菜單選項:analyze->multiple response->frequencies多選項交叉分析下的頻數(shù)分析菜單選項:analyze->multiple response->crosstabs,多選項分析,多選項分析實例分析居
58、民的儲蓄目的采用多選項分類法組織數(shù)據(jù)在某次市場調(diào)查中收集了北京、上海和廣州三個城市的受訪者對幾種常見飲料的喜好情況,可選的飲料有茶、牛奶、咖啡、果汁、礦泉水。(數(shù)據(jù)是從原始數(shù)據(jù)庫中抽出的一小部分資料),作以下分析:采用二分法組織數(shù)據(jù)受訪人群中最受歡迎的飲料是哪種?男、女喜愛的飲料有無差異?三個城市的人群對飲料的喜好有無差異?,作業(yè),根據(jù)第三章的關(guān)于學(xué)生成績的合并后的SPSS數(shù)據(jù)文件做以下處理:對各門課程分組后,做頻數(shù)分析,
59、繪制某兩門課程成績的直方圖繪制男女生構(gòu)成的餅圖分別計算男女生各門成績的基本描述統(tǒng)計量,并對數(shù)據(jù)的集中趨勢、離散程度和偏度加以比較(數(shù)字和圖形的對比),第五章 SPSS參數(shù)檢驗,,假設(shè)檢驗概述,假設(shè)檢驗是一種根據(jù)樣本數(shù)據(jù)來推斷總體的分布或均值、方差等總體統(tǒng)計參數(shù)的方法。根據(jù)樣本來推斷總體的原因:總體數(shù)據(jù)不可能全部收集到。如:質(zhì)量檢測問題收集到總體全部數(shù)據(jù)要耗費大量的人力和財力假設(shè)檢驗包括:參數(shù)檢驗非參數(shù)檢驗,假設(shè)檢驗的基
60、本原理,基本信念:利用小概率原理進行反證明。小概率事件在一次實驗中不可能發(fā)生。例如:對人民大學(xué)男生平均身高進行推斷H0:平均身高為173樣本平均身高為178,由于存在抽樣誤差,不能直接拒絕H0。而需要考慮:在H0成立的條件下,一次抽樣得到平均身高為178的可能性有多大。如果可能性較大,是個大概率事件(與?相比較),則不能認為H0不正確。否則,如果可能性較小,是個小概率事件,但確實發(fā)生了,則只能認為H0不正確。概率P值即為觀測結(jié)果
61、或更極端現(xiàn)象在零假設(shè)成立時出現(xiàn)的概率,假設(shè)檢驗的基本步驟,(1)根據(jù)檢驗的目標(biāo),對待推斷的總體參數(shù)或分布作一個基本假設(shè)H0(2)構(gòu)造檢驗統(tǒng)計量,且該統(tǒng)計量服從某種已知分布.(3)利用收集到的樣本數(shù)據(jù)和基本假設(shè)計算檢驗統(tǒng)計量的值,并得到相應(yīng)的相伴概率P值,即:檢驗統(tǒng)計量在某個特定的極端區(qū)域取值在H0成立時的概率.(4)如果概率P值小于用戶給定的顯著性水平a,則拒絕H0 .否則,不拒絕H0 .,SPSS中的參數(shù)檢驗方法,單樣本t檢驗
62、兩獨立樣本t檢驗兩配對樣本t檢驗,SPSS單樣本t檢驗,(一)含義: 檢驗?zāi)匙兞康目傮w均值與指定的檢驗值之間是否存在顯著差異。例如:周歲兒童的平均身高是否為75厘米(二)要求: 樣本來自的總體服從正態(tài)分布,為什么?,SPSS單樣本t檢驗,(三)基本思路:H0:u=u0,總體均值與檢驗值之間不存在顯著差異.構(gòu)造檢驗統(tǒng)計量.從樣本均值的分布出發(fā),即:~N(u0, σ2/n).于是:總體方差未知時構(gòu)造t統(tǒng)計量D=X
63、- u0t統(tǒng)計量服從n-1個自由度的t分布計算t統(tǒng)計量和對應(yīng)的相伴概率P(絕對值大于等于的雙側(cè)概率)結(jié)論:P≤α,則拒絕H0,認為總體均值與檢驗值之間有顯著差異.P> α,不能拒絕H0.,SPSS單樣本t檢驗,(四)基本操作步驟(1).菜單選項:Analyze->compare means->one-samples T test(2).指定檢驗值: 在test后的框中輸入檢驗值,SPSS單樣本t檢驗,(五
64、)option選項confidence interval:指定輸出?-?0的置信區(qū)間.默認值為95%.Missing values: 缺失值的處理(單樣本檢驗時以下選項沒有差別) exclude cases analysis by analysis:當(dāng)分析時涉及到有缺失值變量時再剔除相應(yīng)的個案exclude cases listwise:剔除所有含缺失值的個案后再分析,SPSS單樣本t檢驗,(六)應(yīng)用舉例周歲兒童的平均身高為7
65、5厘米嗎?根據(jù)以前的大量調(diào)查,已知顧客對某產(chǎn)品的滿意度評分在72分左右,現(xiàn)該產(chǎn)品進行了重新包裝,收集了一批顧客的滿意度評分,現(xiàn)在的評價是否顯著高于以前?,SPSS兩獨立樣本t檢驗,(一)含義: 根據(jù)兩獨立樣本的數(shù)據(jù),對兩總體均值是否有顯著差異進行推斷。例如:男生和女生的計算機平均成績有顯著差異嗎?(二)要求:兩樣本必須相互獨立,即:抽取其中一批樣本對抽取另一批樣本沒有任何影響.(如:北京周歲兒童與上海兒童的平均身高)兩總
66、體服從正態(tài)分布,為什么?,SPSS兩獨立樣本t檢驗,(三)基本思路:H0:u1-u2=0,兩總體均值無顯著差異.構(gòu)造檢驗統(tǒng)計量.從兩樣本均值差的分布出發(fā),即:~N(u1-u2, σ2x1-x2).于是兩總體均方差未知時構(gòu)造t統(tǒng)計量:兩總體均值差的抽樣分布標(biāo)準差:方差相等:用合并方差方差不等:計算t統(tǒng)計量和對應(yīng)的相伴概率P (絕對值大于等于該值的雙側(cè)概率),SPSS兩獨立樣本t檢驗,(三)基本思路:結(jié)論:方
67、差齊性F檢驗利用Levene F檢驗確定兩總體方差是否齊性.H0:兩總體方差無顯著差異.該檢驗首先計算每個個案與所屬組均值之差并取絕對值.然后對其進行單因素方差分析.,SPSS兩獨立樣本t檢驗,(三)基本思路:結(jié)論:首先,如果F檢驗的P≤α,則拒絕F檢驗的H0,認為方差不齊性;其次看Unequal行的t檢驗概率.如果≤α,則拒絕t檢驗的H0,認為兩總體均值有顯著差異;如果>α,則不拒絕t檢驗的H0. 首先,如果F檢驗的P
68、 >α,則不能拒絕F檢驗的H0,認為方差齊性;其次看equal行的t檢驗概率.其余同上,SPSS兩獨立樣本t檢驗,(四)基本操作步驟(1).菜單選項:analyze->compare means->independent-samples T(2).選擇若干變量作為檢驗變量到test variables框(3).選擇代表不同總體的變量作為分組變量到grouping variable 框(4).定義分組變量的分組情
69、況Define Groups...:use specified values:定義分組變量的分組標(biāo)志值分別是什么cut point:分組變量為連續(xù)變量.輸入一個數(shù)字,將大于等于該值的分成一組,小于該值的分成另一組.,SPSS兩獨立樣本t檢驗,應(yīng)用舉例上海周歲兒童的平均身高與北京周歲兒童的平均身高有顯著差異嗎?某商場為某種產(chǎn)品進行了促銷活動,請比較前后數(shù)日的銷售額,以確認促銷活動對銷量有無作用。A、B兩種減肥產(chǎn)品的作用有明顯差異
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- spss統(tǒng)計分析軟件
- spss統(tǒng)計分析軟件簡介
- 統(tǒng)計分析軟件spss實驗報告
- 統(tǒng)計分析與spss應(yīng)用論文
- 統(tǒng)計分析與spss應(yīng)用論文
- 統(tǒng)計分析與spss的應(yīng)用
- spss統(tǒng)計分析案例
- spss實用統(tǒng)計分析
- 統(tǒng)計分析軟件spss試題庫學(xué)生版
- 《統(tǒng)計分析與spss的應(yīng)用》實驗教學(xué)大綱
- spss統(tǒng)計分析考查課試題
- spss統(tǒng)計分析基礎(chǔ)教程
- 附錄五spss在統(tǒng)計分析中的應(yīng)用
- 附錄五spss在統(tǒng)計分析中的應(yīng)用
- 附錄五spss在統(tǒng)計分析中的應(yīng)用
- 論文用到的統(tǒng)計分析spss操作
- 薛薇-《spss統(tǒng)計分析方法及應(yīng)用》第八章--相關(guān)分析和線性回歸分析
- 統(tǒng)計分析軟件sas應(yīng)用課程學(xué)習(xí)
- 統(tǒng)計分析軟件應(yīng)用題庫
- 醫(yī)藥統(tǒng)計分析與軟件應(yīng)用教學(xué)大綱
評論
0/150
提交評論