等級反應(yīng)多水平側(cè)面模型及其在主觀題評分中的應(yīng)用.pdf_第1頁
已閱讀1頁,還剩108頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、隨著我國教育事業(yè)的發(fā)展,國家對“素質(zhì)教育”的重視程度日益增加,主觀題在教育考試中的使用率也不斷增加,因為其可以很好地考察學(xué)生的分析、綜合、歸納以及問題解決等能力。然而,在對主觀題進(jìn)行分?jǐn)?shù)的評定時,由于沒有標(biāo)準(zhǔn)答案,故需要額外的評分人員對其進(jìn)行評分,而在評分過程中,受各種因素的影響,評分者容易出現(xiàn)評分者效應(yīng)(rater effects),最終影響評分結(jié)果的準(zhǔn)確性,不利于測驗的發(fā)展?;诖?,研究者提出并發(fā)展了一系列的評分者效應(yīng)的檢測方法,如

2、概化理論(Generalizability Theory, GT)、多面Rasch模型(Many-Facets RaschMoel,MFRM),以及多水平隨機(jī)系數(shù)模型(Multilevel random coefficient model,MRCM)等。然而,這些方法依然還存在一些局限性,無法處理評分過程中遇到的所有問題。
  本研究擬將項目反應(yīng)模型、多水平模型和評分者模型三者相結(jié)全,提出并探討一種既可以處理繼時性的加工任務(wù),又可

3、以考察評分者影響因素,同時還可以準(zhǔn)確地檢測出各種評分者效應(yīng)的評分者模型,該模型被命名為等級反應(yīng)多水平側(cè)面模型(Grade Response Multilevel Facets Model,GR-MLFM)。該模型屬于非線性混合效應(yīng)模型范疇,包含了三個主要部分:隨機(jī)成分(the random component)、鏈接函數(shù)(the link function)以及非線性成分(the nonlinear component)。為驗證模型的合

4、理性,本研究在MCMC方法基礎(chǔ)上通過兩個模擬研究和一個實證研究對其進(jìn)行論證。
  模擬研究一主要論證的是等級反應(yīng)多水平側(cè)面模型(GR-MLFM)在不包含任何預(yù)測變量(即零模型)的情況下模型的返真性。50次重復(fù)試驗的結(jié)果表明,GR-MLFM的參數(shù)估計值與真值之間的差異非常小,其在偏差值(Bias)、絕對百分比偏差(percentage bias,PB)和誤差均方根(RMSE)等3個指標(biāo)上的值均很小,說明模型的擬合情況較為理想。與此同

5、時,研究還比較了GR-MLFM和Wang和Liu(2007)等提出的廣義多水平側(cè)面模型(G-MLFM)對數(shù)據(jù)的擬合情況,結(jié)果發(fā)現(xiàn)G-MLFM所得到的大部分參數(shù)估計值與真值有較大差異,并且其估計結(jié)果在4個指標(biāo)上的值相對較大,可見,G-MLFM的估計結(jié)果較差,說明G-MLFM并不適用于繼時性加工任務(wù)情境下的評分者效應(yīng)分析,而GR-MLFM則比較適合于該任務(wù)情境,該結(jié)果論證了Tutz(1990)和Andrich(1995)兩位學(xué)者的觀點。

6、r>  模擬研究二論證了GR-MLFM在包含被試和評分者預(yù)測變量(即完整模型)的條件下,模型的擬合情況。實驗結(jié)果表明,除了評分者3的固定效應(yīng)值(γ30)與真值間的差異在.1以上外,其它的參數(shù)估計值與真值間的差異均在.1以內(nèi);同時,模型的各估計值在3個指標(biāo)上的值也相對較小,除γ30外,其PB值為10.101%,達(dá)到了‘顯著性偏差’的標(biāo)準(zhǔn)(PB≥10%)。可見,模型可以較準(zhǔn)確且穩(wěn)定地擬合數(shù)據(jù),具有較好的適用性。
  研究三為實證研究,

7、其目的在于進(jìn)一步驗證模型的實際評分任務(wù)中的功效。研究通過4個主觀題考察學(xué)生的數(shù)學(xué)問題解決能力。研究還將學(xué)生的性別和評分者的責(zé)任心、情緒穩(wěn)定性、自信心、以及評分經(jīng)驗等4個變量納入到模型中,以考察評分任務(wù)中的評分者效應(yīng)。結(jié)果發(fā)現(xiàn),所有20位評分員中,只有一個評分員存在顯著的寬松效應(yīng),其他評分員的寬嚴(yán)度效應(yīng)不顯著。此外,學(xué)生的性別對學(xué)生的數(shù)學(xué)問題解決能力沒有預(yù)測作用,且不同性別學(xué)生的數(shù)學(xué)問題解決能力沒有差異。而評分者的2個預(yù)測變量則對其評分結(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論