版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、本篇論文采用基于現(xiàn)代項目反應理論(IRT)的多側(cè)面Rasch 模型來研究四種評分員因素:嚴厲度/寬松度、評分不穩(wěn)定、光環(huán)效應以及集中趨勢對評分的影響。本文從湖南大學美雅學院ESL國際項目的寫作試卷中隨機抽出30份試卷并由9位評分員進行評分。評分采用的量表為Jacob的7級分項評分量表,從“內(nèi)容”、“結(jié)構(gòu)”、“語言”、“詞匯”、以及“寫作規(guī)范”五個評分維度對考生的寫作水平進行考察。所得的數(shù)據(jù)由多側(cè)面Rasch模型的FACETS軟件包進行分
2、析。多側(cè)面Rasch 模型基于現(xiàn)代項目反應理論,以考生的心理特質(zhì)為依據(jù)進行建模,運用項目反應函數(shù)預測考生在考試中的表現(xiàn),有別于經(jīng)典真分數(shù)理論框架下的對原始分進行觀測分析而得出結(jié)論的方法。研究首先用多側(cè)面Rasch模型對單個評分員的評分嚴厲度以及光環(huán)效應進行了分析,然后運用多側(cè)面Rasch模型的偏差分析來探討評分員在不同的寫作任務和不同的評分維度上的評分是否保持了穩(wěn)定性。最后通過假設(shè)各個評分員有獨立的評分量表,由此建立模型以分析評分員的集
3、中趨勢。 通過分析,本研究得出以下發(fā)現(xiàn): 1)評分員的嚴厲度水平有著顯著性的差異。其中9號評分員的嚴厲度水平是最高的,而5號評分員的嚴厲度水平是最低的。 2)所有評分員在評閱不同的寫作任務時保持了內(nèi)在的一致性,但在評閱不同的評分維度時卻表現(xiàn)出了評分不一致的情況; 3)1號和2號評分員在評分時表現(xiàn)出顯著的光環(huán)效應,即他們傾向于在5個維度上給出相似的分數(shù)。其他的7位評分員都能較好的區(qū)分5個評分維度的差異。
4、 4)4號評分員和6號評分員沒有用評分量表的全距進行評分,1號評分員、4號評分員、以及6號評分員表現(xiàn)出明顯的集中趨勢。 基于以上研究,本文的研究對如何改善和提高寫作評分中的評分員信度有著重要的意義。首先可以改善評分量表,對評分量表有歧義或者欠詳細的部分進行修改;其次,由于本模型可以考察單個評分員的表現(xiàn),因而它可以為評分員的選拔提供參考,再次,對于評分不準確的評分員,可以做進一步的培訓或者加以替換,最后,對于高風險的大規(guī)模測試
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于Rasch模型的寫作測試評分員效應研究——聚焦不同評分員背景群體的對比分析.pdf
- 運用概化理論多側(cè)面模型分析CEPT口語考試的評分員信度.pdf
- 中外評分員英語寫作評分中評分表現(xiàn)的對比研究.pdf
- 高考英語寫作評分中評分員和評分量表的關(guān)系探討.pdf
- 基于多層面Rasch模型的CET-SET評分員效應研究.pdf
- 多層面Rasch模型在自主招生面試評分中的應用.pdf
- 等級反應多水平側(cè)面模型及其在主觀題評分中的應用.pdf
- 影響英語寫作評分的因素研究——以“外研社杯”全國英語寫作大賽評分為例.pdf
- 信用評分模型中的拒絕推斷-職稱論文寫作
- 高考英語寫作評分員培訓效果的研究.pdf
- 高考英語寫作評分員偏頗性研究.pdf
- 英語寫作測試中的評分者效應:整體評分和分項評分對比研究.pdf
- 評分因素
- 多側(cè)面Rasch模式在英語寫作測試中的應用——基于大連理工大學的實證研究.pdf
- 托福寫作評分標準
- 信用評分模型及其在不良顧客預測分析中的應用.pdf
- 一般拖延量表在公務員群體中的應用——基于Rasch模型的分析.pdf
- 成績測試中的EFL寫作評分標準的研究.pdf
- 基于分部評分的多級評分認知診斷模型開發(fā).pdf
- 評分模型的評價指標
評論
0/150
提交評論