基于海量數(shù)據(jù)挖掘的知識(shí)學(xué)習(xí)效果預(yù)測方法研究.pdf_第1頁
已閱讀1頁,還剩55頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著人類生活進(jìn)入信息社會(huì),以信息技術(shù)為核心的信息時(shí)代對(duì)教育領(lǐng)域產(chǎn)生了深刻的影響,并將成為教育改革的技術(shù)基礎(chǔ)與動(dòng)力。數(shù)據(jù)教育挖掘也隨之成為一個(gè)新興的、備受關(guān)注的研究方向。顯而易見,教育領(lǐng)域的各類數(shù)據(jù)將隨著信息化的發(fā)展而極速增加,人們也因此開始思考如何從這些海量和復(fù)雜繁冗數(shù)據(jù)中獲取有用的信息,并將這些信息用以提高人類教育水平和學(xué)習(xí)效率。正是這一問題的提出使教育數(shù)據(jù)挖掘意義重大。
  本文針對(duì)如何更好地從海量數(shù)據(jù)中挖掘出對(duì)學(xué)習(xí)者有用的信

2、息,并為教育決策部門與機(jī)構(gòu)提供有用的參考信息而提出基于海量數(shù)據(jù)挖掘的知識(shí)學(xué)習(xí)效果預(yù)測方法研究。該系統(tǒng)以訓(xùn)練學(xué)生數(shù)學(xué)答題行為為模型,根據(jù)其以往行為表現(xiàn),預(yù)測學(xué)生將來的答題準(zhǔn)確率,從而達(dá)到對(duì)學(xué)生學(xué)習(xí)效果的評(píng)測,并及時(shí)根據(jù)學(xué)生學(xué)習(xí)效果調(diào)整教學(xué)過程。本系統(tǒng)主要包括以下兩部分。
  (1)特征生成階段。根據(jù)學(xué)生與學(xué)校的智能輔導(dǎo)教學(xué)系統(tǒng)的交互日志對(duì)數(shù)據(jù)進(jìn)行分析,并選擇合適特征。因?yàn)樵紨?shù)據(jù)集屬性復(fù)雜,記錄間有時(shí)間先后順序且數(shù)據(jù)量大等特點(diǎn),本文

3、在特征提取部分工作主要包括:使用基于時(shí)間特征的方法生成驗(yàn)證數(shù)據(jù)集,對(duì)原始數(shù)據(jù)集的部分復(fù)雜結(jié)構(gòu)屬性,如組合屬性進(jìn)行分離處理。因?yàn)閷W(xué)生學(xué)習(xí)過程會(huì)隨著時(shí)間的變化而變化,為克服測試集無時(shí)間屬性轉(zhuǎn)而針對(duì)原始數(shù)據(jù)集的特點(diǎn)進(jìn)行其他時(shí)間特征生成。此外,在本文中為了對(duì)更好地表示分類器輸入,還將對(duì)特征進(jìn)行歸一化與二值化處理,并用稀疏矩陣表示。
  (2)學(xué)習(xí)效果預(yù)測階段。為了達(dá)到較好的實(shí)驗(yàn)結(jié)果,本文主要嘗試使用了兩種分類器,一種是K-近鄰算法,并在兩

4、個(gè)方面改進(jìn)了該算法,另一種是邏輯回歸。對(duì)K-近鄰的改進(jìn),本文將改進(jìn)過程中涉及到的權(quán)值調(diào)整進(jìn)行了大量的實(shí)驗(yàn),主要是為了使其在大數(shù)據(jù)集上能夠訓(xùn)練出結(jié)果,并且訓(xùn)練、分類的時(shí)間可以讓人接受。對(duì)于邏輯回歸,本文采用原始數(shù)據(jù)集升維方式將非線性問題轉(zhuǎn)化為線性問題,其中邏輯回歸中使用的調(diào)整參數(shù)的方法為梯度下降法。
  經(jīng)實(shí)驗(yàn),在小數(shù)據(jù)集上,K-近鄰算法的訓(xùn)練速度以及分類效果可以接受,但在大數(shù)據(jù)集上表現(xiàn)不佳,而邏輯回歸方法在本問題上的表現(xiàn)較好,訓(xùn)練

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論