2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著人類生活進入信息社會,以信息技術為核心的信息時代對教育領域產生了深刻的影響,并將成為教育改革的技術基礎與動力。數(shù)據(jù)教育挖掘也隨之成為一個新興的、備受關注的研究方向。顯而易見,教育領域的各類數(shù)據(jù)將隨著信息化的發(fā)展而極速增加,人們也因此開始思考如何從這些海量和復雜繁冗數(shù)據(jù)中獲取有用的信息,并將這些信息用以提高人類教育水平和學習效率。正是這一問題的提出使教育數(shù)據(jù)挖掘意義重大。
  本文針對如何更好地從海量數(shù)據(jù)中挖掘出對學習者有用的信

2、息,并為教育決策部門與機構提供有用的參考信息而提出基于海量數(shù)據(jù)挖掘的知識學習效果預測方法研究。該系統(tǒng)以訓練學生數(shù)學答題行為為模型,根據(jù)其以往行為表現(xiàn),預測學生將來的答題準確率,從而達到對學生學習效果的評測,并及時根據(jù)學生學習效果調整教學過程。本系統(tǒng)主要包括以下兩部分。
  (1)特征生成階段。根據(jù)學生與學校的智能輔導教學系統(tǒng)的交互日志對數(shù)據(jù)進行分析,并選擇合適特征。因為原始數(shù)據(jù)集屬性復雜,記錄間有時間先后順序且數(shù)據(jù)量大等特點,本文

3、在特征提取部分工作主要包括:使用基于時間特征的方法生成驗證數(shù)據(jù)集,對原始數(shù)據(jù)集的部分復雜結構屬性,如組合屬性進行分離處理。因為學生學習過程會隨著時間的變化而變化,為克服測試集無時間屬性轉而針對原始數(shù)據(jù)集的特點進行其他時間特征生成。此外,在本文中為了對更好地表示分類器輸入,還將對特征進行歸一化與二值化處理,并用稀疏矩陣表示。
  (2)學習效果預測階段。為了達到較好的實驗結果,本文主要嘗試使用了兩種分類器,一種是K-近鄰算法,并在兩

4、個方面改進了該算法,另一種是邏輯回歸。對K-近鄰的改進,本文將改進過程中涉及到的權值調整進行了大量的實驗,主要是為了使其在大數(shù)據(jù)集上能夠訓練出結果,并且訓練、分類的時間可以讓人接受。對于邏輯回歸,本文采用原始數(shù)據(jù)集升維方式將非線性問題轉化為線性問題,其中邏輯回歸中使用的調整參數(shù)的方法為梯度下降法。
  經實驗,在小數(shù)據(jù)集上,K-近鄰算法的訓練速度以及分類效果可以接受,但在大數(shù)據(jù)集上表現(xiàn)不佳,而邏輯回歸方法在本問題上的表現(xiàn)較好,訓練

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論