數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)復(fù)習(xí)資料_第1頁
已閱讀1頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第1頁共10頁數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)復(fù)習(xí)資料一、單項選擇題單項選擇題1.數(shù)據(jù)挖掘技術(shù)包括三個主要的部分(C)A數(shù)據(jù)、模型、技術(shù)B算法、技術(shù)、領(lǐng)域知識C數(shù)據(jù)、建模能力、算法與技術(shù)D建模能力、算法與技術(shù)、領(lǐng)域知識2.關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指:(D)A.基本元數(shù)據(jù)與數(shù)據(jù)源數(shù)據(jù)倉庫數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息;B.基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息;C.基本元數(shù)據(jù)包括日志文件和簡歷執(zhí)行處理的時序調(diào)度信息;D.基本元數(shù)據(jù)包括關(guān)于

2、裝載和更新處理分析處理以及管理方面的信息。3.關(guān)于OLAP和OLTP的說法下列不正確的是:(A)AOLAP事務(wù)量大但事務(wù)內(nèi)容比較簡單且重復(fù)率高BOLAP的最終數(shù)據(jù)來源與OLTP不一樣COLTP面對的是決策人員和高層管理人員DOLTP以應(yīng)用為核心,是應(yīng)用驅(qū)動的4將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)?(C)A.頻繁模式挖掘B.分類和預(yù)測C.數(shù)據(jù)預(yù)處理D.數(shù)據(jù)流挖掘5下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?(D)A.變量

3、代換B.離散化C.聚集D.估計遺漏值6.在ID3算法中信息增益是指(D)A.信息的溢出程度B.信息的增加效益C.熵增加的程度最大D.熵減少的程度最大7.以下哪個算法是基于規(guī)則的分類器(A)A.C4.5B.KNNC.BayesD.ANN8.以下哪項關(guān)于決策樹的說法是錯誤的(C)A冗余屬性不會對決策樹的準(zhǔn)確率造成不利的影響B(tài)子樹可能在決策樹中重復(fù)多次C決策樹算法對于噪聲的干擾非常敏感D尋找最佳決策樹是NP完全問題9.假設(shè)收入屬性的最小與最大

4、分別是10000和90000,現(xiàn)在想把當(dāng)前值30000映射到區(qū)間[01]若采用最大-最小數(shù)據(jù)規(guī)范方法,計算結(jié)果是(A)第3頁共10頁A.第一個B.第二個C.第三個D.第四個21.上題中,等寬劃分時(寬度為50),15又在哪個箱子里?(A)A.第一個B.第二個C.第三個D.第四個22.熵是為消除不確定性所需要獲得的信息量,投擲均勻正六面體骰子的熵是:(B)A.1bitB.2.6bitC.3.2bitD.3.8bit23.假設(shè)屬性incom

5、e的最大最小值分別是12000元和98000元。利用最大最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對屬性income的73600元將被轉(zhuǎn)化為:(D)A.0.821B.1.224C.1.458D.0.71624.假定用于分析的數(shù)據(jù)包含屬性age。數(shù)據(jù)元組中age的值如下(按遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70問題:使用

6、按箱平均值平滑方法對上述數(shù)據(jù)進(jìn)行平滑,箱的深度為3。第二個箱子值為:(A)A.18.3B.22.6C.26.8D.27.925.給定兩個對象,分別用元組(2214210)和(200368)表示,則這兩個對象之間的曼哈坦距離為:()A.5B.11C.2.92D.2.2426.概念分層圖是(B)圖。A.無向無環(huán)B.有向無環(huán)C.有向有環(huán)D.無向有環(huán)27.假設(shè)A為事件“產(chǎn)品合格”,B為“機(jī)器工作正?!保F(xiàn)給出以下概率:機(jī)器工作正常,生產(chǎn)產(chǎn)品合格

7、的概率為P(A|B)=0.95;機(jī)器不正常工作時,生產(chǎn)產(chǎn)品合格的概率為=0.1;機(jī)器正常工作的概率,即P(B)=0.9。已知生產(chǎn)了一個)|(BAP不合格品,機(jī)器不正常工作的概率,即是()。)|(ABPA.0.90B.0.333C.0.667D.0.05二、填空題填空題1數(shù)據(jù)倉庫是面向主題的、(集成的)、(具有特性的)、穩(wěn)定的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制定過程。2OLAP的基本多維分析操作有(聚類)、切片、切塊以及(旋轉(zhuǎn))等。3.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論