2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、單選題單選題1.某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的哪類問題?(A)A.關(guān)聯(lián)規(guī)則發(fā)現(xiàn)B.聚類C.分類D.自然語言處理3.將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務(wù)?(C)A.頻繁模式挖掘B.分類和預(yù)測C.數(shù)據(jù)預(yù)處理D.數(shù)據(jù)流挖掘4.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時,可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?(B)A.分類B.聚類C.關(guān)聯(lián)分析D.隱馬爾可夫鏈6.

2、使用交互式的和可視化的技術(shù),對數(shù)據(jù)進(jìn)行探索屬于數(shù)據(jù)挖掘的哪一類任務(wù)?(A)A.探索性數(shù)據(jù)分析B.建模描述C.預(yù)測建模D.尋找模式和規(guī)則11.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?(D)A變量代換B離散化C聚集D估計遺漏值12.假設(shè)12個銷售價格記錄組已經(jīng)排序如下:5101113153550557292204215使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在第幾個箱子內(nèi)?(B)A第一個B第二個C第三個D第四個13.上題中,等寬

3、劃分時(寬度為50),15又在哪個箱子里?(A)A第一個B第二個C第三個D第四個16.只有非零值才重要的二元屬性被稱作:(C)A計數(shù)屬性B離散屬性C非對稱的二元屬性D對稱屬性17.以下哪種方法不屬于特征選擇的標(biāo)準(zhǔn)方法:(D)A嵌入B過濾C包裝D抽樣18.下面不屬于創(chuàng)建新屬性的相關(guān)方法的是:(B)A特征提取B特征修改C映射數(shù)據(jù)到新的空間D特征構(gòu)造22.假設(shè)屬性income的最大最小值分別是12000元和98000元。利用最大最小規(guī)范化的方

4、法將屬性的值映射到0至1的范圍內(nèi)。對屬性income的73600元將被轉(zhuǎn)化為:(D)A0.821B1.224C1.458D0.71623.假定用于分析的數(shù)據(jù)包含屬性age。數(shù)據(jù)元組中age的值如下(按遞增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70問題:使用按箱平均值平滑方法對上述數(shù)據(jù)進(jìn)行平滑,箱的深度為3。第二個箱子值為:(A)A1

5、8.3B22.6C26.8D27.928.數(shù)據(jù)倉庫是隨著時間變化的下面的描述不正確的是(C)A.數(shù)據(jù)倉庫隨時間的變化不斷增加新的數(shù)據(jù)內(nèi)容B.捕捉到的新數(shù)據(jù)會覆蓋原來的快照C.數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容D.數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù)這些綜合數(shù)據(jù)會隨著時間的變化不斷地進(jìn)行重新綜合.29.關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指:(D)A.基本元數(shù)據(jù)與數(shù)據(jù)源數(shù)據(jù)倉庫數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息B.基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和

6、信息C.基本元數(shù)據(jù)包括日志文件和簡歷執(zhí)行處理的時序調(diào)度信息D.基本元數(shù)據(jù)包括關(guān)于裝載和更新處理分析處理以及管理方面的信息.C.決策樹算法對于噪聲的干擾非常敏感D.尋找最佳決策樹是NP完全問題54.在基于規(guī)則分類器的中,依據(jù)規(guī)則質(zhì)量的某種度量對規(guī)則排序,保證每一個測試記錄都是由覆蓋它的“最好的”規(guī)格來分類,這種方案稱為(B)A.基于類的排序方案B.基于規(guī)則的排序方案C.基于度量的排序方案D.基于規(guī)格的排序方案。57.如果對屬性值的任一組合

7、,R中都存在一條規(guī)則加以覆蓋,則稱規(guī)則集R中的規(guī)則為(B)A無序規(guī)則B,窮舉規(guī)則C,互斥規(guī)則D,有序規(guī)則58.如果規(guī)則集中的規(guī)則按照優(yōu)先級降序排列,則稱規(guī)則集是(D)A無序規(guī)則B,窮舉規(guī)則C,互斥規(guī)則D,有序規(guī)則61.以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述錯誤的有(A)A,神經(jīng)網(wǎng)絡(luò)對訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒B,可以處理冗余特征C,訓(xùn)練ANN是一個很耗時的過程D,至少含有一個隱藏層的多層神經(jīng)網(wǎng)絡(luò)二、二、多選題多選題1.通過數(shù)據(jù)挖掘過程所推倒

8、出的關(guān)系和摘要經(jīng)常被稱為:(AB)A.模型B.模式C.模范D.模具2尋找數(shù)據(jù)集中的關(guān)系是為了尋找精確、方便并且有價值地總結(jié)了數(shù)據(jù)的某一特征的表示,這個過程包括了以下哪些步驟?(ABCD)A.決定要使用的表示的特征和結(jié)構(gòu)B.決定如何量化和比較不同表示擬合數(shù)據(jù)的好壞C.選擇一個算法過程使評分函數(shù)最優(yōu)D.決定用什么樣的數(shù)據(jù)管理原則以高效地實現(xiàn)算法。4.數(shù)據(jù)挖掘算法的組件包括:(ABCD)A.模型或模型結(jié)構(gòu)B.評分函數(shù)C.優(yōu)化和搜索方法D.數(shù)據(jù)

9、管理策略5.以下哪些學(xué)科和數(shù)據(jù)挖掘有密切聯(lián)系?(AD)A.統(tǒng)計B.計算機組成原理C.礦產(chǎn)挖掘D.人工智能6.在現(xiàn)實世界的數(shù)據(jù)中,元組在某些屬性上缺少值是常有的。描述處理該問題的各種方法有:(ABCDE)A忽略元組C使用一個全局常量填充空缺值B使用屬性的平均值填充空缺值D使用與給定元組屬同一類的所有樣本的平均值E使用最可能的值填充空缺值8.對于數(shù)據(jù)挖掘中的原始數(shù)據(jù),存在的問題有:(ABCDE)A不一致B重復(fù)C不完整D含噪聲E維度高12.下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論