版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、<p> 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)嶒?yàn)報(bào)告</p><p> ( 2014 -- 2015 年度第一學(xué)期)</p><p> 名 稱: 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程設(shè)計(jì) </p><p> 題 目: 圖書館數(shù)據(jù)倉庫系統(tǒng)分析與設(shè)計(jì) </p><p> 院 系: 經(jīng)濟(jì)管理系 <
2、;/p><p><b> 目錄</b></p><p><b> 1.項(xiàng)目背景3</b></p><p> 2.系統(tǒng)功能概述3</p><p><b> 目標(biāo)分析3</b></p><p><b> 系統(tǒng)配置4</b>
3、</p><p><b> 硬件配置4</b></p><p><b> 系統(tǒng)開發(fā)平臺4</b></p><p> 3.?dāng)?shù)據(jù)倉庫的方案設(shè)計(jì)4</p><p><b> 主題4</b></p><p><b> 概念模型4&l
4、t;/b></p><p><b> 邏輯模型7</b></p><p><b> 物理模型8</b></p><p><b> 元數(shù)據(jù)模型9</b></p><p> 4.系統(tǒng)分析與設(shè)計(jì)13</p><p><b>
5、1)模塊劃分13</b></p><p> 2) 數(shù)據(jù)庫設(shè)計(jì)16</p><p> 5.?dāng)?shù)據(jù)挖掘設(shè)計(jì)17</p><p><b> 6.報(bào)表設(shè)計(jì)18</b></p><p> 7.課程設(shè)計(jì)心得體會20</p><p><b> 1.項(xiàng)目背景</b&g
6、t;</p><p> 我國是一個(gè)擁有五千年歷史的國家來說,自古就是一個(gè)禮儀之邦,文化之邦,書籍的種類和數(shù)量更是多如繁星,所以,歷史上有許多的關(guān)于書籍多的記載和比喻,如“汗牛充棟”。恩格斯曾經(jīng)說過“書是人類進(jìn)步的階梯”,隨著人們生活水平的逐步提高,人們已經(jīng)不再滿足于物質(zhì)生活的享受,而更多的滿足于精神文化生活的享受。但是就我國的現(xiàn)狀來說,同發(fā)達(dá)國家的圖書館相比,我國圖書館的管理存在著很大的問題。圖書館中往往有著許
7、多的資源不能很好的利用,對于我國一個(gè)發(fā)展中的國家來說,這是資源的重大浪費(fèi)!而且在圖書館中人們往往找不到自己需要的資源或是資源被他人所占用。所以,圖書館應(yīng)該建立自己的數(shù)據(jù)倉庫,并且對其進(jìn)行必要的數(shù)據(jù)挖掘,更好的在有中國特色的社會主義中發(fā)揮更好的作用,更好的服務(wù)人民!</p><p><b> 2.系統(tǒng)功能概述</b></p><p><b> 目標(biāo)分析&l
8、t;/b></p><p> 對于圖書館的讀者信息管理(包括讀者ID,姓名,性別,專業(yè)ID,證件號碼,累計(jì)借閱情況和備注);書籍信息管理(包括書籍的編號,名稱,分類,存放的位置,作者,出版社,數(shù)量,破損程度,價(jià)格,出版時(shí)間 );圖書的借閱信息管理(包括圖書編號,借閱姓名,圖書名稱,借書日期,還書日期 ,備注 ,是否歸還)等信息的管理。提高經(jīng)營管理的最重要的保證就是信息技術(shù)。圖書館要想在經(jīng)濟(jì)的效益取得豐厚的
9、回報(bào),就必須對書籍的的情況,讀者的借閱情況有一個(gè)深入的分析和了解,建立一個(gè)統(tǒng)一的數(shù)據(jù)庫,實(shí)施有效地監(jiān)控,對讀者的愛好和需要的數(shù)據(jù)進(jìn)行分析,進(jìn)行必要的挖掘。最后提高讀者的滿意度!</p><p> 所以,據(jù)該圖書館的具體情況,研制開發(fā)了"圖書館管理系統(tǒng)",系統(tǒng)的主要功能設(shè)計(jì)有:</p><p> (1)讀者的信息管理程序設(shè)計(jì):讀者ID,姓名,性別,專業(yè)ID,證件號碼,
10、累計(jì)借閱情況和備注等信息的錄入,修改,刪除,查詢。</p><p> (2) 圖書信息程序設(shè)計(jì):圖書的編號,名稱,分類,作者,出版社,存放的位置,數(shù)量,破損程度,價(jià)格,出版時(shí)間等信息的錄入,修改,刪除,查詢。</p><p> (3) 圖書的借閱信息管理設(shè)計(jì):</p><p> 1)借還書管理:主要負(fù)責(zé)日常的借書登記、還書登記,和逾期未還圖書的催還工作。<
11、;/p><p> 2)檢索查詢:按照各種組合條件對圖書借閱情況查詢,也可以進(jìn)行模糊查詢。</p><p> 3)借書統(tǒng)計(jì):統(tǒng)計(jì)各類書借閱情況,借閱次數(shù);統(tǒng)計(jì)個(gè)人借書情況,打印日常報(bào)表。</p><p> 4)定期整理圖書借閱信息:將還書情況總結(jié)整理后徹底刪除。</p><p> 此外,圖書管理人員還要定期做整理圖書資料的全部圖書清單、分類
12、印圖書清單、借閱清單以及整理填寫各種報(bào)表等工作。</p><p><b> 系統(tǒng)配置</b></p><p><b> 硬件配置</b></p><p><b> PC一臺。</b></p><p><b> 系統(tǒng)開發(fā)平臺</b></p>
13、;<p> 操作系統(tǒng):Microsoft Windows Server 2003 Enterprise Edition</p><p> 工具軟件:Microsoft SQL Server 2005 </p><p> Microsoft Visual Studio 2005 </p><p> Microsoft Office 2003 Ex
14、cel Access</p><p> 3.?dāng)?shù)據(jù)倉庫的方案設(shè)計(jì)</p><p><b> 主題</b></p><p> 主題是一個(gè)抽象的概念,是在高層次上將企業(yè)信息系統(tǒng)中的數(shù)據(jù)綜合、歸類后進(jìn)行分析利用的抽象,《圖書館管理系統(tǒng)》的主題選取有如下五個(gè)方面:讀者信息、圖書信息、存放區(qū)域,分類信息和專業(yè)表,從這些主題方面來分析《圖書館管理系統(tǒng)》
15、。</p><p><b> 概念模型: </b></p><p> 確定在數(shù)據(jù)倉庫中,怎樣的粒度數(shù)據(jù)才能滿足管理人員對數(shù)據(jù)倉庫圖書館經(jīng)營管理策劃分析的需要。</p><p> 圖書館經(jīng)營管理主題中,數(shù)據(jù)源來自圖書館登記記錄的計(jì)算機(jī)上的每個(gè)讀者的數(shù)據(jù)。分析旅館圖書館領(lǐng)導(dǎo)管理人員通過哪些角度,即需要通過哪些維度來考察、選擇經(jīng)營方案。一般情況
16、下,在確定圖書館經(jīng)營策劃時(shí),圖書館管理人員需要通過分類信息、讀者信息、存放區(qū)域、圖書信息和專業(yè)表五個(gè)維度對圖書的借閱情況方案進(jìn)行分析,通過業(yè)績,使管理人員更了解圖書借閱方案的可用性和效果。</p><p><b> 1. 讀者信息維</b></p><p> 圖書館的讀者信息維度可以包含讀者ID、姓名、性別、專業(yè)ID、證件號碼、累計(jì)借閱次數(shù)及備注等內(nèi)容。在讀者信息
17、維中的累計(jì)借閱次數(shù)情況是由圖書的編號以及旅客的專業(yè)ID共同實(shí)現(xiàn)的要將二者加入到圖書借閱情況中。在數(shù)據(jù)倉庫的應(yīng)用中有時(shí)需要對讀者的專業(yè)不同來分類,進(jìn)行圖書類型的選擇,分析哪個(gè)專業(yè)的學(xué)生選擇哪類圖書的頻率高,對其相應(yīng)的選擇圖書的存放的區(qū)域。</p><p><b> 2.存放區(qū)域維</b></p><p> 通過設(shè)置圖書存放區(qū)域的類別:A區(qū)、B區(qū)、C區(qū)、D區(qū)和E區(qū),這
18、五個(gè)區(qū)域按照書柜距離圖書館入口的距離劃分,A區(qū)距離圖入口最近,比較便于進(jìn)入圖書館的讀者瀏覽,因此增大了圖書被借走的幾率,。根據(jù)圖書的受歡迎程度的不同,有利于讀者們的更加方便自由的選擇,同時(shí)也為圖書館盈利帶來了極大的好處。存放區(qū)域維設(shè)置有:區(qū)域ID、區(qū)域名、備注,這些字段的設(shè)置都為圖書館的管理帶來了極大的方便。</p><p><b> 3.圖書信息維</b></p><
19、p> 圖書館的圖書信息維包括:圖書的編號、名稱、分類、存放的位置、出版社、作者、數(shù)量、破損程度、價(jià)格、出版時(shí)間等數(shù)據(jù)的信息。圖書館管理人員通過對圖書的時(shí)時(shí)狀態(tài)的變化,預(yù)測讀者的行為,并對未來的發(fā)展做出預(yù)測,同時(shí)也可以改變圖書館藏書的布局,比如圖書數(shù)量,圖書的擺放位置等,以適應(yīng)讀者不斷變化的需要。</p><p><b> 4. 分類信息維</b></p><p&
20、gt; 分類信息維中存儲分類代碼和分類信息。</p><p> 分類信息的內(nèi)容由管理員設(shè)定,該圖書館中包含15類圖書,各類圖書擺放在特定的區(qū)域,分類相當(dāng)于一種那個(gè)索引,將同一類別的書籍聚集到一起并放在相同位置。分類信息直接引導(dǎo)讀者尋找書籍的位置,對讀者借書有很大的影響,一個(gè)詳細(xì)準(zhǔn)確的圖書分類是每一個(gè)圖書館所必須的。</p><p><b> 5.專業(yè)維</b>&
21、lt;/p><p> 專業(yè)維中存放著所有的專業(yè)名稱和信息,是所有讀者的所屬類別,與讀者信息維相關(guān)聯(lián)。專業(yè)維作為分析圖書受歡迎度的條件之一,對分析圖書的受歡迎度</p><p><b> 邏輯模型: </b></p><p> 圖書館數(shù)據(jù)倉庫的邏輯模型的研究是對概念模型的進(jìn)一步細(xì)化,是將概念模型過渡到人腦的一種抽象。圖書館管理的需求主要針對圖書
22、的管理和讀者選擇的圖書進(jìn)行預(yù)測,依據(jù)這兩方面內(nèi)容來幫助圖書館高層管理者有依據(jù)的預(yù)測圖書館未來的書籍構(gòu)造,同時(shí)也方便大多數(shù)讀者的查找需要。 </p><p> 讀者在進(jìn)入圖書館后,首先要尋找自己想要的書籍,此時(shí)就需要根據(jù)借助館內(nèi)各個(gè)位置所標(biāo)識的圖書分類來確定圖書位置,在找到圖書所在的分類后就能確定圖書位置,然后瀏覽書名,出版社及作者,破損程度,價(jià)格,頁數(shù)版次等信息后,確定次數(shù)是否對自己有價(jià)值,若需要這本書,就去圖
23、書館管理員處辦理借書手續(xù),將借書信息如書名、借書人、借書時(shí)間等登記在數(shù)據(jù)庫中。</p><p><b> 物理模型: </b></p><p> 在數(shù)據(jù)倉庫的物理設(shè)計(jì)中,主要解決數(shù)據(jù)的存儲結(jié)構(gòu)、數(shù)據(jù)的索引策略、數(shù)據(jù)的存儲策略、存儲分配優(yōu)化等問題。物理設(shè)計(jì)的主要目的有兩個(gè),一是提高性能,二是更好地管理存儲的數(shù)據(jù)。訪問的頻率、數(shù)據(jù)容量、選擇的RDBMS支持的特性和存儲
24、介質(zhì)的配置都會影響物理設(shè)計(jì)的最終結(jié)果。</p><p> ?。?)確定數(shù)據(jù)的存儲結(jié)構(gòu) </p><p> 并行存儲結(jié)構(gòu)——RAID(Redundant Array of Inexpensive Disk,廉價(jià)冗余磁盤陣列)。 </p><p><b> ·RAID</b></p><p><b>
25、 ·RAID1級。</b></p><p><b> ·RAID2級。</b></p><p><b> ·RAID3級。</b></p><p><b> ·RAID4級。</b></p><p><b>
26、 ·RAID5級。</b></p><p><b> (2)位圖索引 </b></p><p> (3)數(shù)據(jù)倉庫物理模型的優(yōu)化問題</p><p> 1).合并表:幾個(gè)表的記錄分散存放在幾個(gè)物理塊中時(shí),多個(gè)表的存取和連接操作的代價(jià)會很大。 </p><p> 2).建立數(shù)據(jù)序列:按照某一固
27、定的順序訪問并處理一組數(shù)據(jù)記錄。將數(shù)據(jù)按照處理順序存放到連續(xù)的物理塊中,形成數(shù)據(jù)序列。 </p><p> 3).引入冗余:一些表的某些屬性可能在許多地方都要用到,將這些屬性復(fù)制到多個(gè)主題中,可以減少處理時(shí)存取表的個(gè)數(shù)。 </p><p> 4).表的物理分割:每個(gè)主題中的各個(gè)屬性存取頻率是不同的。將一張表按各屬性被存取的頻率分成兩個(gè)或多個(gè)表,將具有相似訪問頻率的數(shù)據(jù)組織在一起。 &l
28、t;/p><p> 5).生成派出數(shù)據(jù):在原始數(shù)據(jù)的基礎(chǔ)上進(jìn)行總結(jié)或計(jì)算,生成派出數(shù)據(jù),可以在應(yīng)用中直接使用這些派出數(shù)據(jù),減少I/O次數(shù),免去計(jì)算或匯總步驟,在更高級別上建立了公用數(shù)據(jù)源,避免了不同用戶重復(fù)計(jì)算可能產(chǎn)生的偏差。 </p><p><b> 元數(shù)據(jù)模型:</b></p><p> 元數(shù)據(jù)分為兩種一種是靜態(tài)元數(shù)據(jù),另一種是動態(tài)元數(shù)
29、據(jù)。</p><p><b> 1.靜態(tài)元數(shù)據(jù):</b></p><p> 1.1圖書信息:圖書編號,圖書名稱,出版社,作者,出版時(shí)間,頁數(shù),價(jià)格。</p><p> 1.2圖書分類:分類編號,分類名稱</p><p> 1.3圖書存放區(qū)域:區(qū)域編號,區(qū)域名稱</p><p><b&
30、gt; 2.動態(tài)元數(shù)據(jù):</b></p><p> 2.1圖書借出次數(shù):圖書的借出次數(shù),體現(xiàn)受歡迎程度。</p><p> 2.2 圖書存放區(qū)域:圖書的存放位置,可以按照決策改變。</p><p> ?。?)圖書管理元數(shù)據(jù)</p><p> ?。?)圖書管理事實(shí)元數(shù)據(jù)</p><p> (3)數(shù)據(jù)成
31、員元數(shù)據(jù)</p><p><b> 4.系統(tǒng)分析與設(shè)計(jì)</b></p><p><b> 1)模塊劃分: </b></p><p> 《圖書館管理系統(tǒng)》共分為三個(gè)主要模塊:讀者信息管理,圖書信息管理,圖書借閱信息管理,每個(gè)模塊的具體內(nèi)容如下:</p><p><b> 讀者信息管理
32、 </b></p><p> 圖書館信息管理系統(tǒng)中,讀者是圖書館的核心,一個(gè)圖書館的設(shè)置要合理,這樣才能夠滿足讀者們的需求。同時(shí),也要根據(jù)讀者的需求和圖書的借閱程度以及圖書館的圖書的借閱的程度來制定圖書館館的圖書的存放的位置。由于不同的專業(yè)的學(xué)生,以及學(xué)生對圖書的喜愛的不同,則可以分析挖掘出圖書的受歡迎的程度不同,作為圖書館的管理人員,要充分認(rèn)識到這一點(diǎn),根據(jù)讀者們對圖書歡迎程度不同而制定出存放的
33、位置,這樣才能增加讀者的滿意度,提高圖書館的管理效率。因此,對圖書館讀者信息的良好管理,則有利于圖書館整體的經(jīng)營水平的提高,也同時(shí)為圖書館館帶來了巨大的經(jīng)濟(jì)利潤。具體設(shè)計(jì)步驟如下:</p><p><b> 1) 讀者信息登記</b></p><p> 用于讀者自身信息(包括讀者ID,姓名,性別,專業(yè)ID,證件號碼,累計(jì)借閱情況和備注)及借閱登記工作。</p
34、><p><b> 2) 讀者信息注銷</b></p><p> 用于讀者注銷圖書卡及會員身份。</p><p><b> 3) 讀者信息結(jié)算</b></p><p> 用于管理人員的結(jié)算工作, 記錄讀者的還書情況。若有欠書, 則打印欠書單及開出必要的罰金。</p><p&g
35、t;<b> 4) 查詢讀者</b></p><p> 可按讀者編號或讀者名稱查詢讀者的詳細(xì)資料, 也可查詢指定時(shí)間段的所有讀者的借閱圖書信息。</p><p><b> 圖書信息管理 </b></p><p> 圖書信息管理工作包括:圖書入庫、圖書的存放地點(diǎn)、圖書的自身信息、圖書出庫貫穿了一本圖書從進(jìn)入圖書館館到
36、離開圖書館館的全部過程。這使各個(gè)模塊既相互關(guān)聯(lián), 又相互獨(dú)立。在每一個(gè)模塊中, 又有不同的操作, 下面則分別詳細(xì)敘述。</p><p><b> 1.圖書入庫</b></p><p> 一個(gè)圖書館要想有一個(gè)好的經(jīng)營模式, 那么,它必須有不斷的大量的新的圖書。為了不使圖書館蒙受損失,新的圖書入庫前都要做一個(gè)詳細(xì)的記錄, 確定每本圖書的編號,如何有更好的效益,就需要進(jìn)
37、行深入的分析和數(shù)據(jù)挖掘,這樣可以選擇讀者需要的圖書的名稱和數(shù)量,為圖書館節(jié)省大量的資金,提高圖書館的效率。</p><p><b> 2.圖書的存放地點(diǎn)</b></p><p> 將圖書館的書籍劃分為幾個(gè)區(qū)域,對不同的區(qū)域放置不同類的書籍。把經(jīng)常被讀者借閱的圖書放在更方便的地方,可以方便讀者,進(jìn)而提高讀者的滿意度。對每一類的圖書都必須擺放在統(tǒng)一的地方,對圖書進(jìn)行必
38、要的管理。這樣可以對圖書館的圖書有一個(gè)全面的了解。</p><p><b> 3.圖書的自身信息</b></p><p> 在圖書的入庫時(shí), 需要對圖書的自身信息進(jìn)行全面細(xì)致的記錄。圖書的自身信息的記錄包括圖書的編號,名稱,分類,作者,出版社,存放的位置,數(shù)量,破損程度,價(jià)格,出版時(shí)間等信息進(jìn)行記錄,錄入系統(tǒng)的數(shù)據(jù)庫。</p><p>&l
39、t;b> 4.圖書出庫</b></p><p> 圖書的出庫信息可以說是圖書館的最重要的記錄的信息,為了維護(hù)圖書館的利益,并且使圖書館獲得最大的利益,對圖書的出庫信息信息的記錄,可以說是對圖書館的計(jì)劃及經(jīng)營至關(guān)重要,它對于以后的數(shù)據(jù)挖掘及分析有著很大的作用,可以說是影響著圖書館的未來!</p><p><b> 圖書的借閱信息管理</b><
40、;/p><p> 1)借還書管理:主要負(fù)責(zé)日常的借書登記、還書登記,和逾期未還圖書的催還工作。</p><p> 2)檢索查詢:按照各種組合條件對圖書借閱情況查詢,也可以進(jìn)行模糊查詢。</p><p> 3)借書統(tǒng)計(jì):統(tǒng)計(jì)各類書借閱情況,借閱次數(shù);統(tǒng)計(jì)個(gè)人借書情況,打印日常報(bào)表。</p><p> 4)定期整理圖書借閱信息:將還書情況總結(jié)
41、整理后徹底刪除。</p><p> 此外,圖書管理人員還要定期做整理圖書資料的全部圖書清單、分類印圖書清單、借閱清單以及整理填寫各種報(bào)表等工作。</p><p> 2) 數(shù)據(jù)庫設(shè)計(jì): </p><p> 首先,我們建了一個(gè)圖書館數(shù)據(jù)庫,庫中包含了7張數(shù)據(jù)表,表名及其功能分別是:</p><p> 1.存放區(qū)域:將圖書館的圖書分放在A、
42、B、C、D、E五個(gè)區(qū)域。</p><p> 2.讀者借書:用于記錄讀者ID、姓名、專業(yè)ID及借書的詳細(xì)情況。</p><p> 3.讀者信息:用來記錄讀者的基本信息,包括姓名,性別,專業(yè)ID,證件號碼,累積的借閱次數(shù)及備注等信息。</p><p> 4.分類信息:用來把圖書館的圖書劃為科學(xué)的分類。</p><p> 5.圖書管理:圖書
43、的編號,存放區(qū)域的ID,分類,讀者的ID,借出的次數(shù)。</p><p> 8.圖書的信息:包括圖書的編號,名稱,分類,存放的區(qū)域,出版社,作者,價(jià)格,破損的程度,數(shù)量,出版的時(shí)間,頁數(shù),版次,入庫的時(shí)間,借出次數(shù),受歡迎的程度,附件,簡介及登記人等信息。</p><p> 9.專業(yè)表:用于記錄學(xué)生專業(yè)。</p><p> 其次,我們對數(shù)據(jù)庫進(jìn)行ETCL操作,將
44、數(shù)據(jù)庫轉(zhuǎn)換成數(shù)據(jù)倉庫:圖書館數(shù)據(jù)倉庫中包含7個(gè)表,表名及期功能分別是:</p><p> 1.讀者借書:記錄學(xué)生ID,姓名專業(yè)ID及借閱的圖書的情況。</p><p> 2.存放區(qū)域:進(jìn)過數(shù)據(jù)分析之后,將受歡迎程度高的書籍放置在更為方便讀者的地方。</p><p> 3.讀者信息:讀者姓名,性別,專業(yè)ID,證件號碼,累計(jì)的借閱的次數(shù)及備注等信息。</p&
45、gt;<p> 4.分類信息:為了更好的服務(wù)讀者,對圖書進(jìn)行必要的分類。</p><p> 5.圖書管理:圖書編號,存放區(qū)域ID,分類,讀者ID,了解圖書的借閱的情況,挖掘出圖書的受歡迎的程度,擺放相應(yīng)的位置。</p><p> 6.圖書信息:圖書編號,名稱,分類,存放的區(qū)域,數(shù)量,破損的程度,價(jià)格,頁數(shù),借出次數(shù),受歡迎的程度,及附件。用于分析。</p>
46、<p> 7.專業(yè)表:用于了解讀者專業(yè)的情況。用于分析使用。</p><p> 最后,由于選取圖書編號,存放區(qū)域ID,分類ID,讀者ID,所以,選用了圖書管理為事實(shí)表,然后選用了四個(gè)維表進(jìn)行分析,存放區(qū)域.、圖書信息、分類信息、讀者信息,采用了雪花型, 專業(yè)表為詳細(xì)類別表,對讀者信息進(jìn)行詳細(xì)描述。</p><p><b> 5.?dāng)?shù)據(jù)挖掘設(shè)計(jì):</b>
47、</p><p><b> 5.1 挖掘主題</b></p><p> 首先,要明確挖掘要求,包括挖掘要求及欲達(dá)到的目的。旅館管理系統(tǒng)是根據(jù)輸入房間類型預(yù)測銷售總量,根據(jù)預(yù)測的數(shù)據(jù),得到相關(guān)顧客的信息,使決策者及時(shí)作出決策并制定出一系列的方案。</p><p><b> 5.2 數(shù)據(jù)預(yù)處理</b></p>
48、<p><b> ?。ㄒ唬┒x數(shù)據(jù)源</b></p><p> (1)創(chuàng)建數(shù)據(jù)準(zhǔn)備區(qū)</p><p> 創(chuàng)建圖書館數(shù)據(jù)庫,數(shù)據(jù)準(zhǔn)備區(qū)的創(chuàng)建可以利用SQL Server2005中的數(shù)據(jù)庫創(chuàng)建與表創(chuàng)建工具實(shí)現(xiàn)。通過ETCL來抽取轉(zhuǎn)換成圖書館數(shù)據(jù)倉庫。</p><p> (2) Analysis Manager數(shù)據(jù)庫的創(chuàng)建與數(shù)據(jù)源
49、確定</p><p> 定義圖書信息為要挖掘的數(shù)據(jù)源,Analysis Server系統(tǒng)是一個(gè)管理多維數(shù)據(jù)集的有力工具,可以用來創(chuàng)建對數(shù)據(jù)倉庫訪問、分析多維數(shù)據(jù)集和知識發(fā)現(xiàn)的數(shù)據(jù)挖掘模型。</p><p> ?。ǘ┙⒍嗑S數(shù)據(jù)集</p><p> (1)定義一個(gè)新的數(shù)據(jù)源視圖</p><p> 將數(shù)據(jù)庫中的表具體抽取轉(zhuǎn)換成圖書管理表,
50、讀者信息表,存放區(qū)域表,圖書信息表,分類信息表以及專業(yè)表。</p><p> (2)標(biāo)識事實(shí)數(shù)據(jù)表和維度表</p><p> 該項(xiàng)目中的事實(shí)表為圖書管理,維表為圖書信息表,讀者信息表,存放區(qū)域表,分類信息表,,專業(yè)表詳細(xì)類別表。</p><p> (3)創(chuàng)建多維數(shù)據(jù)集,選擇合適的度量值。包括:</p><p> 圖書編號表示對圖書的統(tǒng)
51、。</p><p> 存放區(qū)域ID表示圖書館的存放地點(diǎn)。</p><p> 分類ID表示圖書館的圖書的具體的分類。</p><p> 讀者ID表示對讀者的記錄。</p><p> 5.3 DM算法選擇</p><p><b> 1)類的選擇</b></p><p>
52、; 類可以有三種選擇:關(guān)聯(lián)規(guī)則、分類法和聚類法,此軟件中選擇分類法。</p><p><b> 2)算法的選擇</b></p><p><b> 采用決策樹算法。</b></p><p><b> 5.4 DM</b></p><p><b> 定義合適的挖
53、掘參數(shù)</b></p><p> 將圖書信息表中的圖書分類、圖書存放區(qū)域、圖書頁數(shù)、圖書價(jià)格等作為輸入列,對圖書的受歡迎程度進(jìn)行預(yù)測,</p><p> 將圖書信息表中的讀者的節(jié)約信息作為輸入列,對圖書的借閱的受歡迎的程度進(jìn)行預(yù)測,使我們可以通過這個(gè)簡單的決策樹來對我們的圖書館的建設(shè)和購書情況的具體的操作并且根據(jù)受歡迎的程度設(shè)計(jì)圖書的擺放的位置。</p>&l
54、t;p> 圖書的擺放的位置包括A區(qū),B區(qū),C區(qū),D區(qū),E區(qū)。</p><p> 可預(yù)測列范圍比較廣,包括圖書的受歡迎的程度。</p><p><b> 5.5 結(jié)果展示</b></p><p><b> 圖5-1</b></p><p><b> 5.6 評價(jià)</b&
55、gt;</p><p> 通過這個(gè)簡單的決策樹,我們可以得到算法:</p><p> IF存放區(qū)域=“A區(qū)”THEN AND IF 分類=“計(jì)算機(jī)”受歡迎程度=“高”</p><p> IF存放區(qū)域=“A區(qū)”THEN AND IF 分類=“不等于計(jì)算機(jī)”受歡迎程度=“中”</p><p> IF存放區(qū)域=“不等于A區(qū)”AND IF 存
56、放區(qū)域=“C區(qū)”THEN 受歡迎程度=“中、低”</p><p> IF存放區(qū)域=“不等于A區(qū)”AND IF 存放區(qū)域=“不等于C區(qū)”THEN 受歡迎程度=“低”</p><p> 測試屬性是根據(jù)統(tǒng)計(jì)信息來進(jìn)行選擇的即(信息增益值),通過測試屬性來建立了決策樹,我們又采用了鉆取技術(shù),來對己有的決策樹進(jìn)行分析。如圖5-1所示:</p><p><b>
57、 6.報(bào)表設(shè)計(jì):</b></p><p> 報(bào)表主要是從圖書的存放區(qū)域角度,圖書分類角度進(jìn)行分析,更詳細(xì)可從圖書價(jià)格,圖書數(shù)量等角度分析,報(bào)表內(nèi)容更加復(fù)雜。得出的報(bào)告清晰的顯示出哪個(gè)區(qū)域哪個(gè)類別圖書借出的多少,以及圖書受歡迎的程度,再根據(jù)這些數(shù)據(jù)決定圖書的擺放位置和擺放方式等。似的圖書的擺放設(shè)計(jì)更加人性化。</p><p> 以上餅圖展示出圖書館書籍中受歡迎程度為高、中、低
58、的所屬類別,以及每個(gè)類別中圖書的受歡迎程度,用戶可以從圖中分析出讀者對圖書館中各類圖書的喜愛程度,并幫助管理者對圖書館的圖書布局,圖書構(gòu)成作出決策達(dá)到便于管理和節(jié)約成本的目的。</p><p> 7.課程設(shè)計(jì)心得體會</p><p> 通過此次課程設(shè)計(jì),使我們更加扎實(shí)的掌握了有關(guān)數(shù)據(jù)倉庫與數(shù)據(jù)挖掘方面的知識,在設(shè)計(jì)過程中雖然遇到了一些問題,但經(jīng)過一次又一次的思考,一遍又一遍的檢查終于找
59、出了原因所在,也暴露出了前期我們在這方面的知識欠缺和經(jīng)驗(yàn)不足。實(shí)踐出真知,通過親自動手制作,使我們掌握的知識不再是紙上談兵。</p><p> 過而能改,善莫大焉。在課程設(shè)計(jì)過程中,我們不斷發(fā)現(xiàn)錯(cuò)誤,不斷改正,不斷領(lǐng)悟,不斷獲取。最終的檢測調(diào)試環(huán)節(jié),本身就是在踐行“過而能改,善莫大焉”的知行觀。這次課程設(shè)計(jì)終于順利完成了,在設(shè)計(jì)中遇到了很多問題,最后在老師的指導(dǎo)下,終于游逆而解。在今后社會的發(fā)展和學(xué)習(xí)實(shí)踐過程中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程設(shè)計(jì)
- 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘論文
- 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘習(xí)題
- 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程授課進(jìn)度計(jì)劃
- 數(shù)據(jù)倉庫和數(shù)據(jù)挖掘
- 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教學(xué)大綱
- 數(shù)據(jù)倉庫和數(shù)據(jù)挖掘題庫
- 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在圖書館決策支持系統(tǒng)中的研究與應(yīng)用.pdf
- 數(shù)據(jù)挖掘的數(shù)據(jù)倉庫與olap技術(shù)
- 《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》復(fù)習(xí)題
- 基于數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的圖書借閱管理數(shù)據(jù)研究.pdf
- 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 復(fù)習(xí)題
- 數(shù)據(jù)庫系統(tǒng)原理數(shù)據(jù)挖掘與數(shù)據(jù)倉庫
- 數(shù)據(jù)倉庫系統(tǒng)設(shè)計(jì)文檔
- 基于數(shù)據(jù)倉庫的圖書館決策支持系統(tǒng).pdf
- 稅務(wù)數(shù)據(jù)倉庫與數(shù)據(jù)挖掘系統(tǒng)研究.pdf
- 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)復(fù)習(xí)資料
- 基于數(shù)據(jù)倉庫的OLAP與數(shù)據(jù)挖掘.pdf
- 點(diǎn)擊流數(shù)據(jù)倉庫與數(shù)據(jù)挖掘研究.pdf
- 基于數(shù)據(jù)倉庫的圖書館OLAP系統(tǒng)的構(gòu)建與應(yīng)用.pdf
評論
0/150
提交評論