版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、學校代碼:10126分類號:TP311論文題目學號:蘭!蘭魚Q!窆編號:——數(shù)據(jù)清洗技術研究及清洗框架的設計與實現(xiàn)學院:電子信息工程學院專業(yè):模式識別與智能系統(tǒng)研究方向:過程控制與工業(yè)控制網(wǎng)絡姓名:王江指導教師:趙子先2016年4月25日數(shù)據(jù)清洗技術研究及清洗框架的設計與實現(xiàn)摘要在當今信息化時代的背景下,數(shù)據(jù)對于各行業(yè)發(fā)展的重要性不言而喻。由于數(shù)據(jù)來源的廣泛性和數(shù)據(jù)模型定義的無關性,在整合數(shù)據(jù)源數(shù)據(jù),尤其是整合多數(shù)據(jù)源數(shù)據(jù)時,常常會暴露
2、出嚴重的數(shù)據(jù)質量問題。這些數(shù)據(jù)質量問題常常會導致錯誤決策的制定,使信息驅動型應用失去潛在的效益。所以數(shù)據(jù)質量越來越受到人們的關注,作為提高數(shù)據(jù)質量有效手段的數(shù)據(jù)清洗技術得到了廣泛的研究和發(fā)展。論文所做的主要工作包括以下三部分:第一部分,闡述了當前數(shù)據(jù)清洗在國內外的研究狀況,論述了數(shù)據(jù)質量的概念,對數(shù)據(jù)質量問題的分類進行了討論,并分析了多種造成數(shù)據(jù)質量問題的原因。同時闡述了數(shù)據(jù)清洗的概念、原理及一般過程。第二部分,著重研究了幾種重復數(shù)據(jù)清
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于XML的Web數(shù)據(jù)存儲與數(shù)據(jù)清洗技術研究與實現(xiàn).pdf
- ETL框架及數(shù)據(jù)清洗的研究.pdf
- 基于Spark的大數(shù)據(jù)清洗框架設計與實現(xiàn).pdf
- 測井數(shù)據(jù)倉庫設計與數(shù)據(jù)清洗技術實現(xiàn).pdf
- 基于網(wǎng)絡的數(shù)據(jù)清洗技術研究.pdf
- 動車組大數(shù)據(jù)清洗關鍵技術研究與實現(xiàn).pdf
- 數(shù)據(jù)倉庫中的數(shù)據(jù)清洗技術研究.pdf
- 構件化數(shù)據(jù)清洗框架的研究與應用.pdf
- 數(shù)據(jù)清洗與電能質量評估技術的研究與實現(xiàn).pdf
- 數(shù)據(jù)清洗的若干關鍵技術研究.pdf
- 基于數(shù)據(jù)倉庫的數(shù)據(jù)清洗技術研究.pdf
- RFID數(shù)據(jù)清洗關鍵技術研究.pdf
- 數(shù)據(jù)質量和數(shù)據(jù)清洗關鍵技術研究.pdf
- 大數(shù)據(jù)清洗系統(tǒng)中優(yōu)化技術的研究與實現(xiàn).pdf
- 數(shù)據(jù)清洗框架與缺失值重構方法的研究.pdf
- 數(shù)據(jù)清洗的若干關鍵技術研究(1)
- ETL過程中的數(shù)據(jù)清洗技術研究與應用.pdf
- 基于本體的數(shù)據(jù)清洗系統(tǒng)框架研究.pdf
- 專利數(shù)據(jù)清洗及可視化模塊設計與實現(xiàn).pdf
- RFID中間件數(shù)據(jù)清洗技術研究.pdf
評論
0/150
提交評論