畢業(yè)論文——用于加工中心的計算機智能監(jiān)測控制方法研究

上傳人：奔*** IP屬地：河北更新時間：2024-03-02 格式：doc 頁數(shù)：63 大?。?.20MB 人氣指數(shù)：12 舉報 版權(quán)申訴

畢業(yè)論文——用于加工中心的計算機智能監(jiān)測控制方法研究_第1頁

已閱讀1頁，還剩62頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、　　學位論文　　用于加工中心的計算機智能監(jiān)測　　控制方法研究　　答辯委員會主席：　　評閱人：

2、　指導教師姓名： 　申請學位級別：碩士學科、專業(yè)名稱：精密儀器及機械　論文提交日期：論文答辯日期:　學位授予單位：河北工業(yè)大學　　20XX 年 X 月　　河北工業(yè)

3、大學碩士學位論文　　用于加工中心的計算機智能監(jiān)測控制方法研究　　摘要　　隨著現(xiàn)代工業(yè)生產(chǎn)自動化、連續(xù)化水平的不斷提高，加工中心的占有率也在增大，在生產(chǎn)中已經(jīng)占有重要地位。加工中心在許多企業(yè)中被用于重要的加工環(huán)節(jié)，如果出現(xiàn)故障后不能及時正確地進行故障診斷和維修，則會帶來較大的

4、經(jīng)濟損失。隨著粗集理論近年來在智能信息處理研究領(lǐng)域獲得了迅速發(fā)展，它基于現(xiàn)實的大數(shù)據(jù)集，從中推理、發(fā)現(xiàn)知識和分類系統(tǒng)的某些特點，對于研究不精確知識的表達、學習、歸納方面有其獨特之處。　　本文研究了基于數(shù)據(jù)挖掘的加工中心故障診斷方法，跟以往的故障診斷方法不同，研究的方向并不是基于機械振動分析，而是采用了粗集理論結(jié)合神經(jīng)網(wǎng)絡(luò)的方法。　　論文研究了粗集對故障數(shù)

5、據(jù)進行約簡的可行性，并應用自組織映射神經(jīng)網(wǎng)絡(luò)的聚類功能，來實現(xiàn)連續(xù)屬性值離散化的方法；通過對診斷信息的分析，采取常規(guī)約簡方法，該方法實現(xiàn)了樣本條件屬性的約簡，可消除樣本數(shù)據(jù)中的冗余信息。采用 MATLAB 神經(jīng)網(wǎng)絡(luò)工具箱建立了加工中心故障類型的智能混合診斷系統(tǒng)；研究了智能混合故障診斷系統(tǒng)，并進行了功能模塊設(shè)計，各功能模塊分別為：數(shù)據(jù)采集模塊，數(shù)據(jù)預處理模塊，數(shù)據(jù)約簡模塊，神經(jīng)網(wǎng)絡(luò)模塊，故障診斷模塊。在此基礎(chǔ)上構(gòu)建了一個基于粗集—神經(jīng)網(wǎng)絡(luò)

6、的智能混合故障診斷系統(tǒng)。　　關(guān)鍵詞：粗集，神經(jīng)網(wǎng)絡(luò)，故障診斷，虛擬儀器，加工中心　　i　　用于加工中心的計算機智能監(jiān)測控制方法研究　　RESEARCH ON COMPUTER INTELLIGENT MONITORING AND CO

7、NTROLING USED FOR MACHINING CENTER　　ABSTRACT　　With the development of automation and the high demand of reliableness, Machining Center has got important status

8、 and predomination in manufacturing. Machining Center has grown as key and deciding factor in many plants. Without timely fault diagnosis and service, serious economic loss can be caused. Rough Sets theory has made fast

9、progress in recent years, it has outstanding ability in research of expressing, learning ， concluding non-precise knowledge. It is based on practical large data sets, 　　So this paper studies a method

10、 of Machining Center fault diagnosis based on Rough Sets theory，which is one of the latest tools in Data Mining area. Not like the usual methods that based on mechanical vibrancy, this method combines the Rough Sets theo

11、ry with the Artificial Neural Network.　　The practicality of using rough set to reduce the date was discussed, in this paper, and the interval-valued continuous attribute discretization by applying se

12、lf-organizing map neural network clustering was proposed, too. This article proposes a normal concision 's method, which reduces the example's condition attribute and eliminates the redundant information of the d

13、ate. What's more, it provides the methods used to diagnosis Machining Center's faults based on the intelligence hybrid system by 　　KEY WORDS: rough sets, neutral network, fault diagnosis, vir

14、tual instrument, machining center　　ii　　河北工業(yè)大學碩士學位論文　　目錄　　第一章緒論1

15、　　§1-1 故障診斷技術(shù)的研究現(xiàn)狀1　　1-1-1 傳統(tǒng)故障診斷技術(shù)1　　1-1-2 人工智能故障診斷技術(shù)1　　1-1-3 數(shù)據(jù)挖掘在故障診斷中的應用2　　§1-2 數(shù)據(jù)挖掘技術(shù)3

16、　　1-2-1 數(shù)據(jù)挖掘基本知識3　　1-2-2 數(shù)據(jù)預處理4　　1-2-3 數(shù)據(jù)挖掘分類5　　§1-3 數(shù)據(jù)挖掘方法和技術(shù)6　　1-3-1 統(tǒng)計學習方法6　　1-3-2 機器學習方法7

17、　　1-3-3 生物技術(shù)7　　1-3-4 數(shù)據(jù)挖掘研究中的技術(shù)難題7　　1-3-5 數(shù)據(jù)挖掘在故障診斷中的應用8　　§1-4 基于粗集的數(shù)據(jù)挖掘8　　§1-5 粗集和神經(jīng)網(wǎng)絡(luò)結(jié)合的必要性8<p

18、>　　§1-6 本課題研究的意義及內(nèi)容10　　1-6-1 本課題的目的和意義10　　1-6-2 主要研究內(nèi)容10　　第二章粗集在故障診斷中的應用11　　§2-1 粗集理論的基本概念11　　2-

19、1-1 知識與不可辨識關(guān)系11　　2-1-2 粗集的上近似、下近似及邊界12　　2-1-3 知識的等價與推廣13　　2-1-4 知識的簡化13　　2-1-5 屬性的依賴性和重要性13　　§2-2 連續(xù)數(shù)據(jù)的離散

20、化方法15　　§2-3 粗集數(shù)據(jù)約簡方法16　　2-3-1 決策表16　　2-3-2 決策表的約簡17　　§2-4 本章小結(jié)20　　第三章人工神經(jīng)網(wǎng)絡(luò)的應用21<p&

21、gt;　　§3-1 人工神經(jīng)網(wǎng)絡(luò)概述21　　§3-2 神經(jīng)網(wǎng)絡(luò)的特性和學習算法21　　3-2-1 人工神經(jīng)網(wǎng)絡(luò)的基本特性21　　3-2-2 人工神經(jīng)網(wǎng)絡(luò)的主要學習算法22　　iii&

22、lt;p>　　用于加工中心的計算機智能監(jiān)測控制方法研究　　iv　　河北工業(yè)大學碩士學位論文　　第一章緒論　　§1-1 故障診斷技術(shù)的研究現(xiàn)狀<p&

23、gt;　　故障診斷是根據(jù)設(shè)備運行狀態(tài)信息查找故障源，并確定相應決策的一門綜合性的新興科學。故障診斷技術(shù)進入二十世紀九十年代以來，以前所未有的勢頭在國內(nèi)得到了十分迅速的發(fā)展，并在機械、石化、冶金、電力等行業(yè)得到了十分廣泛的應用。隨著現(xiàn)代工業(yè)及科學技術(shù)的迅速發(fā)展，工程系統(tǒng)日趨復雜化和自動化，一旦系統(tǒng)出現(xiàn)故障不僅造成嚴重的社會影響和巨大的經(jīng)濟損失，而且會危及人身安全，從這個意義上說故障診斷可謂任重而道遠。<p&g

24、t;　　1-1-1 傳統(tǒng)故障診斷技術(shù)　　工業(yè)生產(chǎn)、加工過程中的控制對象常常是復雜的大系統(tǒng)，具有滯后、強耦合、參數(shù)時變等嚴重的非線性特征，且其數(shù)學模型太復雜、噪音統(tǒng)計特性不理想，并存在不確定和外部干擾等因素，因而很難得到較準確的在線狀態(tài)估計或參數(shù)估計，從而難以生成殘差；然而，任何一種基于模型的故障診斷方法，都要構(gòu)造一個與故障有關(guān)的殘差，通過對殘差的分析、評估，以實現(xiàn)故障的分離和補償，這使得大多數(shù)基

25、于系統(tǒng)模型的故障檢測與診斷方法在非線性系統(tǒng)中難以實現(xiàn)，或在簡化條件下實現(xiàn)也無法實際應用。　　以傳感器技術(shù)和動態(tài)測試技術(shù)為基礎(chǔ)，以信息處理技術(shù)為手段的現(xiàn)代設(shè)備診斷技術(shù)經(jīng)歷了三十多年的發(fā)展與應用，已經(jīng)取得了明顯的經(jīng)濟效益。但進一步的理論研究與應用結(jié)果表明，由于各種信息檢測手段和診斷方法都將診斷對象看成是一個有機的整體，大多是利用診斷對象所表現(xiàn)出來的特定信號(特征信號)來診斷特定類型的故障，對多故障同

26、時發(fā)生和各種故障之間可能存在的互相聯(lián)系及影響難以分析，并做出相應決策[1]。　　1-1-2 人工智能故障診斷技術(shù)　　與傳統(tǒng)的基于傳感器技術(shù)和信號處理技術(shù)的故障診斷相比人工智能故障診斷的優(yōu)越性在于：綜合了多個專家的最佳經(jīng)驗，功能水平可以達到甚至超過專家水平，實現(xiàn)了人機聯(lián)合診斷，能夠?qū)Χ喙收?、多過程和突發(fā)性故障進行快速分類診斷[2]。

27、　　人工智能故障診斷已經(jīng)在電路與數(shù)字電子設(shè)備、機電設(shè)備等方面得到了應用，但仍存在一些問題；領(lǐng)域?qū)＜业闹R主要依靠知識工程師人工移植，“知識瓶頸”問題難于解決；只能局限在相當窄的領(lǐng)域內(nèi)，依靠的主要是淺知識，缺乏常識即“知識窄臺階”問題；推理方式與策略不靈活，缺乏適應性，易產(chǎn)生“組合爆炸”、“無窮遞歸”等問題；智能水平低，缺乏自組織、自學習、聯(lián)想記憶和類比推理等功能；對結(jié)構(gòu)性很差的知識難以表達和處理；實時在線診斷性能差。

28、上述的缺點已經(jīng)使人工智能故障診斷的應用和推廣受到了一定程度的限制。　　常用故障診斷技術(shù)的分類：　　按故障診斷技術(shù)在各個不同工程領(lǐng)域中的應用，其可按如下方法分類：　　1. 按診斷環(huán)境分有離線人工分析、診斷和在線計算機輔助監(jiān)視診斷，二者要求有很大差別。　　1

29、　　用于加工中心的計算機智能監(jiān)測控制方法研究　　2. 按監(jiān)測手段分：　　(1)振動監(jiān)測診斷法以機器振動作為信息源，在機器運行過程中，通過振動參數(shù)的變化特征判別機器的運行狀態(tài)。　　(2)噪聲檢測診斷法以機器運行中的噪聲作為信息源，在機器運行過程中，通過噪

30、聲參數(shù)的變化特征判別機器的運行狀態(tài)。其本質(zhì)上與振動監(jiān)測診斷法是一樣的，因為噪聲主要是由振動產(chǎn)生的。　　(3)溫度檢測診斷法以可觀測的機械零件的溫度作為信息源，在機器運行過程中，通過溫度參數(shù)的變化特征判別機器的運行狀態(tài)。　　(4)壓力檢測診斷法以機械系統(tǒng)中的氣體、液體的壓力作為信息源，在機器運行過程中，通過壓力參數(shù)的變化特征判別機器的運行狀態(tài)。</p

31、>　　(5)聲發(fā)射檢測診斷法金屬零件在磨損、變形、破裂過程中產(chǎn)生彈性波，以此彈性波為信息源，在機器運行過程中，分析彈性波的頻率變化特征判別機器的運行狀態(tài)。　　(6)潤滑油或冷卻液中金屬含量分析診斷法在機器運行過程中，以潤滑油或冷卻液中金屬含量的變化，判別機器的運行狀態(tài)。　　(7)金相分析診斷法某些運動的零件，通過對其表面層金屬

32、顯微組織、殘余應力、裂紋及物理性質(zhì)進行檢查，研究其變化特征，判別機器設(shè)備存在的故障及形成原因。　　3. 按診斷方法原理分　　(1)頻域診斷法應用頻譜分析技術(shù)，根據(jù)頻譜特征變化，判別機器的運行狀態(tài)及故障形成原因。　　(2)時域分析法應用時間序列模型及其有關(guān)的特性函數(shù)，判別機器的工況狀態(tài)的變化。

33、　　(3)統(tǒng)計分析法應用概率統(tǒng)計模型及其有關(guān)的特性函數(shù)，實現(xiàn)工況狀態(tài)監(jiān)視與故障診斷。　　(4)信息理論分析法應用信息理論建立的某些特征函數(shù)，在機器運行過程中的變化進行工況狀態(tài)分析和故障診斷。　　(5)模式識別法利用檢測信號，提取對工況狀態(tài)反應敏感的特征量構(gòu)成模式矢量，設(shè)計合適的分類器，判別工況狀態(tài)，它是人工智能的技術(shù)之一。</p

34、>　　(6)專家系統(tǒng)，專家系統(tǒng)是一個人工智能計算機程序，它利用知識和推理過程來解決那些需要大量的人類專家知識才能解決的復雜問題，所用的知識和推理過程可認為是最好的領(lǐng)域?qū)＜业膶ｉT知識的模型。以此為基礎(chǔ)，可把數(shù)控機床故障診斷專家系統(tǒng)定義為：能以人類專家水平進行數(shù)控機床故障診斷的計算機程序。　　(7)人工神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是在生物神經(jīng)研究成果的基礎(chǔ)上提出的人工智能概念，是對人

35、腦神經(jīng)組織結(jié)構(gòu)和行為的模擬。它以神經(jīng)元為信息處理的基本單元，以神經(jīng)元間的連接弧為信息傳遞通道，多個神經(jīng)元聯(lián)接而成的網(wǎng)絡(luò)結(jié)構(gòu)，具有知識的分布式存儲和并行處理等特點。　　1-1-3 數(shù)據(jù)挖掘在故障診斷中的應用　　數(shù)據(jù)挖掘技術(shù)是隨著人工智能技術(shù)和數(shù)據(jù)庫技術(shù)的發(fā)展而興起的，能從大量數(shù)據(jù)中挖掘和發(fā)現(xiàn)有價值的、隱含的知識。目前數(shù)據(jù)挖掘與知識發(fā)現(xiàn)己經(jīng)被廣泛應用于市場營

36、銷、銀行業(yè)、電信業(yè)、制造業(yè)、保險業(yè)醫(yī)藥業(yè)等各個領(lǐng)域。隨著信息技術(shù)的進步以及計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展，故障診斷中采集的數(shù)據(jù)(包括統(tǒng)計數(shù)據(jù)、實驗數(shù)據(jù))可以方便地被收集和存儲在各種數(shù)據(jù)庫中。采用傳統(tǒng)的數(shù)據(jù)分析方法對這些巨量的數(shù)據(jù)進行分析和處理，不僅耗時而且難以有效地挖掘和發(fā)現(xiàn)數(shù)據(jù)中隱含的知識。另一方面，盡管專家系統(tǒng)、智能診斷等方法在故障診斷中得到了廣泛的應用，但專家系統(tǒng)的知識瓶頸以及智能診斷方法所帶來的診斷推理過程解釋困難等問題仍未得到很好

37、的解決。因而數(shù)據(jù)挖掘技術(shù)能有效地應用于故障診斷中，并且能克服以往存在的知識獲取瓶頸。因此，將數(shù)據(jù)挖掘技術(shù)應用于故障診斷中是必要的，也是可行的[3]。　　2　　河北工業(yè)大學碩士學位論文　　§1-2 數(shù)據(jù)挖掘技術(shù)　　早在 20

38、世紀 80 年代，人們在“物競天擇，適者生存”的大原則下，就認識到“誰最先從外部世界獲得有用信息并加以利用，誰就可能成為贏家”。因此，如何對數(shù)據(jù)與信息快速有效地進行分析、加工、提煉以獲取所需知識，就成為計算機及信息技術(shù)領(lǐng)域的重要研究課題。而計算機及信息技術(shù)發(fā)展的歷史，也就是數(shù)據(jù)和信息加工手段不斷更新和改善的歷史。　　隨著數(shù)據(jù)庫技術(shù)與應用的日益普及，人們面臨著快速擴張的數(shù)據(jù)海洋，如何有效利用豐富的

39、數(shù)據(jù)海洋所蘊含的寶藏為人類服務，人們所依賴的數(shù)據(jù)分析工具卻無法有效地為決策者提供其決策支持所需要的相關(guān)知識，從而形成了一種“豐富的數(shù)據(jù)，貧乏的知識”之獨特的現(xiàn)象。為有效解決這一問題，數(shù)據(jù)挖掘技術(shù)逐步發(fā)展起來，其迅速發(fā)展得益于目前全世界所擁有的巨大數(shù)據(jù)資源，以及對將這些數(shù)據(jù)資源轉(zhuǎn)換為信息和知識資源的巨大需求。　　1-2-1 數(shù)據(jù)挖掘基本知識　　數(shù)據(jù)挖掘（D

40、ata Mining，簡稱 DM）是從數(shù)據(jù)庫中知識發(fā)現(xiàn)(Knowledge Discovery from Database，簡稱 KDD)的一個重要組成步驟，它是一個從大量數(shù)據(jù)中抽取挖掘出未知的、有價值的模式或規(guī)律等知識的復雜過程[4]，如圖 1.1 所示：　　整個知識挖掘過程是由若干挖掘步驟組成，而 DM 僅是其中的一個主要步驟。整個知識挖掘的主要步驟有：<p&g

41、t;　　數(shù)據(jù)清洗：其作用就是清除數(shù)據(jù)噪聲和與挖掘主題明顯無關(guān)的數(shù)據(jù)：　　數(shù)據(jù)集成：其作用是將來自多數(shù)據(jù)源中的相關(guān)數(shù)據(jù)組合到一起；　　數(shù)據(jù)轉(zhuǎn)換：其作用是將數(shù)據(jù)轉(zhuǎn)換為易于進行數(shù)據(jù)挖掘的數(shù)據(jù)存儲形式；　　數(shù)據(jù)挖掘：它是知識挖掘的一個基本步驟，其作用就是利用智能方法挖掘數(shù)據(jù)模式或規(guī)律知識；模式評估：其作用就是根據(jù)一定評估

42、標準從挖掘結(jié)果篩選出有意義的模式知識；　　知識表示：其作用就是利用可視化和知識表達技術(shù)，向用戶展示所挖掘出的相關(guān)知識。　　圖 1.1 知識挖掘全過程示意描述　　Fig. 1.1 Data mining described in the whole course<b&

43、gt;　　3　　用于加工中心的計算機智能監(jiān)測控制方法研究　　盡管 DM 僅僅是整個知識挖掘過程中的一個重要步驟，但在工業(yè)、媒體、數(shù)據(jù)庫研究領(lǐng)域中，“數(shù)據(jù)挖掘”一詞己被廣泛使用和普遍接受，不加區(qū)分地表示整個知識挖掘過程。DM 就是利用機器學習的方法從數(shù)據(jù)庫中提取有價值知識的過程，它是數(shù)據(jù)庫技術(shù)和機器學習兩個學科的交叉領(lǐng)域。數(shù)據(jù)庫技術(shù)側(cè)重

44、于對數(shù)據(jù)存儲處理的高效率方法的研究，而機器學習則側(cè)重于設(shè)計新的方法從數(shù)據(jù)中提取知識。同時，DM 與其他學科也有很強的聯(lián)系，如統(tǒng)計學、數(shù)學和可視化技術(shù)等。另外，在 KDD 過程中要特別注意的是，數(shù)據(jù)挖掘質(zhì)量的好壞有兩個影響要素：一是所采用的數(shù)據(jù)挖掘技術(shù)的有效性，二是用于采掘的數(shù)據(jù)的質(zhì)量和數(shù)量。如果選擇了錯誤的數(shù)據(jù)或不適當?shù)膶傩裕驅(qū)?shù)據(jù)進行了不適當?shù)淖儞Q，則采掘的結(jié)果是不會好的[5]。　　1-2-

45、2 數(shù)據(jù)預處理　　由于數(shù)據(jù)庫系統(tǒng)所獲數(shù)據(jù)量的迅速膨脹，導致了現(xiàn)實世界數(shù)據(jù)庫中常常包含許多含有噪聲、不完整、甚至是不一致的數(shù)據(jù)。顯然，對數(shù)據(jù)挖掘所涉及的數(shù)據(jù)對象必須進行預處理，以提高數(shù)據(jù)挖掘?qū)ο蟮馁|(zhì)量，并最終達到提高數(shù)據(jù)挖掘所獲模式知識質(zhì)量的目的。　　1. 數(shù)據(jù)預處理的基本內(nèi)容　　數(shù)據(jù)預處理主要包括：數(shù)據(jù)清洗、數(shù)據(jù)

46、集成、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)消減。數(shù)據(jù)清洗是指消除數(shù)據(jù)中所存在的噪聲以及糾正其不一致的錯誤：數(shù)據(jù)集成則是指將來自多個數(shù)據(jù)源的數(shù)據(jù)合并到一起構(gòu)成一個完整的數(shù)據(jù)集：數(shù)據(jù)轉(zhuǎn)換是指將一種格式的數(shù)據(jù)轉(zhuǎn)換為另一種格式的數(shù)據(jù)；最后數(shù)據(jù)消減是指通過刪除冗余特征或聚類消除多余數(shù)據(jù)。　　數(shù)據(jù)清洗通常包括：添補遺漏數(shù)據(jù)、平滑噪聲數(shù)據(jù)、識別或去除異常值，以及解決不一致問題。有問題的數(shù)據(jù)將會誤導數(shù)據(jù)挖掘的搜索過程。盡管大多數(shù)數(shù)據(jù)

47、挖掘過程包含有對不完全或噪聲數(shù)據(jù)的處理，但它們并不魯棒且常常將處理重點放在如何避免挖掘出的模式對數(shù)據(jù)過分逼近的描述上。　　數(shù)據(jù)集成是將來自多個數(shù)據(jù)源的數(shù)據(jù)合并到一起。由于描述同一個概念的屬性在不同數(shù)據(jù)庫取不同的名字，在進行數(shù)據(jù)集成時常常會引起數(shù)據(jù)的不一致或冗余。因此在完成數(shù)據(jù)集成之后，有時需要進行數(shù)據(jù)清洗以便消除可能存在的數(shù)據(jù)冗余[6]。　　數(shù)據(jù)轉(zhuǎn)換主要

48、是將數(shù)據(jù)轉(zhuǎn)換以構(gòu)成一個適合數(shù)據(jù)挖掘的描述形式。數(shù)據(jù)轉(zhuǎn)換包含以下處理內(nèi)容：平滑、合計、泛化、規(guī)格化以及屬性構(gòu)造。平滑是一種數(shù)據(jù)清洗方法，合計和泛化也可以作為數(shù)據(jù)消減的方法。對于使用基于對象距離的挖掘算法，必須進行數(shù)據(jù)規(guī)格化，將其收縮至特定的范圍內(nèi)。　　數(shù)據(jù)消減的目的就是縮小所挖掘數(shù)據(jù)的規(guī)模，但卻不會或基本不影響最終的挖掘結(jié)果。數(shù)據(jù)消減的主要策略有以下幾種：數(shù)據(jù)立方合計、維數(shù)消減、數(shù)據(jù)壓縮、數(shù)據(jù)塊消

49、減以及離散化與概念層次生成等。數(shù)據(jù)消減所花費的時間不應該超過由于數(shù)據(jù)消減而節(jié)約的數(shù)據(jù)挖掘時間。　　以上所提及的各種數(shù)據(jù)預處理方法，并不是相互獨立的，而是相互關(guān)聯(lián)的。如：消除數(shù)據(jù)冗余即可以看成是一種形式的數(shù)據(jù)清洗，又可以認為是一種數(shù)據(jù)消減。由于現(xiàn)實世界數(shù)據(jù)常常是含有噪聲、不完全和不一致的，數(shù)據(jù)預處理能夠幫助改善數(shù)據(jù)的質(zhì)量，進而幫助提高數(shù)據(jù)挖掘進程的有效性和準確性。高質(zhì)量的決策來自高質(zhì)量的數(shù)據(jù)，因此

50、數(shù)據(jù)預處理是整個數(shù)據(jù)挖掘與知識發(fā)現(xiàn)過程中的一個重要步驟。　　2. 數(shù)據(jù)離散化　　數(shù)據(jù)離散化是數(shù)據(jù)預處理中的一個重要部分，它是一種數(shù)據(jù)消減方式。所謂離散化就是利用取值范圍或更高層次概念來替換初始數(shù)據(jù)，將連續(xù)取值屬性的域值范圍分為若干區(qū)間，幫助消減連續(xù)取值屬性的取值個數(shù)，對于諸如粗集、決策樹這種主要是用來學習以離散型變量

51、作為屬性類型的學習方法，連續(xù)性變量必須被離散化才能夠被學習[7]。　　從本質(zhì)上來看，連續(xù)屬性的離散化過程就是用一定的閾值對屬性空間進行劃分的過程。為了提高機器學習算法的聚類能力和識別能力，離散化過程要求在保證離散化結(jié)果性能的前提下防止對屬性空間的過分細化，用盡可能少的斷點將屬性空間劃分成盡可能少的子空間。　　有效的離散化會顯著地提高系統(tǒng)的聚類能力，增強系

52、統(tǒng)對輸入的待識別樣本中數(shù)據(jù)噪音的魯棒性。　　4　　河北工業(yè)大學碩士學位論文　　離散化結(jié)果將會減小系統(tǒng)對存儲空間的實際需求，加快數(shù)據(jù)挖掘算法的運行速度，減小計算過程的空間開銷。此外，若離散化過程將某一連續(xù)屬性的所有屬性值均映射到同一結(jié)果，則該屬性存在與否都不會影響系統(tǒng)對樣本的分

53、辨能力，因而它可以被刪除。從這一角度來說，離散化過程同時也是屬性簡約的過程。　　有許多學者提出各種離散化方法，其中較為常用的有：人工劃分方法，Bin 方法(包括等距離和等頻率離散化)、基于信息嫡的離散化、布爾推理離散化，Kohonen 網(wǎng)絡(luò)離散化、自然/半自然離散算法以及統(tǒng)計檢驗方法。　　1-2-3 數(shù)據(jù)挖掘分類

54、　　利用數(shù)據(jù)挖掘技術(shù)可以幫助獲得決策所需的多種知識。在許多情況下，用戶并不知道數(shù)據(jù)存在哪些有價值的信息知識，因此對于一個數(shù)據(jù)挖掘系統(tǒng)而言，應該能夠同時搜索發(fā)現(xiàn)多種模式的知識以滿足用戶的期望和實際需要；還應該能夠挖掘出多種層次的模式知識；還應允許用戶來指導挖掘搜索有價值的模式知識。　　數(shù)據(jù)挖掘是一個多學科交叉領(lǐng)域，這些交叉學科包括：數(shù)據(jù)庫系統(tǒng)，機器學習、統(tǒng)計學、可視化和信息科學。此外，因數(shù)據(jù)挖掘任

55、務不同，數(shù)據(jù)挖掘系統(tǒng)也可能采用其他學科的一些技術(shù)方法，如神經(jīng)網(wǎng)絡(luò)、模糊邏輯，Rough 集、知識表示、推理邏輯編程或高性能計算等。根據(jù)所挖掘的數(shù)據(jù)或挖掘應用背景，數(shù)據(jù)挖掘系統(tǒng)還可能集成其他領(lǐng)域的一些技術(shù)方法，其中包括：空間數(shù)據(jù)分析、信息檢索、模式識別、圖像分析、信號處理、計算機圖形學、互聯(lián)網(wǎng)技術(shù)、經(jīng)濟學、心理學等。正因為數(shù)據(jù)挖掘技術(shù)方法的多樣性，也就導致了數(shù)據(jù)挖掘系統(tǒng)的多樣性。而對于數(shù)據(jù)挖掘系統(tǒng)分類也有多種方式?？梢愿鶕?jù)所挖掘的數(shù)據(jù)庫進

56、行分類，如按照數(shù)據(jù)類型或數(shù)據(jù)模型進行分類；還可以根據(jù)所使用的技術(shù)進行分類，按照用戶交互程度或所使用的數(shù)據(jù)分析方法進行分類。這里按照所挖掘的知識類型對數(shù)據(jù)挖掘系統(tǒng)進行分類。因此可以根據(jù)概念描述知識、對比概念描述知識、關(guān)聯(lián)知識、分類知識、聚類知識等進行劃分。　　1. 概念描述　　用戶常常需要抽象的有意義的描述。經(jīng)過歸納的

57、抽象描述能概括大量的關(guān)于類的信息。有兩種典型的描述：特征描述和判別描述。特征描述是從與學習任務相關(guān)的一組數(shù)據(jù)中提取出關(guān)于這些數(shù)據(jù)的特征式，這些特征式表達了該數(shù)據(jù)集的總體特征；而判別描述則描述了兩個或更多個類之間有何差異　　[8]。　　2. 關(guān)聯(lián)分析<

58、p>　　關(guān)聯(lián)分析的目的是發(fā)現(xiàn)特征之間或數(shù)據(jù)之間的相互依賴關(guān)系。數(shù)據(jù)相關(guān)性關(guān)系代表一類重要的可發(fā)現(xiàn)的知識。一個依賴關(guān)系存在于兩個元素之間。如果從一個元素 A 的值可以推出另一個元素 B 的值，則稱 B 依賴于 A。這里所謂元素可以是字段，也可以是字段間的關(guān)系。若兩個或多個數(shù)據(jù)項的取值之間重復出現(xiàn)且概率很高時，它就存在某種關(guān)聯(lián)，可以建立起這些數(shù)據(jù)項的關(guān)聯(lián)規(guī)則[9]。　　關(guān)聯(lián)分析的結(jié)果有時可以

59、直接提供給最終用戶。然而，通常強的關(guān)聯(lián)關(guān)系反映的是固有的領(lǐng)域結(jié)構(gòu)而不是什么新的或有興趣的事物。關(guān)聯(lián)知識可被其他模式抽取算法使用。常用技術(shù)有回歸分析、機器學習，、信念網(wǎng)絡(luò)等。結(jié)合領(lǐng)域知識或通過進一步分析，可將關(guān)聯(lián)規(guī)則直接用于分類與預測。　　3. 分類與預測　　分類是數(shù)據(jù)挖掘中一項非常重要的任務，其目的是提出一個分類函數(shù)

60、或分類模型(也常常稱作分類器)，該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定類別中的某一個。一般使用分類來表示對有限離散屬性值的預測，而預測表示對連續(xù)屬性值的預測。　　分類器的構(gòu)造方法有統(tǒng)計方法、機器學習方法、仿生學方法等。統(tǒng)計方法包括貝葉斯法和諸如近鄰學習、基于范例的學習等非參數(shù)法，對應的知識表示則為判別函數(shù)和原型事例。機器學習方法包括決策樹法和規(guī)則歸納法，前者對應的表示為決策樹或判別樹，后者則一般為

61、產(chǎn)生式規(guī)則。粗集方法的知識表示即為產(chǎn)生式規(guī)則，仿生學方法包括神經(jīng)網(wǎng)絡(luò)方法和遺傳算法。神經(jīng)網(wǎng)絡(luò)方法主要是 BP 算法，　　5　　用于加工中心的計算機智能監(jiān)測控制方法研究　　它的模型表示是前向反饋神經(jīng)網(wǎng)絡(luò)模型，其本質(zhì)上是一種非線性判別函數(shù)[10]。<

62、p>　　4. 聚類分析　　聚類分析與分類預測方法明顯不同之處在于，后者所學習獲取分類預測模型所使用的數(shù)據(jù)是己知類別歸屬，屬于有教師監(jiān)督學習方法，而聚類分析所分析處理的數(shù)據(jù)均是無事先確定的類別歸屬，屬于無教師監(jiān)督學習方法。　　聚類分析以“各聚集內(nèi)部數(shù)據(jù)對象間的相似度最大化和各聚集對象間相似度最小化”作為基本的分析

63、原則，同樣包括統(tǒng)計方法、機器學習方法和神經(jīng)網(wǎng)絡(luò)方法。統(tǒng)計方法主要研究基于幾何距離的聚類，如歐式距離、海明距離等，是一種基于全局比較的聚類，需要考察所有個體才能決定類的劃分。基于神經(jīng)網(wǎng)絡(luò)的聚類主要是自組織特征映射方法，如 AttT 模型、Kohonen 模型等，當給定距離閾值后，各樣本按域值進行聚類。而在機器學習領(lǐng)域，距離是根據(jù)概念的描述來確定的，概念聚類方法首先發(fā)現(xiàn)適當?shù)念?，然后再根?jù)每個類形成相應的特征描述[11]。</p&g

64、t;　　5. 數(shù)據(jù)挖掘結(jié)果的評估　　一個數(shù)據(jù)挖掘系統(tǒng)在完成一個挖掘算法之后，常常會獲得成千上萬的模式或規(guī)則。在這些規(guī)則中，只會有一小部分是有實際應用價值的。需要對數(shù)據(jù)挖掘步驟所獲得的挖掘結(jié)果進行有效的評估，以便最終能夠獲得有實際應用價值的模式或規(guī)則知識。這就給數(shù)據(jù)挖掘提出許多需要解決的問題。　　首先，使一個模式有價值的因素是什么？對

65、于該問題，評估一個模式是否有意義通常依據(jù)以下四條標準：易于用戶理解；對新數(shù)據(jù)或測試數(shù)據(jù)能夠確定有效程度；具有潛在價值；新奇的。此外，還有一些評價模式價值的客觀標準，這些標準是基于所挖掘出模式的結(jié)構(gòu)或統(tǒng)計特征。另外，結(jié)合一些主觀評價措施可有效反映用戶的需求和興趣。許多根據(jù)客觀評價標準是有價值的模式知識卻只是普通的常識知識，而主觀評價標準是建立在用戶對數(shù)據(jù)的信念基礎(chǔ)上的，這些評估標準基于所發(fā)現(xiàn)模式是否是意外的或與用戶信念相悖的，或能夠提供決

66、策支持而確定的。而意料之中的模式是有價值的則是指它能夠幫助確認用戶想要認可的一個假設(shè)[5]。　　其次，一個數(shù)據(jù)挖掘算法能否產(chǎn)生所有有價值的模式？這個問題是指數(shù)據(jù)挖掘算法的完全性。期望數(shù)據(jù)挖掘算法能夠產(chǎn)生所有可能模式是不現(xiàn)實的，實際上一個模式搜索方法可以利用有趣性評價標準來幫助縮小模式的搜索范圍。因此通常只需要保證挖掘算法的完全性就可以了。評估所挖掘模式的趣味性標準對于有效挖掘出具有應用價值的模式

67、知識是十分重要的。這些標準可以直接幫助指導挖掘算法及時消除無前途的搜索路徑，獲取有實際應用價值的模式知識，有效摒棄無意義的模式，提高挖掘的有效性。　　另外，一個數(shù)據(jù)挖掘算法能否只產(chǎn)生有價值的模式？這是數(shù)據(jù)挖掘算法的一個最優(yōu)化問題。一般當然希望數(shù)據(jù)挖掘算法僅挖掘有價值的模式，但這是一個較為棘手的最優(yōu)化高效搜索問題，至今尚未有好的辦法。　　§1-3

68、數(shù)據(jù)挖掘方法和技術(shù)　　現(xiàn)有的多種數(shù)據(jù)分析方法從總體上均可歸類到統(tǒng)計學習方法、機器學習方法以及仿生物學方法這三大類中的某一種，在應用上這些方法各有利弊，需要針對具體挖掘問題選擇合適的技術(shù)。對于復雜的數(shù)據(jù)挖掘系統(tǒng)，還常常采用多種數(shù)據(jù)挖掘技術(shù)或整合多種數(shù)據(jù)挖掘技術(shù)以彌補不同數(shù)據(jù)挖掘技術(shù)所存在的不足。　　1-3-1 統(tǒng)計學習方法<

69、p>　　數(shù)據(jù)處理的最初階段就是用人工方法進行統(tǒng)計分析，統(tǒng)計學習方法在數(shù)據(jù)挖掘領(lǐng)域的應用可謂歷史悠久。統(tǒng)計方法是從事物的外在數(shù)量的表現(xiàn)去推斷該事物可能的規(guī)律性。　　傳統(tǒng)的統(tǒng)計方法在解決機器學習問題中起著基礎(chǔ)性的作用，主要研究漸近理論，即當樣本趨向于　　6　　河北工業(yè)大學碩

70、士學位論文　　無窮多時的統(tǒng)計性質(zhì)。它依賴于顯示的基本概率模型，常見的方法有回歸分析、聚類分析、主元分析以及相關(guān)分析等。　　在傳統(tǒng)的統(tǒng)計學習方法基礎(chǔ)上，已經(jīng)形成多種新型的數(shù)據(jù)分析方法，如基于范例的推理方法直接使用過去的經(jīng)驗或解法來求解給定的問題。范例推理檢索范例庫，尋找相似范例，并將待解問題添加進范例庫以便將來參考。Naive 貝葉斯和貝葉斯網(wǎng)絡(luò)這兩種貝葉

71、斯統(tǒng)計分析方法能夠?qū)崿F(xiàn)預測、分類等數(shù)據(jù)挖掘任務。新興的支持向量機技術(shù)則是建立在計算學習理淪的結(jié)構(gòu)風險最小化原則之上，主要針對兩類分類問題在高維空間中尋找一個超平面作為兩類的分割，以保證最小分類錯誤率，其重要優(yōu)勢在于可處理線性不可分情況[12]。　　1-3-2 機器學習方法　　機器學習方法是目前研究的重點，研究成果較多。從采用的技術(shù)上看，可分為兩大類：基于

72、決策樹的技術(shù)和基于決策規(guī)則的方法[13]。　　基于決策樹的技術(shù)以信息論的原理為基礎(chǔ)建立決策樹，最后獲得的知識表示形式是決策樹，最為著名的方法就是 Quinlan 開發(fā)的 ID3 方法，利用信息增益尋找數(shù)據(jù)庫中具有最大信息量的字段建立決策樹的節(jié)點，再根據(jù)字段的不同取值建立樹的分支，由每個分支的數(shù)據(jù)子集重復建樹的下層節(jié)點和分支的過程，這樣就建立了決策樹。另外，還有一些決策樹方法，如 Assistan

73、t Professional。 IDL 以及 PRISM 等。　　基于決策規(guī)則的方法又可細分為兩類，一種是在決策樹基礎(chǔ)上加入規(guī)則求取步驟獲得決策規(guī)則的方法，如 CN2 方法、C4.5 方法、AQIS 及其系列版本等；另外一種則是直接具有規(guī)則求取能力的方法，　　Rough 集、Fuzzy 集。　　1-3-3 生物

74、技術(shù)　　仿生物技術(shù)典型的方法是神經(jīng)網(wǎng)絡(luò)方法和遺傳算法，這兩種方法己經(jīng)形成了獨立的研究體系，在數(shù)據(jù)挖掘中發(fā)揮著巨大作用。　　神經(jīng)網(wǎng)絡(luò)模擬人腦神經(jīng)元結(jié)構(gòu)，以 MP 和 Hebb 學習規(guī)則為基礎(chǔ)，建立了前饋式網(wǎng)絡(luò)、反饋式網(wǎng)絡(luò)和自組織網(wǎng)絡(luò)。前饋式網(wǎng)絡(luò)可用于預測及模式識別，反饋式網(wǎng)絡(luò)擅長聯(lián)想記憶和優(yōu)化計算，而自組織網(wǎng)絡(luò)極適用于聚類研究[16]。

75、　　遺傳算法是按照自然進化原理提出的一種優(yōu)化策略。在求解過程中，通過最好解的選擇和彼此組合，可以期望解的集合將會越來越好。在數(shù)據(jù)挖掘中，遺傳算法能夠用來形成變量間依賴關(guān)系假設(shè)。　　1-3-4 數(shù)據(jù)挖掘研究中的技術(shù)難題　　在數(shù)據(jù)挖掘研究和開發(fā)已取得令人矚目的進展的同時，許多尚待解決和完善的課題也擺在了研究者面前。

76、　　涉及數(shù)據(jù)的問題包括噪聲數(shù)據(jù)、缺失數(shù)據(jù)、冗余數(shù)據(jù)、海量數(shù)據(jù)以及動態(tài)數(shù)據(jù)等。噪聲數(shù)據(jù)的屬性值是不精確或錯誤的，從而會影響抽取的模式的準確性，造成最終結(jié)果的不確定性。缺失值現(xiàn)象尤其在關(guān)系數(shù)據(jù)庫中經(jīng)常發(fā)生，這種情況給發(fā)現(xiàn)、評估和解釋模式帶來了困難，要求知識發(fā)現(xiàn)模型應當具有近似決策能力。而與不完整數(shù)據(jù)相反，給定的數(shù)據(jù)集中可能含有冗余的或者不重要的屬性或?qū)ο?，從而增加時間空間開銷和結(jié)果規(guī)則的復雜度。數(shù)據(jù)庫中數(shù)據(jù)量的迅速增長，

77、是促進數(shù)據(jù)挖掘技術(shù)發(fā)展的原因之一，也是數(shù)據(jù)挖掘技術(shù)首先要解決的問題。數(shù)據(jù)庫的基本特點是庫中的內(nèi)容是動態(tài)改變的，所以知識發(fā)現(xiàn)方法應當具有增量式學習的能力。　　為了能夠有效的從數(shù)據(jù)庫大量的數(shù)據(jù)中抽取模式知識，數(shù)據(jù)挖掘算法必須是高效的和可擴展的，相應數(shù)據(jù)挖掘算法的運行時間是可以預測的并可以接受的。已發(fā)現(xiàn)的知識應能準確描述數(shù)據(jù)庫中的內(nèi)容，并能用于實際領(lǐng)域。數(shù)據(jù)挖掘系統(tǒng)還應能很好地處理和抑制噪聲數(shù)據(jù)和不希

78、望的數(shù)據(jù)，所以要研　　7　　用于加工中心的計算機智能監(jiān)測控制方法研究　　究度量知識質(zhì)量的方法。數(shù)據(jù)挖掘應該能夠用高水平語言、可視化表示或其它表示方式來描述所挖掘出的知識，以使用戶更加容易的理解和應用所挖掘出的知識[14]。　　雖然大多

79、數(shù)數(shù)據(jù)庫是關(guān)系型的，但許多實際應用的關(guān)系數(shù)據(jù)庫還可能含有復雜的數(shù)據(jù)類型，如結(jié)構(gòu)數(shù)據(jù)和復雜數(shù)據(jù)對象、超文本和多媒體數(shù)據(jù)、空間和時態(tài)數(shù)據(jù)、事務數(shù)據(jù)以及歷史數(shù)據(jù)等，因此一個功能很強的數(shù)據(jù)挖掘系統(tǒng)應能對各種復雜數(shù)據(jù)類型進行挖掘[17]。鑒于數(shù)據(jù)類型的差異和不同的數(shù)據(jù)挖掘目的，針對不同數(shù)據(jù)挖掘任務應當構(gòu)造專用的數(shù)據(jù)挖掘系統(tǒng)。　　1-3-5 數(shù)據(jù)挖掘在故障診斷中的應用

80、;　　數(shù)據(jù)挖掘技術(shù)是隨著人工智能技術(shù)和數(shù)據(jù)庫技術(shù)的發(fā)展而興起的，能從大量數(shù)據(jù)中挖掘和發(fā)現(xiàn)有價值的、隱含的知識。目前數(shù)據(jù)挖掘與知識發(fā)現(xiàn)己經(jīng)被廣泛應用于市場營銷、銀行業(yè)、電信業(yè)、制造業(yè)、保險業(yè)、醫(yī)藥業(yè)等各個領(lǐng)域[15]。隨著信息技術(shù)的進步以及計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展，故障診斷中采集的數(shù)據(jù)(包括統(tǒng)計數(shù)據(jù)、實驗數(shù)據(jù))可以方便地被收集和存儲在各種數(shù)據(jù)庫中。采用傳統(tǒng)的數(shù)據(jù)分析方法對這些巨量的數(shù)據(jù)進行分析和處理，不僅耗時而且難以有效地挖掘和發(fā)現(xiàn)數(shù)據(jù)

81、中隱含的知識。另一方面，盡管專家系統(tǒng)、智能診斷等方法在故障診斷中得到了廣泛的應用，但專家系統(tǒng)的知識瓶頸以及智能診斷方法所帶來的診斷推理過程解釋困難等問題仍未得到很好的解決。因而數(shù)據(jù)挖掘技術(shù)能有效地應用于故障診斷中，并且能克服以往存在的知識獲取瓶頸。因此，將數(shù)據(jù)挖掘技術(shù)應用于故障診斷中是必要的，也是可行的。　　§1-4 基于粗集的數(shù)據(jù)挖掘　　智能

82、的、有效的、可擴展的數(shù)據(jù)挖掘方法的研究是當前研究的熱點，涉及數(shù)據(jù)的問題包括海量數(shù)據(jù)、缺失數(shù)據(jù)、冗余數(shù)據(jù)、噪聲數(shù)據(jù)以及動態(tài)數(shù)據(jù)等。粗集理論從新的視角對知識進行了定義；把知識看作是關(guān)于論域的劃分，從而認為知識是具有粒度(granularity)的；認為知識的不精確性是由知識粒度太大引起的。為處理數(shù)據(jù)(特別是帶噪聲、不精確或不完備數(shù)據(jù))分類問題提供了一套嚴密的數(shù)學工具，使得對知識能夠進行嚴密的分析和操作。采用粗集理論作為研究知識發(fā)現(xiàn)的工具具有

83、許多優(yōu)點：首先，粗集理論提供了一套數(shù)學方法從數(shù)學上嚴格地處理數(shù)據(jù)分類問題，尤其是當數(shù)據(jù)具有不完備性或不精確性時；其次，粗集理論僅僅分析隱藏在數(shù)據(jù)中的事實，并沒有校正數(shù)據(jù)中所表現(xiàn)的不一致性，而是一般將所生成的規(guī)則分為確定與可能的規(guī)則；第三，粗集理論包含了知識的一種形式模型，這種模型將知識定義為不可區(qū)分關(guān)系的一個族集，這就使得知識有了一種清晰的數(shù)學意義，并且可使用數(shù)學方法來分析處理；最后，粗集理論不需要關(guān)于數(shù)據(jù)的任何附加知識[18]。<

84、;/p>　　粗集理論和粗集分析能夠有效地從數(shù)據(jù)中獲取知識，對不一致、不確定和不完整的信息進行推理，在保留有用信息的前提下進行數(shù)據(jù)簡約和模式分類，識別以及評估數(shù)據(jù)之間的依賴關(guān)系，并且獲得易于理解的規(guī)則呈現(xiàn)給使用者。因此本文利用粗集分析，針對數(shù)據(jù)挖掘領(lǐng)域要處理的不同知識類型，從高效性和可擴展性方面進行了算法研究；面向數(shù)據(jù)挖掘中的數(shù)據(jù)預處理問題。　　§1-5 粗

85、集和神經(jīng)網(wǎng)絡(luò)結(jié)合的必要性　　人工神經(jīng)網(wǎng)絡(luò)是在生物神經(jīng)研究成果的基礎(chǔ)上提出的人工智能概念，是對人腦神經(jīng)組織結(jié)構(gòu)和行為的模擬。它以神經(jīng)元為信息處理的基本單元，以神經(jīng)元間的連接弧為信息傳遞通道，多個神經(jīng)元聯(lián)接而成的網(wǎng)絡(luò)結(jié)構(gòu)，具有知識的分布式存儲和并行處理等特點。　　但是基于人工神經(jīng)網(wǎng)絡(luò)的診斷方法也存在著局限性；神經(jīng)網(wǎng)絡(luò)的故障診斷能力是與它的學習樣本</p

86、>　　8　　河北工業(yè)大學碩士學位論文　　數(shù)量成正比關(guān)系的，故障訓練樣本越多，則神經(jīng)網(wǎng)絡(luò)的診斷能力越強，能夠診斷的故障種類就越多，因此一個好的神經(jīng)網(wǎng)絡(luò)故障診斷系統(tǒng)，首先需要較多訓練例子用于神經(jīng)網(wǎng)絡(luò)學習才能使網(wǎng)絡(luò)收斂，從而得出穩(wěn)定的診斷結(jié)果；同時神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)復雜程度和訓練時間的多少，也與故障

87、樣本的種類和數(shù)量成正比關(guān)系，樣本種類和數(shù)量越多，則神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)越復雜，達到網(wǎng)絡(luò)收斂需要的訓練時間也就越多。也就是說復雜的神經(jīng)網(wǎng)絡(luò)，需要大量的訓練時間才能使網(wǎng)絡(luò)收斂，甚至不能收斂；這是一個矛盾的問題，一方面希望有大量的故障樣本用于訓練網(wǎng)絡(luò)，使網(wǎng)絡(luò)的診斷能力提高，而另一方面卻要求，神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不要過于復雜，訓練和診斷時間短一些，使網(wǎng)絡(luò)能夠收斂并快速正確的得到診斷結(jié)果。這是神經(jīng)網(wǎng)絡(luò)進一步實用化需要解決的一個主要問題。&

88、lt;p>　　通常解決這個問題采用的方法是，改進神經(jīng)網(wǎng)絡(luò)的訓練學習算法，提高訓練速度來減少網(wǎng)絡(luò)訓練和診斷需要的時間圈；如：有動量的梯度下降法、共軌梯度法、高斯一牛頓法等，但是問題遠未得到完美解決。　　用于故障診斷的樣本數(shù)據(jù)，通常包含了設(shè)備很多零部件的技術(shù)狀態(tài)信息，很顯然這些信息并不都是必要的。其中很大一部分是冗余的，是由周圍設(shè)備或設(shè)備自身不同部位的相互影響而產(chǎn)生的信息，或者是本身檢測到的數(shù)

89、據(jù)的重復判據(jù)，而這些信息對故障的診斷是沒有用處的，因此有必要去除這些冗余信息，使訓練樣本的到簡化。樣本簡化后，神經(jīng)網(wǎng)絡(luò)需要處理的數(shù)據(jù)量就會大量減少，需要的網(wǎng)絡(luò)結(jié)構(gòu)也就沒有那么復雜，同時訓練時間也得到減少，而不影響故障診斷的診斷效果。如何有效去除故障樣本數(shù)據(jù)中的冗余信息就是本文所要研究的主要任務。　　知識約簡是粗集理論的核心內(nèi)容之一。利用粗集方法的約簡屬性來簡化樣本的條件屬性，去除其中的冗余信息，

90、可以使神經(jīng)網(wǎng)絡(luò)的訓練樣本數(shù)據(jù)的冗余信息大大減少，只保留得到正確診斷結(jié)果必需的數(shù)據(jù)，這正是神經(jīng)網(wǎng)絡(luò)所要解決的問題，因此有必要將神經(jīng)網(wǎng)絡(luò)和粗集相結(jié)合起來，組成粗集一神經(jīng)網(wǎng)絡(luò)智能混合故障診斷系統(tǒng)，來解決神經(jīng)網(wǎng)絡(luò)訓練樣本量和網(wǎng)絡(luò)結(jié)構(gòu)之間的矛盾。　　粗集理論處理的輸入信息可以是不完整、不精確、不確定的定量數(shù)據(jù)或定性語句，并定義條件屬性和決策屬性的依賴關(guān)系，即輸入空間與輸出空間的映射關(guān)系是通過決策表簡化得到

91、的，通過去除冗余屬性，來實現(xiàn)簡化知識的表達空間維數(shù)。而神經(jīng)網(wǎng)絡(luò)完成輸入空間與輸出空間的映射關(guān)系是通過網(wǎng)絡(luò)結(jié)構(gòu)、不斷學習和調(diào)整，最后，以特定的結(jié)構(gòu)來表達，即沒有顯式函數(shù)表達卻完成了并行處理，同時，具有較好的抑制噪聲干擾的能力和高度的自學習、自組織、容錯性和分布處理能力。　　因此，采用粗集理論方法和神經(jīng)網(wǎng)絡(luò)方法相結(jié)合，利用其各自特點，進行優(yōu)勢互補是非常有意義的。<p&g

92、t;　　分類結(jié)果輸出　　圖 1.2 粗集—神經(jīng)網(wǎng)絡(luò)系統(tǒng)框圖　　Fig. 1.2 Rough sets-neutral network system diagram　　9　　用于加工中心的計算機智能

93、監(jiān)測控制方法研究　　§1-6 本課題研究的意義及內(nèi)容　　1-6-1 本課題的目的和意義　　神經(jīng)網(wǎng)絡(luò)的故障診斷能力的好壞是與它的學習樣本數(shù)量多少成正比關(guān)系的；而神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)復雜程度和訓練時間的多少，和故障樣本的種類和數(shù)量的多少也是成正比關(guān)系的，也就是說診斷能力強，可以適應多故障診斷的神經(jīng)網(wǎng)絡(luò)必然有復雜的

94、網(wǎng)絡(luò)結(jié)構(gòu)，并且需要大量的訓練時間才能使網(wǎng)絡(luò)收斂，甚至不能收斂；這是一個矛盾的問題，一方面希望有大量的故障樣本用于訓練網(wǎng)絡(luò)，使網(wǎng)絡(luò)的診斷能力提高，而另一方面卻要求，神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不要過于復雜，訓練和診斷時間短一些，使網(wǎng)絡(luò)訓練時能夠收斂并且在診斷時能夠快速正確的得到診斷結(jié)果。這是神經(jīng)網(wǎng)絡(luò)進一步實用化需要解決的一個首要問題。如何解決這個矛盾正是本課題的主要研究任務。　　智能混合故障診斷系統(tǒng)是故障診斷領(lǐng)域

95、當今的研究熱點問題，因為故障診斷本身就是一門交叉性很強的學科，不少領(lǐng)域的技術(shù)都可以在其中得以應用；單一的診斷方法難以解決故障診斷中的所有問題，并且每種方法都有自身的優(yōu)缺點，因此有必要將多種方法綜合起來，組成混合診斷系統(tǒng)，實現(xiàn)各方法的優(yōu)勢互補，使故障診斷技術(shù)更加有效實用。如何有效的將各種方法組合起來，實現(xiàn)優(yōu)勢互補是混合系統(tǒng)需要解決的主要問題。將粗集應用在神經(jīng)網(wǎng)絡(luò)的前端，組合成智能混合診斷系統(tǒng)，利用粗集對故障樣本進行簡化處理，降低神經(jīng)網(wǎng)絡(luò)結(jié)

96、構(gòu)的復雜度，使神經(jīng)網(wǎng)絡(luò)能夠進一步實用化是本課題的研究意義所在。　　1-6-2 主要研究內(nèi)容　　論文計劃利用粗集的約簡功能對訓練樣本數(shù)據(jù)進行處理，消除樣本數(shù)據(jù)中冗余信息，使訓練樣本的到簡化，同時也就降低了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的復雜程度，解決了上面所提到的影響神經(jīng)網(wǎng)絡(luò)實用化的矛盾。本論文主要解決以下幾個問題：　　1. 如何將

97、檢測到的連續(xù)數(shù)據(jù)處理成適合粗集理論要求的離散數(shù)據(jù)；　　2. 粗集對決策表實行越簡的方法和算法的實現(xiàn)；　　3. 神經(jīng)網(wǎng)絡(luò)故障診斷系統(tǒng)的程序?qū)崿F(xiàn)；　　4. 粗集—神經(jīng)網(wǎng)絡(luò)智能混合故障診斷系統(tǒng)的構(gòu)成和實現(xiàn)。　　10&

98、lt;p>　　河北工業(yè)大學碩士學位論文　　第二章粗集在故障診斷中的應用　　粗集(RoughSet)理論是 Z.Pawlak 在 20 世紀 80 年代提出的用于分析和處理各種不完備信息，從中發(fā)現(xiàn)規(guī)則，揭示潛在規(guī)律的數(shù)學工具。它最顯著的特點是僅利用數(shù)據(jù)本身提供的信息，而不需要其他任何的先驗知識[20，21]。這一理論的提出，為處理故障診斷樣本數(shù)據(jù)中

99、模糊的和不精確的數(shù)據(jù)以及數(shù)據(jù)中的冗余信息的約簡提供了一條全新的途徑。　　粗集理論處理的輸入信息可以是不完整、不精確、不確定的定量數(shù)據(jù)或定性語句，并定義條件屬性和決策屬性的依賴關(guān)系[22，23]，即輸入空間與輸出空間的映射關(guān)系是通過決策表簡化得到的，通過去除冗余屬性，來實現(xiàn)簡化知識的表達空間維數(shù)。　　粗集理論具有以下特點[24]：&

100、lt;p>　　1. 粗集不需要先驗知識。粗集分析方法僅利用數(shù)據(jù)本身所提供的信息，不需要任何先驗的知識。　　2. 粗集理論是一個強大的分析工具。它能表達和處理冗余信息；能在保留關(guān)鍵信息的前提下對數(shù)據(jù)進行簡化并求得知識的最小表達；能從經(jīng)驗數(shù)據(jù)中獲取易于證實的規(guī)則知識，特別適合智能控制。　　3. 粗集在刻劃不完備信息方面，以不可分辨關(guān)系為基礎(chǔ)，側(cè)重分類。

101、粗集不能清晰定義的原因是缺乏足夠的論域知識，但可以用一對清晰集合逼近。　　目前，利用粗集理論處理的主要問題包括數(shù)據(jù)庫中的數(shù)據(jù)約簡、數(shù)據(jù)相關(guān)性的發(fā)現(xiàn)、數(shù)據(jù)意義的評估、由數(shù)據(jù)產(chǎn)生決策控制算法、數(shù)據(jù)的近似分類、數(shù)據(jù)中的相似性或差異性的發(fā)現(xiàn)、數(shù)據(jù)中范式的發(fā)現(xiàn)以及因果關(guān)系的發(fā)現(xiàn)等。　　粗集經(jīng)過 20 多年的發(fā)展。正日益受到重視且日趨完善。它逐漸成為數(shù)據(jù)挖掘的一種新

102、的工具。　　§2-1 粗集理論的基本概念　　2-1-1 知識與不可辨識關(guān)系　　在基于粗集的知識理論中，知識被認為是一種對對象或現(xiàn)實對象進行分類的能力，也即根據(jù)研究對象的屬性特征對對象論域作出分類處理的能力。因此知識是由對象論域的分類模塊組成的，它提供關(guān)于現(xiàn)實的明顯事實，同時也具有由明顯事實推導出模糊事實

103、的推理能力。假設(shè)給定一對象論域U(Universe)，對于任何子集 X U稱為 U 中的一個概念，U 中的任何概念族稱為關(guān)于 U 的知識。一　　U 上的分類族定義為一個 U 上的知識庫，它表達了一個或一組智能機構(gòu)的各種基本分類方式。知識　　庫可表示為 K= (U， R)，其中 R 為 U 上的一個分類(或稱為等價關(guān)系)，則 U/R 為 R 上的所有等價類

104、　　族[25]。　　識表達系統(tǒng)一般表示為： S U, C, D, V, f 。其中； U 為所有對象的集合，　　x1, x2 ,......, xn ； C 為條件屬性的集合；D 為決策屬性的集合， C D A， A 為屬性集合；&

105、lt;/p>　　Vp ， p A，其中 V 是 p 的值域；f： U Vp 為一單射，使論域 U 中任一元素取屬性 p 在 Vp　　中有唯一確定值。這種知識表達方法實質(zhì)上為決策表形式描述，其中決策表表頭為設(shè)定對象的各類屬性，它的每一行表示論域中的一個成員、實例或稱一條決策規(guī)則，每一列表示屬性及屬性值。如表 2.1 所示的流感信息系統(tǒng)，其條件屬性為{頭痛，肌肉痛，

106、體溫}，決策屬性為{感冒}[26]。　　11　　用于加工中心的計算機智能監(jiān)測控制方法研究　　表 2.1 流感數(shù)據(jù)　　Table 2.1 Influenza data　　不可分辨關(guān)系是粗集理論的

107、基石，揭示了論域中知識的顆粒結(jié)構(gòu)，也是定義其他概念的基礎(chǔ)。其　　概念為：設(shè)有決策系統(tǒng) SU, Cd ， BC 是條件屬性集合的一個子集，稱二元關(guān)系　　IND B, dx, yU U; d xd y 或者 aB, a xa y 為 S 的不可分辨關(guān)系，其中，x，　　y 為 U 中的元素。不可分

108、辨關(guān)系是一個等價關(guān)系，通過一個不可分辨關(guān)系，可以得到?jīng)Q策系統(tǒng)的一個劃分，一般稱劃分后的等價類為不可分辨類，可用 X ind B 來表示包含元素 x 的不可分辨類。　　12　　河北工業(yè)大學碩士學位論文　　是集合 X 的上近似與下近似之差，也就是 U 中即不能肯定歸入集合 X，也

109、不能肯定歸入集合 X 的補集的元素構(gòu)成的集合。如果 RNR X ，則稱集合 X 為可定義集，簡稱精確集；如果　　RNR X，則稱集合 X 為不可定義集，簡稱粗集。X 的不精確性是由邊界的存在引起的。X 的　　2-1-3 知識的等價與推廣　　有兩個知識庫 KU, A 和 K'U, B ，當 ind

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

畢業(yè)論文——用于加工中心的計算機智能監(jiān)測控制方法研究

文檔簡介

溫馨提示

最新文檔

評論

畢業(yè)論文——用于加工中心的計算機智能監(jiān)測控制方法研究

文檔簡介

溫馨提示

最新文檔

評論

免費下載