畢業(yè)論文——用于加工中心的計(jì)算機(jī)智能監(jiān)測(cè)控制方法研究_第1頁(yè)
已閱讀1頁(yè),還剩62頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p><b>  學(xué) 位 論 文</b></p><p>  用于加工中心的計(jì)算機(jī)智能監(jiān)測(cè)</p><p><b>  控制方法研究</b></p><p><b>  答辯委員會(huì)主席:</b></p><p><b>  評(píng)閱人:</b>

2、</p><p> 指導(dǎo)教師姓名: </p><p> 申請(qǐng)學(xué)位級(jí)別: 碩 士學(xué)科、專業(yè)名稱: 精密儀器及機(jī)械</p><p> 論文提交日期: 論文答辯日期:</p><p> 學(xué)位授予單位:河北工業(yè)大學(xué)</p><p>  20XX 年 X 月</p><p>  河北工業(yè)

3、大學(xué)碩士學(xué)位論文</p><p>  用于加工中心的計(jì)算機(jī)智能監(jiān)測(cè)控制方法研究</p><p><b>  摘要</b></p><p>  隨著現(xiàn)代工業(yè)生產(chǎn)自動(dòng)化、連續(xù)化水平的不斷提高,加工中心的占有率也在增大,在生產(chǎn)中已經(jīng)占有重要地位。加工中心在許多企業(yè)中被用于重要的加工環(huán)節(jié),如果出現(xiàn)故障后不能及時(shí)正確地進(jìn)行故障診斷和維修,則會(huì)帶來較大的

4、經(jīng)濟(jì)損失。隨著粗集理論近年來在智能信息處理研究領(lǐng)域獲得了迅速發(fā)展,它基于現(xiàn)實(shí)的大數(shù)據(jù)集,從中推理、發(fā)現(xiàn)知識(shí)和分類系統(tǒng)的某些特點(diǎn),對(duì)于研究不精確知識(shí)的表達(dá)、學(xué)習(xí)、歸納方面有其獨(dú)特之處。</p><p>  本文研究了基于數(shù)據(jù)挖掘的加工中心故障診斷方法,跟以往的故障診斷方法不同,研究的方向并不是基于機(jī)械振動(dòng)分析,而是采用了粗集理論結(jié)合神經(jīng)網(wǎng)絡(luò)的方法。</p><p>  論文研究了粗集對(duì)故障數(shù)

5、據(jù)進(jìn)行約簡(jiǎn)的可行性,并應(yīng)用自組織映射神經(jīng)網(wǎng)絡(luò)的聚類功能,來實(shí)現(xiàn)連續(xù)屬性值離散化的方法;通過對(duì)診斷信息的分析,采取常規(guī)約簡(jiǎn)方法,該方法實(shí)現(xiàn)了樣本條件屬性的約簡(jiǎn),可消除樣本數(shù)據(jù)中的冗余信息。采用 MATLAB 神經(jīng)網(wǎng)絡(luò)工具箱建立了加工中心故障類型的智能混合診斷系統(tǒng);研究了智能混合故障診斷系統(tǒng),并進(jìn)行了功能模塊設(shè)計(jì),各功能模塊分別為:數(shù)據(jù)采集模塊,數(shù)據(jù)預(yù)處理模塊,數(shù)據(jù)約簡(jiǎn)模塊,神經(jīng)網(wǎng)絡(luò)模塊,故障診斷模塊。在此基礎(chǔ)上構(gòu)建了一個(gè)基于粗集—神經(jīng)網(wǎng)絡(luò)

6、的智能混合故障診斷系統(tǒng)。</p><p>  關(guān)鍵詞:粗集,神經(jīng)網(wǎng)絡(luò),故障診斷,虛擬儀器,加工中心</p><p><b>  i</b></p><p>  用于加工中心的計(jì)算機(jī)智能監(jiān)測(cè)控制方法研究</p><p>  RESEARCH ON COMPUTER INTELLIGENT MONITORING AND CO

7、NTROLING USED FOR MACHINING CENTER</p><p><b>  ABSTRACT</b></p><p>  With the development of automation and the high demand of reliableness, Machining Center has got important status

8、 and predomination in manufacturing. Machining Center has grown as key and deciding factor in many plants. Without timely fault diagnosis and service, serious economic loss can be caused. Rough Sets theory has made fast

9、progress in recent years, it has outstanding ability in research of expressing, learning , concluding non-precise knowledge. It is based on practical large data sets, </p><p>  So this paper studies a method

10、 of Machining Center fault diagnosis based on Rough Sets theory,which is one of the latest tools in Data Mining area. Not like the usual methods that based on mechanical vibrancy, this method combines the Rough Sets theo

11、ry with the Artificial Neural Network.</p><p>  The practicality of using rough set to reduce the date was discussed, in this paper, and the interval-valued continuous attribute discretization by applying se

12、lf-organizing map neural network clustering was proposed, too. This article proposes a normal concision 's method, which reduces the example's condition attribute and eliminates the redundant information of the d

13、ate. What's more, it provides the methods used to diagnosis Machining Center's faults based on the intelligence hybrid system by </p><p>  KEY WORDS: rough sets, neutral network, fault diagnosis, vir

14、tual instrument, machining center</p><p><b>  ii</b></p><p>  河北工業(yè)大學(xué)碩士學(xué)位論文</p><p><b>  目 錄</b></p><p><b>  第一章緒 論1</b></p>

15、<p>  §1-1 故障診斷技術(shù)的研究現(xiàn)狀1</p><p>  1-1-1 傳統(tǒng)故障診斷技術(shù)1</p><p>  1-1-2 人工智能故障診斷技術(shù)1</p><p>  1-1-3 數(shù)據(jù)挖掘在故障診斷中的應(yīng)用2</p><p>  §1-2 數(shù)據(jù)挖掘技術(shù)3</p><p>

16、  1-2-1 數(shù)據(jù)挖掘基本知識(shí)3</p><p>  1-2-2 數(shù)據(jù)預(yù)處理4</p><p>  1-2-3 數(shù)據(jù)挖掘分類5</p><p>  §1-3 數(shù)據(jù)挖掘方法和技術(shù)6</p><p>  1-3-1 統(tǒng)計(jì)學(xué)習(xí)方法6</p><p>  1-3-2 機(jī)器學(xué)習(xí)方法7</p>

17、<p>  1-3-3 生物技術(shù)7</p><p>  1-3-4 數(shù)據(jù)挖掘研究中的技術(shù)難題7</p><p>  1-3-5 數(shù)據(jù)挖掘在故障診斷中的應(yīng)用8</p><p>  §1-4 基于粗集的數(shù)據(jù)挖掘8</p><p>  §1-5 粗集和神經(jīng)網(wǎng)絡(luò)結(jié)合的必要性8</p><p

18、>  §1-6 本課題研究的意義及內(nèi)容10</p><p>  1-6-1 本課題的目的和意義10</p><p>  1-6-2 主要研究?jī)?nèi)容10</p><p>  第二章粗集在故障診斷中的應(yīng)用11</p><p>  §2-1 粗集理論的基本概念11</p><p>  2-

19、1-1 知識(shí)與不可辨識(shí)關(guān)系11</p><p>  2-1-2 粗集的上近似、下近似及邊界12</p><p>  2-1-3 知識(shí)的等價(jià)與推廣13</p><p>  2-1-4 知識(shí)的簡(jiǎn)化13</p><p>  2-1-5 屬性的依賴性和重要性13</p><p>  §2-2 連續(xù)數(shù)據(jù)的離散

20、化方法15</p><p>  §2-3 粗集數(shù)據(jù)約簡(jiǎn)方法16</p><p>  2-3-1 決策表16</p><p>  2-3-2 決策表的約簡(jiǎn)17</p><p>  §2-4 本章小結(jié)20</p><p>  第三章人工神經(jīng)網(wǎng)絡(luò)的應(yīng)用21</p><p&

21、gt;  §3-1 人工神經(jīng)網(wǎng)絡(luò)概述21</p><p>  §3-2 神經(jīng)網(wǎng)絡(luò)的特性和學(xué)習(xí)算法21</p><p>  3-2-1 人工神經(jīng)網(wǎng)絡(luò)的基本特性21</p><p>  3-2-2 人工神經(jīng)網(wǎng)絡(luò)的主要學(xué)習(xí)算法22</p><p><b>  iii</b></p>&

22、lt;p>  用于加工中心的計(jì)算機(jī)智能監(jiān)測(cè)控制方法研究</p><p><b>  iv</b></p><p>  河北工業(yè)大學(xué)碩士學(xué)位論文</p><p><b>  第一章緒 論</b></p><p>  §1-1 故障診斷技術(shù)的研究現(xiàn)狀</p><p&

23、gt;  故障診斷是根據(jù)設(shè)備運(yùn)行狀態(tài)信息查找故障源,并確定相應(yīng)決策的一門綜合性的新興科學(xué)。故障診斷技術(shù)進(jìn)入二十世紀(jì)九十年代以來,以前所未有的勢(shì)頭在國(guó)內(nèi)得到了十分迅速的發(fā)展,并在機(jī)械、石化、冶金、電力等行業(yè)得到了十分廣泛的應(yīng)用。隨著現(xiàn)代工業(yè)及科學(xué)技術(shù)的迅速發(fā)展,工程系統(tǒng)日趨復(fù)雜化和自動(dòng)化,一旦系統(tǒng)出現(xiàn)故障不僅造成嚴(yán)重的社會(huì)影響和巨大的經(jīng)濟(jì)損失,而且會(huì)危及人身安全,從這個(gè)意義上說故障診斷可謂任重而道遠(yuǎn)。</p><p&g

24、t;  1-1-1 傳統(tǒng)故障診斷技術(shù)</p><p>  工業(yè)生產(chǎn)、加工過程中的控制對(duì)象常常是復(fù)雜的大系統(tǒng),具有滯后、強(qiáng)耦合、參數(shù)時(shí)變等嚴(yán)重的非線性特征,且其數(shù)學(xué)模型太復(fù)雜、噪音統(tǒng)計(jì)特性不理想,并存在不確定和外部干擾等因素,因而很難得到較準(zhǔn)確的在線狀態(tài)估計(jì)或參數(shù)估計(jì),從而難以生成殘差;然而,任何一種基于模型的故障診斷方法,都要構(gòu)造一個(gè)與故障有關(guān)的殘差,通過對(duì)殘差的分析、評(píng)估,以實(shí)現(xiàn)故障的分離和補(bǔ)償,這使得大多數(shù)基

25、于系統(tǒng)模型的故障檢測(cè)與診斷方法在非線性系統(tǒng)中難以實(shí)現(xiàn),或在簡(jiǎn)化條件下實(shí)現(xiàn)也無法實(shí)際應(yīng)用。</p><p>  以傳感器技術(shù)和動(dòng)態(tài)測(cè)試技術(shù)為基礎(chǔ),以信息處理技術(shù)為手段的現(xiàn)代設(shè)備診斷技術(shù)經(jīng)歷了三十多年的發(fā)展與應(yīng)用,已經(jīng)取得了明顯的經(jīng)濟(jì)效益。但進(jìn)一步的理論研究與應(yīng)用結(jié)果表明,由于各種信息檢測(cè)手段和診斷方法都將診斷對(duì)象看成是一個(gè)有機(jī)的整體,大多是利用診斷對(duì)象所表現(xiàn)出來的特定信號(hào)(特征信號(hào))來診斷特定類型的故障,對(duì)多故障同

26、時(shí)發(fā)生和各種故障之間可能存在的互相聯(lián)系及影響難以分析,并做出相應(yīng)決策[1]。</p><p>  1-1-2 人工智能故障診斷技術(shù)</p><p>  與傳統(tǒng)的基于傳感器技術(shù)和信號(hào)處理技術(shù)的故障診斷相比人工智能故障診斷的優(yōu)越性在于:綜合了多個(gè)專家的最佳經(jīng)驗(yàn),功能水平可以達(dá)到甚至超過專家水平,實(shí)現(xiàn)了人機(jī)聯(lián)合診斷,能夠?qū)Χ喙收稀⒍噙^程和突發(fā)性故障進(jìn)行快速分類診斷[2]。</p>

27、<p>  人工智能故障診斷已經(jīng)在電路與數(shù)字電子設(shè)備、機(jī)電設(shè)備等方面得到了應(yīng)用,但仍存在一些問題 ;領(lǐng)域?qū)<业闹R(shí)主要依靠知識(shí)工程師人工移植,“知識(shí)瓶頸”問題難于解決;只能局限在相當(dāng)窄的領(lǐng)域內(nèi),依靠的主要是淺知識(shí),缺乏常識(shí)即“知識(shí)窄臺(tái)階”問題;推理方式與策略不靈活,缺乏適應(yīng)性,易產(chǎn)生“組合爆炸”、“無窮遞歸”等問題;智能水平低,缺乏自組織、自學(xué)習(xí)、聯(lián)想記憶和類比推理等功能;對(duì)結(jié)構(gòu)性很差的知識(shí)難以表達(dá)和處理;實(shí)時(shí)在線診斷性能差。

28、上述的缺點(diǎn)已經(jīng)使人工智能故障診斷的應(yīng)用和推廣受到了一定程度的限制。</p><p>  常用故障診斷技術(shù)的分類:</p><p>  按故障診斷技術(shù)在各個(gè)不同工程領(lǐng)域中的應(yīng)用,其可按如下方法分類:</p><p>  1. 按診斷環(huán)境分有離線人工分析、診斷和在線計(jì)算機(jī)輔助監(jiān)視診斷,二者要求有很大差別。</p><p><b>  1

29、</b></p><p>  用于加工中心的計(jì)算機(jī)智能監(jiān)測(cè)控制方法研究</p><p>  2. 按監(jiān)測(cè)手段分:</p><p>  (1)振動(dòng)監(jiān)測(cè)診斷法以機(jī)器振動(dòng)作為信息源,在機(jī)器運(yùn)行過程中,通過振動(dòng)參數(shù)的變化特征判別機(jī)器的運(yùn)行狀態(tài)。</p><p>  (2)噪聲檢測(cè)診斷法以機(jī)器運(yùn)行中的噪聲作為信息源,在機(jī)器運(yùn)行過程中,通過噪

30、聲參數(shù)的變化特征判別機(jī)器的運(yùn)行狀態(tài)。其本質(zhì)上與振動(dòng)監(jiān)測(cè)診斷法是一樣的,因?yàn)樵肼曋饕怯烧駝?dòng)產(chǎn)生的。</p><p>  (3)溫度檢測(cè)診斷法以可觀測(cè)的機(jī)械零件的溫度作為信息源,在機(jī)器運(yùn)行過程中,通過溫度參數(shù)的變化特征判別機(jī)器的運(yùn)行狀態(tài)。</p><p>  (4)壓力檢測(cè)診斷法以機(jī)械系統(tǒng)中的氣體、液體的壓力作為信息源,在機(jī)器運(yùn)行過程中,通過壓力參數(shù)的變化特征判別機(jī)器的運(yùn)行狀態(tài)。</p

31、><p>  (5)聲發(fā)射檢測(cè)診斷法金屬零件在磨損、變形、破裂過程中產(chǎn)生彈性波,以此彈性波為信息源,在機(jī)器運(yùn)行過程中,分析彈性波的頻率變化特征判別機(jī)器的運(yùn)行狀態(tài)。</p><p>  (6)潤(rùn)滑油或冷卻液中金屬含量分析診斷法在機(jī)器運(yùn)行過程中,以潤(rùn)滑油或冷卻液中金屬含量的變化,判別機(jī)器的運(yùn)行狀態(tài)。</p><p>  (7)金相分析診斷法某些運(yùn)動(dòng)的零件,通過對(duì)其表面層金屬

32、顯微組織、殘余應(yīng)力、裂紋及物理性質(zhì)進(jìn)行檢查,研究其變化特征,判別機(jī)器設(shè)備存在的故障及形成原因。</p><p>  3. 按診斷方法原理分</p><p>  (1)頻域診斷法應(yīng)用頻譜分析技術(shù),根據(jù)頻譜特征變化,判別機(jī)器的運(yùn)行狀態(tài)及故障形成原因。</p><p>  (2)時(shí)域分析法應(yīng)用時(shí)間序列模型及其有關(guān)的特性函數(shù),判別機(jī)器的工況狀態(tài)的變化。</p>

33、<p>  (3)統(tǒng)計(jì)分析法應(yīng)用概率統(tǒng)計(jì)模型及其有關(guān)的特性函數(shù),實(shí)現(xiàn)工況狀態(tài)監(jiān)視與故障診斷。</p><p>  (4)信息理論分析法應(yīng)用信息理論建立的某些特征函數(shù),在機(jī)器運(yùn)行過程中的變化進(jìn)行工況狀態(tài)分析和故障診斷。</p><p>  (5)模式識(shí)別法利用檢測(cè)信號(hào),提取對(duì)工況狀態(tài)反應(yīng)敏感的特征量構(gòu)成模式矢量,設(shè)計(jì)合適的分類器,判別工況狀態(tài),它是人工智能的技術(shù)之一。</p

34、><p>  (6)專家系統(tǒng),專家系統(tǒng)是一個(gè)人工智能計(jì)算機(jī)程序,它利用知識(shí)和推理過程來解決那些需要大量的人類專家知識(shí)才能解決的復(fù)雜問題,所用的知識(shí)和推理過程可認(rèn)為是最好的領(lǐng)域?qū)<业膶iT知識(shí)的模型。以此為基礎(chǔ),可把數(shù)控機(jī)床故障診斷專家系統(tǒng)定義為:能以人類專家水平進(jìn)行數(shù)控機(jī)床故障診斷的計(jì)算機(jī)程序。</p><p>  (7)人工神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是在生物神經(jīng)研究成果的基礎(chǔ)上提出的人工智能概念,是對(duì)人

35、腦神經(jīng)組織結(jié)構(gòu)和行為的模擬。它以神經(jīng)元為信息處理的基本單元,以神經(jīng)元間的連接弧為信息傳遞通道,多個(gè)神經(jīng)元聯(lián)接而成的網(wǎng)絡(luò)結(jié)構(gòu),具有知識(shí)的分布式存儲(chǔ)和并行處理等特點(diǎn)。</p><p>  1-1-3 數(shù)據(jù)挖掘在故障診斷中的應(yīng)用</p><p>  數(shù)據(jù)挖掘技術(shù)是隨著人工智能技術(shù)和數(shù)據(jù)庫(kù)技術(shù)的發(fā)展而興起的,能從大量數(shù)據(jù)中挖掘和發(fā)現(xiàn)有價(jià)值的、隱含的知識(shí)。目前數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)己經(jīng)被廣泛應(yīng)用于市場(chǎng)營(yíng)

36、銷、銀行業(yè)、電信業(yè)、制造業(yè)、保險(xiǎn)業(yè)醫(yī)藥業(yè)等各個(gè)領(lǐng)域。隨著信息技術(shù)的進(jìn)步以及計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,故障診斷中采集的數(shù)據(jù)(包括統(tǒng)計(jì)數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù))可以方便地被收集和存儲(chǔ)在各種數(shù)據(jù)庫(kù)中。采用傳統(tǒng)的數(shù)據(jù)分析方法對(duì)這些巨量的數(shù)據(jù)進(jìn)行分析和處理,不僅耗時(shí)而且難以有效地挖掘和發(fā)現(xiàn)數(shù)據(jù)中隱含的知識(shí)。另一方面,盡管專家系統(tǒng)、智能診斷等方法在故障診斷中得到了廣泛的應(yīng)用,但專家系統(tǒng)的知識(shí)瓶頸以及智能診斷方法所帶來的診斷推理過程解釋困難等問題仍未得到很好

37、的解決。因而數(shù)據(jù)挖掘技術(shù)能有效地應(yīng)用于故障診斷中,并且能克服以往存在的知識(shí)獲取瓶頸。因此,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于故障診斷中是必要的,也是可行的[3]。</p><p><b>  2</b></p><p>  河北工業(yè)大學(xué)碩士學(xué)位論文</p><p>  §1-2 數(shù)據(jù)挖掘技術(shù)</p><p>  早在 20

38、世紀(jì) 80 年代,人們?cè)凇拔锔?jìng)天擇,適者生存”的大原則下,就認(rèn)識(shí)到“誰最先從外部世界獲得有用信息并加以利用,誰就可能成為贏家”。因此,如何對(duì)數(shù)據(jù)與信息快速有效地進(jìn)行分析、加工、提煉以獲取所需知識(shí),就成為計(jì)算機(jī)及信息技術(shù)領(lǐng)域的重要研究課題。而計(jì)算機(jī)及信息技術(shù)發(fā)展的歷史,也就是數(shù)據(jù)和信息加工手段不斷更新和改善的歷史。</p><p>  隨著數(shù)據(jù)庫(kù)技術(shù)與應(yīng)用的日益普及,人們面臨著快速擴(kuò)張的數(shù)據(jù)海洋,如何有效利用豐富的

39、數(shù)據(jù)海洋所蘊(yùn)含的寶藏為人類服務(wù),人們所依賴的數(shù)據(jù)分析工具卻無法有效地為決策者提供其決策支持所需要的相關(guān)知識(shí),從而形成了一種“豐富的數(shù)據(jù),貧乏的知識(shí)”之獨(dú)特的現(xiàn)象。為有效解決這一問題,數(shù)據(jù)挖掘技術(shù)逐步發(fā)展起來,其迅速發(fā)展得益于目前全世界所擁有的巨大數(shù)據(jù)資源,以及對(duì)將這些數(shù)據(jù)資源轉(zhuǎn)換為信息和知識(shí)資源的巨大需求。</p><p>  1-2-1 數(shù)據(jù)挖掘基本知識(shí)</p><p>  數(shù)據(jù)挖掘(D

40、ata Mining,簡(jiǎn)稱 DM)是從數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)(Knowledge Discovery from Database,簡(jiǎn)稱 KDD)的一個(gè)重要組成步驟,它是一個(gè)從大量數(shù)據(jù)中抽取挖掘出未知的、有價(jià)值的模式或規(guī)律等知識(shí)的復(fù)雜過程[4],如圖 1.1 所示:</p><p>  整個(gè)知識(shí)挖掘過程是由若干挖掘步驟組成,而 DM 僅是其中的一個(gè)主要步驟。整個(gè)知識(shí)挖掘的主要步驟有:</p><p&g

41、t;  數(shù)據(jù)清洗:其作用就是清除數(shù)據(jù)噪聲和與挖掘主題明顯無關(guān)的數(shù)據(jù):</p><p>  數(shù)據(jù)集成:其作用是將來自多數(shù)據(jù)源中的相關(guān)數(shù)據(jù)組合到一起;</p><p>  數(shù)據(jù)轉(zhuǎn)換:其作用是將數(shù)據(jù)轉(zhuǎn)換為易于進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)存儲(chǔ)形式;</p><p>  數(shù)據(jù)挖掘:它是知識(shí)挖掘的一個(gè)基本步驟,其作用就是利用智能方法挖掘數(shù)據(jù)模式或規(guī)律知識(shí);模式評(píng)估:其作用就是根據(jù)一定評(píng)估

42、標(biāo)準(zhǔn)從挖掘結(jié)果篩選出有意義的模式知識(shí);</p><p>  知識(shí)表示:其作用就是利用可視化和知識(shí)表達(dá)技術(shù),向用戶展示所挖掘出的相關(guān)知識(shí)。</p><p>  圖 1.1 知識(shí)挖掘全過程示意描述</p><p>  Fig. 1.1 Data mining described in the whole course</p><p><b&

43、gt;  3</b></p><p>  用于加工中心的計(jì)算機(jī)智能監(jiān)測(cè)控制方法研究</p><p>  盡管 DM 僅僅是整個(gè)知識(shí)挖掘過程中的一個(gè)重要步驟,但在工業(yè)、媒體、數(shù)據(jù)庫(kù)研究領(lǐng)域中,“數(shù)據(jù)挖掘”一詞己被廣泛使用和普遍接受,不加區(qū)分地表示整個(gè)知識(shí)挖掘過程。DM 就是利用機(jī)器學(xué)習(xí)的方法從數(shù)據(jù)庫(kù)中提取有價(jià)值知識(shí)的過程,它是數(shù)據(jù)庫(kù)技術(shù)和機(jī)器學(xué)習(xí)兩個(gè)學(xué)科的交叉領(lǐng)域。數(shù)據(jù)庫(kù)技術(shù)側(cè)重

44、于對(duì)數(shù)據(jù)存儲(chǔ)處理的高效率方法的研究,而機(jī)器學(xué)習(xí)則側(cè)重于設(shè)計(jì)新的方法從數(shù)據(jù)中提取知識(shí)。同時(shí),DM 與其他學(xué)科也有很強(qiáng)的聯(lián)系,如統(tǒng)計(jì)學(xué)、數(shù)學(xué)和可視化技術(shù)等。另外,在 KDD 過程中要特別注意的是,數(shù)據(jù)挖掘質(zhì)量的好壞有兩個(gè)影響要素:一是所采用的數(shù)據(jù)挖掘技術(shù)的有效性,二是用于采掘的數(shù)據(jù)的質(zhì)量和數(shù)量。如果選擇了錯(cuò)誤的數(shù)據(jù)或不適當(dāng)?shù)膶傩?,或?qū)?shù)據(jù)進(jìn)行了不適當(dāng)?shù)淖儞Q,則采掘的結(jié)果是不會(huì)好的[5]。</p><p>  1-2-

45、2 數(shù)據(jù)預(yù)處理</p><p>  由于數(shù)據(jù)庫(kù)系統(tǒng)所獲數(shù)據(jù)量的迅速膨脹,導(dǎo)致了現(xiàn)實(shí)世界數(shù)據(jù)庫(kù)中常常包含許多含有噪聲、不完整、甚至是不一致的數(shù)據(jù)。顯然,對(duì)數(shù)據(jù)挖掘所涉及的數(shù)據(jù)對(duì)象必須進(jìn)行預(yù)處理,以提高數(shù)據(jù)挖掘?qū)ο蟮馁|(zhì)量,并最終達(dá)到提高數(shù)據(jù)挖掘所獲模式知識(shí)質(zhì)量的目的。</p><p>  1. 數(shù)據(jù)預(yù)處理的基本內(nèi)容</p><p>  數(shù)據(jù)預(yù)處理主要包括:數(shù)據(jù)清洗、數(shù)據(jù)

46、集成、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)消減。數(shù)據(jù)清洗是指消除數(shù)據(jù)中所存在的噪聲以及糾正其不一致的錯(cuò)誤:數(shù)據(jù)集成則是指將來自多個(gè)數(shù)據(jù)源的數(shù)據(jù)合并到一起構(gòu)成一個(gè)完整的數(shù)據(jù)集:數(shù)據(jù)轉(zhuǎn)換是指將一種格式的數(shù)據(jù)轉(zhuǎn)換為另一種格式的數(shù)據(jù);最后數(shù)據(jù)消減是指通過刪除冗余特征或聚類消除多余數(shù)據(jù)。</p><p>  數(shù)據(jù)清洗通常包括:添補(bǔ)遺漏數(shù)據(jù)、平滑噪聲數(shù)據(jù)、識(shí)別或去除異常值,以及解決不一致問題。有問題的數(shù)據(jù)將會(huì)誤導(dǎo)數(shù)據(jù)挖掘的搜索過程。盡管大多數(shù)數(shù)據(jù)

47、挖掘過程包含有對(duì)不完全或噪聲數(shù)據(jù)的處理,但它們并不魯棒且常常將處理重點(diǎn)放在如何避免挖掘出的模式對(duì)數(shù)據(jù)過分逼近的描述上。</p><p>  數(shù)據(jù)集成是將來自多個(gè)數(shù)據(jù)源的數(shù)據(jù)合并到一起。由于描述同一個(gè)概念的屬性在不同數(shù)據(jù)庫(kù)取不同的名字,在進(jìn)行數(shù)據(jù)集成時(shí)常常會(huì)引起數(shù)據(jù)的不一致或冗余。因此在完成數(shù)據(jù)集成之后,有時(shí)需要進(jìn)行數(shù)據(jù)清洗以便消除可能存在的數(shù)據(jù)冗余[6]。</p><p>  數(shù)據(jù)轉(zhuǎn)換主要

48、是將數(shù)據(jù)轉(zhuǎn)換以構(gòu)成一個(gè)適合數(shù)據(jù)挖掘的描述形式。數(shù)據(jù)轉(zhuǎn)換包含以下處理內(nèi)容:平滑、合計(jì)、泛化、規(guī)格化以及屬性構(gòu)造。平滑是一種數(shù)據(jù)清洗方法,合計(jì)和泛化也可以作為數(shù)據(jù)消減的方法。對(duì)于使用基于對(duì)象距離的挖掘算法,必須進(jìn)行數(shù)據(jù)規(guī)格化,將其收縮至特定的范圍內(nèi)。</p><p>  數(shù)據(jù)消減的目的就是縮小所挖掘數(shù)據(jù)的規(guī)模,但卻不會(huì)或基本不影響最終的挖掘結(jié)果。數(shù)據(jù)消減的主要策略有以下幾種:數(shù)據(jù)立方合計(jì)、維數(shù)消減、數(shù)據(jù)壓縮、數(shù)據(jù)塊消

49、減以及離散化與概念層次生成等。數(shù)據(jù)消減所花費(fèi)的時(shí)間不應(yīng)該超過由于數(shù)據(jù)消減而節(jié)約的數(shù)據(jù)挖掘時(shí)間。</p><p>  以上所提及的各種數(shù)據(jù)預(yù)處理方法,并不是相互獨(dú)立的,而是相互關(guān)聯(lián)的。如:消除數(shù)據(jù)冗余即可以看成是一種形式的數(shù)據(jù)清洗,又可以認(rèn)為是一種數(shù)據(jù)消減。由于現(xiàn)實(shí)世界數(shù)據(jù)常常是含有噪聲、不完全和不一致的,數(shù)據(jù)預(yù)處理能夠幫助改善數(shù)據(jù)的質(zhì)量,進(jìn)而幫助提高數(shù)據(jù)挖掘進(jìn)程的有效性和準(zhǔn)確性。高質(zhì)量的決策來自高質(zhì)量的數(shù)據(jù),因此

50、數(shù)據(jù)預(yù)處理是整個(gè)數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)過程中的一個(gè)重要步驟。</p><p><b>  2. 數(shù)據(jù)離散化</b></p><p>  數(shù)據(jù)離散化是數(shù)據(jù)預(yù)處理中的一個(gè)重要部分,它是一種數(shù)據(jù)消減方式。所謂離散化就是利用取值范圍或更高層次概念來替換初始數(shù)據(jù),將連續(xù)取值屬性的域值范圍分為若干區(qū)間,幫助消減連續(xù)取值屬性的取值個(gè)數(shù),對(duì)于諸如粗集、決策樹這種主要是用來學(xué)習(xí)以離散型變量

51、作為屬性類型的學(xué)習(xí)方法,連續(xù)性變量必須被離散化才能夠被學(xué)習(xí)[7]。</p><p>  從本質(zhì)上來看,連續(xù)屬性的離散化過程就是用一定的閾值對(duì)屬性空間進(jìn)行劃分的過程。為了提高機(jī)器學(xué)習(xí)算法的聚類能力和識(shí)別能力,離散化過程要求在保證離散化結(jié)果性能的前提下防止對(duì)屬性空間的過分細(xì)化,用盡可能少的斷點(diǎn)將屬性空間劃分成盡可能少的子空間。</p><p>  有效的離散化會(huì)顯著地提高系統(tǒng)的聚類能力,增強(qiáng)系

52、統(tǒng)對(duì)輸入的待識(shí)別樣本中數(shù)據(jù)噪音的魯棒性。</p><p><b>  4</b></p><p>  河北工業(yè)大學(xué)碩士學(xué)位論文</p><p>  離散化結(jié)果將會(huì)減小系統(tǒng)對(duì)存儲(chǔ)空間的實(shí)際需求,加快數(shù)據(jù)挖掘算法的運(yùn)行速度,減小計(jì)算過程的空間開銷。此外,若離散化過程將某一連續(xù)屬性的所有屬性值均映射到同一結(jié)果,則該屬性存在與否都不會(huì)影響系統(tǒng)對(duì)樣本的分

53、辨能力,因而它可以被刪除。從這一角度來說,離散化過程同時(shí)也是屬性簡(jiǎn)約的過程。</p><p>  有許多學(xué)者提出各種離散化方法,其中較為常用的有:人工劃分方法,Bin 方法(包括等距離和等頻率離散化)、基于信息嫡的離散化、布爾推理離散化,Kohonen 網(wǎng)絡(luò)離散化、自然/半自然離散算法以及統(tǒng)計(jì)檢驗(yàn)方法。</p><p>  1-2-3 數(shù)據(jù)挖掘分類</p><p>

54、  利用數(shù)據(jù)挖掘技術(shù)可以幫助獲得決策所需的多種知識(shí)。在許多情況下,用戶并不知道數(shù)據(jù)存在哪些有價(jià)值的信息知識(shí),因此對(duì)于一個(gè)數(shù)據(jù)挖掘系統(tǒng)而言,應(yīng)該能夠同時(shí)搜索發(fā)現(xiàn)多種模式的知識(shí)以滿足用戶的期望和實(shí)際需要;還應(yīng)該能夠挖掘出多種層次的模式知識(shí);還應(yīng)允許用戶來指導(dǎo)挖掘搜索有價(jià)值的模式知識(shí)。</p><p>  數(shù)據(jù)挖掘是一個(gè)多學(xué)科交叉領(lǐng)域,這些交叉學(xué)科包括:數(shù)據(jù)庫(kù)系統(tǒng),機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、可視化和信息科學(xué)。此外,因數(shù)據(jù)挖掘任

55、務(wù)不同,數(shù)據(jù)挖掘系統(tǒng)也可能采用其他學(xué)科的一些技術(shù)方法,如神經(jīng)網(wǎng)絡(luò)、模糊邏輯,Rough 集、知識(shí)表示、推理邏輯編程或高性能計(jì)算等。根據(jù)所挖掘的數(shù)據(jù)或挖掘應(yīng)用背景,數(shù)據(jù)挖掘系統(tǒng)還可能集成其他領(lǐng)域的一些技術(shù)方法,其中包括:空間數(shù)據(jù)分析、信息檢索、模式識(shí)別、圖像分析、信號(hào)處理、計(jì)算機(jī)圖形學(xué)、互聯(lián)網(wǎng)技術(shù)、經(jīng)濟(jì)學(xué)、心理學(xué)等。正因?yàn)閿?shù)據(jù)挖掘技術(shù)方法的多樣性,也就導(dǎo)致了數(shù)據(jù)挖掘系統(tǒng)的多樣性。而對(duì)于數(shù)據(jù)挖掘系統(tǒng)分類也有多種方式??梢愿鶕?jù)所挖掘的數(shù)據(jù)庫(kù)進(jìn)

56、行分類,如按照數(shù)據(jù)類型或數(shù)據(jù)模型進(jìn)行分類;還可以根據(jù)所使用的技術(shù)進(jìn)行分類,按照用戶交互程度或所使用的數(shù)據(jù)分析方法進(jìn)行分類。這里按照所挖掘的知識(shí)類型對(duì)數(shù)據(jù)挖掘系統(tǒng)進(jìn)行分類。因此可以根據(jù)概念描述知識(shí)、對(duì)比概念描述知識(shí)、關(guān)聯(lián)知識(shí)、分類知識(shí)、聚類知識(shí)等進(jìn)行劃分。</p><p><b>  1. 概念描述</b></p><p>  用戶常常需要抽象的有意義的描述。經(jīng)過歸納的

57、抽象描述能概括大量的關(guān)于類的信息。有兩種典型的描述:特征描述和判別描述。特征描述是從與學(xué)習(xí)任務(wù)相關(guān)的一組數(shù)據(jù)中提取出關(guān)于這些數(shù)據(jù)的特征式,這些特征式表達(dá)了該數(shù)據(jù)集的總體特征;而判別描述則描述了兩個(gè)或更多個(gè)類之間有何差異</p><p><b>  [8]。</b></p><p><b>  2. 關(guān)聯(lián)分析</b></p><

58、p>  關(guān)聯(lián)分析的目的是發(fā)現(xiàn)特征之間或數(shù)據(jù)之間的相互依賴關(guān)系。數(shù)據(jù)相關(guān)性關(guān)系代表一類重要的可發(fā)現(xiàn)的知識(shí)。一個(gè)依賴關(guān)系存在于兩個(gè)元素之間。如果從一個(gè)元素 A 的值可以推出另一個(gè)元素 B 的值 ,則稱 B 依賴于 A。這里所謂元素可以是字段,也可以是字段間的關(guān)系。若兩個(gè)或多個(gè)數(shù)據(jù)項(xiàng)的取值之間重復(fù)出現(xiàn)且概率很高時(shí),它就存在某種關(guān)聯(lián),可以建立起這些數(shù)據(jù)項(xiàng)的關(guān)聯(lián)規(guī)則[9]。</p><p>  關(guān)聯(lián)分析的結(jié)果有時(shí)可以

59、直接提供給最終用戶。然而,通常強(qiáng)的關(guān)聯(lián)關(guān)系反映的是固有的領(lǐng)域結(jié)構(gòu)而不是什么新的或有興趣的事物。關(guān)聯(lián)知識(shí)可被其他模式抽取算法使用。常用技術(shù)有回歸分析、機(jī)器學(xué)習(xí),、信念網(wǎng)絡(luò)等。結(jié)合領(lǐng)域知識(shí)或通過進(jìn)一步分析,可將關(guān)聯(lián)規(guī)則直接用于分類與預(yù)測(cè)。</p><p><b>  3. 分類與預(yù)測(cè)</b></p><p>  分類是數(shù)據(jù)挖掘中一項(xiàng)非常重要的任務(wù),其目的是提出一個(gè)分類函數(shù)

60、或分類模型(也常常稱作分類器),該模型能把數(shù)據(jù)庫(kù)中的數(shù)據(jù)項(xiàng)映射到給定類別中的某一個(gè)。一般使用分類來表示對(duì)有限離散屬性值的預(yù)測(cè),而預(yù)測(cè)表示對(duì)連續(xù)屬性值的預(yù)測(cè)。</p><p>  分類器的構(gòu)造方法有統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、仿生學(xué)方法等。統(tǒng)計(jì)方法包括貝葉斯法和諸如近鄰學(xué)習(xí)、基于范例的學(xué)習(xí)等非參數(shù)法,對(duì)應(yīng)的知識(shí)表示則為判別函數(shù)和原型事例。機(jī)器學(xué)習(xí)方法包括決策樹法和規(guī)則歸納法,前者對(duì)應(yīng)的表示為決策樹或判別樹,后者則一般為

61、產(chǎn)生式規(guī)則。粗集方法的知識(shí)表示即為產(chǎn)生式規(guī)則,仿生學(xué)方法包括神經(jīng)網(wǎng)絡(luò)方法和遺傳算法。神經(jīng)網(wǎng)絡(luò)方法主要是 BP 算法,</p><p><b>  5</b></p><p>  用于加工中心的計(jì)算機(jī)智能監(jiān)測(cè)控制方法研究</p><p>  它的模型表示是前向反饋神經(jīng)網(wǎng)絡(luò)模型,其本質(zhì)上是一種非線性判別函數(shù)[10]。</p><

62、p><b>  4. 聚類分析</b></p><p>  聚類分析與分類預(yù)測(cè)方法明顯不同之處在于,后者所學(xué)習(xí)獲取分類預(yù)測(cè)模型所使用的數(shù)據(jù)是己知類別歸屬,屬于有教師監(jiān)督學(xué)習(xí)方法,而聚類分析所分析處理的數(shù)據(jù)均是無事先確定的類別歸屬,屬于無教師監(jiān)督學(xué)習(xí)方法。</p><p>  聚類分析以“各聚集內(nèi)部數(shù)據(jù)對(duì)象間的相似度最大化和各聚集對(duì)象間相似度最小化”作為基本的分析

63、原則,同樣包括統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法和神經(jīng)網(wǎng)絡(luò)方法。統(tǒng)計(jì)方法主要研究基于幾何距離的聚類,如歐式距離、海明距離等,是一種基于全局比較的聚類,需要考察所有個(gè)體才能決定類的劃分?;谏窠?jīng)網(wǎng)絡(luò)的聚類主要是自組織特征映射方法,如 AttT 模型、Kohonen 模型等,當(dāng)給定距離閾值后 ,各樣本按域值進(jìn)行聚類。而在機(jī)器學(xué)習(xí)領(lǐng)域,距離是根據(jù)概念的描述來確定的,概念聚類方法首先發(fā)現(xiàn)適當(dāng)?shù)念?,然后再根?jù)每個(gè)類形成相應(yīng)的特征描述[11]。</p&g

64、t;<p>  5. 數(shù)據(jù)挖掘結(jié)果的評(píng)估</p><p>  一個(gè)數(shù)據(jù)挖掘系統(tǒng)在完成一個(gè)挖掘算法之后,常常會(huì)獲得成千上萬的模式或規(guī)則。在這些規(guī)則中,只會(huì)有一小部分是有實(shí)際應(yīng)用價(jià)值的。需要對(duì)數(shù)據(jù)挖掘步驟所獲得的挖掘結(jié)果進(jìn)行有效的評(píng)估,以便最終能夠獲得有實(shí)際應(yīng)用價(jià)值的模式或規(guī)則知識(shí)。這就給數(shù)據(jù)挖掘提出許多需要解決的問題。</p><p>  首先,使一個(gè)模式有價(jià)值的因素是什么?對(duì)

65、于該問題,評(píng)估一個(gè)模式是否有意義通常依據(jù)以下四條標(biāo)準(zhǔn):易于用戶理解;對(duì)新數(shù)據(jù)或測(cè)試數(shù)據(jù)能夠確定有效程度;具有潛在價(jià)值;新奇的。此外,還有一些評(píng)價(jià)模式價(jià)值的客觀標(biāo)準(zhǔn),這些標(biāo)準(zhǔn)是基于所挖掘出模式的結(jié)構(gòu)或統(tǒng)計(jì)特征。另外,結(jié)合一些主觀評(píng)價(jià)措施可有效反映用戶的需求和興趣。許多根據(jù)客觀評(píng)價(jià)標(biāo)準(zhǔn)是有價(jià)值的模式知識(shí)卻只是普通的常識(shí)知識(shí),而主觀評(píng)價(jià)標(biāo)準(zhǔn)是建立在用戶對(duì)數(shù)據(jù)的信念基礎(chǔ)上的,這些評(píng)估標(biāo)準(zhǔn)基于所發(fā)現(xiàn)模式是否是意外的或與用戶信念相悖的,或能夠提供決

66、策支持而確定的。而意料之中的模式是有價(jià)值的則是指它能夠幫助確認(rèn)用戶想要認(rèn)可的一個(gè)假設(shè)[5]。</p><p>  其次,一個(gè)數(shù)據(jù)挖掘算法能否產(chǎn)生所有有價(jià)值的模式?這個(gè)問題是指數(shù)據(jù)挖掘算法的完全性。期望數(shù)據(jù)挖掘算法能夠產(chǎn)生所有可能模式是不現(xiàn)實(shí)的,實(shí)際上一個(gè)模式搜索方法可以利用有趣性評(píng)價(jià)標(biāo)準(zhǔn)來幫助縮小模式的搜索范圍。因此通常只需要保證挖掘算法的完全性就可以了。評(píng)估所挖掘模式的趣味性標(biāo)準(zhǔn)對(duì)于有效挖掘出具有應(yīng)用價(jià)值的模式

67、知識(shí)是十分重要的。這些標(biāo)準(zhǔn)可以直接幫助指導(dǎo)挖掘算法及時(shí)消除無前途的搜索路徑,獲取有實(shí)際應(yīng)用價(jià)值的模式知識(shí),有效摒棄無意義的模式,提高挖掘的有效性。</p><p>  另外,一個(gè)數(shù)據(jù)挖掘算法能否只產(chǎn)生有價(jià)值的模式?這是數(shù)據(jù)挖掘算法的一個(gè)最優(yōu)化問題。一般當(dāng)然希望數(shù)據(jù)挖掘算法僅挖掘有價(jià)值的模式,但這是一個(gè)較為棘手的最優(yōu)化高效搜索問題,至今尚未有好的辦法。</p><p>  §1-3

68、 數(shù)據(jù)挖掘方法和技術(shù)</p><p>  現(xiàn)有的多種數(shù)據(jù)分析方法從總體上均可歸類到統(tǒng)計(jì)學(xué)習(xí)方法、機(jī)器學(xué)習(xí)方法以及仿生物學(xué)方法這三大類中的某一種,在應(yīng)用上這些方法各有利弊,需要針對(duì)具體挖掘問題選擇合適的技術(shù)。對(duì)于復(fù)雜的數(shù)據(jù)挖掘系統(tǒng),還常常采用多種數(shù)據(jù)挖掘技術(shù)或整合多種數(shù)據(jù)挖掘技術(shù)以彌補(bǔ)不同數(shù)據(jù)挖掘技術(shù)所存在的不足。</p><p>  1-3-1 統(tǒng)計(jì)學(xué)習(xí)方法</p><

69、p>  數(shù)據(jù)處理的最初階段就是用人工方法進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)學(xué)習(xí)方法在數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用可謂歷史悠久。統(tǒng)計(jì)方法是從事物的外在數(shù)量的表現(xiàn)去推斷該事物可能的規(guī)律性。</p><p>  傳統(tǒng)的統(tǒng)計(jì)方法在解決機(jī)器學(xué)習(xí)問題中起著基礎(chǔ)性的作用,主要研究漸近理論,即當(dāng)樣本趨向于</p><p><b>  6</b></p><p>  河北工業(yè)大學(xué)碩

70、士學(xué)位論文</p><p>  無窮多時(shí)的統(tǒng)計(jì)性質(zhì)。它依賴于顯示的基本概率模型,常見的方法有回歸分析、聚類分析、主元分析以及相關(guān)分析等。</p><p>  在傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí)方法基礎(chǔ)上,已經(jīng)形成多種新型的數(shù)據(jù)分析方法,如基于范例的推理方法直接使用過去的經(jīng)驗(yàn)或解法來求解給定的問題。范例推理檢索范例庫(kù),尋找相似范例,并將待解問題添加進(jìn)范例庫(kù)以便將來參考。Naive 貝葉斯和貝葉斯網(wǎng)絡(luò)這兩種貝葉

71、斯統(tǒng)計(jì)分析方法能夠?qū)崿F(xiàn)預(yù)測(cè)、分類等數(shù)據(jù)挖掘任務(wù)。新興的支持向量機(jī)技術(shù)則是建立在計(jì)算學(xué)習(xí)理淪的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則之上,主要針對(duì)兩類分類問題在高維空間中尋找一個(gè)超平面作為兩類的分割,以保證最小分類錯(cuò)誤率,其重要優(yōu)勢(shì)在于可處理線性不可分情況[12]。</p><p>  1-3-2 機(jī)器學(xué)習(xí)方法</p><p>  機(jī)器學(xué)習(xí)方法是目前研究的重點(diǎn),研究成果較多。從采用的技術(shù)上看,可分為兩大類:基于

72、決策樹的技術(shù)和基于決策規(guī)則的方法[13]。</p><p>  基于決策樹的技術(shù)以信息論的原理為基礎(chǔ)建立決策樹,最后獲得的知識(shí)表示形式是決策樹,最為著名的方法就是 Quinlan 開發(fā)的 ID3 方法,利用信息增益尋找數(shù)據(jù)庫(kù)中具有最大信息量的字段建立決策樹的節(jié)點(diǎn),再根據(jù)字段的不同取值建立樹的分支,由每個(gè)分支的數(shù)據(jù)子集重復(fù)建樹的下層節(jié)點(diǎn)和分支的過程,這樣就建立了決策樹。另外,還有一些決策樹方法,如 Assistan

73、t Professional。 IDL 以及 PRISM 等。</p><p>  基于決策規(guī)則的方法又可細(xì)分為兩類,一種是在決策樹基礎(chǔ)上加入規(guī)則求取步驟獲得決策規(guī)則的方法,如 CN2 方法、C4.5 方法、AQIS 及其系列版本等;另外一種則是直接具有規(guī)則求取能力的方法 ,</p><p>  Rough 集、Fuzzy 集。</p><p>  1-3-3 生物

74、技術(shù)</p><p>  仿生物技術(shù)典型的方法是神經(jīng)網(wǎng)絡(luò)方法和遺傳算法,這兩種方法己經(jīng)形成了獨(dú)立的研究體系,在數(shù)據(jù)挖掘中發(fā)揮著巨大作用。</p><p>  神經(jīng)網(wǎng)絡(luò)模擬人腦神經(jīng)元結(jié)構(gòu),以 MP 和 Hebb 學(xué)習(xí)規(guī)則為基礎(chǔ),建立了前饋式網(wǎng)絡(luò)、反饋式網(wǎng)絡(luò)和自組織網(wǎng)絡(luò)。前饋式網(wǎng)絡(luò)可用于預(yù)測(cè)及模式識(shí)別,反饋式網(wǎng)絡(luò)擅長(zhǎng)聯(lián)想記憶和優(yōu)化計(jì)算,而自組織網(wǎng)絡(luò)極適用于聚類研究[16]。</p>

75、<p>  遺傳算法是按照自然進(jìn)化原理提出的一種優(yōu)化策略。在求解過程中,通過最好解的選擇和彼此組合,可以期望解的集合將會(huì)越來越好。在數(shù)據(jù)挖掘中,遺傳算法能夠用來形成變量間依賴關(guān)系假設(shè)。</p><p>  1-3-4 數(shù)據(jù)挖掘研究中的技術(shù)難題</p><p>  在數(shù)據(jù)挖掘研究和開發(fā)已取得令人矚目的進(jìn)展的同時(shí),許多尚待解決和完善的課題也擺在了研究者面前。</p>

76、<p>  涉及數(shù)據(jù)的問題包括噪聲數(shù)據(jù)、缺失數(shù)據(jù)、冗余數(shù)據(jù)、海量數(shù)據(jù)以及動(dòng)態(tài)數(shù)據(jù)等。噪聲數(shù)據(jù)的屬性值是不精確或錯(cuò)誤的,從而會(huì)影響抽取的模式的準(zhǔn)確性,造成最終結(jié)果的不確定性。缺失值現(xiàn)象尤其在關(guān)系數(shù)據(jù)庫(kù)中經(jīng)常發(fā)生,這種情況給發(fā)現(xiàn)、評(píng)估和解釋模式帶來了困難,要求知識(shí)發(fā)現(xiàn)模型應(yīng)當(dāng)具有近似決策能力。而與不完整數(shù)據(jù)相反,給定的數(shù)據(jù)集中可能含有冗余的或者不重要的屬性或?qū)ο?,從而增加時(shí)間空間開銷和結(jié)果規(guī)則的復(fù)雜度。數(shù)據(jù)庫(kù)中數(shù)據(jù)量的迅速增長(zhǎng),

77、是促進(jìn)數(shù)據(jù)挖掘技術(shù)發(fā)展的原因之一,也是數(shù)據(jù)挖掘技術(shù)首先要解決的問題。數(shù)據(jù)庫(kù)的基本特點(diǎn)是庫(kù)中的內(nèi)容是動(dòng)態(tài)改變的,所以知識(shí)發(fā)現(xiàn)方法應(yīng)當(dāng)具有增量式學(xué)習(xí)的能力。</p><p>  為了能夠有效的從數(shù)據(jù)庫(kù)大量的數(shù)據(jù)中抽取模式知識(shí),數(shù)據(jù)挖掘算法必須是高效的和可擴(kuò)展的,相應(yīng)數(shù)據(jù)挖掘算法的運(yùn)行時(shí)間是可以預(yù)測(cè)的并可以接受的。已發(fā)現(xiàn)的知識(shí)應(yīng)能準(zhǔn)確描述數(shù)據(jù)庫(kù)中的內(nèi)容,并能用于實(shí)際領(lǐng)域。數(shù)據(jù)挖掘系統(tǒng)還應(yīng)能很好地處理和抑制噪聲數(shù)據(jù)和不希

78、望的數(shù)據(jù),所以要研</p><p><b>  7</b></p><p>  用于加工中心的計(jì)算機(jī)智能監(jiān)測(cè)控制方法研究</p><p>  究度量知識(shí)質(zhì)量的方法。數(shù)據(jù)挖掘應(yīng)該能夠用高水平語言、可視化表示或其它表示方式來描述所挖掘出的知識(shí),以使用戶更加容易的理解和應(yīng)用所挖掘出的知識(shí)[14]。</p><p>  雖然大多

79、數(shù)數(shù)據(jù)庫(kù)是關(guān)系型的,但許多實(shí)際應(yīng)用的關(guān)系數(shù)據(jù)庫(kù)還可能含有復(fù)雜的數(shù)據(jù)類型,如結(jié)構(gòu)數(shù)據(jù)和復(fù)雜數(shù)據(jù)對(duì)象、超文本和多媒體數(shù)據(jù)、空間和時(shí)態(tài)數(shù)據(jù)、事務(wù)數(shù)據(jù)以及歷史數(shù)據(jù)等,因此一個(gè)功能很強(qiáng)的數(shù)據(jù)挖掘系統(tǒng)應(yīng)能對(duì)各種復(fù)雜數(shù)據(jù)類型進(jìn)行挖掘[17]。鑒于數(shù)據(jù)類型的差異和不同的數(shù)據(jù)挖掘目的,針對(duì)不同數(shù)據(jù)挖掘任務(wù)應(yīng)當(dāng)構(gòu)造專用的數(shù)據(jù)挖掘系統(tǒng)。</p><p>  1-3-5 數(shù)據(jù)挖掘在故障診斷中的應(yīng)用</p><p>

80、;  數(shù)據(jù)挖掘技術(shù)是隨著人工智能技術(shù)和數(shù)據(jù)庫(kù)技術(shù)的發(fā)展而興起的,能從大量數(shù)據(jù)中挖掘和發(fā)現(xiàn)有價(jià)值的、隱含的知識(shí)。目前數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)己經(jīng)被廣泛應(yīng)用于市場(chǎng)營(yíng)銷、銀行業(yè)、電信業(yè)、制造業(yè)、保險(xiǎn)業(yè)、醫(yī)藥業(yè)等各個(gè)領(lǐng)域[15]。隨著信息技術(shù)的進(jìn)步以及計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,故障診斷中采集的數(shù)據(jù)(包括統(tǒng)計(jì)數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù))可以方便地被收集和存儲(chǔ)在各種數(shù)據(jù)庫(kù)中。采用傳統(tǒng)的數(shù)據(jù)分析方法對(duì)這些巨量的數(shù)據(jù)進(jìn)行分析和處理,不僅耗時(shí)而且難以有效地挖掘和發(fā)現(xiàn)數(shù)據(jù)

81、中隱含的知識(shí)。另一方面,盡管專家系統(tǒng)、智能診斷等方法在故障診斷中得到了廣泛的應(yīng)用,但專家系統(tǒng)的知識(shí)瓶頸以及智能診斷方法所帶來的診斷推理過程解釋困難等問題仍未得到很好的解決。因而數(shù)據(jù)挖掘技術(shù)能有效地應(yīng)用于故障診斷中,并且能克服以往存在的知識(shí)獲取瓶頸。因此,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于故障診斷中是必要的,也是可行的。</p><p>  §1-4 基于粗集的數(shù)據(jù)挖掘</p><p>  智能

82、的、有效的、可擴(kuò)展的數(shù)據(jù)挖掘方法的研究是當(dāng)前研究的熱點(diǎn),涉及數(shù)據(jù)的問題包括海量數(shù)據(jù)、缺失數(shù)據(jù)、冗余數(shù)據(jù)、噪聲數(shù)據(jù)以及動(dòng)態(tài)數(shù)據(jù)等。粗集理論從新的視角對(duì)知識(shí)進(jìn)行了定義;把知識(shí)看作是關(guān)于論域的劃分,從而認(rèn)為知識(shí)是具有粒度(granularity)的;認(rèn)為知識(shí)的不精確性是由知識(shí)粒度太大引起的。為處理數(shù)據(jù)(特別是帶噪聲、不精確或不完備數(shù)據(jù))分類問題提供了一套嚴(yán)密的數(shù)學(xué)工具,使得對(duì)知識(shí)能夠進(jìn)行嚴(yán)密的分析和操作。采用粗集理論作為研究知識(shí)發(fā)現(xiàn)的工具具有

83、許多優(yōu)點(diǎn):首先,粗集理論提供了一套數(shù)學(xué)方法從數(shù)學(xué)上嚴(yán)格地處理數(shù)據(jù)分類問題,尤其是當(dāng)數(shù)據(jù)具有不完備性或不精確性時(shí);其次,粗集理論僅僅分析隱藏在數(shù)據(jù)中的事實(shí),并沒有校正數(shù)據(jù)中所表現(xiàn)的不一致性,而是一般將所生成的規(guī)則分為確定與可能的規(guī)則;第三,粗集理論包含了知識(shí)的一種形式模型,這種模型將知識(shí)定義為不可區(qū)分關(guān)系的一個(gè)族集,這就使得知識(shí)有了一種清晰的數(shù)學(xué)意義,并且可使用數(shù)學(xué)方法來分析處理;最后,粗集理論不需要關(guān)于數(shù)據(jù)的任何附加知識(shí)[18]。<

84、;/p><p>  粗集理論和粗集分析能夠有效地從數(shù)據(jù)中獲取知識(shí),對(duì)不一致、不確定和不完整的信息進(jìn)行推理 ,在保留有用信息的前提下進(jìn)行數(shù)據(jù)簡(jiǎn)約和模式分類,識(shí)別以及評(píng)估數(shù)據(jù)之間的依賴關(guān)系,并且獲得易于理解的規(guī)則呈現(xiàn)給使用者。因此本文利用粗集分析,針對(duì)數(shù)據(jù)挖掘領(lǐng)域要處理的不同知識(shí)類型,從高效性和可擴(kuò)展性方面進(jìn)行了算法研究;面向數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理問題。</p><p>  §1-5 粗

85、集和神經(jīng)網(wǎng)絡(luò)結(jié)合的必要性</p><p>  人工神經(jīng)網(wǎng)絡(luò)是在生物神經(jīng)研究成果的基礎(chǔ)上提出的人工智能概念,是對(duì)人腦神經(jīng)組織結(jié)構(gòu)和行為的模擬。它以神經(jīng)元為信息處理的基本單元,以神經(jīng)元間的連接弧為信息傳遞通道,多個(gè)神經(jīng)元聯(lián)接而成的網(wǎng)絡(luò)結(jié)構(gòu),具有知識(shí)的分布式存儲(chǔ)和并行處理等特點(diǎn)。</p><p>  但是基于人工神經(jīng)網(wǎng)絡(luò)的診斷方法也存在著局限性;神經(jīng)網(wǎng)絡(luò)的故障診斷能力是與它的學(xué)習(xí)樣本</p

86、><p><b>  8</b></p><p>  河北工業(yè)大學(xué)碩士學(xué)位論文</p><p>  數(shù)量成正比關(guān)系的,故障訓(xùn)練樣本越多,則神經(jīng)網(wǎng)絡(luò)的診斷能力越強(qiáng),能夠診斷的故障種類就越多,因此一個(gè)好的神經(jīng)網(wǎng)絡(luò)故障診斷系統(tǒng),首先需要較多訓(xùn)練例子用于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)才能使網(wǎng)絡(luò)收斂,從而得出穩(wěn)定的診斷結(jié)果;同時(shí)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)復(fù)雜程度和訓(xùn)練時(shí)間的多少,也與故障

87、樣本的種類和數(shù)量成正比關(guān)系,樣本種類和數(shù)量越多,則神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)越復(fù)雜,達(dá)到網(wǎng)絡(luò)收斂需要的訓(xùn)練時(shí)間也就越多。也就是說復(fù)雜的神經(jīng)網(wǎng)絡(luò),需要大量的訓(xùn)練時(shí)間才能使網(wǎng)絡(luò)收斂,甚至不能收斂;這是一個(gè)矛盾的問題,一方面希望有大量的故障樣本用于訓(xùn)練網(wǎng)絡(luò),使網(wǎng)絡(luò)的診斷能力提高,而另一方面卻要求,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不要過于復(fù)雜,訓(xùn)練和診斷時(shí)間短一些,使網(wǎng)絡(luò)能夠收斂并快速正確的得到診斷結(jié)果。這是神經(jīng)網(wǎng)絡(luò)進(jìn)一步實(shí)用化需要解決的一個(gè)主要問題。</p>&

88、lt;p>  通常解決這個(gè)問題采用的方法是,改進(jìn)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)算法,提高訓(xùn)練速度來減少網(wǎng)絡(luò)訓(xùn)練和診斷需要的時(shí)間圈;如:有動(dòng)量的梯度下降法、共軌梯度法、高斯一牛頓法等,但是問題遠(yuǎn)未得到完美解決。</p><p>  用于故障診斷的樣本數(shù)據(jù),通常包含了設(shè)備很多零部件的技術(shù)狀態(tài)信息,很顯然這些信息并不都是必要的。其中很大一部分是冗余的,是由周圍設(shè)備或設(shè)備自身不同部位的相互影響而產(chǎn)生的信息,或者是本身檢測(cè)到的數(shù)

89、據(jù)的重復(fù)判據(jù),而這些信息對(duì)故障的診斷是沒有用處的,因此有必要去除這些冗余信息,使訓(xùn)練樣本的到簡(jiǎn)化。樣本簡(jiǎn)化后,神經(jīng)網(wǎng)絡(luò)需要處理的數(shù)據(jù)量就會(huì)大量減少,需要的網(wǎng)絡(luò)結(jié)構(gòu)也就沒有那么復(fù)雜,同時(shí)訓(xùn)練時(shí)間也得到減少,而不影響故障診斷的診斷效果。如何有效去除故障樣本數(shù)據(jù)中的冗余信息就是本文所要研究的主要任務(wù)。</p><p>  知識(shí)約簡(jiǎn)是粗集理論的核心內(nèi)容之一。利用粗集方法的約簡(jiǎn)屬性來簡(jiǎn)化樣本的條件屬性,去除其中的冗余信息,

90、可以使神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本數(shù)據(jù)的冗余信息大大減少,只保留得到正確診斷結(jié)果必需的數(shù)據(jù),這正是神經(jīng)網(wǎng)絡(luò)所要解決的問題,因此有必要將神經(jīng)網(wǎng)絡(luò)和粗集相結(jié)合起來,組成粗集一神經(jīng)網(wǎng)絡(luò)智能混合故障診斷系統(tǒng),來解決神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本量和網(wǎng)絡(luò)結(jié)構(gòu)之間的矛盾。</p><p>  粗集理論處理的輸入信息可以是不完整、不精確、不確定的定量數(shù)據(jù)或定性語句,并定義條件屬性和決策屬性的依賴關(guān)系,即輸入空間與輸出空間的映射關(guān)系是通過決策表簡(jiǎn)化得到

91、的,通過去除冗余屬性,來實(shí)現(xiàn)簡(jiǎn)化知識(shí)的表達(dá)空間維數(shù)。而神經(jīng)網(wǎng)絡(luò)完成輸入空間與輸出空間的映射關(guān)系是通過網(wǎng)絡(luò)結(jié)構(gòu)、不斷學(xué)習(xí)和調(diào)整,最后,以特定的結(jié)構(gòu)來表達(dá),即沒有顯式函數(shù)表達(dá)卻完成了并行處理,同時(shí),具有較好的抑制噪聲干擾的能力和高度的自學(xué)習(xí)、自組織、容錯(cuò)性和分布處理能力。</p><p>  因此,采用粗集理論方法和神經(jīng)網(wǎng)絡(luò)方法相結(jié)合,利用其各自特點(diǎn),進(jìn)行優(yōu)勢(shì)互補(bǔ)是非常有意義的。</p><p&g

92、t;<b>  分類結(jié)果輸出</b></p><p>  圖 1.2 粗集—神經(jīng)網(wǎng)絡(luò)系統(tǒng)框圖</p><p>  Fig. 1.2 Rough sets-neutral network system diagram</p><p><b>  9</b></p><p>  用于加工中心的計(jì)算機(jī)智能

93、監(jiān)測(cè)控制方法研究</p><p>  §1-6 本課題研究的意義及內(nèi)容</p><p>  1-6-1 本課題的目的和意義</p><p>  神經(jīng)網(wǎng)絡(luò)的故障診斷能力的好壞是與它的學(xué)習(xí)樣本數(shù)量多少成正比關(guān)系的;而神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)復(fù)雜程度和訓(xùn)練時(shí)間的多少,和故障樣本的種類和數(shù)量的多少也是成正比關(guān)系的,也就是說診斷能力強(qiáng),可以適應(yīng)多故障診斷的神經(jīng)網(wǎng)絡(luò)必然有復(fù)雜的

94、網(wǎng)絡(luò)結(jié)構(gòu),并且需要大量的訓(xùn)練時(shí)間才能使網(wǎng)絡(luò)收斂,甚至不能收斂;這是一個(gè)矛盾的問題,一方面希望有大量的故障樣本用于訓(xùn)練網(wǎng)絡(luò),使網(wǎng)絡(luò)的診斷能力提高,而另一方面卻要求,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不要過于復(fù)雜,訓(xùn)練和診斷時(shí)間短一些,使網(wǎng)絡(luò)訓(xùn)練時(shí)能夠收斂并且在診斷時(shí)能夠快速正確的得到診斷結(jié)果。這是神經(jīng)網(wǎng)絡(luò)進(jìn)一步實(shí)用化需要解決的一個(gè)首要問題。如何解決這個(gè)矛盾正是本課題的主要研究任務(wù)。</p><p>  智能混合故障診斷系統(tǒng)是故障診斷領(lǐng)域

95、當(dāng)今的研究熱點(diǎn)問題,因?yàn)楣收显\斷本身就是一門交叉性很強(qiáng)的學(xué)科,不少領(lǐng)域的技術(shù)都可以在其中得以應(yīng)用;單一的診斷方法難以解決故障診斷中的所有問題,并且每種方法都有自身的優(yōu)缺點(diǎn),因此有必要將多種方法綜合起來,組成混合診斷系統(tǒng),實(shí)現(xiàn)各方法的優(yōu)勢(shì)互補(bǔ),使故障診斷技術(shù)更加有效實(shí)用。如何有效的將各種方法組合起來,實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ)是混合系統(tǒng)需要解決的主要問題。將粗集應(yīng)用在神經(jīng)網(wǎng)絡(luò)的前端,組合成智能混合診斷系統(tǒng),利用粗集對(duì)故障樣本進(jìn)行簡(jiǎn)化處理,降低神經(jīng)網(wǎng)絡(luò)結(jié)

96、構(gòu)的復(fù)雜度,使神經(jīng)網(wǎng)絡(luò)能夠進(jìn)一步實(shí)用化是本課題的研究意義所在。</p><p>  1-6-2 主要研究?jī)?nèi)容</p><p>  論文計(jì)劃利用粗集的約簡(jiǎn)功能對(duì)訓(xùn)練樣本數(shù)據(jù)進(jìn)行處理,消除樣本數(shù)據(jù)中冗余信息,使訓(xùn)練樣本的到簡(jiǎn)化,同時(shí)也就降低了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜程度,解決了上面所提到的影響神經(jīng)網(wǎng)絡(luò)實(shí)用化的矛盾。本論文主要解決以下幾個(gè)問題:</p><p>  1. 如何將

97、檢測(cè)到的連續(xù)數(shù)據(jù)處理成適合粗集理論要求的離散數(shù)據(jù);</p><p>  2. 粗集對(duì)決策表實(shí)行越簡(jiǎn)的方法和算法的實(shí)現(xiàn);</p><p>  3. 神經(jīng)網(wǎng)絡(luò)故障診斷系統(tǒng)的程序?qū)崿F(xiàn);</p><p>  4. 粗集—神經(jīng)網(wǎng)絡(luò)智能混合故障診斷系統(tǒng)的構(gòu)成和實(shí)現(xiàn)。</p><p><b>  10</b></p>&

98、lt;p>  河北工業(yè)大學(xué)碩士學(xué)位論文</p><p>  第二章粗集在故障診斷中的應(yīng)用</p><p>  粗集(RoughSet)理論是 Z.Pawlak 在 20 世紀(jì) 80 年代提出的用于分析和處理各種不完備信息,從中發(fā)現(xiàn)規(guī)則,揭示潛在規(guī)律的數(shù)學(xué)工具。它最顯著的特點(diǎn)是僅利用數(shù)據(jù)本身提供的信息,而不需要其他任何的先驗(yàn)知識(shí)[20,21]。這一理論的提出,為處理故障診斷樣本數(shù)據(jù)中

99、模糊的和不精確的數(shù)據(jù)以及數(shù)據(jù)中的冗余信息的約簡(jiǎn)提供了一條全新的途徑。</p><p>  粗集理論處理的輸入信息可以是不完整、不精確、不確定的定量數(shù)據(jù)或定性語句,并定義條件屬性和決策屬性的依賴關(guān)系[22,23],即輸入空間與輸出空間的映射關(guān)系是通過決策表簡(jiǎn)化得到的,通過去除冗余屬性,來實(shí)現(xiàn)簡(jiǎn)化知識(shí)的表達(dá)空間維數(shù)。</p><p>  粗集理論具有以下特點(diǎn)[24]:</p>&

100、lt;p>  1. 粗集不需要先驗(yàn)知識(shí)。粗集分析方法僅利用數(shù)據(jù)本身所提供的信息,不需要任何先驗(yàn)的知識(shí)。</p><p>  2. 粗集理論是一個(gè)強(qiáng)大的分析工具。它能表達(dá)和處理冗余信息;能在保留關(guān)鍵信息的前提下對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)化并求得知識(shí)的最小表達(dá);能從經(jīng)驗(yàn)數(shù)據(jù)中獲取易于證實(shí)的規(guī)則知識(shí),特別適合智能控制。</p><p>  3. 粗集在刻劃不完備信息方面,以不可分辨關(guān)系為基礎(chǔ),側(cè)重分類。

101、粗集不能清晰定義的原因是缺乏足夠的論域知識(shí),但可以用一對(duì)清晰集合逼近。</p><p>  目前,利用粗集理論處理的主要問題包括數(shù)據(jù)庫(kù)中的數(shù)據(jù)約簡(jiǎn)、數(shù)據(jù)相關(guān)性的發(fā)現(xiàn)、數(shù)據(jù)意義的評(píng)估、由數(shù)據(jù)產(chǎn)生決策控制算法、數(shù)據(jù)的近似分類、數(shù)據(jù)中的相似性或差異性的發(fā)現(xiàn)、數(shù)據(jù)中范式的發(fā)現(xiàn)以及因果關(guān)系的發(fā)現(xiàn)等。</p><p>  粗集經(jīng)過 20 多年的發(fā)展。正日益受到重視且日趨完善。它逐漸成為數(shù)據(jù)挖掘的一種新

102、的工具。</p><p>  §2-1 粗集理論的基本概念</p><p>  2-1-1 知識(shí)與不可辨識(shí)關(guān)系</p><p>  在基于粗集的知識(shí)理論中,知識(shí)被認(rèn)為是一種對(duì)對(duì)象或現(xiàn)實(shí)對(duì)象進(jìn)行分類的能力,也即根據(jù)研究對(duì)象的屬性特征對(duì)對(duì)象論域作出分類處理的能力。因此知識(shí)是由對(duì)象論域的分類模塊組成的,它提供關(guān)于現(xiàn)實(shí)的明顯事實(shí),同時(shí)也具有由明顯事實(shí)推導(dǎo)出模糊事實(shí)

103、的推理能力。假設(shè)給定一對(duì)象論域U(Universe),對(duì)于任何子集 X U稱為 U 中的一個(gè)概念,U 中的任何概念族稱為關(guān)于 U 的知識(shí)。一</p><p>  U 上的分類族定義為一個(gè) U 上的知識(shí)庫(kù),它表達(dá)了一個(gè)或一組智能機(jī)構(gòu)的各種基本分類方式。知識(shí)</p><p>  庫(kù)可表示為 K= (U, R),其中 R 為 U 上的一個(gè)分類(或稱為等價(jià)關(guān)系),則 U/R 為 R 上的所有等價(jià)類

104、</p><p><b>  族[25]。</b></p><p>  識(shí) 表達(dá) 系 統(tǒng)一 般 表示 為 : S U, C, D, V, f 。其 中 ; U 為所 有 對(duì) 象 的 集 合 ,</p><p>  x1, x2 ,......, xn ; C 為條件屬性的集合;D 為決策屬性的集合, C D A, A 為屬性集合;&

105、lt;/p><p>  Vp , p A,其中 V 是 p 的值域;f: U Vp 為一單射,使論域 U 中任一元素取屬性 p 在 Vp</p><p>  中有唯一確定值。這種知識(shí)表達(dá)方法實(shí)質(zhì)上為決策表形式描述,其中決策表表頭為設(shè)定對(duì)象的各類屬性,它的每一行表示論域中的一個(gè)成員、實(shí)例或稱一條決策規(guī)則,每一列表示屬性及屬性值。如表 2.1 所示的流感信息系統(tǒng),其條件屬性為{頭痛,肌肉痛,

106、體溫},決策屬性為{感冒}[26]。</p><p><b>  11</b></p><p>  用于加工中心的計(jì)算機(jī)智能監(jiān)測(cè)控制方法研究</p><p>  表 2.1 流感數(shù)據(jù)</p><p>  Table 2.1 Influenza data</p><p>  不可分辨關(guān)系是粗集理論的

107、基石,揭示了論域中知識(shí)的顆粒結(jié)構(gòu),也是定義其他概念的基礎(chǔ)。其</p><p>  概念為:設(shè)有決策系統(tǒng) SU, Cd , BC 是條件屬性集合的一個(gè)子集,稱二元關(guān)系</p><p>  IND B, dx, yU U; d xd y 或者 aB, a xa y 為 S 的不可分辨關(guān)系,其中,x,</p><p>  y 為 U 中的元素。不可分

108、辨關(guān)系是一個(gè)等價(jià)關(guān)系,通過一個(gè)不可分辨關(guān)系,可以得到?jīng)Q策系統(tǒng)的一個(gè)劃分,一般稱劃分后的等價(jià)類為不可分辨類,可用 X ind B 來表示包含元素 x 的不可分辨類。</p><p><b>  12</b></p><p>  河北工業(yè)大學(xué)碩士學(xué)位論文</p><p>  是集合 X 的上近似與下近似之差,也就是 U 中即不能肯定歸入集合 X,也

109、不能肯定歸入集合 X 的補(bǔ)集的元素構(gòu)成的集合。如果 RNR X ,則稱集合 X 為可定義集,簡(jiǎn)稱精確集;如果</p><p>  RNR X,則稱集合 X 為不可定義集,簡(jiǎn)稱粗集。X 的不精確性是由邊界的存在引起的。X 的</p><p>  2-1-3 知識(shí)的等價(jià)與推廣</p><p>  有兩個(gè)知識(shí)庫(kù) KU, A 和 K'U, B ,當(dāng) ind

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論