

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、在信息爆炸的時代,信息過量已經(jīng)成為大家面對的一個新的問題。人們迫切需要一些新的強有力的數(shù)據(jù)分析方法及工具來自動化、智能化地將海量的數(shù)據(jù)轉(zhuǎn)化為有用的信息和知識。數(shù)據(jù)挖掘正是這樣一種技術(shù)。其中,關(guān)聯(lián)規(guī)則發(fā)現(xiàn)是數(shù)據(jù)挖掘中最重要的任務(wù)之一,它的目標(biāo)是發(fā)現(xiàn)數(shù)據(jù)集中所有的頻繁模式和強關(guān)聯(lián)規(guī)則。目前,對于布爾型屬性關(guān)聯(lián)規(guī)則挖掘的研究相對比較成熟,但是對于數(shù)量型屬性關(guān)聯(lián)規(guī)則挖掘問題還需要進(jìn)行廣泛地研究。 解決數(shù)量型關(guān)聯(lián)規(guī)則挖掘問題的一個非常重要
2、的方法就是將其轉(zhuǎn)換為布爾型關(guān)聯(lián)規(guī)則挖掘的問題。對于數(shù)量型屬性當(dāng)屬性全部取值是有限個數(shù)時,只需將每個屬性值映射為一個布爾型屬性即可,當(dāng)屬性的取值范圍很寬時,則需將其劃分成為若干個區(qū)間,然后將每個區(qū)間映射為一個布爾型屬性。然而在劃分區(qū)間時往往容易出現(xiàn)一些問題,例如:若區(qū)間劃分過小,即區(qū)間的劃分個數(shù)過多時,會造成每一個單個區(qū)間的支持度都很低;將值劃分成區(qū)間時,可能會造成一些信息丟失;在處理高偏度的數(shù)據(jù)時,連續(xù)屬性離散化很難有效地體現(xiàn)出數(shù)據(jù)的實
3、際分布情況;存在劃分邊界過硬的弱點等等。因此,對數(shù)量型關(guān)聯(lián)規(guī)則挖掘算法的研究就轉(zhuǎn)化為如何對數(shù)量型屬性定義域的合理劃分問題。雖然已經(jīng)有人提出使用模糊集理論來解決這些問題,但是對于算法的具體實現(xiàn)的研究仍值得不斷探索和深入。 本文先闡述了有關(guān)數(shù)據(jù)挖掘的一些主要技術(shù)以及與關(guān)聯(lián)規(guī)則相關(guān)的問題,接著討論了模糊集合、模糊相似矩陣、模糊等價矩陣等模糊集理論的原理及特性,以基于模糊等價矩陣的模糊聚類方法為基礎(chǔ)提出了分類數(shù)不確定的FEM-TC算法,
4、描述了該算法實現(xiàn)的一般步驟;通過典型數(shù)據(jù)直接觀察法對算法的正確性與有效性進(jìn)行了驗證;在確定了F統(tǒng)計量作為評判分類效果優(yōu)劣的標(biāo)準(zhǔn)之后又對其中的關(guān)鍵步驟,即數(shù)據(jù)規(guī)格化和構(gòu)造模糊相似矩陣,各自采用不同方法的分類結(jié)果進(jìn)行了多方面的對比分析,確定了最佳的模型。然后,以基于目標(biāo)函數(shù)的模糊ISODATA聚類方法為基礎(chǔ)提出了分類數(shù)確定的FMI算法以及檢驗該算法分類效果的指標(biāo),描述了算法的具體實現(xiàn),同樣也使用一些典型的數(shù)據(jù)對FMI算法的正確性及有效性進(jìn)行
5、了驗證與分析,明確了初始模糊劃分矩陣的一些特點。 在研究了對數(shù)量型屬性進(jìn)行分類或者區(qū)間劃分的兩種算法之后,本文又對經(jīng)典的Apriori算法進(jìn)行剖析,并在如何發(fā)現(xiàn)頻繁項集和生成關(guān)聯(lián)規(guī)則等方面對經(jīng)典的Apriori算法進(jìn)行了改進(jìn),即利用去尾法求子集再交叉關(guān)聯(lián),只需一次掃描數(shù)據(jù)庫即可得到滿足要求的關(guān)聯(lián)規(guī)則。之后,本文又探討了在計算支持度和置信度時如何合理使用模糊分類過程中產(chǎn)生的隸屬度的值,提出了一些新的基于模糊隸屬度的支持度與置信度的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于模糊集理論的關(guān)聯(lián)規(guī)則研究.pdf
- 基于模糊集的關(guān)聯(lián)規(guī)則及其應(yīng)用.pdf
- 基于模糊集理論的量化關(guān)聯(lián)規(guī)則挖掘.pdf
- 基于模糊集理論的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘研究.pdf
- 基于模糊集的時序關(guān)聯(lián)規(guī)則研究與應(yīng)用.pdf
- 基于模糊集的安全事件關(guān)聯(lián)算法研究與實現(xiàn).pdf
- 基于公理模糊集的模糊決策樹算法研究.pdf
- 基于模糊集的蟻群聚類算法研究.pdf
- 基于模糊集理論的圖像增強算法研究.pdf
- 隨機模糊集與概率模糊集的研究.pdf
- 基于模糊理論的關(guān)聯(lián)規(guī)則挖掘算法研究.pdf
- 基于模糊集與空間信息的圖像分割算法研究.pdf
- 基于模糊集與水平集的醫(yī)學(xué)圖像自動分割算法研究.pdf
- 基于粗糙集和模糊集理論的屬性約簡算法研究.pdf
- 區(qū)間直覺模糊集的聚類算法研究.pdf
- 模糊關(guān)聯(lián)規(guī)則挖掘算法的研究.pdf
- 基于模糊關(guān)聯(lián)規(guī)則Web挖掘算法的研究.pdf
- 基于區(qū)間值模糊集的三I推理算法研究.pdf
- 基于無或言規(guī)則集的關(guān)聯(lián)規(guī)則挖掘算法研究.pdf
- 基于模糊集的不確定數(shù)據(jù)聚類算法研究.pdf
評論
0/150
提交評論