版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、自然界一直是人類創(chuàng)造力的豐富源泉,人類認(rèn)識(shí)事物的能力來源于自然界的相互作用之中,自然界的許多自適應(yīng)優(yōu)化現(xiàn)象不斷給人類以啟示。智能算法是人們受自然規(guī)律或生物界規(guī)律的啟迪,根據(jù)其原理,模仿某些規(guī)律而設(shè)計(jì)的求解實(shí)際問題的一類算法。它將復(fù)雜任務(wù)交給群體中大量的個(gè)體合作完成,具有概念簡(jiǎn)單、實(shí)現(xiàn)方便的特點(diǎn)。由于智能算法具有的分布性、簡(jiǎn)單性、靈活性和健壯性,已在計(jì)算機(jī)科學(xué)、知識(shí)發(fā)現(xiàn)、通信網(wǎng)絡(luò)、機(jī)器人等研究領(lǐng)域廣泛應(yīng)用,成為一個(gè)研究熱點(diǎn)。近幾十年來,一
2、些與經(jīng)典的數(shù)學(xué)規(guī)劃原理截然不同的,試圖通過模擬自然生態(tài)系統(tǒng)機(jī)制以求解復(fù)雜優(yōu)化問題的仿生智能優(yōu)化算法相繼被提出和研究。如模擬退火算法、遺傳算法、人工神經(jīng)網(wǎng)絡(luò)技術(shù)、人工免疫算法和群智能算法等。這些算法大大豐富了現(xiàn)代優(yōu)化技術(shù),也為那些傳統(tǒng)優(yōu)化技術(shù)難以處理的優(yōu)化問題提供了切實(shí)可行的解決方案。
數(shù)據(jù)挖掘是從存貯在數(shù)據(jù)庫、數(shù)據(jù)倉(cāng)庫或其它信息倉(cāng)庫中的,大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又
3、是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘最常用的技術(shù)有關(guān)聯(lián)規(guī)則、序列模式分析、分類分析和聚類分析等。這些技術(shù)很多都涉及到優(yōu)化問題,完全可以用智能優(yōu)化算法來解決和處理。
如何將數(shù)據(jù)挖掘技術(shù)和智能算法結(jié)合起來,使數(shù)據(jù)挖掘技術(shù)可以為智能算法服務(wù),或者智能算法可以用到數(shù)據(jù)挖掘中,這無疑是一個(gè)很有意義的問題。如果這兩種技術(shù)或算法能夠成功的結(jié)合,消除各自的缺點(diǎn)和不足,充分利用彼此的優(yōu)點(diǎn),這是百利而無一害的事。同時(shí),將對(duì)大規(guī)模數(shù)據(jù)的數(shù)據(jù)挖掘?qū)?/p>
4、指出一條行之有效的方法,也是對(duì)智能算法很好地、新穎獨(dú)特地探索。本文的主要工作如下:
1.在并行粒子群算法中,引入圍繞中心點(diǎn)的劃分 PAM(Partitioning Around Medoid)聚類技術(shù)來劃分整個(gè)種群為幾個(gè)相互不重疊的子種群。通過聚類,相同子種群的粒子相對(duì)集中,從而它們能夠較容易地相互學(xué)習(xí)。這使得有限的時(shí)間能夠花費(fèi)在最有效的搜索上,以便提高算法的搜索效率。為了均勻地探測(cè)整個(gè)解空間,引入均勻設(shè)計(jì)來產(chǎn)生初始種群,使種
5、群中的種群成員或個(gè)體均勻地分散在可行解空間中。進(jìn)化過程中,使用均勻設(shè)計(jì)產(chǎn)生的較好個(gè)體替換種群中的較差個(gè)體,已達(dá)到優(yōu)勝劣汰的目的。
2.在多目標(biāo)粒子群優(yōu)化算法中,為了維持或增加種群的多樣性,幫助算法跳出局部最優(yōu),分別引入PAM聚類算法和均勻設(shè)計(jì)來產(chǎn)生和選擇Pareto最優(yōu)解。提出了一個(gè)新的基于PAM和均勻設(shè)計(jì)的多目標(biāo)粒子群優(yōu)化算法。
3.在關(guān)聯(lián)規(guī)則挖掘中,評(píng)價(jià)關(guān)聯(lián)規(guī)則需要重復(fù)掃描數(shù)據(jù)庫來比較數(shù)據(jù)庫中的每個(gè)記錄與規(guī)則的前
6、件,后件和整個(gè)規(guī)則。為了減少比較的次數(shù)和時(shí)間消耗,提出了屬性索引策略。它只需要掃描數(shù)據(jù)庫一次就能創(chuàng)建每一個(gè)屬性的屬性索引,然后所有評(píng)價(jià)關(guān)聯(lián)規(guī)則的度量值不再需要掃描數(shù)據(jù)庫,而僅僅通過屬性索引就能得到這些值。關(guān)聯(lián)規(guī)則挖掘被看作多目標(biāo)而不是單目標(biāo)問題,為了在目標(biāo)空間中獲得均勻分散在Pareto前沿的解,精英策略和均勻設(shè)計(jì)被引入。本文提出基于屬性索引和均勻設(shè)計(jì)的多目標(biāo)演化規(guī)則挖掘,它不再要求用戶指定最小支持度和最小置信度,而僅僅使用屬性索引。它
7、設(shè)計(jì)了新的實(shí)屬編碼,以便擴(kuò)展它的應(yīng)用范圍。
4.使用幾個(gè)評(píng)價(jià)指標(biāo),成功率、成功數(shù)和完全成功率來度量聚類算法的性能或有效性。為了正確地獲取它們,提出了兩個(gè)新的類別分配算法,一個(gè)能夠最大化幾個(gè)評(píng)價(jià)指標(biāo);另一個(gè)能夠確保每個(gè)簇至少包含一個(gè)矢量數(shù)據(jù)。為了驗(yàn)證它們的有效性,應(yīng)用它們來評(píng)價(jià)幾個(gè)聚類算法的性能。
5.為了克服粒子群PSO(Particle Swarm Optimization)算法的早熟收斂,引入動(dòng)態(tài)交叉到PSO中,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)據(jù)挖掘中若干問題的研究.pdf
- 數(shù)據(jù)挖掘中聚類若干問題研究.pdf
- 進(jìn)化計(jì)算若干問題研究.pdf
- 數(shù)據(jù)流挖掘若干問題的研究.pdf
- 軟件工程數(shù)據(jù)挖掘若干問題研究.pdf
- 軟件數(shù)據(jù)挖掘的若干問題研究.pdf
- 時(shí)間序列數(shù)據(jù)挖掘中的若干問題研究.pdf
- 有關(guān)智能優(yōu)化算法及應(yīng)用的若干問題研究.pdf
- 結(jié)構(gòu)數(shù)據(jù)挖掘與處理的若干問題的研究.pdf
- 序列模式挖掘若干問題研究.pdf
- 數(shù)據(jù)挖掘在中醫(yī)若干問題研究中的應(yīng)用.pdf
- 社會(huì)化數(shù)據(jù)挖掘中的若干問題研究.pdf
- 進(jìn)化計(jì)算中的若干問題及應(yīng)用研究.pdf
- 隨機(jī)算法若干問題研究.pdf
- 多策略數(shù)據(jù)挖掘平臺(tái)MSMiner構(gòu)建中若干問題的研究.pdf
- 近似算法若干問題研究.pdf
- 進(jìn)化計(jì)算與小波分析若干問題研究.pdf
- 基于數(shù)據(jù)挖掘的無線傳感器網(wǎng)絡(luò)若干問題研究.pdf
- 粗糙集理論在數(shù)據(jù)挖掘中若干問題的研究.pdf
- Web使用挖掘中若干問題的研究.pdf
評(píng)論
0/150
提交評(píng)論