電子商務數據挖掘中的若干關鍵技術的研究.pdf_第1頁
已閱讀1頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、目前,眾多的實際應用已證明,數據挖掘在電子商務等方面具有著極高的商業(yè)價值和重要研究意義,并且已經被廣泛的應用到各個領域。而針對數據挖掘的算法也層出不窮,尤其是關聯規(guī)則挖掘算法。在挖掘關聯規(guī)則時,比較常用的經典挖掘算法是Apriori算法。對于Apriori算法,其關鍵步驟是根據最小支持度獲取頻繁項集,且在目前大多數算法中,最小支持度的確定一般是根據用戶的挖掘經驗而被人為進行設定。該做法無疑會給挖掘的結果帶來比較大的偏差。有時,該誤差甚至

2、是致命性的。因此,如何使最小支持度因被人為設定而產生的誤差及其影響最小呢?于是,針對在電子商務應用的過程中所產生的有關問題,本文展開了較為詳細的研討,并通過充分利用各數據挖掘技術等方法加以解決,其具體工作目的、研究思路及結果分為如下幾方面:
   (1)算法設計模式方面。為有效提高算法設計的可擴展性和可維護性,避免算法設計混亂,減少算法設計上的誤差因素影響,通過探討了裝飾模式與策略模式及適配器模式的結合,文中提出了三個方案,并對

3、其可行性及性能進行了詳細分析與比較。最后,本文選用了效率相對較高的方案三應用到所開發(fā)的系統中,并分析實驗結果。
   (2)軟件復雜度及AOP(Aspect Oriented Program)方面。為有力控制系統復雜度水平過高,使系統中模塊間保持高內聚、低耦合,避免算法的冗余度過高,減輕其他誤差因素對算法的影響,本項工作據課題的特點及其需求情況,研討了軟件復雜度的幾項重要指標,并希望用AOP達到該部分預期目標。通過使用經濟學中的

4、層次分析法,本部分定量分析了AOP對軟件復雜度水平降低的重要作用。實驗證明,AOP已使系統達到了預期效果。
   (3)挖掘關聯規(guī)則算法方面。在挖掘關聯規(guī)則時,最小支持度的重新確定問題已有通過采用牛頓插值算法進行逆向自學習解決,但因牛頓插值算法在確定點值時需多次對整個事務數據庫進行掃描,其所產生的掃描數據量是巨大的。所以,該算法直接影響了整個關聯規(guī)則挖掘算法的時間復雜度。因此,本部分的主要工作是利用分塊算法解決支持度逆向自學習時

5、的高時間復雜度問題,并就點值誤差所引起的凸點問題通過借用哈希表沖突處理方法的思想進行解決,使實驗結果屬于誤差可控范圍,減小挖掘算法的時間復雜度。實驗證明,該改善方案是可行的,有效的。
   (4)系統開發(fā)。為了證明上述各項研討成果能達到預期水平,本文開發(fā)了一個電子商務實驗系統。通過實驗過程及實驗結果數據的對比、分析與繪圖,與目前現有方法相比,上述各項改善工作是切實可行的,富有成效的。
   文尾之處對本論文開展的各項工作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論