管理工程決策方法結(jié)課論文-地級市地區(qū)生產(chǎn)總值數(shù)據(jù)分析

上傳人：奔*** IP屬地：河北更新時間：2024-06-07 格式：docx 頁數(shù)：24 大小：1.05MB 人氣指數(shù)：12 舉報 版權(quán)申訴

管理工程決策方法結(jié)課論文-地級市地區(qū)生產(chǎn)總值數(shù)據(jù)分析_第1頁

已閱讀1頁，還剩23頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、　　管理工程決策方法　　課程論文　　院系物流學院 　　專業(yè) 物流工程 　　班級物工一班

2、 　　地級市地區(qū)生產(chǎn)總值數(shù)據(jù)分析　　關(guān)鍵詞：地區(qū)生產(chǎn)總值；時間序列；聚類分析；回歸分析　　第1章緒論　　1.1研究目的　　地區(qū)生產(chǎn)總值（地區(qū)GDP）是

3、一個地區(qū)的所有常住單位在一定時期內(nèi)所生產(chǎn)的全部最終產(chǎn)品和服務(wù)的價值總和是反映經(jīng)濟總體狀況最重要的指標，GDP就像天氣的衛(wèi)星云圖一樣，能夠提供經(jīng)濟狀況的完整圖像，能夠幫助領(lǐng)導(dǎo)者判斷經(jīng)濟是在萎縮還是在膨脹，是需要刺激還是需要控制，是處于嚴重衰退還是處于通脹威脅之中。如果沒有像GDP這樣的總量指標，政策制定者就會陷入雜亂無章的數(shù)字海洋而不知所措。，地區(qū)GDP可以反映一個地區(qū)的經(jīng)濟發(fā)展規(guī)模，判斷其經(jīng)濟總體實力和經(jīng)濟發(fā)展的快慢，還可以用來進行經(jīng)濟

4、結(jié)構(gòu)分析，是宏觀經(jīng)濟決策的重要依據(jù)。所以通過研究各地區(qū)的生產(chǎn)總值，可以讓我們了解全國各地區(qū)的經(jīng)濟發(fā)展水平并將同一級別的城市進行聚類，同時也有利于進行相應(yīng)的政策支持。　　1.2數(shù)據(jù)來源　　此數(shù)據(jù)來自2009-2011年中國城市統(tǒng)計年鑒的地級市地區(qū)生產(chǎn)總值（如下圖）<b&g

5、t;　　圖1- 1數(shù)據(jù)來源　　1.3研究思路　　圖1- 2研究思路　　第2章數(shù)據(jù)挖掘與處理　　2.1數(shù)據(jù)挖掘簡介

6、　　2.1.1數(shù)據(jù)挖掘的定義　　數(shù)據(jù)挖掘是從大量的原始數(shù)據(jù)中采用多種方法去尋找數(shù)據(jù)間隱含的有趣模式和知識的過程。如果數(shù)據(jù)挖掘的過程可形象的比喻成從黃金礦山中幵釆黃金(如圖2-1所示),那么原始數(shù)據(jù)具的大容量、含噪音和異質(zhì)數(shù)據(jù)就像是礦山上的廢漁一樣;挖掘算法好比肝釆工具一樣具有多樣化特點;數(shù)據(jù)間隱藏的模式和知識就如黃金一樣事先人們是看不到的、但是對人們又非常有用。[1]</

7、p>　　2.1.2挖掘數(shù)據(jù)的類型　　數(shù)掘挖掘足一種通用的技術(shù),它可以挖掘任何對目標應(yīng)用有意義的數(shù)據(jù)。　　這些數(shù)據(jù)大致可分以下四類:　?。?）數(shù)據(jù)庫數(shù)據(jù)　　作為數(shù)據(jù)挖掘研究中最主要的數(shù)據(jù)形式,關(guān)系數(shù)據(jù)庫擁有豐

8、富的數(shù)據(jù)源。它是許多表的匯集,每個表都包含許多字段,并且存放大量的記錄。每一個記錄代表一個對象,被唯一的關(guān)鍵字所標識,并且被其它字段描述它的屬性。　?。?）數(shù)據(jù)倉庫　　數(shù)據(jù)倉庫是按照某一主題組織的、經(jīng)過清理加工和整理的、能夠反映歷史各階段信息的、相對較穩(wěn)定的數(shù)據(jù)的累積。<

9、;b>　　（3）事務(wù)數(shù)據(jù)　　事務(wù)數(shù)據(jù)庫中的每一個記錄表示一個事務(wù),每個事務(wù)擁有唯一的標識號,以及組成事務(wù)的項的列表。　　（4）其它類型的數(shù)據(jù)　　除了上述三種數(shù)據(jù)以外,還有很多其它數(shù)據(jù)也可以作為數(shù)據(jù)挖掘的數(shù)據(jù)源。例如工程設(shè)計數(shù)據(jù)(如集成電路)、多媒體和文本數(shù)據(jù)(如音頻、視頻)、數(shù)據(jù)流(如視

10、頻監(jiān)控)、空間數(shù)據(jù)(如導(dǎo)航地圖)等等。　　2.1.3數(shù)據(jù)挖掘的任務(wù)　　數(shù)據(jù)的挖掘任務(wù)包括兩類,第一類任務(wù)用于刻畫目標數(shù)據(jù)中數(shù)據(jù)的性質(zhì),第二類任務(wù)用于在當前數(shù)據(jù)上分析判斷,然后做出預(yù)測。前者屬于描述性任務(wù),而后者屬于預(yù)測性任務(wù)。一般而言,數(shù)據(jù)的挖掘任務(wù)有如下6種任務(wù):　?。?）數(shù)據(jù)特征化與區(qū)分（2）關(guān)聯(lián)分析（

11、3）分類　?。?）聚類分析（5）離群點分析（6）序列模式　　2.1.4數(shù)據(jù)挖掘的步驟　?。?）確定問題　　明確數(shù)據(jù)挖掘任務(wù)的具體需求和確定挖掘釆用的具體方法(如關(guān)聯(lián)、分類、聚類等)。<p

12、>　?。?）數(shù)據(jù)收集和預(yù)處理　　此步驟主要包括數(shù)據(jù)的選擇、預(yù)處理以及轉(zhuǎn)換。　　1數(shù)據(jù)選擇就是確定挖掘任務(wù)的目標數(shù)據(jù),依據(jù)任務(wù)要求,從相關(guān)數(shù)據(jù)源中選取任務(wù)相關(guān)數(shù)據(jù)。　　2、數(shù)據(jù)預(yù)處理一般包括空缺處理、平滑噪聲、數(shù)據(jù)規(guī)約、數(shù)據(jù)類型轉(zhuǎn)換、數(shù)據(jù)集成等處理。　　3、數(shù)據(jù)轉(zhuǎn)換是

13、指從對象的初始屬性中選取挖掘任務(wù)相關(guān)的屬性,來提高挖掘的整體效率。　?。?）數(shù)據(jù)挖掘　　根據(jù)所選定的挖掘方法,對上面步驟處理好的數(shù)據(jù),選擇合適的挖掘算法進行數(shù)據(jù)挖掘得出模型。　?。?）分析和評估

14、　對上面步驟中挖掘所得的模型進行評估分析。需要注意的是整個數(shù)據(jù)挖掘的過程是需要不斷反饋和修正的。當在挖掘的過程中發(fā)現(xiàn)由于數(shù)據(jù)不合適或者挖掘方法不恰當,造成挖掘的結(jié)果不夠理想,那么需要重復(fù)挖掘過程,如果有需要的話,可以從頭重新開始。　　（5）知識的應(yīng)用　　將最后確定的有用挖掘結(jié)果(知識)應(yīng)用到問題中去。</p&g

15、t;　　2.2數(shù)據(jù)處理　　在數(shù)據(jù)挖掘整體過程中,海量的原始數(shù)據(jù)中存在著大量雜亂的、重復(fù)的、不完整的數(shù)據(jù)，嚴重影響到數(shù)據(jù)挖掘算法的執(zhí)行效率，甚至可能導(dǎo)致挖掘結(jié)果的偏差。為此，在數(shù)據(jù)挖掘算法執(zhí)行之前，必須對收集到的原始數(shù)據(jù)進行預(yù)處理，以改進數(shù)據(jù)的質(zhì)量，提高數(shù)據(jù)挖掘過程的效率、精度和性能。數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換與數(shù)據(jù)歸

16、約等技術(shù)　　圖2- 1剔除各省名稱和空值　　2.2時間序列數(shù)據(jù)準備　　選取各城市地區(qū)生產(chǎn)總值的全市數(shù)值列匯總到時間序列原數(shù)據(jù)表格　　圖2- 2　　2.3聚類分析和回歸數(shù)據(jù)準備

17、;　　將2008-2011年數(shù)據(jù)整理　　圖2- 3　　第3章地區(qū)生產(chǎn)總值數(shù)據(jù)分析　　3.1 2012-2017年時間序列分析　　3.1.1時間序列分析簡介　　時間序列

18、：是指將某種現(xiàn)象某一個統(tǒng)計指標在不同時間上的各個數(shù)值，按時間先后順序排列而形成的序列。時間序列法是一種定量預(yù)測方法，亦稱簡單外延方法。在統(tǒng)計學中作為一種常用的預(yù)測手段被廣泛應(yīng)用。時間序列分析在第二次世界大戰(zhàn)前應(yīng)用于經(jīng)濟預(yù)測。二次大戰(zhàn)中和戰(zhàn)后，在軍事科學、空間科學、氣象預(yù)報和工業(yè)自動化等部門的應(yīng)用更加廣泛。時間序列分析(Time series analysis)是一種動態(tài)數(shù)據(jù)處理的統(tǒng)計方法。該方法基于隨機過程理論和數(shù)理統(tǒng)計學方法，研究隨機

19、數(shù)據(jù)序列所遵從的統(tǒng)計規(guī)律，以用于解決實際問題。　　時間序列分析方法：它包括一般統(tǒng)計分析(如自相關(guān)分析，譜分析等),統(tǒng)計模型的建立與推斷，以及關(guān)于時間序列的最優(yōu)預(yù)測、控制與濾波等內(nèi)容。經(jīng)典的統(tǒng)計分析都假定數(shù)據(jù)序列具有獨立性，而時間序列分析則側(cè)重研究數(shù)據(jù)序列的互相依賴關(guān)系。后者實際上是對離散指標的隨機過程的統(tǒng)計分析，所以又可看作是隨機過程統(tǒng)計的一個組成部分。例如，記錄了某地區(qū)第一個月，第二個月，……

20、，第N個月的降雨量，利用時間序列分析方法，可以對未來各月的雨量進行預(yù)報。　　隨著計算機的相關(guān)軟件的開發(fā)，數(shù)學知識不再是空談理論，時間序列分析主要是建立在數(shù)理統(tǒng)計等知識之上，應(yīng)用相關(guān)數(shù)理知識在相關(guān)方面的應(yīng)用等。　　3.1.2數(shù)據(jù)分析　　(1)導(dǎo)入2008年-2009年數(shù)據(jù)<

21、;/p>　　圖3- 1　?。?）讀取值　　圖3- 2　?。?）設(shè)置時間區(qū)間和初始年份　　時間以年為單位，初始年份為2008年<

22、;/p>　　圖3- 3　　并預(yù)測未來五年　　圖3- 4　　采用指數(shù)平滑方法，　　指數(shù)平滑方法

23、：最近的過去態(tài)勢，在某種程度上會持續(xù)到最近的未來，所以將較大的權(quán)值放在最近的數(shù)據(jù)樣本上。 　　原理：任一期的指數(shù)平滑值都是本期實際觀察值與前一期指數(shù)平滑值的加權(quán)平均。　　基本思想：預(yù)測值是以前觀察值的加權(quán)和，且對不同的數(shù)據(jù)給予不同的權(quán)值，新數(shù)據(jù)給較大的權(quán)值，舊數(shù)據(jù)給較小的權(quán)值。　　圖3- 5&l

24、t;/b>　?。?）選定地區(qū)生產(chǎn)總值進行繪圖　　圖3- 6　　(5)運行預(yù)測如下　　圖3- 7

25、;　?。?）圖形如下　　指數(shù)平滑建模結(jié)果如下　　圖3- 8　　專家建模器結(jié)果如下　　圖3- 9&

26、lt;b>　　模型如下　　圖3- 10　　3.2 2008-2011年各地區(qū)生產(chǎn)總值聚類分析　　3.2.1聚類分析及算法簡介　?。?）聚類分析（Cluster Analysis）又稱群分析，是根據(jù)“物以類聚”

27、的道理，對樣品或指標進行分類的一種多元統(tǒng)計分析方法，它們討論的對象是大量的樣品，要求能合理地按各自的特性來進行合理的分類，沒有任何模式可供參考或依循，即是在沒有先驗知識的情況下進行的。聚類分析起源于分類學，在古老的分類學中，人們主要依靠經(jīng)驗和專業(yè)知識來實現(xiàn)分類，很少利用數(shù)學工具進行定量的分類。隨著人類科學技術(shù)的發(fā)展，對分類的要求越來越高，以致有時僅憑經(jīng)驗和專業(yè)知識難以確切地進行分類，于是人們逐漸地把數(shù)學工具引用到了分類學中，形成了數(shù)值分

28、類學，之后又將多元分析的技術(shù)引入到數(shù)值分類學形成了聚類分析。　　聚類分析被應(yīng)用于很多方面，在商業(yè)上，聚類分析被用來發(fā)現(xiàn)不同的客戶群，并且通過購買模式刻畫不同的客戶群的特征；在生物上，聚類分析被用來動植物分類和對基因進行分類，獲取對種群固有結(jié)構(gòu)的認識；在地理上，聚類能夠幫助在地球中被觀察的數(shù)據(jù)庫商趨于的相似性；在保險行業(yè)上，聚類分析通過一個高的平均消費來鑒定汽車保險單持有者的分組，同時根據(jù)住宅類型

29、，價值，地理位置來鑒定一個城市的房產(chǎn)分組；在因特網(wǎng)應(yīng)用上，聚類分析被用來在網(wǎng)上進行文檔歸類來修復(fù)信息。　　聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個過程，所以同一個簇中的對象有很大的相似性，而不同簇間的對象有很大的相異性。聚類分析的目標就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類。聚類源于很多領(lǐng)域，包括數(shù)學，計算機科學，統(tǒng)計學，生物學和經(jīng)濟學。在不同的應(yīng)用領(lǐng)域，很多聚類技術(shù)都得到了發(fā)展，這些技術(shù)方法被用作描

30、述數(shù)據(jù)，衡量不同數(shù)據(jù)源間的相似性，以及把數(shù)據(jù)源分類到不同的簇中。　?。?）聚類方法的特征　　1、聚類分析簡單、直觀；　　2、聚類分析主要應(yīng)用于探索性的研究，其分析的結(jié)果可以提供多個可能的解，選擇最終的解需要研究者的主觀判斷和后續(xù)的分析；　　3、不管實際數(shù)據(jù)中是否真正存在不

31、同的類別，利用聚類分析都能得到分成若干類別的解；　　4、聚類分析的解完全依賴于研究者所選擇的聚類變量，增加或刪除一些變量對最終的解都可能產(chǎn)生實質(zhì)性的影響；　　5、研究者在使用聚類分析時應(yīng)特別注意可能影響結(jié)果的各個因素；　　6、異常值和特殊的變量對聚類有較大影響，當分類變量的測量尺度不一致時，需要事先做標準化處理。

32、　　（3）K-means算法　　也稱k-平均算法。k-means是一種迭代算法，初始的k個簇被隨機的定義之后，這些簇將被不斷地更新，并在更新中被優(yōu)化，當無法再進一步優(yōu)化（或者達到一定的迭代次數(shù)）時算法才停止，然后生成模型。　　在k-means算法中，每個簇有一個中心，稱為“質(zhì)心”，k個簇就相應(yīng)地有k個質(zhì)心。一個樣

33、本究竟被劃分到哪個簇，就看它和哪個質(zhì)心的“相異度”最小。在k-means算法中，衡量相異度的指標是“距離”。所以也可以這么說，一個樣本究竟被劃分到哪個簇，就看它和哪個質(zhì)心的“距離”最小。這里的距離，則是由樣本的每一個屬性的取值來共同參與決定的。　　3.2.2數(shù)據(jù)分析　　(1)建立模型如下</b

34、>　　圖3- 11　　（2）導(dǎo)入2008年地區(qū)生產(chǎn)總值數(shù)據(jù)　　圖3- 12　?。?）讀取值

35、　圖3- 13　?。?）設(shè)置聚類數(shù)并運行　　圖3- 14　　（5）得到結(jié)果　　圖3- 15　　由

36、上圖可知聚類7占所有的34.1%，而這些城市多是通遼市，呼倫貝爾市，巴彥淖爾市，吉林市，四平市這些城市大多市轄區(qū)地區(qū)生產(chǎn)總值增長率較高都保持在20%以上，且其發(fā)展水平在國家各城市發(fā)展水平的中部，有較高發(fā)展前景。　　(6)分別帶入2009.2010.2011年數(shù)據(jù)取得結(jié)果　　圖3- 16 2009年　　圖3- 1

37、7 2010年　　圖3- 18 2011年　　分別選取通遼市，呼倫貝爾市，巴彥淖爾市，吉林市，四平市等城市進行跟蹤對比得到下圖　　表3- 1　　由上表可以看出在2008年到2009年，9所城市發(fā)展情況差不多，地區(qū)生產(chǎn)總值都在穩(wěn)步提

38、升，但到2010年開始聚類層次不一致的情況，且有些城市增速放緩，到2011年更加明顯聚類更加不一致，以通遼市、吉林市、松原市為代表的聚類5繼續(xù)保持快速上升趨勢。而通化市的增速則放緩了。　　3.3 2008年-2011年各城市地區(qū)生產(chǎn)總值回歸分析　　3.3.1線性回歸介紹　　線性回歸是一種古老類型的技術(shù)統(tǒng)計，是重

39、要的也是最有用的挖掘工具之一。線性回歸能夠使挖掘者找到數(shù)據(jù)中最有價值和最深入的發(fā)現(xiàn)，同時，也很容易解釋在被發(fā)現(xiàn)的關(guān)系上發(fā)生了什么。本質(zhì)上，線性回歸是一種探索式、驗證性的方式，尋找穿過狀態(tài)空間的單獨一條直線以便使這條直線盡可能地靠近空間中的所有點。當狀態(tài)空間多于二維時，它不是恰好一條直線。在三維空間中，它是一個面，在多維空間中，它將是二維空間中直線的高緯度模擬。以二維的狀態(tài)空間為例，只要數(shù)據(jù)很好地聚合至少大致接近于一條直線（如圖1所示），

40、就可以對數(shù)據(jù)集合進行解釋和預(yù)測。因為直線被調(diào)整得離所有的點盡可能近，當通過一個已知變量進行預(yù)測時，其預(yù)測值在狀態(tài)空間中應(yīng)當在直線附近。所以，直線上的點所返回的變量值是一個合理值的近似估計值。[2]　　在Clementine中，一元或多元線性回歸分析由回歸節(jié)點來完成，它采用最小二乘法來根據(jù)樣本數(shù)據(jù)建立回歸方程。在回歸模型中只能使用連續(xù)型字段，必須有且僅有一個目標字段（輸出字段，因變量），可以有一個

41、或多個預(yù)測變量（輸入字段，自變量）　　3.3.2數(shù)據(jù)分析　?。?）建立模型　　圖3- 19　?。?）導(dǎo)入數(shù)據(jù)</p

42、>　　圖3- 20　?。?）讀取值并設(shè)置全市地區(qū)生產(chǎn)總值為目標　　圖3- 21　?。?）設(shè)置方法為進入法　　圖3- 22</

43、p>　?。?）運行模型　　圖3- 23　　（6）設(shè)置不同的方法運行　　圖3- 24　　取得結(jié)果如下</b&

44、gt;　　逐步法　　圖3- 25 逐步法　　后退法　　圖3- 26 后退法　　前進法&l

45、t;p>　　圖3- 27 前進法　　通過回歸分析的預(yù)測，可以得知各城市基本在保持穩(wěn)定增長。　　第4章總結(jié)　　本文通過分別的2012年到2017年的時間序列分析，2008年到2011年地區(qū)生產(chǎn)總值聚類分析以及2011年各城市地區(qū)的回歸分析，得到一些結(jié)論，隨著中國發(fā)展，

46、基本上各城市都保持這穩(wěn)定的地區(qū)經(jīng)濟發(fā)展，像通遼市、吉林市、松原市為代表的中國中等發(fā)展水平的城市現(xiàn)在仍然在保持著每年10%以上的地區(qū)生產(chǎn)總值增長率，但是像呼倫貝爾市，巴彥淖爾，四平市等東北部城市增速放緩，已經(jīng)處于中下等增速城市，需要國家政策支持。　　參考文獻　　[1] 孫兵. 數(shù)據(jù)挖掘在高校招生中應(yīng)用的研究[D].安徽

眾賞文庫> 全部分類> 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

管理工程決策方法結(jié)課論文-地級市地區(qū)生產(chǎn)總值數(shù)據(jù)分析

文檔簡介

溫馨提示

最新文檔

評論

管理工程決策方法結(jié)課論文-地級市地區(qū)生產(chǎn)總值數(shù)據(jù)分析

文檔簡介

溫馨提示

最新文檔

評論

免費下載