管理工程決策方法結(jié)課論文-地級(jí)市地區(qū)生產(chǎn)總值數(shù)據(jù)分析_第1頁(yè)
已閱讀1頁(yè),還剩23頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、<p><b>  管理工程決策方法</b></p><p><b>  課程論文</b></p><p>  院 系 物流學(xué)院 </p><p>  專(zhuān) 業(yè) 物流工程 </p><p>  班 級(jí) 物工一班

2、 </p><p>  地級(jí)市地區(qū)生產(chǎn)總值數(shù)據(jù)分析</p><p>  關(guān)鍵詞:地區(qū)生產(chǎn)總值;時(shí)間序列;聚類(lèi)分析;回歸分析</p><p><b>  第1章 緒論</b></p><p><b>  1.1研究目的</b></p><p>  地區(qū)生產(chǎn)總值(地區(qū)GDP)是

3、一個(gè)地區(qū)的所有常住單位在一定時(shí)期內(nèi)所生產(chǎn)的全部最終產(chǎn)品和服務(wù)的價(jià)值總和是反映經(jīng)濟(jì)總體狀況最重要的指標(biāo),GDP就像天氣的衛(wèi)星云圖一樣,能夠提供經(jīng)濟(jì)狀況的完整圖像,能夠幫助領(lǐng)導(dǎo)者判斷經(jīng)濟(jì)是在萎縮還是在膨脹,是需要刺激還是需要控制,是處于嚴(yán)重衰退還是處于通脹威脅之中。如果沒(méi)有像GDP這樣的總量指標(biāo),政策制定者就會(huì)陷入雜亂無(wú)章的數(shù)字海洋而不知所措。,地區(qū)GDP可以反映一個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展規(guī)模,判斷其經(jīng)濟(jì)總體實(shí)力和經(jīng)濟(jì)發(fā)展的快慢,還可以用來(lái)進(jìn)行經(jīng)濟(jì)

4、結(jié)構(gòu)分析,是宏觀(guān)經(jīng)濟(jì)決策的重要依據(jù)。所以通過(guò)研究各地區(qū)的生產(chǎn)總值,可以讓我們了解全國(guó)各地區(qū)的經(jīng)濟(jì)發(fā)展水平并將同一級(jí)別的城市進(jìn)行聚類(lèi),同時(shí)也有利于進(jìn)行相應(yīng)的政策支持。</p><p><b>  1.2數(shù)據(jù)來(lái)源</b></p><p>  此數(shù)據(jù)來(lái)自2009-2011年中國(guó)城市統(tǒng)計(jì)年鑒的地級(jí)市地區(qū)生產(chǎn)總值(如下圖)</p><p><b&g

5、t;  圖1- 1數(shù)據(jù)來(lái)源</b></p><p><b>  1.3研究思路</b></p><p><b>  圖1- 2研究思路</b></p><p>  第2章 數(shù)據(jù)挖掘與處理</p><p><b>  2.1數(shù)據(jù)挖掘簡(jiǎn)介</b></p>

6、<p>  2.1.1數(shù)據(jù)挖掘的定義</p><p>  數(shù)據(jù)挖掘是從大量的原始數(shù)據(jù)中采用多種方法去尋找數(shù)據(jù)間隱含的有趣模式和知識(shí)的過(guò)程。如果數(shù)據(jù)挖掘的過(guò)程可形象的比喻成從黃金礦山中幵釆黃金(如圖2-1所示),那么原始數(shù)據(jù)具的大容量、含噪音和異質(zhì)數(shù)據(jù)就像是礦山上的廢漁一樣;挖掘算法好比肝釆工具一樣具有多樣化特點(diǎn);數(shù)據(jù)間隱藏的模式和知識(shí)就如黃金一樣事先人們是看不到的、但是對(duì)人們又非常有用。[1]</

7、p><p>  2.1.2挖掘數(shù)據(jù)的類(lèi)型</p><p>  數(shù)掘挖掘足一種通用的技術(shù),它可以挖掘任何對(duì)目標(biāo)應(yīng)用有意義的數(shù)據(jù)。</p><p>  這些數(shù)據(jù)大致可分以下四類(lèi):</p><p><b> ?。?)數(shù)據(jù)庫(kù)數(shù)據(jù)</b></p><p>  作為數(shù)據(jù)挖掘研究中最主要的數(shù)據(jù)形式,關(guān)系數(shù)據(jù)庫(kù)擁有豐

8、富的數(shù)據(jù)源。它是許多表的匯集,每個(gè)表都包含許多字段,并且存放大量的記錄。每一個(gè)記錄代表一個(gè)對(duì)象,被唯一的關(guān)鍵字所標(biāo)識(shí),并且被其它字段描述它的屬性。</p><p><b> ?。?)數(shù)據(jù)倉(cāng)庫(kù)</b></p><p>  數(shù)據(jù)倉(cāng)庫(kù)是按照某一主題組織的、經(jīng)過(guò)清理加工和整理的、能夠反映歷史各階段信息的、相對(duì)較穩(wěn)定的數(shù)據(jù)的累積。</p><p><

9、;b> ?。?)事務(wù)數(shù)據(jù)</b></p><p>  事務(wù)數(shù)據(jù)庫(kù)中的每一個(gè)記錄表示一個(gè)事務(wù),每個(gè)事務(wù)擁有唯一的標(biāo)識(shí)號(hào),以及組成事務(wù)的項(xiàng)的列表。</p><p> ?。?)其它類(lèi)型的數(shù)據(jù)</p><p>  除了上述三種數(shù)據(jù)以外,還有很多其它數(shù)據(jù)也可以作為數(shù)據(jù)挖掘的數(shù)據(jù)源。例如工程設(shè)計(jì)數(shù)據(jù)(如集成電路)、多媒體和文本數(shù)據(jù)(如音頻、視頻)、數(shù)據(jù)流(如視

10、頻監(jiān)控)、空間數(shù)據(jù)(如導(dǎo)航地圖)等等。</p><p>  2.1.3數(shù)據(jù)挖掘的任務(wù)</p><p>  數(shù)據(jù)的挖掘任務(wù)包括兩類(lèi),第一類(lèi)任務(wù)用于刻畫(huà)目標(biāo)數(shù)據(jù)中數(shù)據(jù)的性質(zhì),第二類(lèi)任務(wù)用于在當(dāng)前數(shù)據(jù)上分析判斷,然后做出預(yù)測(cè)。前者屬于描述性任務(wù),而后者屬于預(yù)測(cè)性任務(wù)。一般而言,數(shù)據(jù)的挖掘任務(wù)有如下6種任務(wù):</p><p> ?。?)數(shù)據(jù)特征化與區(qū)分(2)關(guān)聯(lián)分析 (

11、3)分類(lèi)</p><p>  (4)聚類(lèi)分析 (5)離群點(diǎn)分析 (6)序列模式</p><p>  2.1.4數(shù)據(jù)挖掘的步驟</p><p><b> ?。?)確定問(wèn)題</b></p><p>  明確數(shù)據(jù)挖掘任務(wù)的具體需求和確定挖掘釆用的具體方法(如關(guān)聯(lián)、分類(lèi)、聚類(lèi)等)。</p><p

12、>  (2)數(shù)據(jù)收集和預(yù)處理</p><p>  此步驟主要包括數(shù)據(jù)的選擇、預(yù)處理以及轉(zhuǎn)換。</p><p>  1數(shù)據(jù)選擇就是確定挖掘任務(wù)的目標(biāo)數(shù)據(jù),依據(jù)任務(wù)要求,從相關(guān)數(shù)據(jù)源中選取任務(wù)相關(guān)數(shù)據(jù)。</p><p>  2、數(shù)據(jù)預(yù)處理一般包括空缺處理、平滑噪聲、數(shù)據(jù)規(guī)約、數(shù)據(jù)類(lèi)型轉(zhuǎn)換、數(shù)據(jù)集成等處理。</p><p>  3、數(shù)據(jù)轉(zhuǎn)換是

13、指從對(duì)象的初始屬性中選取挖掘任務(wù)相關(guān)的屬性,來(lái)提高挖掘的整體效率。</p><p><b> ?。?)數(shù)據(jù)挖掘</b></p><p>  根據(jù)所選定的挖掘方法,對(duì)上面步驟處理好的數(shù)據(jù),選擇合適的挖掘算法進(jìn)行數(shù)據(jù)挖掘得出模型。</p><p><b> ?。?)分析和評(píng)估</b></p><p> 

14、 對(duì)上面步驟中挖掘所得的模型進(jìn)行評(píng)估分析。需要注意的是整個(gè)數(shù)據(jù)挖掘的過(guò)程是需要不斷反饋和修正的。當(dāng)在挖掘的過(guò)程中發(fā)現(xiàn)由于數(shù)據(jù)不合適或者挖掘方法不恰當(dāng),造成挖掘的結(jié)果不夠理想,那么需要重復(fù)挖掘過(guò)程,如果有需要的話(huà),可以從頭重新開(kāi)始。</p><p><b> ?。?)知識(shí)的應(yīng)用</b></p><p>  將最后確定的有用挖掘結(jié)果(知識(shí))應(yīng)用到問(wèn)題中去。</p&g

15、t;<p><b>  2.2數(shù)據(jù)處理</b></p><p>  在數(shù)據(jù)挖掘整體過(guò)程中,海量的原始數(shù)據(jù)中存在著大量雜亂的、重復(fù)的、不完整的數(shù)據(jù),嚴(yán)重影響到數(shù)據(jù)挖掘算法的執(zhí)行效率,甚至可能導(dǎo)致挖掘結(jié)果的偏差。為此,在數(shù)據(jù)挖掘算法執(zhí)行之前,必須對(duì)收集到的原始數(shù)據(jù)進(jìn)行預(yù)處理,以改進(jìn)數(shù)據(jù)的質(zhì)量,提高數(shù)據(jù)挖掘過(guò)程的效率、精度和性能。數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換與數(shù)據(jù)歸

16、約等技術(shù)</p><p>  圖2- 1剔除各省名稱(chēng)和空值</p><p>  2.2時(shí)間序列數(shù)據(jù)準(zhǔn)備</p><p>  選取各城市地區(qū)生產(chǎn)總值的全市數(shù)值列匯總到時(shí)間序列原數(shù)據(jù)表格</p><p><b>  圖2- 2</b></p><p>  2.3聚類(lèi)分析和回歸數(shù)據(jù)準(zhǔn)備</p>

17、;<p>  將2008-2011年數(shù)據(jù)整理</p><p><b>  圖2- 3</b></p><p>  第3章 地區(qū)生產(chǎn)總值數(shù)據(jù)分析</p><p>  3.1 2012-2017年時(shí)間序列分析</p><p>  3.1.1時(shí)間序列分析簡(jiǎn)介</p><p>  時(shí)間序列

18、:是指將某種現(xiàn)象某一個(gè)統(tǒng)計(jì)指標(biāo)在不同時(shí)間上的各個(gè)數(shù)值,按時(shí)間先后順序排列而形成的序列。時(shí)間序列法是一種定量預(yù)測(cè)方法,亦稱(chēng)簡(jiǎn)單外延方法。在統(tǒng)計(jì)學(xué)中作為一種常用的預(yù)測(cè)手段被廣泛應(yīng)用。時(shí)間序列分析在第二次世界大戰(zhàn)前應(yīng)用于經(jīng)濟(jì)預(yù)測(cè)。二次大戰(zhàn)中和戰(zhàn)后,在軍事科學(xué)、空間科學(xué)、氣象預(yù)報(bào)和工業(yè)自動(dòng)化等部門(mén)的應(yīng)用更加廣泛。時(shí)間序列分析(Time series analysis)是一種動(dòng)態(tài)數(shù)據(jù)處理的統(tǒng)計(jì)方法。該方法基于隨機(jī)過(guò)程理論和數(shù)理統(tǒng)計(jì)學(xué)方法,研究隨機(jī)

19、數(shù)據(jù)序列所遵從的統(tǒng)計(jì)規(guī)律,以用于解決實(shí)際問(wèn)題。</p><p>  時(shí)間序列分析方法:它包括一般統(tǒng)計(jì)分析(如自相關(guān)分析,譜分析等),統(tǒng)計(jì)模型的建立與推斷,以及關(guān)于時(shí)間序列的最優(yōu)預(yù)測(cè)、控制與濾波等內(nèi)容。經(jīng)典的統(tǒng)計(jì)分析都假定數(shù)據(jù)序列具有獨(dú)立性,而時(shí)間序列分析則側(cè)重研究數(shù)據(jù)序列的互相依賴(lài)關(guān)系。后者實(shí)際上是對(duì)離散指標(biāo)的隨機(jī)過(guò)程的統(tǒng)計(jì)分析,所以又可看作是隨機(jī)過(guò)程統(tǒng)計(jì)的一個(gè)組成部分。例如,記錄了某地區(qū)第一個(gè)月,第二個(gè)月,……

20、,第N個(gè)月的降雨量,利用時(shí)間序列分析方法,可以對(duì)未來(lái)各月的雨量進(jìn)行預(yù)報(bào)。</p><p>  隨著計(jì)算機(jī)的相關(guān)軟件的開(kāi)發(fā),數(shù)學(xué)知識(shí)不再是空談理論,時(shí)間序列分析主要是建立在數(shù)理統(tǒng)計(jì)等知識(shí)之上,應(yīng)用相關(guān)數(shù)理知識(shí)在相關(guān)方面的應(yīng)用等。</p><p><b>  3.1.2數(shù)據(jù)分析</b></p><p>  (1)導(dǎo)入2008年-2009年數(shù)據(jù)<

21、;/p><p><b>  圖3- 1</b></p><p><b> ?。?)讀取值</b></p><p><b>  圖3- 2</b></p><p> ?。?)設(shè)置時(shí)間區(qū)間和初始年份</p><p>  時(shí)間以年為單位,初始年份為2008年<

22、;/p><p><b>  圖3- 3</b></p><p><b>  并預(yù)測(cè)未來(lái)五年</b></p><p><b>  圖3- 4</b></p><p><b>  采用指數(shù)平滑方法,</b></p><p>  指數(shù)平滑方法

23、:最近的過(guò)去態(tài)勢(shì),在某種程度上會(huì)持續(xù)到最近的未來(lái),所以將較大的權(quán)值放在最近的數(shù)據(jù)樣本上。 </p><p>  原理:任一期的指數(shù)平滑值都是本期實(shí)際觀(guān)察值與前一期指數(shù)平滑值的加權(quán)平均。</p><p>  基本思想:預(yù)測(cè)值是以前觀(guān)察值的加權(quán)和,且對(duì)不同的數(shù)據(jù)給予不同的權(quán)值,新數(shù)據(jù)給較大的權(quán)值,舊數(shù)據(jù)給較小的權(quán)值。</p><p><b>  圖3- 5&l

24、t;/b></p><p> ?。?)選定地區(qū)生產(chǎn)總值進(jìn)行繪圖</p><p><b>  圖3- 6</b></p><p><b>  (5)運(yùn)行預(yù)測(cè)如下</b></p><p><b>  圖3- 7</b></p><p><b>

25、; ?。?)圖形如下</b></p><p>  指數(shù)平滑建模結(jié)果如下</p><p><b>  圖3- 8</b></p><p><b>  專(zhuān)家建模器結(jié)果如下</b></p><p><b>  圖3- 9</b></p><p>&

26、lt;b>  模型如下</b></p><p><b>  圖3- 10</b></p><p>  3.2 2008-2011年各地區(qū)生產(chǎn)總值聚類(lèi)分析</p><p>  3.2.1聚類(lèi)分析及算法簡(jiǎn)介</p><p> ?。?)聚類(lèi)分析(Cluster Analysis)又稱(chēng)群分析,是根據(jù)“物以類(lèi)聚”

27、的道理,對(duì)樣品或指標(biāo)進(jìn)行分類(lèi)的一種多元統(tǒng)計(jì)分析方法,它們討論的對(duì)象是大量的樣品,要求能合理地按各自的特性來(lái)進(jìn)行合理的分類(lèi),沒(méi)有任何模式可供參考或依循,即是在沒(méi)有先驗(yàn)知識(shí)的情況下進(jìn)行的。聚類(lèi)分析起源于分類(lèi)學(xué),在古老的分類(lèi)學(xué)中,人們主要依靠經(jīng)驗(yàn)和專(zhuān)業(yè)知識(shí)來(lái)實(shí)現(xiàn)分類(lèi),很少利用數(shù)學(xué)工具進(jìn)行定量的分類(lèi)。隨著人類(lèi)科學(xué)技術(shù)的發(fā)展,對(duì)分類(lèi)的要求越來(lái)越高,以致有時(shí)僅憑經(jīng)驗(yàn)和專(zhuān)業(yè)知識(shí)難以確切地進(jìn)行分類(lèi),于是人們逐漸地把數(shù)學(xué)工具引用到了分類(lèi)學(xué)中,形成了數(shù)值分

28、類(lèi)學(xué),之后又將多元分析的技術(shù)引入到數(shù)值分類(lèi)學(xué)形成了聚類(lèi)分析。</p><p>  聚類(lèi)分析被應(yīng)用于很多方面,在商業(yè)上,聚類(lèi)分析被用來(lái)發(fā)現(xiàn)不同的客戶(hù)群,并且通過(guò)購(gòu)買(mǎi)模式刻畫(huà)不同的客戶(hù)群的特征;在生物上,聚類(lèi)分析被用來(lái)動(dòng)植物分類(lèi)和對(duì)基因進(jìn)行分類(lèi),獲取對(duì)種群固有結(jié)構(gòu)的認(rèn)識(shí);在地理上,聚類(lèi)能夠幫助在地球中被觀(guān)察的數(shù)據(jù)庫(kù)商趨于的相似性;在保險(xiǎn)行業(yè)上,聚類(lèi)分析通過(guò)一個(gè)高的平均消費(fèi)來(lái)鑒定汽車(chē)保險(xiǎn)單持有者的分組,同時(shí)根據(jù)住宅類(lèi)型

29、,價(jià)值,地理位置來(lái)鑒定一個(gè)城市的房產(chǎn)分組;在因特網(wǎng)應(yīng)用上,聚類(lèi)分析被用來(lái)在網(wǎng)上進(jìn)行文檔歸類(lèi)來(lái)修復(fù)信息。</p><p>  聚類(lèi)是將數(shù)據(jù)分類(lèi)到不同的類(lèi)或者簇這樣的一個(gè)過(guò)程,所以同一個(gè)簇中的對(duì)象有很大的相似性,而不同簇間的對(duì)象有很大的相異性。聚類(lèi)分析的目標(biāo)就是在相似的基礎(chǔ)上收集數(shù)據(jù)來(lái)分類(lèi)。聚類(lèi)源于很多領(lǐng)域,包括數(shù)學(xué),計(jì)算機(jī)科學(xué),統(tǒng)計(jì)學(xué),生物學(xué)和經(jīng)濟(jì)學(xué)。在不同的應(yīng)用領(lǐng)域,很多聚類(lèi)技術(shù)都得到了發(fā)展,這些技術(shù)方法被用作描

30、述數(shù)據(jù),衡量不同數(shù)據(jù)源間的相似性,以及把數(shù)據(jù)源分類(lèi)到不同的簇中。</p><p> ?。?)聚類(lèi)方法的特征</p><p>  1、聚類(lèi)分析簡(jiǎn)單、直觀(guān);</p><p>  2、聚類(lèi)分析主要應(yīng)用于探索性的研究,其分析的結(jié)果可以提供多個(gè)可能的解,選擇最終的解需要研究者的主觀(guān)判斷和后續(xù)的分析;</p><p>  3、不管實(shí)際數(shù)據(jù)中是否真正存在不

31、同的類(lèi)別,利用聚類(lèi)分析都能得到分成若干類(lèi)別的解;</p><p>  4、聚類(lèi)分析的解完全依賴(lài)于研究者所選擇的聚類(lèi)變量,增加或刪除一些變量對(duì)最終的解都可能產(chǎn)生實(shí)質(zhì)性的影響;</p><p>  5、研究者在使用聚類(lèi)分析時(shí)應(yīng)特別注意可能影響結(jié)果的各個(gè)因素;</p><p>  6、異常值和特殊的變量對(duì)聚類(lèi)有較大影響,當(dāng)分類(lèi)變量的測(cè)量尺度不一致時(shí),需要事先做標(biāo)準(zhǔn)化處理。

32、</p><p> ?。?)K-means算法</p><p>  也稱(chēng)k-平均算法。k-means是一種迭代算法,初始的k個(gè)簇被隨機(jī)的定義之后,這些簇將被不斷地更新,并在更新中被優(yōu)化,當(dāng)無(wú)法再進(jìn)一步優(yōu)化(或者達(dá)到一定的迭代次數(shù))時(shí)算法才停止,然后生成模型。</p><p>  在k-means算法中,每個(gè)簇有一個(gè)中心,稱(chēng)為“質(zhì)心”,k個(gè)簇就相應(yīng)地有k個(gè)質(zhì)心。一個(gè)樣

33、本究竟被劃分到哪個(gè)簇,就看它和哪個(gè)質(zhì)心的“相異度”最小。在k-means算法中,衡量相異度的指標(biāo)是“距離”。所以也可以這么說(shuō),一個(gè)樣本究竟被劃分到哪個(gè)簇,就看它和哪個(gè)質(zhì)心的“距離”最小。這里的距離,則是由樣本的每一個(gè)屬性的取值來(lái)共同參與決定的。</p><p><b>  3.2.2數(shù)據(jù)分析</b></p><p><b>  (1)建立模型如下</b

34、></p><p><b>  圖3- 11</b></p><p>  (2)導(dǎo)入2008年地區(qū)生產(chǎn)總值數(shù)據(jù)</p><p><b>  圖3- 12</b></p><p><b> ?。?)讀取值</b></p><p><b> 

35、 圖3- 13</b></p><p> ?。?)設(shè)置聚類(lèi)數(shù)并運(yùn)行</p><p><b>  圖3- 14</b></p><p><b> ?。?)得到結(jié)果</b></p><p><b>  圖3- 15</b></p><p>  由

36、上圖可知聚類(lèi)7占所有的34.1%,而這些城市多是通遼市,呼倫貝爾市,巴彥淖爾市,吉林市,四平市這些城市大多市轄區(qū)地區(qū)生產(chǎn)總值增長(zhǎng)率較高都保持在20%以上,且其發(fā)展水平在國(guó)家各城市發(fā)展水平的中部,有較高發(fā)展前景。</p><p>  (6)分別帶入2009.2010.2011年數(shù)據(jù)取得結(jié)果</p><p>  圖3- 16 2009年</p><p>  圖3- 1

37、7 2010年</p><p>  圖3- 18 2011年</p><p>  分別選取通遼市,呼倫貝爾市,巴彥淖爾市,吉林市,四平市等城市進(jìn)行跟蹤對(duì)比得到下圖</p><p><b>  表3- 1</b></p><p>  由上表可以看出在2008年到2009年,9所城市發(fā)展情況差不多,地區(qū)生產(chǎn)總值都在穩(wěn)步提

38、升,但到2010年開(kāi)始聚類(lèi)層次不一致的情況,且有些城市增速放緩,到2011年更加明顯聚類(lèi)更加不一致,以通遼市、吉林市、松原市為代表的聚類(lèi)5繼續(xù)保持快速上升趨勢(shì)。而通化市的增速則放緩了。</p><p>  3.3 2008年-2011年各城市地區(qū)生產(chǎn)總值回歸分析</p><p>  3.3.1線(xiàn)性回歸介紹</p><p>  線(xiàn)性回歸是一種古老類(lèi)型的技術(shù)統(tǒng)計(jì),是重

39、要的也是最有用的挖掘工具之一。線(xiàn)性回歸能夠使挖掘者找到數(shù)據(jù)中最有價(jià)值和最深入的發(fā)現(xiàn),同時(shí),也很容易解釋在被發(fā)現(xiàn)的關(guān)系上發(fā)生了什么。本質(zhì)上,線(xiàn)性回歸是一種探索式、驗(yàn)證性的方式,尋找穿過(guò)狀態(tài)空間的單獨(dú)一條直線(xiàn)以便使這條直線(xiàn)盡可能地靠近空間中的所有點(diǎn)。當(dāng)狀態(tài)空間多于二維時(shí),它不是恰好一條直線(xiàn)。在三維空間中,它是一個(gè)面,在多維空間中,它將是二維空間中直線(xiàn)的高緯度模擬。以二維的狀態(tài)空間為例,只要數(shù)據(jù)很好地聚合至少大致接近于一條直線(xiàn)(如圖1所示),

40、就可以對(duì)數(shù)據(jù)集合進(jìn)行解釋和預(yù)測(cè)。因?yàn)橹本€(xiàn)被調(diào)整得離所有的點(diǎn)盡可能近,當(dāng)通過(guò)一個(gè)已知變量進(jìn)行預(yù)測(cè)時(shí),其預(yù)測(cè)值在狀態(tài)空間中應(yīng)當(dāng)在直線(xiàn)附近。所以,直線(xiàn)上的點(diǎn)所返回的變量值是一個(gè)合理值的近似估計(jì)值。[2]</p><p>  在Clementine中,一元或多元線(xiàn)性回歸分析由回歸節(jié)點(diǎn)來(lái)完成,它采用最小二乘法來(lái)根據(jù)樣本數(shù)據(jù)建立回歸方程。在回歸模型中只能使用連續(xù)型字段,必須有且僅有一個(gè)目標(biāo)字段(輸出字段,因變量),可以有一個(gè)

41、或多個(gè)預(yù)測(cè)變量(輸入字段,自變量)</p><p><b>  3.3.2數(shù)據(jù)分析</b></p><p><b> ?。?)建立模型</b></p><p><b>  圖3- 19</b></p><p><b>  (2)導(dǎo)入數(shù)據(jù)</b></p

42、><p><b>  圖3- 20</b></p><p>  (3)讀取值并設(shè)置全市地區(qū)生產(chǎn)總值為目標(biāo)</p><p><b>  圖3- 21</b></p><p> ?。?)設(shè)置方法為進(jìn)入法</p><p><b>  圖3- 22</b></

43、p><p><b> ?。?)運(yùn)行模型</b></p><p><b>  圖3- 23</b></p><p>  (6)設(shè)置不同的方法運(yùn)行</p><p><b>  圖3- 24</b></p><p><b>  取得結(jié)果如下</b&

44、gt;</p><p><b>  逐步法</b></p><p>  圖3- 25 逐步法</p><p><b>  后退法</b></p><p>  圖3- 26 后退法</p><p><b>  前進(jìn)法</b></p>&l

45、t;p>  圖3- 27 前進(jìn)法</p><p>  通過(guò)回歸分析的預(yù)測(cè),可以得知各城市基本在保持穩(wěn)定增長(zhǎng)。</p><p><b>  第4章 總結(jié)</b></p><p>  本文通過(guò)分別的2012年到2017年的時(shí)間序列分析,2008年到2011年地區(qū)生產(chǎn)總值聚類(lèi)分析以及2011年各城市地區(qū)的回歸分析,得到一些結(jié)論,隨著中國(guó)發(fā)展,

46、基本上各城市都保持這穩(wěn)定的地區(qū)經(jīng)濟(jì)發(fā)展,像通遼市、吉林市、松原市為代表的中國(guó)中等發(fā)展水平的城市現(xiàn)在仍然在保持著每年10%以上的地區(qū)生產(chǎn)總值增長(zhǎng)率,但是像呼倫貝爾市,巴彥淖爾,四平市等東北部城市增速放緩,已經(jīng)處于中下等增速城市,需要國(guó)家政策支持。</p><p><b>  參考文獻(xiàn)</b></p><p>  [1] 孫兵. 數(shù)據(jù)挖掘在高校招生中應(yīng)用的研究[D].安徽

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論