數(shù)理統(tǒng)計學課程設計--關于中小型銀行大數(shù)據(jù)的統(tǒng)計分析_第1頁
已閱讀1頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、<p>  關于中小型銀行大數(shù)據(jù)的統(tǒng)計分析</p><p><b>  年 月</b></p><p> 學 院</p><p> 專 業(yè)*****</p><p> 班 級***</p><p> 學 號*****</p><p> 

2、姓 名</p><p> 指導教師</p><p><b>  目錄</b></p><p><b>  前言1</b></p><p>  一、采集樣本及數(shù)據(jù)整理2</p><p>  1、數(shù)據(jù)的搜集方法及說明2</p><p>  2、

3、數(shù)據(jù)整理:給出頻數(shù)、頻率分布表及說明5</p><p>  3、畫出直方圖和折線圖并給出說明5</p><p>  4、 畫出經(jīng)驗分布函數(shù)7</p><p>  二、假定總體服從正態(tài)分布,給出,的估計8</p><p><b>  1、矩估計法8</b></p><p>  2、極大似然

4、估計8</p><p>  三、參數(shù)區(qū)間估計10</p><p>  1、方差未知,求數(shù)學期望的置信區(qū)間10</p><p>  2、數(shù)學期望,均未知,求方差的置信區(qū)間10</p><p>  四、參數(shù)的假設檢驗11</p><p>  1.樣本統(tǒng)計數(shù)據(jù)的t檢驗11</p><p>

5、  2.樣本統(tǒng)計數(shù)據(jù)的檢驗11</p><p>  五、 非參數(shù)假設檢驗13</p><p><b>  六、結論15</b></p><p><b>  參考文獻16</b></p><p><b>  前言</b></p><p>  數(shù)理統(tǒng)

6、計是一門對隨機現(xiàn)象進行有限次的觀測或試驗的結果進行數(shù)量研究,并依之對總體的數(shù)理規(guī)律性作出具有一定可靠性推斷的應用數(shù)學學科。也就是說,數(shù)理統(tǒng)計學是統(tǒng)計學的數(shù)學基礎,它是研究怎樣有效地收集、整理和分析帶有隨機性的數(shù)據(jù),以對所考察的問題作出推斷和預測,直至為采取一定的決策和行動提供依據(jù)和建議的數(shù)學分支。近幾十年來,數(shù)理統(tǒng)計的廣泛應用是非常引人注目的。在社會科學中,選舉人對政府意見的調(diào)查、民意測驗、經(jīng)濟價值的評估、產(chǎn)品銷路的預測、犯罪案件的偵破

7、等,都有數(shù)理統(tǒng)計的功勞[1]。在經(jīng)濟領域,從某種商品未來的銷售情況預測,甚至整個國家國民經(jīng)濟狀況預測及發(fā)展計劃的制定都要用到數(shù)理統(tǒng)計知識[2]。在自然科學、軍事科學、工農(nóng)業(yè)生產(chǎn)、醫(yī)療衛(wèi)生等領域,哪一個門類都離不開數(shù)理統(tǒng)計。它的用處之大不勝枚舉?;\統(tǒng)地說,數(shù)理統(tǒng)計學的理論和方法,與人類活動的各個領域在不同程度上都有關聯(lián)。因為各個領域內(nèi)的活動,都得在不同的程度上與數(shù)據(jù)打交道,都有如何收集和分析數(shù)據(jù)的問題,因此也就有數(shù)理統(tǒng)計學用武之地。可以這

8、么說,現(xiàn)代人的生活、科學的發(fā)展都離不開數(shù)理統(tǒng)計。從某種意義上講,數(shù)理統(tǒng)計在一個國家中的應用標志著這個國家的科學水平</p><p>  數(shù)理統(tǒng)計可以看做是概率論的推廣應用,其眾多內(nèi)容都是建立在概率論基礎之上的[4]。但是,數(shù)理統(tǒng)計作為純數(shù)學的一個方向,如果僅僅研究數(shù)理統(tǒng)計的數(shù)學性質(zhì),就脫離了數(shù)學在科學研究中應有的價值。正如數(shù)學以其邏輯性和嚴密性被其他學科作為有力工具運用于分析應用中一樣,數(shù)理統(tǒng)計也因為其邏輯性和嚴

9、密性被引用到銀行的領域中。本文就是對這方面的應用,通過用計算機領域中的信息安全技術,對全國中小型銀行的大數(shù)據(jù)處理個數(shù)的統(tǒng)計。其間分別進行了數(shù)據(jù)模型的選擇和建立,數(shù)據(jù)的采集,數(shù)據(jù)的整理,對數(shù)據(jù)進行的統(tǒng)計推斷,給出矩法估計、極大似然估計、給出參數(shù)估計區(qū)間、給出的t檢驗和檢驗,進行非參數(shù)擬合優(yōu)度檢驗,從而得出相應的結論。</p><p>  一、采集樣本及數(shù)據(jù)整理</p><p>  1、數(shù)據(jù)的

10、搜集方法及說明</p><p>  眾所周知,數(shù)據(jù)的搜集方法有直接搜集方法和間接搜集方法,直接搜集是直接向調(diào)查對象搜集反映調(diào)查單位的原始資料數(shù)據(jù)。而我采用的是間接搜集方法,也就是通過網(wǎng)絡搜集到已經(jīng)加工整理過的、能夠說明總體現(xiàn)象的數(shù)據(jù)。本文采集的是2012年5月1日中國部分中小型銀行利用信息安全技術對大數(shù)據(jù)處理個數(shù)。如表1-1所示:</p><p>  表1-1 中國部分

11、中小型銀行數(shù)據(jù)統(tǒng)計</p><p>  從表1-1中,可以非常明顯得看到各中小型銀行的大數(shù)據(jù)處理個數(shù),下面我們對各銀行做下討論與研究。</p><p>  2、數(shù)據(jù)整理:給出頻數(shù)、頻率分布表及說明</p><p>  從上面的表中看到,銀行大數(shù)據(jù)(單元:億)的樣本觀察值的最小值是湖北省孝感市商業(yè)銀行的個數(shù),最大值是位于北京市的北京銀行,取a=78,b=4418,全距

12、L=4418-78=4340,把數(shù)據(jù)分布的區(qū)間(78,4418]等分為10個子區(qū)間,等組距為,i=1,2,…10。</p><p>  通過計數(shù)求出落在各子區(qū)間的大數(shù)據(jù)個數(shù),則得頻數(shù)和頻率分布,列入表1-2。</p><p>  表1-2 大數(shù)據(jù)頻數(shù)和頻率分布表</p><p>  3、畫出直方圖和折線圖并給出說明</p&

13、gt;<p>  由于等組距,故在橫軸上截取子區(qū)間,且各子區(qū)間的寬度等于組距434,第i個小矩形的高為組頻數(shù),由此從直方圖的分布上可以大致看出大數(shù)據(jù)的分布。直方圖1-1和折線圖1-2所示。</p><p>  圖1-1 頻數(shù)-大數(shù)據(jù)子區(qū)間直方圖</p><p>  圖1-2 頻數(shù)-大數(shù)據(jù)子區(qū)間折線圖</p><p>  由圖1-1和圖1-2可見,直方圖

14、大致呈對稱形狀,可以認為大數(shù)據(jù)近似服從正態(tài)分布,其數(shù)學期望大致在2300附近。</p><p><b>  畫出經(jīng)驗分布函數(shù)</b></p><p>  由于依賴順序統(tǒng)計量的觀察值,所以是一個隨機變量,它的可能取值為:,,…,,1,故表示n次獨立試驗中,事件發(fā)生的頻率。樣本X1,X2,…Xn中n個隨機變量相互獨立,導致事件發(fā)生的概率等價于進行n次伯努力試驗,事件發(fā)生k

15、次的概率,即</p><p>  其中是總體X的分布函數(shù)。</p><p>  二、假定總體服從正態(tài)分布,給出,的估計</p><p><b>  1、矩估計法</b></p><p>  從總體中隨機抽取25個樣本:</p><p>  162.33, 702.22, 1233.85, 1501

16、, 1795.1, 1800, 1928.38, 2000, 2107, 2217,</p><p>  2240.77, 2247.81, 2507, 2577.56, 2627, 2668.4, 2681.5, 2699, 2926.7, </p><p>  2998.13, 3015.24, 3108.56, 3533.6, 3716, 4417.65 </p>

17、<p>  將樣本值代入,得出和的矩估計值:</p><p>  的矩估計值為 =2376.5</p><p>  的矩估計值為 =810220.1</p><p><b>  2、極大似然估計</b></p><p>  對正態(tài)總體,是二維參數(shù),設有樣本,,…,則似

18、然函數(shù)及其對數(shù)分別為</p><p>  將分別關于兩個分量求偏導并令其為0,即得到似然方程組</p><p>  解此方程組,可得的極大似然估計為</p><p>  將之代入第二方程,得出的極大似然估計</p><p>  所以的極大似然估計量為 </p><p>  的極大似然估計量為 </p>

19、<p>  將樣本值代入,得出,的極大似然估計值</p><p><b>  =2376.5</b></p><p> ?。?10353.15</p><p><b>  三、參數(shù)區(qū)間估計</b></p><p>  1、方差未知,求數(shù)學期望的置信區(qū)間</p><p&

20、gt;  當已知時,選取樣本的函數(shù)服從標準正態(tài)分布,即</p><p>  給定置信水平0.95,使</p><p>  分位數(shù)為,上式等價于</p><p>  則的置信水平為0.95的置信區(qū)間為</p><p>  2、數(shù)學期望,均未知,求方差的置信區(qū)間</p><p><b>  選取樣本的函數(shù)為<

21、;/b></p><p>  給定置信水平0.95,使</p><p>  從分布表查出分位數(shù)為,,于是</p><p>  樣本方差為844117.9則的置信水平為0.95的置信區(qū)間為</p><p><b>  四、參數(shù)的假設檢驗</b></p><p>  1.樣本統(tǒng)計數(shù)據(jù)的t檢驗&l

22、t;/p><p>  假設所有銀行所處理的大數(shù)據(jù)個數(shù)都為2400億個。 </p><p>  (1) 原假設和備擇假設</p><p><b>  , </b></p><p>  (2) 選取檢驗統(tǒng)計量</p><p>  當原假設為真時,檢驗統(tǒng)計量為</p><p&

23、gt;<b>  (3) 確定拒絕域</b></p><p><b>  給定顯著水平,使</b></p><p>  查t分布表得臨界值為,則拒絕域為或。</p><p>  (4) 樣本標準差為,計算檢驗統(tǒng)計量的觀察值,</p><p><b>  (5) 作判斷</b>&

24、lt;/p><p>  由于,因此接受原假設。認為所有銀行所處理的大數(shù)據(jù)均為2400億個。</p><p>  2.樣本統(tǒng)計數(shù)據(jù)的檢驗</p><p>  (1) 原假設和備擇假設</p><p><b>  , </b></p><p>  (2) 選取檢驗統(tǒng)計量</p><

25、;p>  當原假設為真時,檢驗統(tǒng)計量為</p><p><b>  (3) 確定拒絕域</b></p><p>  樣本方差為844117.9,給定顯著性水平,使</p><p>  則拒絕域為(0,10.856]或[42.980,)。</p><p>  計算檢驗統(tǒng)計量的觀察值</p><p&

26、gt;<b>  (5)作判斷 </b></p><p>  因為,所以接受原假設。</p><p><b>  非參數(shù)假設檢驗</b></p><p><b>  擬合優(yōu)度檢驗</b></p><p>  頻率分布如表1-2所示,通過畫直方圖,粗略知大數(shù)據(jù)個數(shù)服從正態(tài)分布,數(shù)

27、學期望大致在2300左右。檢驗在顯著性水平下,各銀行的大數(shù)據(jù)個數(shù)X是否服從正態(tài)分布。</p><p><b>  原假設和備擇假設為</b></p><p><b>  , 不真</b></p><p>  其中,均為未知參數(shù)。,的極大似然估計值分別為</p><p>  =2376.5,

28、 </p><p>  以表1-2為基礎,原假設為真時,計算隨機變量X 落在各小區(qū)間的概率。</p><p><b>  …</b></p><p><b>  等價檢驗假設</b></p><p><b>  ,,…,</b></p><p>  計算

29、結果列于表5-1。</p><p>  表5-1 各區(qū)間概率</p><p>  合并后的區(qū)間個數(shù)為k=7,隨機變量分布中含有兩個未知參數(shù),因此當原假設為真時,檢驗統(tǒng)計量為</p><p><b>  給定顯著性水平,使</b></p><p>  臨界值為,則拒絕域為

30、[9.448,)。</p><p>  檢驗統(tǒng)計量的觀察值為</p><p>  因此,因此接受原假設,可以認為大數(shù)據(jù)個數(shù)服從正態(tài)分布N(2376.5,900.1962)。</p><p><b>  六、結論</b></p><p>  本文第一部分對全國中小型銀行的大數(shù)據(jù)處理情況分別進行采集、數(shù)據(jù)整理,給出了頻數(shù)、頻

31、率分布表并畫出了直方圖和折線圖并給出說明,通過得到的圖可以看出期望大致在2300左右。第二部分給出,的估計,包括矩估計和極大似然估計,從而得到估計的期望和方差。第三部分是參數(shù)區(qū)間估計,有方差未知時,在置信水平為0.95時得到的數(shù)學期望的置信區(qū)間;還有數(shù)學期望,均未知,也是置信水平為0.95時所得到的方差的置信區(qū)間。第四部分是參數(shù)的假設檢驗,有樣本統(tǒng)計數(shù)據(jù)的t檢驗,通過判斷接受原假設,可以認為所有銀行所處理的大數(shù)據(jù)均為2400億個。還有樣

32、本統(tǒng)計數(shù)據(jù)的檢驗,通過分析,可以接受原假設。最后第五章是非參數(shù)假設檢驗,也就是對總體分布不作任何假設,至多設總體服從連續(xù)分布,這種就是非參數(shù)假設檢驗。這章就是針對總體分布未知,檢驗總體是否服從正態(tài)分布,利用樣本觀察值對總體分布作出推斷[5] 。實際上是檢驗樣本與理論分布的擬合優(yōu)度,這一節(jié)所用的就是擬合優(yōu)度檢驗,通過檢驗得出,可以認為樣本服從正態(tài)分布N(2376.5,900.1962)。</p><p><b

33、>  參考文獻</b></p><p>  [1] 梁相龍.論數(shù)理統(tǒng)計在客觀現(xiàn)實中的意義與作用[J].Forum on Contemporary </p><p>  Education,2011(02)</p><p>  [2] 李志浩.數(shù)理統(tǒng)計與現(xiàn)代金融[B].征信,2012(4)</p><p>  [3] 陸冬

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論