版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第三章用表格法和圖形法描述統(tǒng)計數據,第三章用表格法和圖形法描述統(tǒng)計數據,第一節(jié) 數據的預處理 第二節(jié) 品質數據的整理和描述第三節(jié) 數值型數據的整理和描述第四節(jié) 統(tǒng)計表,學習目標,了解數據預處理的內容和目的掌握品質數據整理和描述的方法掌握數量數據整理和描述的方法用Excel作頻數分布表和分布圖合理使用統(tǒng)計表,統(tǒng)計數據為什么要用圖表描述?,1、原始數據反映個體特征,龐大而雜亂,單從原始數 據中
2、無法得到總體特征和數量規(guī)律,2、圖表描述的結果能反映樣本分布特征,3、圖表描述的結果可用于研究變量之間的關系,,,用圖表法描述數據的一般過程,本章內容,第一節(jié) 數據的預處理,第二節(jié) 用圖表法描述品質數據,第三節(jié) 用圖表法描述數量數據,第一節(jié) 數據的預處理,,,,一、數據的審核,二、數據的篩選,三、數據的排序,,一、數據的審核,原始數據,,確認是否有必要做進一步的加工整理,第二手數據,一、數據的審核,計算檢查——主要用于對數量數據
3、的審核,檢查調查表中的各項數據在計算結果和計算方法上有無錯誤,,SomethingWrong !!!,審核數據準確性的方法,審核數據準確性的方法,邏輯檢查——主要用于對品質數據的審核,從定性角度,審核數據是否符合邏輯,內容是否合理,各項目或數字之間有無相互矛盾的現象,他們住在同一區(qū),不,他們住在三個區(qū)!,二、數據的篩選——處理數據中的錯誤,數據錯誤,能,按一定順序將數據排列,以發(fā)現一些明顯的特征或趨勢,找到解決問題的線索排序有助于對
4、數據檢查糾錯,以及為重新歸類或分組等提供依據在某些場合,排序本身就是分析的目的之一排序可借助于計算機完成,三、數據的排序——發(fā)現數據的基本特征,8 3 1 5 7 2 4 6,1 2 3 4 5 6 7 8,一、數據的整理,要弄清所面對的數據類型,因為不同類型的數據,所采取的處理方式和方法是不同的對品質數據主要是做分類整理對數量數據主要是做分組整理適合于低層次數據的整理和顯示方法也適合于高層次的數據;但適合于高層次數據的整理和
5、顯示方法并不適合于低層次的數據,第二節(jié) 用圖表法描述品質數據,一、品質數據的整理,二、品質數據的展示,品質數據的整理,確定分類標志,整理過程,數據整理中計算的指標,定類數據,定序數據,頻數,頻率,累計頻數,累計頻率,落在各類別中數據的個數,,,,,將對比的基數作為100而計算的比值,將各類別的頻數逐級累加,將各類別的頻率(百分比)逐級累加,實例1:定類數據的頻數分布表,【例3.1】某市移動公司為研究移動數據業(yè)務集團客戶的行業(yè)分布狀況
6、,搜集了該城市90個集團客戶的客戶資料。將其所屬行業(yè)分為下列類別:1.金融(銀行證券保險)2.政府,工商、稅務3.制造業(yè)4.教育科研5.交通運輸6.批發(fā)零售7.公用事業(yè)8.旅游酒店,實例2:定序數據的頻數分布表,【例3.2】在一項關于用戶移動業(yè)務支出情況的調查中,研究人員在某城市抽樣調查了330名移動用戶,對其中的一個問題:“手機話費一個月多少錢?”設了七個選項:1、100元以內2、 101-200元3、201-3
7、00元4、301-500元5、501-600元6、601-1200元7、1501元以上,二、數據的展示,3 to 5 years,數據類型與圖示,,品質數據的圖示─條形圖(Bar Graph),在表示品質數據的分布時,條形圖是用條形圖的高度或長短來表示各類別數據的頻數或頻率繪制時,各類別可以放在縱軸,稱為條形圖,也可以放在橫軸,稱為柱形圖條形圖和柱形圖有單式、復式等形式,3 to 5 years,用EXCEL制作的條形圖,柱
8、形圖的應用——Fixed revenue evolution,2007年上半年中國移動增值業(yè)務占運營總收入的25.2% ,中國電信非話業(yè)務收入占比34.5%,品質數據的圖示─圓形圖(Pie Graph),圓形圖也稱餅圖,主要用于表示總體中各組成部分所占的比例,對于研究結構性問題十分有用用圓及圓內扇形的面積來表示數值大小的圖形這些扇形的中心角度,是按各部分百分比占3600的相應比例確定的,品質數據的圖示─環(huán)形圖(Doughnut
9、 Pie ),環(huán)形圖可用于進行比較研究環(huán)形圖有若干個圓環(huán),總體中的每一部分數據用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個總體的數據系列,每一個總體的數據系列為一個環(huán),第三節(jié) 用圖表法描述數量數據,一.頻數分布表的編制,二、數量數據的展示,三、頻數分布的類型,頻數分布表的編制,頻數分布表反映數量數據分布特征,417822324529539 507 6
10、17430 522725708431425517522 533626422 518808610618523526633 634527323 518612712734627423519 513520523527435337414520528624 415439628 724721,編制頻數分布表的步驟,確定組數,確定組距,計算頻數,編制表格,,,,頻數分布表
11、的編制(實例),例:某移動公司有50名大客戶。他們月使用移動業(yè)務支出見右側數據(單位:元)。試編制頻數分布表。,417822324529539 507 617430 522725708431425517522 533626422 518808610618523526633 634527323 518612712734627423519 5135205235274
12、35337414520528624 415439628 724721,分組方法,分組方法,單變量值分組(要點),1. 將一個變量值作為一組2. 適合于離散變量3. 適合于變量值較少的情況,單變量值分組表(實例),組距分組(要點),將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況必須遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組,組距分組(步驟),確定組數:組數的確
13、定應以能夠顯示數據的分布特征和規(guī)律為目的。在實際分組時,可以按 Sturges 提出的經驗公式來確定組數K:,確定各組的組距:組距(Class Width)是一個組的上限與下限之差,可根據全部數據的最大值和最小值及所分的組數來確定,即 組距=( 最大值 - 最小值)÷ 組數,根據分組整理成頻數分布表,組距分組(幾個概念),1. 下 限:一個組的最小值2.
14、上 限:一個組的最大值3. 組 距:上限與下限之差4. 組中值:下限與上限之間的中點值,等距分組表(上下組限重疊),等距分組表(上下組限間斷),等距分組表(使用開口組),等距分組與不等距分組(在表現頻數分布上的差異),等距分組各組頻數的分布不受組距大小的影響可直接根據絕對頻數來觀察頻數分布的特征和規(guī)律不等距分組各組頻數的分布受組距大小不同的影響各組絕對頻數的多少不能反映頻數分布的實際狀況需要用頻數
15、密度(頻數密度=頻數/組距)反映頻數分布的實際狀況,數據類型與圖示,,分組數據—直方圖(直方圖的制作),用矩形的寬度和高度來表示頻數分布的圖形,實際上是用矩形的面積來表示各組的頻數分布在平面直角坐標中,用橫軸表示數據分組,縱軸表示頻數或頻率,各組與相應的頻數就形成了一個矩形,即直方圖直方圖下的總面積等于1,分組數據—直方圖(直方圖的繪制),直觀發(fā)現多數大客戶月使用移動服務大約在五、六百元,分組數據—直方圖(直方圖與條形圖的區(qū)別
16、),條形圖是用條形的長度(橫置時)表示各類別頻數的多少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數的多少,矩形的高度表示每一組的頻數或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列,分組數據—折線圖(折線圖的制作),折線圖也稱頻數多邊形圖(Frequency polygon)是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖
17、的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數分布是一致的,分組數據—折線圖(折線圖的繪制),月移動業(yè)務支出(元),,,,頻數(人),,,,,,15,12,9,6,3,,300,400,,500,,600,,700,,800,,900,,,,,,,,數據類型與圖示,,未分組
18、數據—莖葉圖(莖葉圖的制作),用于顯示未分組的原始數據的分布由“莖”和“葉”兩部分構成,其圖形是由數字組成的以該組數據的高位數值作樹莖,低位數字作樹葉對于n(20≤n≤300)個數據,莖葉圖最大行數不超過 L = [ 10 × log 10 n ] 5. 莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可大體上看出一組數據的分布狀況,但沒有
19、給出具體的數值莖葉圖既能給出數據的分布狀況,又能給出每一個原始數值,保留了原始數據的信息,未分組數據—莖葉圖(莖葉圖的制作),樹莖,樹葉,,24 23 37,17 30 31 25 22 23 35 14 15 39,29 39 07 22 17 22 33 18 23 26 27 18 19 13 20 23 27 20 28,17 26 10 18 33 34 12 27 24 28,,300,400,500,600,,數據個數
20、,3,25 08 12 34 24 21,22 08,700,800,未分組數據—箱線圖(箱線圖的制作),用于顯示未分組的原始數據或分組數據的分布箱線圖由一組數據的5個特征值繪制而成,它由一個箱子和兩條線段組成其繪制方法是:首先找出一組數據的5個特征值,即最大值、最小值、中位數Me 和兩個四分位數(下四分位數QL和上四分位數QU)連接兩個四分(位)數畫出箱子,再將兩個極值點與箱子相連接,未分組數據—單批數據箱線圖(箱線圖的構
21、成),未分組數據—單批數據箱線圖(實例),,最小值323,最大值822,中位數524.5,下四分位數438,上四分位數626.25,,,,,,,分布的形狀與箱線圖,,圖3-11 不同分布的箱線圖,,未分組數據—多批數據箱線圖(實例),【例3.4】 從某大學經濟管理專業(yè)二年級學生中隨機抽取11人,對8門主要課程的考試成績進行調查,所得結果如表3-8。試繪制各科考試成績的批比較箱線圖,并分析各科考試成績的分布特征,未分組數
22、據—多批數據箱線圖,圖3-12 8門課程考試成績的箱線圖,圖3-13 11名學生8門課程考試成績的箱線圖,,,,,Min-Max,,25%-75%,,Median value,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
23、,,,,,,,,,,,,,,,,,,45,55,65,75,85,95,105,,,,,,,,,,,,,,,學生1,學生2,學生3,學生4,學生5,學生6,學生7,學生8,學生9,學生10,學生11,未分組數據—箱線圖,數據類型與圖示,,時間序列數據—線圖(線圖的制作),? 繪制線圖時應注意以下幾點時間一般繪在橫軸,指標數據繪在縱軸圖形的長寬比例要適當,其長寬比例大致為10:7一般情況下,縱軸數據下端應從“0”開始,以便于比較
24、。數據與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷,雷達圖(Radar Chart)是顯示多個變量的常用圖示方法在顯示或對比各變量的數值總和時十分有用假定各變量的取值具有相同的正負號,總的絕對值與圖形所圍成的區(qū)域成正比可用于研究多個樣本之間的相似程度,多變量數據—雷達圖(要點),? 設有n組樣本S1,S2,…Sn,每個樣本測得P個變量X1,X2,Xp,要繪制這P個變量的雷達圖,其具體做法是,多變量數據—雷達圖(雷達圖
25、的制作),先做一個圓,然后將圓P等分,得到P個點,令這P個點分別對應P個變量,在將這P個點與圓心連線,得到P個幅射狀的半徑,這P個半徑分別作為P個變量的坐標軸,每個變量值的大小由半徑上的點到圓心的距離表示 再將同一樣本的值在P個坐標上的點連線。這樣,n個樣本形成的n個多邊形就是一個雷達圖,,,,,,,,多變量數據—雷達圖(實例),多變量數據—雷達圖(由 Excel 繪制的雷達圖),,數據類型及圖示(小結),使用Excel用表格法
26、和圖形法描述統(tǒng)計數據,頻數分布的類型,頻數分布的類型,圖3-17 幾種常見的頻數分布,第四節(jié) 統(tǒng)計表,一. 統(tǒng)計表的構成二. 統(tǒng)計表的設計,統(tǒng)計表的結構,,行標題,表頭,列標題,數字資料,附加,,,,,要合理安排統(tǒng)計表的結構總標題內容應滿足3W要求數據計量單位相同時,可放在表的右上角標明,不同時應放在每個指標后或單列出一列標明表中的上下兩條橫線一般用粗線,其他線用細線通常情況下,統(tǒng)計表的左右兩邊不封口表中的數據一
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 應用統(tǒng)計學講義第三章
- 統(tǒng)計學第三章習題
- 醫(yī)學統(tǒng)計學第三章
- 統(tǒng)計學第三章new
- 統(tǒng)計學第三章統(tǒng)計整理
- 《統(tǒng)計學》-第三章-統(tǒng)計整理
- 統(tǒng)計學原理第三章-統(tǒng)計整理
- 統(tǒng)計學第三章,統(tǒng)計分組
- 統(tǒng)計學第三章選擇題
- 統(tǒng)計學資料第三章統(tǒng)計整理編輯
- 疲勞與斷裂第三章疲勞應用統(tǒng)計學基礎
- 統(tǒng)計學第三章練習題附答案
- 《統(tǒng)計學》第三章課后作業(yè)題
- 統(tǒng)計學第三章課后習題畫圖作業(yè)
- 統(tǒng)計學原理第三章(統(tǒng)計資料整理)習題答案
- 統(tǒng)計學第三章-數據分布特征的描述
- 生物統(tǒng)計第三章
- 第三章 excel數據處理與圖表應用
- 統(tǒng)計學第五版第三章課后習題答案
- [學習]統(tǒng)計學--第三章平均數與標準差
評論
0/150
提交評論