醫(yī)學研究數據管理與統(tǒng)計分析spss_第1頁
已閱讀1頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1,王建明,公共衛(wèi)生學院流行病與衛(wèi)生統(tǒng)計學系merry21st@yahoo.com.cn,,SPSS軟件應用(一),醫(yī)學研究數據管理與分析,2,常用統(tǒng)計軟件,SASSTATASPSS,3,常用統(tǒng)計軟件,SASSTATASPSS,4,常用統(tǒng)計軟件,SASSTATASPSS,5,SPSS 軟件簡介,SPSS原為Statistical Package for the Social Sciences的簡稱,意為“社會科

2、學統(tǒng)計軟件包”。2002年SPSS公司正式將英文全稱更改為Statistical Product and Service Solutions,意為“統(tǒng)計產品與服務解決方案”。近年來版本不斷更新。,Mousing with spss,Point and click,6,SPSS 13,菜單式操作易學易用,7,PASW(SPSS 18),Between 2009 and 2010 the premier software for SPS

3、S was called PASW (Predictive Analytics SoftWare) Statistics.2009年4月9日 美國芝加哥SPSS公司宣布重新包裝旗下的SPSS產品線,定位為預測統(tǒng)計分析軟件(Predictive Analytics Software)PASW.The company announced July 28, 2009 that it was being acquired by IBM f

4、or US$1.2 billion. As of January 2010, it became "SPSS: An IBM Company".IBM于2009年7月28日宣布以12億美元收購SPSS公司,SPSS正式成為IBM Information Management產品線下品牌。,PASW,PASW Statistics (formerly SPSS Statistics):統(tǒng)計分析PASW Model

5、er (formerly Clementine) :數據挖掘Data Collection family (formerly Dimensions):數據收集PASW Collaboration and Deployment Services (formerly Predictive Enterprise Services):企業(yè)應用服務,8,9,PASW Statistics 18 中文版界面,PASW Statistics

6、Family的每個模塊都可以獨立安裝和運行,或者是幾個模塊組合在一起,每個模塊都擁有數據訪問、數據管理和繪圖功能。,IBM SPSS Statistics 20,10,多國語言可以切換功能更強大,11,SPSS 軟件簡介,SPSS for Windows是一個集數據整理、分析功能于一身的組合式軟件包。SPSS的基本功能:數據管理、統(tǒng)計分析、圖表分析、輸出管理等,我們還是緬懷歷史,學習一下老版本的SPSS吧!,早期SPSS是DOS版

7、的,12,基本窗口The Four Windows:,Data editor (主窗口,數據管理) Output viewer (輸出窗口) Syntax editor (命令編輯) Script window (腳本),,我們應用SPSS時接觸最多的兩個窗口,13,The Four Windows: Data Editor,Data Editor 數據編輯Spreadsheet-like system for defini

8、ng, entering, editing, and displaying data. Extension of the saved file will be “.sav”,14,The Four Windows: Output Viewer,Output Viewer 結果輸出Displays output and errors. Extension of the saved file will be “spo”.(SPSS 16

9、 : *.spv),15,The Four Windows: Syntax editor,Syntax EditorText editor for syntax composition. Extension of the saved file will be *.sps,例如:我們對年齡進行統(tǒng)計描述,菜單式操作背后的命令語句是這樣的,執(zhí)行該語句可獲得相同結果,,16,The Four Windows: Script Window,

10、Script WindowProvides the opportunity to write full-blown programs, in a BASIC-like language. Text editor for syntax composition. Extension of the saved file will be “.sbs”,17,STEP 1:讓我們先打開SPSS程序,,18,SPSS數據錄入與管理,The de

11、fault window will have the data editorThere are two sheets in the window: 1. Data view (錄入或瀏覽記錄)2. Variable view(定義變量,包括字段名稱、字段類型、長度、標簽等),19,數據的錄入,,20,(1)單擊Variable View,數據錄入和分析前,我們需先定義字段(變量,),有兩種方法可進入變量定義狀態(tài):,(2

12、)雙擊 Var,21,數據錄入: Name (變量名),The first character of the variable name must be alphabetic.Variable names must be unique. Spaces are NOT allowed.,,定義變量名不同版本對于變量名的限制不同但變量名應盡量簡化雖然SPSS支持,但不建議使用中文作為變量名,22,數據錄入: Type,Click

13、on the ‘type’ box. This column enables you to specify the type of variable.,,標準數值型逗號數值型圓點數值型科學計數法型日期型美元數值型用戶自定義型字符型,定義變量類型,,23,數據錄入: Width,determine the number of characters SPSS will allow to be entered for the v

14、ariable,,定義變量長度,24,數據錄入: Decimals,Number of decimals (小數位數),,定義數值變量的小數點位數對于字符型和日期型變量該選項無效,25,數據錄入: Label,specify the details of the variable (標簽),,定義變量標簽,提示你變量的含義,有利于統(tǒng)計分析,26,數據錄入: Values (1),suggest which numbers repres

15、ent which categories when the variable represents a category(變量值標簽),,,Click,,Add,定義變量值標簽,例如:數據錄入時我們一般以數值型變量表示性別,如(1)男,(2)女。通過設置標簽值就可讓軟件知道1=男,2=女,27,數據錄入: Values (2),,Click,,,,點擊該按鈕用于讓軟件知道是顯示原始數值?還是顯示標簽值?,28,Practice 1,試建

16、立SPSS數據庫,錄入下列資料,并保存為test1.sav,不建議用中文作為變量名,29,Open an existing database打開一個已有數據庫,,或Click,然后選擇數據庫,30,SPSS 13 軟件常用數據庫類型,31,文本數據的讀入,,使用文本導入向導讀入文本類型的數據*.txt,Notice:支持EXCEL文件直接copy/paster,但請注意變量句和類型的修正,32,,SPSS16支持更好,SPSS 16,

17、SPSS 13,33,使用數據轉換軟件進行多種文件格式間的互轉,如 Stata/Transfer,34,數據的管理,35,文件級別的管理,Define DatesInsert VariableInsert CaseGo to CaseSort caseTransposeRestructure Merge Files Aggregate Split File Select Cases Weight Cases,,36

18、,Insert Variables/Cases,插入變量,插入記錄,37,Insert Variables/Cases,將光標置于不同位置,點擊右鍵,快捷菜單會彈出相應的“插入變量”或“插入記錄”選項,插入變量,插入記錄,38,Go to Case...,,,,指定記錄號,軟件會自動定位于相應記錄,39,Sort Case...,,,將數據庫按某一個或多個變量排序升序 Accednding降序 Decending,40,Sort C

19、ase...,在某一變量名上點擊鼠標右鍵同樣可進行排序操作,*但是只能進行單變量排序,41,Transpose...,將數據庫的行 列,列 行,,,,42,大家還記得EPIDATA中的縱向追加記錄和橫向合并字段嗎?,,縱向合并,橫向合并,,Merge Files...數據庫合并,43,Add Cases...,原則:兩個待合并的SPSS數據文件,其內容合并是有實際意義的;為方便SPSS數據文件的合并,在不同

20、數據文件中,數據含義相同的列,最好起相同的文件名,變量類型和變量長度也要盡量相同,這樣方便 SPSS對變量的自動對應和匹配。,44,Add Variables...,原則:如果不是按照記錄號對應的規(guī)則進行合并,則兩個數據文件必須至少有一個變量名相同的公共變量,這個變量是兩個數據文件橫向對應合并的依據,稱為關鍵變量;如果是使用關鍵變量進行合并的對應,則兩個數據文件都必須事先按關鍵變量進行排序,否則會出錯;為方便SPSS數據文件的合并

21、,在不同數據文件中,數據含義不同的列,變量名不應該取相同的名稱。,45,Add Variables,,,,,合并數據A與數據B,以no為關鍵變量,46,,選擇不同的合并方式,合并后的數據庫不同,*橫向合并一定要按照關鍵變量進行排序,,,,47,Practice 2,試建立SPSS數據庫,錄入下列資料,并保存為test2.sav,試將test1 與 test2 兩個數據庫橫向合并,產生一新數據庫,命名為test12,保存于桌面。,NOTI

22、CE,48,實際應用中盡量使用數值型變量為識別(KEY)變量,如記錄號ID,便于數據庫合并,且需唯一。注意SORT。,49,Practice 3,試建立SPSS數據庫,錄入下列資料,并保存于桌面,文件名test3.sav,性別:1=男; 2=女,試將test1 與 test3 兩個數據庫合并,產生一新數據庫,命名為test13,保存于桌面。比較一下兩種合并方式的異同。,50,Split File...,,例如:我們欲分別比較男性和

23、女性的某些特征,可以采用文件分割功能,按性別分割,結果將會按性別分層分別輸出。,文件分割,51,Select Cases...,,,對于前例我們也可以采用select cases功能按性別進行統(tǒng)計分析,與Split不同的是,該選項無法實現男性和女性的結果同時輸出,需分別 select ? if sex=1(男); if sex=2(女),記錄篩選,52,Select Cases...,分析所有的記錄,沒有select只分析滿足條件

24、的記錄(常用)從原始數據中按某種條件抽樣基于時間或記錄號來選擇記錄使用篩選指標變量來選擇,,過濾,未被選中的記錄將從數據庫中刪除,謹慎操作,53,Weight Cases...,請思考一下,如何錄入下列數據?,性別:1=男; 2=女,一種錄入方法,54,假如不是15例,而是100例、1000例…呢?,55,Weight Cases...,,,另一種方法,,通過weight,告訴SPSS該變量是頻數,frequency=5表示有5條

25、記錄,,以example.sav為例,假定我們錯誤地將id(198)錄入兩次,id(199)錄入了三次,如何利用SPSS正確識別出來?*有幾種方法?,56,記錄重復的識別,57,記錄重復的識別,,識別變量,是否產生新變量,用于指示記錄,,58,Compute(常用)Recode (常用)Visual banderCountRank CasesAutomatic RecodeDate/Time (常用)Creat Ti

26、me SeriesReplace Missing ValueRandom Number Seed,變量級別的管理,,59,Compute...,(可以根據現有變量或直接)生成一新變量。例如:收縮壓共測量了三次,我們需產生一新變量sbp,等于三次的平均值??墒褂煤瘮倒δ苓M行計算,,Sbp=(sbp1+sbp2+sbp3) / 3,可定義條件,,60,1、計算平均的收縮壓和舒張壓:2、計算BMI:,Practice 4,分析數據庫

27、example.sav,,61,Recode...,重新產生一新變量,原變量不變(建議使用),對變量自身賦值,將改變原變量數值,,,對變量進行賦值,可以將連續(xù)性變量分類化。例如:年齡可以通過該命令劃分為不同的年齡組。,62,Into Same Variables,,1. 先確定需賦值的變量,對變量自身賦值,將改變原變量數值,2. 點擊old and new variables,3. 選擇原變量相應的賦值規(guī)則,4.定義新值,別忘了點Ad

28、d,63,,Into Different Variables,,定義新變量名后,別忘了click change,,重新產生一新變量,原變量不變,1. 先確定需賦值的變量,2. 定義新變量名,3. 點擊old and new variables,4. 選擇原變量相應的賦值規(guī)則,5.定義新值,別忘了點Add,變量賦值規(guī)則(以年齡為例),64,以年齡為例,某一具體年齡值,某年齡范圍,如15-25歲,從最小值至某一年齡,如=<25歲,從某

29、一年齡至最大值,如>=25歲,65,練習:1、Into Same Variables 將性別變量編碼(1=男;2=女)修改為2=男;1=女2、Into Different Variables 根據計算出來的BMI分組,產生新變量obesity, 變量賦值1:BMI=30(肥胖),Practice 5,分析數據庫 example.sav,66,Date/time,與時間有關變量的便捷處理方法,例如:已知調查日期和出生

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論