版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第8章 數(shù)據(jù)倉庫開發(fā)實例,8.1超市銷售數(shù)據(jù)倉庫的規(guī)劃與分析 8.2數(shù)據(jù)倉庫開發(fā)工具簡介 8.3SQL Server的數(shù)據(jù)倉庫創(chuàng)建 8.4SQL Server數(shù)據(jù)倉庫事實表與多維數(shù)據(jù)集的建立,8.1 超市銷售數(shù)據(jù)倉庫的規(guī)劃與分析,某大型連鎖超市的業(yè)務涵蓋于3個省范圍內的1000多家門市。每個門市都有較完整的日用品和食品銷售部門,包括百貨、雜貨、冷凍食品、奶制品、肉制品和面包食品等,大約5萬多種,其中大約45000種商品來自外部
2、生產廠家,并在包裝上印有條形碼。每個條形碼代表了唯一的商品。為該超市建立一個能夠提高市場競爭能力的數(shù)據(jù)倉庫,首先需要進行數(shù)據(jù)倉庫的規(guī)劃分析。這就涉及到對數(shù)據(jù)倉庫的需求分析、模型構建兩個過程。,8.1.1 超市銷售數(shù)據(jù)倉庫的需求分析,1超市營銷售策略分析超市最高層管理所關注的是如何通過商品的采購、儲存與銷售,最大限度地獲取利潤。需要通過加強對每種商品的管理,減低商品的采購成本和管理費用,吸引盡可能多的客戶。其中最重要的是關于商品促銷
3、的管理決策。需要依靠合適的促銷活動,應用適當?shù)拇黉N策略針對合適的客戶,以增加超市的銷售利潤,是超市數(shù)據(jù)倉庫建設的基本需求。超市不同商品的銷售利潤是有差別的。希望在數(shù)據(jù)倉庫中通過對商品的贏利分析,了解不同商品的銷售贏利狀態(tài),以確定企業(yè)的銷售重點,對那些可以為企業(yè)帶來較大贏利的商品加大促銷力度。,8.1.1 超市銷售數(shù)據(jù)倉庫的需求分析,2超市商品庫存分析超市商品的庫存狀況對超市的利潤具有巨大的影響。超市如果能夠在合適的時候銷售合適的商
4、品,在不出現(xiàn)脫銷的情況下盡可能減少商品庫存的庫存成本,是超市商品庫存分析的主要目的。在商品庫存分析中,管理人員還經常要根據(jù)商品的庫存量和商品庫存成本確定商品的銷售價格。從超市的商品庫存情況來看,庫存分析實質上是對超市的價值鏈進行分析,分析商品庫存在超市的整個價值鏈上所發(fā)揮的作用。,8.1.1 超市銷售數(shù)據(jù)倉庫的需求分析,3超市商品采購分析超市在商品采購工作中需要分析哪些商品是熱銷的商品,盡可能采購銷售熱銷商品。熱銷商品往往是加快企業(yè)
5、資金流動的動力,快速流動的資金可以使企業(yè)在一定的時間內取得比其他企業(yè)更多的利潤。而且超市營銷管理人員在了解熱銷商品后,可以大量采購熱銷商品,重新安排熱銷商品的貨架,向更多的客戶推銷熱銷商品,便于更多客戶的購買,以進一步加快企業(yè)資金的流動。,8.1.1 超市銷售數(shù)據(jù)倉庫的需求分析,4超市客戶關系分析用80:20理論分析,占企業(yè)客戶群20%左右的客戶購買金額往往占據(jù)了企業(yè)銷售金額的80%。對客戶群體的劃分有利于企業(yè)了解企業(yè)的主要客戶群體
6、狀況、主要客戶群對企業(yè)銷售服務的需求狀況、不同客戶群為企業(yè)所帶來的利潤狀況。在對客戶進行類型劃分的基礎上,可以針對不同客戶群體的特點采用不同的營銷策略,對客戶群體的消費進行合理的引導。超市客戶的流失,意味著企業(yè)贏利的降低。企業(yè)管理者希望了解哪些客戶可能會流失,使企業(yè)能夠提前設法加以挽留。,8.1.2 超市銷售數(shù)據(jù)倉庫E-R模型構造,數(shù)據(jù)倉庫設計中就首先考慮營銷主題的設計,確定超市營銷主題模型 采用了星型模型,沒有采用雪花模型。因
7、為雪花模型通過對維表的分類細化描述,對于主題的分類詳細查詢具有良好的響應能力。但是雪花模型的構造在本質上是一種數(shù)據(jù)模型的規(guī)范化處理,會給數(shù)據(jù)倉庫操作帶來不同表的連接困難 。但是在對維度表進行維護時,可能需要對大量重復值進行修改。星型模型通過對維表的冗余應用,以犧牲維表空間來換取數(shù)據(jù)倉庫的高性能與易使用的優(yōu)勢。,8.1.2 超市銷售數(shù)據(jù)倉庫E-R模型構造,,8.1.3 超市數(shù)據(jù)倉庫事實表模型,確定在數(shù)據(jù)倉庫中,怎樣的粒度數(shù)據(jù)才能滿足
8、管理人員對數(shù)據(jù)倉庫營銷策劃分析的需要。 超市商品銷售主題中,最理想的原子數(shù)據(jù)是來自POS機上的每個銷售事務數(shù)據(jù) 分析超市高層管理人員通過那些角度,即需要通過那些維度來考察、選擇營銷方案。一般情況下,在確定超市營銷策劃時,超市管理人員需要通過日期、商品、門市、促銷和客戶五個維度對促銷方案進行分析,了解促銷方案的可用性和效果,超市營銷數(shù)據(jù)倉庫事實表模型,,超市營銷數(shù)據(jù)倉庫事實表模型,從銷售系統(tǒng)中可直接獲取商品銷售量、銷售單價、商品成本。
9、但管理人員考察超市的營銷策略時,需要考慮營銷策略和相應的商品銷售利潤。商品銷售利潤可以直接通過商品銷售量、銷售單價和商品成本計算獲得,但商品銷售利潤具有良好的可加性,管理人員又經常需要查看。將利潤數(shù)據(jù)存放在事實表中可大大減少數(shù)據(jù)倉庫工作時的工作量,還可以保證所有用戶在使用商品銷售利潤這一重要數(shù)據(jù)時的一致性。商品銷售單價對于計算商品利潤十分重要,但將某個商品一段時間內的所有銷售單價相加是毫無意義的。管理人員可能只對某一時間段內某個商品的
10、平均銷售價感興趣。平均銷售價格可以用該時間段內的商品銷售額除以商品銷售量獲取。在事實表中可以不用商品銷售單價,代之以商品銷售額,銷售額也常常是管理人員衡量營銷策略好壞的重要指標。,超市營銷數(shù)據(jù)倉庫事實表模型,超市管理者還可能對商品銷售的利潤率感興趣,該數(shù)據(jù)可以用商品銷售利潤除以銷售額獲得,該數(shù)據(jù)不是一個可加數(shù)據(jù)。將比率或百分數(shù)的數(shù)據(jù)進行相加,所獲得的數(shù)據(jù)是沒有什么意義的。管理人員在了解某一時期某些商品的利潤率時,完全可以利用該時期該商品
11、利潤和銷售額獲得。因此,事實表中確定度量數(shù)據(jù)為商品銷售量、商品銷售額、商品成本和商品銷售利潤。,8.1.4 超市數(shù)據(jù)倉庫維表模型設計,1.日期維日期維模型是許多數(shù)據(jù)倉庫應用中的常用維度,其設計方式與其他多數(shù)維模型有差別。具體設計時,日期維可以存放以日期表示的5到10年的數(shù)據(jù)行,也可以將3至4年的數(shù)據(jù)行作為日期維內容。如果對10年的每一天都進行存儲,也只需要3650行 日期維的每列由行所代表的特定日期進行定義?!靶瞧凇绷泻邢瘛靶?/p>
12、期一”這樣的名稱內容,該列可用于創(chuàng)建比較“星期一”與“星期日”銷售情況對比的查詢。日歷日期編號從1開始取值,然后根據(jù)月份的情況取到28、29、30或者31,這一列主要用于對每個月的同一天進行比較。同樣,可以給出日歷周編號、和日歷月編號(1,…,12)。,8.1.4 超市數(shù)據(jù)倉庫維表模型設計,紀元表示法采用從某紀元開始連續(xù)對日期進行計數(shù)的方法來給出日編號,在表中還可以給出“星期”與“月份”的絕對編號列。這些數(shù)據(jù)支持跨年度跨月份的簡單數(shù)據(jù)
13、運算。在生成報表時,經常要給出像“一月”這樣的月份名稱。因此,為報表確定一個“年月”(YYYY-MM)列標題也有必要。報表中很可能需要季度編號(Q1,…,Q4) 或年季度編號列。如果企業(yè)的財政年度與日歷表在周期上不一致,還需要為財政年度給出類似列。在“節(jié)假日”列中給出“節(jié)假日”或者“非節(jié)假日”的內容,維表屬性作為數(shù)據(jù)分析的導航,簡單地在“節(jié)假日”列中給出“Y”或者“N”對數(shù)據(jù)分析沒有多大用處。例如,在生成某種商品的節(jié)假日與非節(jié)假日銷售
14、情況比較查詢時,列中給出“節(jié)假日”或者“非節(jié)假日”這樣有意義的值要比一個簡單的“Y”或者“N”之類的值有用得多。,8.1.4 超市數(shù)據(jù)倉庫維表模型設計,“星期六”與“星期日”要歸入“周末”之列。當然,可以對多個日期表屬性進行共同約束,從而能夠實現(xiàn)一些像平日假期銷售與周末假期銷售進行比較的數(shù)據(jù)倉庫應用?!颁N售時節(jié)”列應設置為銷售時節(jié)的名稱,例如,春節(jié)、情人節(jié)、端午節(jié)、五一節(jié)、國慶節(jié)、中秋節(jié)、重陽節(jié)、圣誕節(jié)、或者標為“不是”?!爸卮笫?/p>
15、件”列與“銷售時節(jié)”列情形類似,可以標記為“周日大采購”或者“中秋合家歡”這樣與日期有特殊聯(lián)系的促銷事件。而一般性的促銷活動通常不放在日期表中處理,以促銷維表的形式進行更加完整的描述。因為促銷事件并不是僅僅由日期來定義,通常還需要由日期、商品與商店的組合來定義。,,,,,,,,8.1.4 超市數(shù)據(jù)倉庫維表模型設計,2.商品維一般超市門市可能存儲60000個商品編號,但大型連鎖超市保留不再銷售的歷史商品營銷方案情況,商品維度可能至少需
16、要150000行乃至多達百萬行。 商品維度數(shù)據(jù)主要來源于業(yè)務系統(tǒng)的商品主文件。超市總部對所銷售商品的主文件進行統(tǒng)一管理。商品主文件的一個重要作用,就是維護每個商品存儲標志的許多描述屬性。商品維是一組重要的屬性。 某個商品種類包含多個商品子類,商品子類包含多個商標,商標包含多個商品存儲標志。 還應包含描述商品形狀或存儲位置的層次屬性,例如商品的包裝類型、包裝尺寸、包裝數(shù)量、托盤中的包裝數(shù),以及與商品存儲的層次:存儲類型、貨架結構等
17、維度。,8.1.4 超市數(shù)據(jù)倉庫維表模型設計,3.門市維門市維表用于描述超市的各個鏈鎖店。門市維表是基本的地理維度,每個門市可被看成一個位置。這樣,可以由門市形成諸如街道、郵政編碼、縣、市、省這樣的任意地理屬性。地理體系與門市地區(qū)體系對每個門市來說,都有良好的定義。在連鎖超市所使用的門市維表中有建筑面積、金融服務、最早開業(yè)時間等描述特定門市的文字描述。描述銷售面積的列應該是數(shù)字型的,并且在理論上是跨門市可相加的,以表示某一地區(qū)的銷
18、售面積。它是門市的一個不變屬性,通常作為報表約束或者行標題使用。而且為了能夠分析不同種類商品對超市銷售利潤的貢獻情況,還需要設立不同商品的銷售面積。,8.1.4 超市數(shù)據(jù)倉庫維表模型設計,4.促銷維超市的促銷方案可能包含:臨時降價、柜臺展銷、報紙廣告與優(yōu)惠券發(fā)放等。促銷維應該可以反映商品促銷方案的成效。促銷的成效評估因素:促銷商品的銷售是否在促銷區(qū)間出現(xiàn)增長、是否在促銷進行之前或者隨后出現(xiàn)減少狀況;是否發(fā)生促銷商品的銷售出現(xiàn)增長,
19、而臨近貨架上的其他商品銷售卻呈現(xiàn)出相應的降低情況(同類相食);促銷類別中所有商品的銷售是否都經歷了一個實際的總體增長;促銷是否贏利。促銷利潤的計算要考慮促銷類別的利潤增量與時間過渡、同類調劑以及銷售底線等各種情況。,8.1.4 超市數(shù)據(jù)倉庫維表模型設計,4.促銷維在促銷維度中為促銷出現(xiàn)的每種組合都建立一行記錄是很有意義的。在一年的銷售活動中,可能出現(xiàn)1000個廣告,5000次臨時降價和1000次柜臺展銷,但可能只有10000個組合促
20、銷能影響任何特定的商品。例如,在某給定維度中,大多數(shù)門市都會同時運作所有促銷售手段,而只有少數(shù)幾個門市不進行柜臺展銷。在這種情況下,就需要兩個單獨的促銷記錄行,一個用于通常的降價并外加廣告與柜臺展銷,而另一個用于降價并外加單純的廣告。超市的促銷維度可以包含促銷名稱、減價類型、促銷媒體類型、廣告類型和優(yōu)惠券類型等。超市的主要促銷方式是降價、廣告、柜臺展銷與優(yōu)惠券。如果將這些因素分別建立促銷維度,就可以記錄分析這些促銷方法非常相似的信息,
21、使用戶更加容易理解促銷方案的作用。但是將所有的促銷因素合并在一個維表中,則能夠方便用戶的瀏覽,能夠弄清各種不同的價格降低、廣告、展銷與優(yōu)惠券是如何在一起共同發(fā)揮促銷作用的。,8.1.4 超市數(shù)據(jù)倉庫維表模型設計,5.客戶維超市的客戶維度可以包含客戶賬號、姓名、地址、所在地區(qū)、郵政編碼、電子信箱、電話、日?;顒臃秶?、出生日期、收入、孩子數(shù)量、住房和汽車等內容。在客戶維中的地址由于客戶可能會給出其家庭地址、工作地址或其它一些常用地址,因
22、此在維表中可以設置4個地址,對于電話的設置也是出于相同因素的考慮。在數(shù)據(jù)倉庫的應用中有時需要對客戶按照不同的地區(qū)進行分析,為此,在維表中就按照省、市、縣(區(qū))郵政編碼進行地區(qū)的設置。性別、婚姻狀況、家庭人口、住房條件和自有汽車情況均是超市銷售管理人員對超市營銷策略進行分析的主要依據(jù)。出于超市營銷策略制定的考慮,還需要了解客戶的日?;顒臃秶员阌嗅槍π缘剡M行促銷廣告的發(fā)送。,8.1.5 超市數(shù)據(jù)倉庫模型的關鍵字設計,采用代理關鍵字技術
23、,而不是依賴業(yè)務系統(tǒng)中的各種關鍵字(許多業(yè)務系統(tǒng)中的各種編碼往往具有某種特定的含義)代理關鍵字一般采用在填充維度時按需要而順序分配的整數(shù)值。例如,為第一條商品記錄分配一個值為1的商品代理關鍵字,第二條分配2,第n條分配n等。代理關鍵字僅僅用于維度表到事實表的連接。 代理關鍵字的好處還能夠對數(shù)據(jù)倉庫環(huán)境的操作型變化進行緩沖,不會受到商品編碼生成、更新、刪除、再生與重用等操作型規(guī)則的妨礙。代理關鍵字允許數(shù)據(jù)倉庫對來自多個業(yè)務型系統(tǒng)的數(shù)
24、據(jù)進行合并,即使它們之間缺乏一致的源關鍵字也無所謂。,8.1.5 超市數(shù)據(jù)倉庫模型的關鍵字設計,使用代理關鍵字還可以獲得性能上的優(yōu)勢。代理關鍵字可能只有一個整數(shù)所占據(jù)的空間大小,卻能確保充裕地容納維度行以后可能需要的序號或者最大編號。而業(yè)務型編碼常常是一個混合了字母與數(shù)字的區(qū)間編碼體系。 代理關鍵字還能夠用于記錄那些諸如“不在促銷之列”這樣的可能沒有業(yè)務系統(tǒng)中編碼的維度情形。通過對數(shù)據(jù)倉庫的關鍵字施加控制,就能夠做到不管是否缺少業(yè)務
25、型編碼,總可以分配一個代理關鍵字將這類情況標識出來。 將代理日期關鍵字處理成日期序號,可以允許事實表在日期關鍵字基礎上進行物理分區(qū)。,8.1.5 超市數(shù)據(jù)倉庫模型的關鍵字設計,目前在超市數(shù)據(jù)倉庫中已經包含了6個實際的表:營銷事實表與日期、商品、門市、促銷和客戶維表。每個維表有一個主關鍵字,而事實表除了有一個退化的銷售事務編號之外,還有由五個外關鍵字組成的一個復合關鍵字。如果五個關鍵字都是進行了緊湊處理的連續(xù)整數(shù),那么僅僅需要為所有五
26、個關鍵字保留18個字節(jié)的小存儲空間(日期、商品、促銷和客戶維各用4個字節(jié),而門市用2個字節(jié))。同時,銷售事務編號可能另外需要8個字節(jié)。如果事實表4類事實(銷售量、銷售額、成本和利潤)中的任何一個都是4字節(jié)的整數(shù),則僅僅需要再保留另外的16個字節(jié),這樣事實表只有42個字節(jié)寬。對一個10億行的事實表也只占用大約42GB的存儲空間就可以存儲所有事實數(shù)據(jù)。,8.1.6 超市數(shù)據(jù)倉庫元數(shù)據(jù)設計,,銷售主題元數(shù)據(jù),銷售事實元數(shù)據(jù),,銷售事實元數(shù)
27、據(jù),,銷售事實元數(shù)據(jù),維元數(shù)據(jù),銷售事實元數(shù)據(jù),維元數(shù)據(jù),銷售事實元數(shù)據(jù),維元數(shù)據(jù),銷售事實元數(shù)據(jù),數(shù)據(jù)成員元數(shù)據(jù),銷售事實元數(shù)據(jù),數(shù)據(jù)成員元數(shù)據(jù),銷售事實元數(shù)據(jù),8.2 數(shù)據(jù)倉庫開發(fā)工具簡介,銷售事實元數(shù)據(jù),,8.2.1 數(shù)據(jù)倉庫開發(fā)工具目前已有許多數(shù)據(jù)倉庫開發(fā)工具供應商,可以提供各種構建數(shù)據(jù)倉庫的工具。但有些數(shù)據(jù)倉庫開發(fā)工具還要結合第三方供應商工具才能完成整個數(shù)據(jù)倉庫的構建。1.Oracle數(shù)據(jù)倉庫開發(fā)工具以Oracle
28、9i為核心的數(shù)據(jù)倉庫構建體系;可以進行數(shù)據(jù)建模、數(shù)據(jù)抽取、數(shù)據(jù)轉移和裝載、聚合、元數(shù)據(jù)管理的Oracle Warehouse Builder;能夠為最終用戶提供查詢、報告、下鉆、旋轉和WEB公布工具的Oracle Discoverer;可以對數(shù)據(jù)倉庫進行數(shù)據(jù)挖掘、提供決策樹、神經網絡等多種數(shù)據(jù)挖掘方法、具有簡單易用的圖形化界面、支持海量數(shù)據(jù)并行處理、進行結果分析和系統(tǒng)集成的Oracle Darwin。,2.IBM數(shù)據(jù)倉庫開發(fā)工具,銷售事
29、實元數(shù)據(jù),,基于可視數(shù)據(jù)倉庫的商業(yè)智能(BI)解決方案,具有集成能力強,面向對象SQL等特性。其中Visual Warehouse(VW)是一個功能很強的集成環(huán)境,可用于數(shù)據(jù)倉庫建模和元數(shù)據(jù)管理,又用于數(shù)據(jù)抽取、轉換、裝載和調度;Essbase/DB2 OLAP Server支持多維數(shù)據(jù)庫,它是一個(ROLAP和MOLAP)混合的HOLAP服務器,在Essbase完成數(shù)據(jù)裝載后,數(shù)據(jù)存放在系統(tǒng)指定的DB2 UDB數(shù)據(jù)庫中;QUEST是一
30、個多任務數(shù)據(jù)挖掘系統(tǒng),系統(tǒng)提供多種開采功能,挖掘算法可適用于任意大小的數(shù)據(jù)庫。,3.Sybase數(shù)據(jù)倉庫開發(fā)工具,銷售事實元數(shù)據(jù),,數(shù)據(jù)倉庫解決方案能夠支持多種關系型數(shù)據(jù)庫,能夠同時處理幾十個即席查詢。其中Bit_Wisc技術和垂直數(shù)據(jù)存儲技術使系統(tǒng)可以只訪問特定的少量數(shù)據(jù)。Warehouse Architect是Power Designer中的一個設計模塊,數(shù)據(jù)集市或數(shù)據(jù)倉庫設計者利用該模塊可以自動地對已有的關系數(shù)據(jù)庫進行目標數(shù)據(jù)庫
31、設計、物理設計和DDL設計。Power Stage、Replication Server、Carleton PASSPORT是數(shù)據(jù)抽取與轉換工具。Adaptive Server IQ是專為數(shù)據(jù)倉庫設計的關系數(shù)據(jù)庫。Power Dimensions、English Wizard、Info Maker、Power Dynamo是數(shù)據(jù)分析與展現(xiàn)工具。Warehouse Control Center、Sybase Central、Distrib
32、ution Director是數(shù)據(jù)倉庫的維護與管理工具。Industry Warehouse Studio包括相應行業(yè)所需的商業(yè)智能應用軟件和數(shù)據(jù)分析模型,可以針對不同行業(yè)進行業(yè)績分析、促銷活動分析、銷售分析和收益分析等,具有數(shù)據(jù)倉庫設計、元數(shù)據(jù)管理等功能、支持廣泛的應用軟件和報表,并提供Warehouse Studio 的設計工具、Warehouse Control Center等工具。,4.Informix數(shù)據(jù)倉庫開發(fā)工具,銷售事
33、實元數(shù)據(jù),,Fast Start數(shù)據(jù)倉庫解決方案,可以快速便捷地設計開發(fā)具有可伸縮性的數(shù)據(jù)倉庫或數(shù)據(jù)集市。采用ROLAP的星型模式與Informix IDS 、IDS/AD緊密集成提供預先匯總、抽樣、后臺查詢等性能優(yōu)化手段。Informix產品還能夠集成Microsoft IIS或Netscape Enterprise/Fast Track服務器,從而支持web訪問。MetaCube ROLAP Option為基于Informix的數(shù)
34、據(jù)倉庫或數(shù)據(jù)中心提供了全面、簡便易用、可擴展和自動化的商業(yè)分析環(huán)境。Informix InfoMover是一套集成工具,用于從多個工作資源中抽取、轉換和維護數(shù)據(jù)。Seagate Crystal Info是企業(yè)級報表、分析系統(tǒng)。IDS以及AD/XP選項是Informix數(shù)據(jù)倉庫系統(tǒng)的核心,提供數(shù)據(jù)倉庫數(shù)據(jù)的存儲功能。Informix沒有提供自己的報表和數(shù)據(jù)挖掘工具,它主要集成第三方產品(例如結合Brio的前端數(shù)據(jù)分析和報表功能,結合S
35、AS的數(shù)據(jù)挖掘功能)。,5.NCR數(shù)據(jù)倉庫開發(fā)工具,銷售事實元數(shù)據(jù),,NCR可擴展數(shù)據(jù)倉庫的基本框架主要分成三個部分:數(shù)據(jù)裝載、數(shù)據(jù)管理和信息訪問。NCR的Teradata是高端數(shù)據(jù)倉庫市場最有力的競爭者,主要運行在NCR WorldMark SMP硬件的Unix操作系統(tǒng)平臺上,提供交互分析、標準報告和多維度分析。為了開拓數(shù)據(jù)集市(Data Mart)市場1998年,該公司也提供了基于Windows NT的Teradata。,6.SA
36、S數(shù)據(jù)倉庫開發(fā)工具,銷售事實元數(shù)據(jù),,SAS公司所提供的工具(例如:智能化的客戶機/服務器,多廠商構架等)可以幫助企業(yè)實現(xiàn)一個靈活和低風險的處理。SAS數(shù)據(jù)倉庫可以支持各種硬件平臺、支持不同數(shù)據(jù)庫之間數(shù)據(jù)的存取,它還可對不同格式的數(shù)據(jù)進行查詢、訪問和分析,具有與目前許多流行數(shù)據(jù)庫軟件和老的數(shù)據(jù)文件的接口,并可在SAS環(huán)境中建立對應外部異構數(shù)據(jù)的統(tǒng)一公用數(shù)據(jù)界面。SAS提供的工具包括30多個專用模塊。其中: SAS/WA(Wareh
37、ouse Administrator)是建立數(shù)據(jù)倉庫的集成管理工具,包括定義主題、數(shù)據(jù)轉換與匯總、更新匯總數(shù)據(jù)、元數(shù)據(jù)管理和數(shù)據(jù)集市的實現(xiàn)等;SAS/MDDB是SAS用于在線分析的多維數(shù)據(jù)庫服務器;,7.CA數(shù)據(jù)倉庫開發(fā)工具,銷售事實元數(shù)據(jù),,CA能夠提供以“元數(shù)據(jù)”為核心的,結構化的,包容構造數(shù)據(jù)倉庫各項技術的全面解決方案。它具有獨特的“元數(shù)據(jù)”管理與應用特性,具有用三維可視化技術解析處理的功能。CA解決方案提供ODBC接口,并將數(shù)
38、據(jù)存儲在第三方關系數(shù)據(jù)庫(如Oracle、Sybase、SQL Server、Informix和IBM DB2等)中。Erwin是數(shù)據(jù)庫/數(shù)據(jù)倉庫模型設計工具;DecisionBase是圖形界面的元數(shù)據(jù)管理和數(shù)據(jù)轉移工具;InfoPump是可編程控制的雙向數(shù)據(jù)轉移工具;InfoBeacon是OLAP服務器;Forest&Trees DSS/EIS開發(fā)工具;Repository是企業(yè)環(huán)境下元數(shù)據(jù)的集中管理工具;,8.2
39、.2 SQL Server數(shù)據(jù)倉庫開發(fā)應用工具,銷售事實元數(shù)據(jù),,SQL的數(shù)據(jù)倉庫開發(fā)工具,銷售事實元數(shù)據(jù),,1.創(chuàng)建數(shù)據(jù)準備區(qū)數(shù)據(jù)準備區(qū)的創(chuàng)建可以利用SQL Server中的數(shù)據(jù)庫創(chuàng)建與表創(chuàng)建工具實現(xiàn)。2.創(chuàng)建數(shù)據(jù)倉庫數(shù)據(jù)倉庫的框架通常由事實表和一些維表組成,可以用SQL Server中的數(shù)據(jù)庫創(chuàng)建工具和表創(chuàng)建工具完成。3.從業(yè)務系統(tǒng)提取數(shù)據(jù)SQL Server中的數(shù)據(jù)抽取工具主要有Transact-SQL、分布式查詢、D
40、TS、命令行應用程序、bcp實用工具、從文本文件加載的BULK Insert語句和ActiveX腳本。4.清理和轉換數(shù)據(jù)SQL Server提供了Transact-SQL查詢、DTS包、命令行應用程序、ActiveX腳本等工具完成清理工作,并對數(shù)據(jù)進行必要的轉換。5.將數(shù)據(jù)加載進數(shù)據(jù)倉庫SQL Server提供的Transact-SQL、DTS和bcp工具實現(xiàn)數(shù)據(jù)加載。6.將數(shù)據(jù)發(fā)布到數(shù)據(jù)集市SQL Server提供了數(shù)據(jù)復
41、制技術來完成數(shù)據(jù)集市的初始裝載,并提供了各種數(shù)據(jù)加載工具對數(shù)據(jù)集市進行數(shù)據(jù)加載。,,8.2.2 SQL Server數(shù)據(jù)倉庫開發(fā)應用工具,銷售事實元數(shù)據(jù),7.SQL查詢SQL Server提供了Transact-SQL來實現(xiàn)SQL查詢。8.OLAP應用SQL Server中的Analysis Services可以實現(xiàn)OLAP應用的創(chuàng)建和管理。8.數(shù)據(jù)挖掘SQL Server在Analysis Services中還提供了數(shù)據(jù)挖
42、掘技術的創(chuàng)建和管理功能,可以實現(xiàn)決策樹和聚集兩種數(shù)據(jù)挖掘功能。10.Web訪問SQL Server所提供的Analysis Services、English Query可以與Internet信息服務(IIS)一起,用多種方法在Web上對數(shù)據(jù)倉庫進行查詢和更新。11.更新數(shù)據(jù)倉庫數(shù)據(jù)數(shù)據(jù)倉庫在實際應用中還需要定期地進行數(shù)據(jù)更新維護,這些工作可以用SQL Server的Transact-SQL、DTS和bcp實用工具完成。,8.3
43、 SQL Server的數(shù)據(jù)倉庫創(chuàng)建,銷售事實元數(shù)據(jù),8.3.1 創(chuàng)建數(shù)據(jù)庫,,選擇’數(shù)據(jù)庫’,單擊 單擊建立數(shù)據(jù)庫 星型按鈕建立數(shù)據(jù)庫 按鈕,建立數(shù)據(jù)庫,,,銷售事實元數(shù)據(jù),數(shù)據(jù)庫屬性設置窗口,,,銷售事實元數(shù)據(jù),8.2.2 創(chuàng)建表,,,銷售事實元數(shù)據(jù),表結構輸入窗口,,8.4 SQL Server數(shù)據(jù)倉庫事實表與多維數(shù)據(jù)集的建立,銷售事實元數(shù)據(jù),8.4
44、.1 Analysis Manager數(shù)據(jù)庫的創(chuàng)建與數(shù)據(jù)源確定Analysis Server系統(tǒng)是一個管理多維數(shù)據(jù)集的有力工具,可以用來創(chuàng)建對數(shù)據(jù)倉庫訪問、分析多維數(shù)據(jù)集和知識發(fā)現(xiàn)的數(shù)據(jù)挖掘模型。在使用Analysis Server以前,必須要從SQL Server的安裝光盤上將其安裝到機器上。 1.Analysis Manager數(shù)據(jù)庫的創(chuàng)建用戶可以利用Analysis Manager在數(shù)據(jù)倉庫中建立起多維數(shù)據(jù)集合,以有效地訪
45、問數(shù)據(jù)倉庫中數(shù)據(jù)。,,,,銷售事實元數(shù)據(jù),1.Analysis Manager數(shù)據(jù)庫的創(chuàng)建,,,銷售事實元數(shù)據(jù),2.Analysis Manager中ODBC數(shù)據(jù)源的確定,,,銷售事實元數(shù)據(jù),進入“數(shù)據(jù)鏈接屬性”對話框,,,銷售事實元數(shù)據(jù),在數(shù)據(jù)源要求用戶在連接時給出用戶名和口令時,就需要在輸入登錄服務器的信息部分的“用戶名稱”文本框中輸入用戶名,“口令”文本框中輸入口令。復選框“空白密碼”用于禁止輸入口令,“允許保存密碼”用于使機器保
46、存用戶口令。在“輸入要使用的初始目錄”下拉列表框中選擇相應的位置。完成這些設置后,可以單擊“測試連接”按鈕,測試連接是否成功,測試結果將以對話框方式告知。高級標簽頁用于設置一些連接數(shù)據(jù)源的高級選項。其中的網絡設置部分,用于設置用戶連接網絡的網絡安全等級。其他部分的連接超時設定文本框設置連接超時的時間(秒),訪問權限列表框設置連接數(shù)據(jù)源的7種權限:只讀(Read)、讀寫(ReadWrite)、可共享(ShareDenyNone)、除讀
47、以外的共享(ShareDenyRead)、除寫以外的共享(ShareDenyWrite)、其它共享(ShareExclusive)、可寫(Write)。在所有標簽頁中,用一個列表框顯示了前面所進行的設置內容,如果對設置不滿意,可以單擊“編輯值”按鈕,編輯這里的設置。完成設置后,可以單擊“確定”按鈕完成數(shù)據(jù)源指定操作。,,,,銷售事實元數(shù)據(jù),3.Analysis Manager中SQL Server數(shù)據(jù)源的確定可以選擇系統(tǒng)自帶的Acc
48、ess數(shù)據(jù)庫FoodMart2000,,完成數(shù)據(jù)連接屬性的設置后,可以單擊其中的“測試連接”按鈕,,銷售事實元數(shù)據(jù),,“高級”標簽頁,,銷售事實元數(shù)據(jù),,“所有”標簽頁,8.4.2 SQL Server數(shù)據(jù)倉庫的維創(chuàng)建,銷售事實元數(shù)據(jù),,,1.調出維度向導歡迎對話框,2.“選擇維度的創(chuàng)建方式”對話框,銷售事實元數(shù)據(jù),,,在維度向導歡迎對話框中單擊“下一步”,調出“選擇維度的創(chuàng)建方式”對話框。該對話框中包含5種維結構選項:星型架構、雪花
49、架構、父子維度、虛擬維度、挖掘模型。星型架構可以從一個表中選擇一列或幾列,每一個列都可以作為維的一個層次。如果選擇多個列,列就要有一種逐漸變化的信息。例如,可以選擇商店所在省、商店所在市、商店所在縣/區(qū)、商店名稱作為商店維的層次。選擇年、季度、月作為日期維的層次。選擇省、市、縣、姓名作為客戶維的層次;雪花架構可以創(chuàng)建多個相關的維表,從多個維表中可以選擇一個或多個列,每一個列都可以作為維的一個層次。在建立商品維時就采用了雪花結構,
50、選擇商品表和商品類型表中的商品種類、商品子類、商標名稱作為商品維的層次;父子維度要從表中選兩列,一列為維成員,另一列為父成員。例如,用雇員和管理者可以創(chuàng)建一個組織維;虛擬維度中的維成員來自另一個維中的成員,數(shù)據(jù)在運行時才計算,不占用磁盤空間;挖掘模型需要用一個列和一種數(shù)據(jù)挖掘工具來構造。選擇星型架構后,單擊“下一步”按鈕,進入“選擇維度表”對話框 。,,銷售事實元數(shù)據(jù),,,維度向導歡迎對話框圖,,銷售事實元數(shù)據(jù),,,“選擇維度的創(chuàng)建
51、方式”對話框,“選擇維度表”對話框,銷售事實元數(shù)據(jù),,,建立客戶維時,可以選擇customer表;建立日期維時,可以選擇time_by_day表;建立商店維時,可以選擇Store表;建立商品維時,就可以選擇product表和product_class表;,4.“選擇維度類型”對話框,銷售事實元數(shù)據(jù),,,5.“選擇維度的級別”對話框,銷售事實元數(shù)據(jù),,,客戶維選擇省、市、縣區(qū)、姓名列,商店維則選擇商店所在省、商店所在市、商店所在縣/區(qū)、商
52、店名稱列。日期維則選擇年、月、日列。商品維選擇商品種類、商品子類和商品名稱列。,6.“指定成員鍵列”對話框,銷售事實元數(shù)據(jù),,,7.“選擇高級選項”對話框,銷售事實元數(shù)據(jù),,,8.“指定排序依據(jù)和唯一性”對話框,銷售事實元數(shù)據(jù),,,9.“指定存儲模式和成員分組”對話框,銷售事實元數(shù)據(jù),,,10.“設置可更改屬性”對話框,銷售事實元數(shù)據(jù),,,11.向導結束對話框,銷售事實元數(shù)據(jù),,,“維度編輯器”窗口,銷售事實元數(shù)據(jù),,,8.4.3 S
53、QL Server的多維數(shù)據(jù)集創(chuàng)建,銷售事實元數(shù)據(jù),,,1.進入多維數(shù)據(jù)集創(chuàng)建,,銷售事實元數(shù)據(jù),,,2.“從數(shù)據(jù)源選擇事實數(shù)據(jù)表”對話框,,銷售事實元數(shù)據(jù),,,3.“選擇用于定義度量列的數(shù)字列”對話框,,銷售事實元數(shù)據(jù),,,4.“選擇多維數(shù)據(jù)集的維度”對話框,,銷售事實元數(shù)據(jù),,,5.“多維數(shù)據(jù)集向導完成”對話框,,銷售事實元數(shù)據(jù),,,多維數(shù)據(jù)集編輯框,,銷售事實元數(shù)據(jù),,,“設計存儲”提示對話框,,銷售事實元數(shù)據(jù),,,6.“存儲設計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論