版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、CHAPTER 9 Market Basket Analysis and Association Rules購物籃分析與關(guān)聯(lián)規(guī)則,吳欣潔 張啟帆 國立中興大學行銷研究所,2,前言,圖9.1,一公升的柳橙汁、一些香蕉、洗碗精、窗戶清潔劑、6包裝的蘇打水,蘇打水是否會和香蕉一起買?品牌是否會造成蘇打水銷售的差異?,有什麼是應(yīng)該在購物籃裡卻沒有的?,洗碗精和柳橙汁一起被買時,窗戶清潔劑是否也一起買了?,不同的人口特質(zhì)會如何影響顧客的
2、消費?,3,前言,購物籃分析的主要資料來源是零售業(yè),藉由分析銷售點(Point-of-Sale)的資料,以找出哪些商品會一起售出的規(guī)則。其中最常使用的方法是關(guān)聯(lián)規(guī)則(Association Rules)。除了零售業(yè)外,購物籃分析也可以應(yīng)用在其他領(lǐng)域:信用卡消費電話使用者的附加功能消費者的常用銀行服務(wù)保險配套方式醫(yī)院病患的歷史資料,4,購物籃分析資料架構(gòu),圖9.2,5,訂單(orders)的基本衡量方式,每個顧客的平均有多少o
3、rder每一個order的平均有多少品項每一個order的平均有多少特殊品項針對某產(chǎn)品,曾購買這項產(chǎn)品的顧客佔多少比例針對某產(chǎn)品,曾購買這項產(chǎn)品的顧客平均會購買幾次針對某產(chǎn)品,這項產(chǎn)品被購買時的平均數(shù)量,購物籃分析資料架構(gòu)(2),6,圖 9.3,購物籃分析資料架構(gòu)(3),7,訂單特性,購物籃分析資料架構(gòu)(4),8,品項的受歡迎程度,要用存貨曲線來找出最受歡迎的商品並不難,不過,只知道商品的銷售量是不夠的,下面還有幾個相關(guān)的問題
4、:在one-item order中,最受歡迎的品項是什麼?在multi-item order中,最受歡迎的品項是什麼?在重覆購買的顧客心中,最受歡迎的品項是什麼?特定品項的受歡迎程度如何隨時間改變?某一品項的受歡迎程度如何隨區(qū)域改變?,購物籃分析資料架構(gòu)(5),9,追蹤行銷干擾事件,Mail drop,購物籃分析資料架構(gòu)(6),10,利用用途將產(chǎn)品分群,通常還有很多關(guān)於產(chǎn)品的敘述性的資料,例如衣服的顏色等,這些資料可以幫助產(chǎn)品
5、的分級,還能類似解決以下的問題瘦身產(chǎn)品是否傾向一起賣出?消費者是否同時會買類似顏色的衣服?買有框的明信片的消費者是否會同時買其他產(chǎn)品?,購物籃分析資料架構(gòu)(7),11,利用用途將產(chǎn)品分群(圖 9.6),購物籃分析資料架構(gòu)(8),12,關(guān)聯(lián)規(guī)則(Association Rule),購物籃分析會找出應(yīng)該放在一起的產(chǎn)品或服務(wù)。利用關(guān)聯(lián)規(guī)則找到的結(jié)果很清楚,但卻未必有用。以下是關(guān)聯(lián)規(guī)則的三種典型例子??尚械囊?guī)則(Actionable R
6、ule) 明顯的規(guī)則(Trivial Rule)無法解釋的規(guī)則(Inexplicable Rule),13,可行的規(guī)則(Actionable Rules),有用的規(guī)則必須包含高品質(zhì)的,可行的資訊。業(yè)者一旦找到模式,必須要能夠配合這個模式來調(diào)整。 Ex1.芭比娃娃與糖果條Ex2.尿布與啤酒,關(guān)聯(lián)規(guī)則(2),14,明顯的規(guī)則(Trivial Rules),明顯的規(guī)則可能在該行業(yè)中都已經(jīng)知道了,在行銷上沒有太大的價值。Ex.維修協(xié)
7、定與大型家電用品Ex.油漆與油漆刷,關(guān)聯(lián)規(guī)則(3),15,無法解釋的規(guī)則(Inexplicable Rule),這種規(guī)則似乎沒有任何原因,也無法作為行銷活動的參考,可以只是某個時空下的一種巧合。Ex.五金賣場開幕時,銷售最好的是馬桶清潔劑,關(guān)聯(lián)規(guī)則(4),16,關(guān)聯(lián)規(guī)則的運作方式,表9.1 雜貨銷售點交易狀況,17,表9.2 Co-occurrence Table,關(guān)聯(lián)規(guī)則的運作方式(2),18,信心水準(Degree of Co
8、nfidence),「if蘇打飲料,then柳橙汁」 信心水準=67%(2/3)「if柳橙汁,then蘇打飲料」 信心水準=50%(2/4),,,關(guān)聯(lián)規(guī)則的運作方式(3),19,增益(Improvement/Lift),「if蘇打飲料,then柳橙汁」 lift=0.83 (0.67/0.8)「if柳橙汁,then蘇打飲料」 lift=0
9、.83 (0.5/0.6)一般來說,lift> 1的模式才有行銷上的價值。,,,關(guān)聯(lián)規(guī)則的運作方式(4),20,建立關(guān)聯(lián)規(guī)則,基本步驟(圖9.9)決定商品的集合與等級 例:pizza是一個商品還是配料商品?計算商品的機率和聯(lián)合機率,也許限制在交易佔有率超過某一門檻的商品分析機率來決定規(guī)則例:如果蘑菇,則義大利辣味香腸,21,圖9.9,,決定商品的集合與等級,計算商品的機率和聯(lián)合機率,分析機率來決定規(guī)則,2
10、2,建立關(guān)聯(lián)規(guī)則,注意事項選擇正確的項目組合從矩陣中的數(shù)字產(chǎn)生規(guī)則克服龐大資料帶來的現(xiàn)實限制,23,選擇正確的項目組合(1),用來找出關(guān)聯(lián)規(guī)則的資料,通常來自銷售點(point of sale)中的詳細交易資料選什麼資料、蒐集和運用這些資料,對購物籃分析是很重要的部份特殊的物件由什麼組成,是視各行業(yè)的需要而定例:雜貨店 VS. 披薩店,建立關(guān)聯(lián)法則(3),24,表9.3,25,表9.4,26,選擇正確的項目組合(2),我們感
11、興趣的商品是會隨時間而改變的問題:想用過去的資料分析時,不同的層級無法一起分析選擇適當?shù)木毘潭仁沁@個分析的關(guān)鍵,建立關(guān)聯(lián)規(guī)則(4),27,選擇正確的項目組合(3),產(chǎn)品階層(Product Hierarchies)可幫助歸納商品在現(xiàn)實生活中,每件產(chǎn)品都有自己的生產(chǎn)和倉儲序號(stock-keeping unit, SKUs),也就是產(chǎn)品階層或分類學(taxonomy)《圖9.10》要用怎樣的分類階層才最適合?,建立關(guān)聯(lián)規(guī)則(5
12、),28,圖9.10,,,,,,品牌、尺寸、倉儲序號,冷凍食品,冷凍晚餐,冷凍蔬菜,冷凍甜點,其他,混合,胡蘿蔔,豌豆,水果吧,冰淇淋,冷凍優(yōu)格,其他,櫻桃,核桃,香草,草莓,巧克力,,,,,,,,,,,,,,,,,,,更籠統(tǒng),更詳細,部份產(chǎn)品分類法,29,選擇正確的項目組合(4),產(chǎn)品階層可幫助歸納商品要考慮的組合隨著分析商品數(shù)量的增加而快速成長項目分得越精細,分析的結(jié)果越實用一項規(guī)則的複雜度,取決於它包含了多少項商品分類階層
13、越上層,所列出的項目越少適合的層級應(yīng)該由商品本身來決定,建立關(guān)聯(lián)規(guī)則(6),30,選擇正確的項目組合(5),小秘訣在含有特定目標的交易數(shù)量約等於分析母體資料數(shù)時,購物籃分析可發(fā)揮到最大效果這可以避免讓最常見的物品支配大多數(shù)的規(guī)則將少見的商品用高階的階層,這樣出現(xiàn)的頻率比較高,建立關(guān)聯(lián)規(guī)則(7),31,選擇正確的項目組合(6),跨越產(chǎn)品階層的虛擬項目虛擬項目的目的在於從跨越產(chǎn)品階層的訊息中得到好處虛擬項目不會出現(xiàn)在原始的產(chǎn)品階
14、層虛擬項目有時甚至會包含交易的資訊不一定要加入虛擬項目虛擬項目可能造成明顯的規(guī)則,建立關(guān)聯(lián)規(guī)則(8),32,選擇正確的項目組合(7),資料品質(zhì)購物籃分析所用的資料,品質(zhì)通常不高通常都在與顧客直接接觸時獲得,且主要用途是在運作目的上(例:倉儲管理)資料需要額外處理後,才能拿來分析,建立關(guān)聯(lián)規(guī)則(9),33,選擇正確的項目組合(8),具名或匿名零售業(yè)--現(xiàn)金交易—匿名網(wǎng)路交易、信用卡、消費者俱樂部—具名,建立關(guān)聯(lián)規(guī)則(1
15、0),34,從這些資料中產(chǎn)生規(guī)則(1),項目的組合並非規(guī)則規(guī)則:如果「條件句」,則「結(jié)論句」。 例:如果「芭比娃娃」,則「糖果條」。具實用性的規(guī)則,在結(jié)論句只包含一項商品,建立關(guān)聯(lián)規(guī)則(11),35,從這些資料中產(chǎn)生規(guī)則(2),計算信心水準(confidence)信心水準= P(條件句與結(jié)論句)/ P(條件句)以三種商品、結(jié)論句只有一種商品的組合為例:如果A和B,則C如果A和C,則B如果B和C,則A,建立關(guān)聯(lián)規(guī)則(12
16、),36,表9.5,37,表9.6,38,從這些資料中產(chǎn)生規(guī)則(3),計算LiftLift = (P(條件句與結(jié)論句)/ P(條件句))/ P(結(jié)論句) = 信心水準/ P(結(jié)論句) = (P(條件句與結(jié)論句)/ P(條件句)* P(結(jié)論句)當Lift大於1時,最後的結(jié)果會比單純亂數(shù)好當Lift小於1時,效果則比較差否定規(guī)則,建立關(guān)聯(lián)規(guī)則(13),39,表9.7,40,圖9.1
17、1(1),41,圖9.11(2),42,克服現(xiàn)實的限制(1),產(chǎn)生關(guān)聯(lián)規(guī)則是一個多步驟的過程隨著商品數(shù)的增加,計算的複雜度會成幾何級數(shù)增加解決方法:修剪(pruning) 例:最低交易佔有率修剪(minimum support pruning)門檻數(shù)也可以根據(jù)運算過程修正,建立關(guān)聯(lián)規(guī)則(14),43,克服現(xiàn)實的限制(2),龐大資料的問題:假設(shè)某店有100種商品,建立關(guān)聯(lián)法則(15),44,觀念延伸(1),用關(guān)聯(lián)規(guī)則比較各分店
18、購物籃分析常用來比較連鎖店中的各分店用虛擬項目協(xié)助分析,一把榔頭一盒釘子超細砂紙,,一把榔頭一盒釘子超細砂紙「在一家舊分店買的」,45,觀念延伸(2),比較兩家分店的程序蒐集開幕後特定期間的資料,用虛擬項目說明這是新店的資料自舊分店蒐集相同數(shù)目的資料,也用虛擬項目標是這是舊分店的資料找出各組的關(guān)聯(lián)規(guī)則特別注意有虛擬項目的規(guī)則其它應(yīng)用:促銷期間vs.平時、都會區(qū)vs.郊區(qū)、不同季節(jié)、不同地理區(qū),46,觀念延伸(3),
19、無關(guān)規(guī)則(Dissociation Rules)條件句中可以包含「且非」的陳述加入一個「逆轉(zhuǎn)商品」(Inverse Items),,,47,觀念延伸(4),無關(guān)規(guī)則的缺點分析對象增加一倍交易數(shù)量增加逆轉(zhuǎn)商品出現(xiàn)頻率比原始商品高實用性不高 例:如果沒有A也沒有B,則沒有C,48,利用關(guān)聯(lián)規(guī)則進行序列分析(sequence analysis),相對於購物籃分析,序列分析希望找到某段時間內(nèi)特定的消費者的消費行為。Ex1.
20、割草機→水管Ex2.清點(和解)帳戶→取消帳戶,49,序列分析的附加條件,時間序列資料(time-series data)必定建立在顧客的基本資料上。如果無法追蹤顧客的長期行為,便無法建立序列分析。每筆交易記錄都必須有註記或序號決定交易順序。Ex.信用卡交易、銀行服務(wù)、醫(yī)療服務(wù),50,購物籃分析的優(yōu)點,能產(chǎn)生簡單明瞭的結(jié)論能運用在非監(jiān)督式資料採礦上能分析不同形式的原始資料所採用的計算模式簡單易懂,51,購物籃分析的缺點,當商
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 利用seqman進行序列拼接
- 利用excel進行時間序列的譜分析(i)
- 謹防利用關(guān)聯(lián)交易進行利潤操縱
- 時間序列時序關(guān)聯(lián)規(guī)則挖掘研究.pdf
- 如何進行序列分析
- 康芝藥業(yè)利用關(guān)聯(lián)交易進行財務(wù)舞弊的案例分析
- 基于信息熵的金融時間序列時序關(guān)聯(lián)規(guī)則分析與研究.pdf
- 多元時間序列流動態(tài)關(guān)聯(lián)規(guī)則挖掘.pdf
- 基于序列模式的正負關(guān)聯(lián)規(guī)則挖掘技術(shù).pdf
- 康芝藥業(yè)利用關(guān)聯(lián)交易進行財務(wù)舞弊的案例分析.pdf
- 關(guān)聯(lián)規(guī)則在股票時間序列上的應(yīng)用.pdf
- 數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則和序列模式.pdf
- 基于時間序列聚類的關(guān)聯(lián)規(guī)則挖掘研究.pdf
- 關(guān)聯(lián)規(guī)則在時間序列數(shù)據(jù)挖掘中的應(yīng)用.pdf
- 警情數(shù)據(jù)的關(guān)聯(lián)規(guī)則與序列模式發(fā)現(xiàn).pdf
- 利用excel進行財務(wù)分析
- 時間序列的聚類和關(guān)聯(lián)規(guī)則挖掘研究.pdf
- 基于股票時間序列數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘研究.pdf
- 基于關(guān)聯(lián)規(guī)則的股票時間序列趨勢預(yù)測研究.pdf
- 如何利用ethereal進行協(xié)議分析
評論
0/150
提交評論