iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 11
4
AI & Data

AI無法一步登天,讓我們先從專有名詞定義開始。系列 第 11

資料分析(Data Analysis) -3.迴歸

  • 分享至 

  • xImage
  •  

【1.分類分析(Classification)】、【2.群集分析(Clustering)】...

3. 迴歸分析(Regression):

變數之間是否具相關性,例如每個會員有三個變數:

A. 瀏覽筆電商品頁面的次數
B. 瀏覽保健食品頁面的次數
C. 筆電商品的消費金額

迴歸分析主軸,在於瞭解變數間的關係,例如我們預期A越高,C就越高;預期B無論高低,都與C無關。而迴歸分析,就是會跑出統計值,告訴我們是否真如預期。當然,統計跑出來的結果,很可能和直覺狀況不符合。

同理,迴歸分析也是一種統稱,背後有各種不同的迴歸方法,如上舉例,可拿A和C跑一次迴歸、拿B和C跑一次迴歸,跑兩次就是了,這種單一個變數的稱為【簡單迴歸(Simple Regression)】。那不簡單的是怎樣呢?就是對於某個結果,拿兩個以上的變數同時執行,例如把A和B同時拿來跑看看哪個變數與C有關,跑一次而已,這種稱【複迴歸(Multiple Regression)】。

除此之外,變數的相關不一定是【線性(Linear)】,例如原本是一根蘿蔔20元,五根蘿蔔100元;非線性像是賣菜阿姨,第二根賣你16元、第三根賣你13元、第四根賣你10元......,因而還有例如【對數線性迴歸(Log-Linear Model)】、【邏輯迴歸(Logistic Regression)】等等。

但再細談下去,例如解釋什麼時候要跑兩次、什麼時候可以一起跑跑一次就夠?哪種情境要用哪種迴歸方法?這還必須說明一些變數的限制,包括一致性、不偏性、自我相關、線性重合等等,就真的往統計學課本裡去了,不是本系列文重點,因此現階段,只要知道以下即可:

迴歸分析,在於瞭解變數與變數間的(正負)相關性。

老話重提,統計分析的結果,只在告訴人們變數的相關,而非告訴人們變數的因果。以上述為例,我們只知道【A.瀏覽筆電商品頁面次數】和【C.筆電商品消費金額】有明顯的正相關,但不代表【因為常常瀏覽筆電頁面,所以去買了筆電。】之所以補充說這些,是因為要理解往後內容,必須要先有這樣的觀念存在。

4. 時間序列分析(Time Series Analysis):

同樣是釐清變數之間是否具相關性,例如每個會員有三個變數:

甲、 瀏覽筆電商品頁面的時間點
乙、 瀏覽保健食品頁面的時間點
丙、 筆電商品的消費時間點

舉例我們都知道甲發生完沒多久,應該會發生丙;至於乙和丙的時間發生先後則應毫無關係。

相較於迴歸分析,此分析方法考量時間先後與間隔長短,更為繁複,資料準備也必須下更多心思,要能以【時間序列分析】料理的食材,絕對必須透過【資料採礦(Data Mining)】過,而不單純只是清洗乾淨而已。

但是,我們該怎麼定義甲叫做【發生完沒多久】?是指甲和丙的時間點差距一天?三天?一周?一個月?兩個月?那兩年還算不算?三年還算不算?誰來決定相差超過多久不算,相差多久內要算?

這就是時間序列分析在做的分析內容,我們希望得到類似這樣的結論:大部分的人,在瀏覽完筆電頁面後的三天內會購買筆電,因此可以找出已經超過三天還沒買的會員,推測這些人可能不打算買了,再針對這些人做些促銷,重燃他想購買的念頭。

這也是時間序列分析的實際用法。



數據分析 番外篇3

廣告是種藝術,促銷是門科學。

有人會問,為什麼不針對還沒超過三天的人促銷?要知道,促銷,就是降低商品毛利或是增加行銷費用,如果已經知道人大概要考慮三天,卻急著在三天內就對這個人行銷,造成的可能只是讓「本來就要買的人撿到了便宜」,而不是讓「不買的人因為促銷而決定購買」。

延續此議題,今天要來談一個經濟學名詞「需求彈性(Price Elasticity of Demand)」,
欸等等先別關網頁啊!

這邊絕對不會要導公式、也不會講一些很學術用語的內容,保證簡單易懂。

需求彈性的概念,即是用在價格的調低調高之上,先很簡單想件事情:

當降價後,交易人數變多了,是一件好事嗎?
和降價前,交易人數較少時,相比,交易人數多一定比較好嗎?

舉例如下:
原本價格是100元,有10個人來購買,你的營收是1000元;
現在價格降為90元,有11個人來購買,你的營收是990元。

交易人數變多了,但營收卻變少了!這還沒考量商品成本多少喔,我們假設成本80元。

原本利潤是有20元,有10人來購買,你的利潤是200元;
現在利潤降為10元,有11人來購買,你的利潤剩110元。
當利潤降為10元,必須有20人來購買,利潤才會回到200元。

這數字很可怕在於,你明明只是打9折,卻必須吸引原本交易人數的2倍,才能做到原本的利潤。因為實際上,你是對這件商品的利潤打了5折啊!

而這就是「需求彈性(Price Elasticity of Demand)」的初衷,它要告訴我們:降價不一定有利,反之提高價格也可能獲利更多。必須含淚地老實說,這是我大學加研究所在學的內容裡面,極少數的在出社會後學以致用......

而這個實用性也發生得很離奇,小馬初踏入社會之際,我本來以為一間公司對於一項商品該訂什麼價格,背後應該是有學理基礎的,殊不知映入眼簾的,是業務單位極盡所能的要求商品單位降價(毫不在意利潤,只求賣出的單件數),商品單位極盡所能的不要降價,於是雙方砲聲隆隆、好不熱鬧......

「你訂這種價格,根本沒有人會買,還不降價!至少打個八折,或少個一千元嘛!」
「打八折賣一件賠一件,現在價格買的人少不代表市場差,降價是不得已才做的事!」

而背後,沒有任何數據分析,有的只有:人為經驗判斷。

但或許,兩造雙方的拔河角力之下,確實將商品價格訂在了一個非常合理的數字?
人為經驗沒有對錯,說不定更準。
只是小馬心裡默默想著:這真是太不科學了...

還好小馬從業務單位起步發展,有幸把「需求彈性」的概念給帶進去,並多次準確預測降價後的交易量。時隔一兩年發酵後,終於業務單位和商品單位不再那麼劍拔弩張,業務單位的要求降價也顯得經過理性計算,不再無腦無理由的片面要求促銷折扣。

「需求彈性」算是功德圓滿的發揮了效用,善哉善哉。


上一篇
資料分析(Data Analysis) -2.分群(分類)
下一篇
資料分析(Data Analysis) -4.關聯(購物籃)
系列文
AI無法一步登天,讓我們先從專有名詞定義開始。31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言