iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 14
3
AI & Data

AI無法一步登天,讓我們先從專有名詞定義開始。系列 第 14

資料分析(Data Analysis) -6.小結

  • 分享至 

  • xImage
  •  

為什麼會差這麼多?都是數據分析的結果啊?能接受「洗手乳和親子票券一起被購買」的結果,卻對「買鏡框的人會一同購買鏡片」的結果嗤之以鼻?關鍵就在於...

有沒有辦法被解釋?
有沒有因果關係?
還有…大家是不是早就知道這件事?

老闆想看到的分析

啤酒尿布,Walmart調查後發現顧小孩的爸爸順手拿了這個組合;抗菌洗手乳和親子票券,我們想像了剛結婚不久的年輕族群,網路購物傾向較高,且家裡可能剛育有兒女。

因為能解釋,所以我們接受了分析報告的結果;但弔詭的是,統計分析做出來的,並不是在「解釋」這些事是否合理、是否有因果,而僅僅只是從數據上來看,是否有正負相關罷了。這也是3.迴歸我先說明了「統計不是在談因果」那段話的原因。

於是我們這些數據分析人員,做到最後,終將發現一種非常無奈的狀況,在於一個大家認為「有效」的分析、老闆想要看到的分析,必須具備以下三個要件:

1.數據支持:統計數據上要有顯著關聯。
2.大家不知:這個關聯並不是大家早就知道的關聯,例如「買鏡框會買鏡片」這種廢話。
3.可以解釋:這個關聯必須要能被大家想像後認為合理並接受,例如穿紅衣服的人買HTC大家覺得無厘頭而不接受、不敢決策執行。

一切的盲點就是,並不是只做了1數據支持就完工了,還必須滿足2和3的條件,你才真的做出了「大家(老闆)認為你該做出的分析報告」,甚至你還面對了更嚴苛的挑戰:

4.政治議題:你有沒有考慮過,這個數據分析所帶來的改變,會造成誰的損失?

證明了商品經理不如數據分析、證明了公司可以多省1200萬但害得老闆朋友少賺1200萬,有人能幫你擋下隨之而來的負面反彈、甚至藏在深處的暗算嗎?

前車之鑑於此,盼同行謹言慎行,小心為上。
有些分析,有的人想要你做,有的人恨不得你趕快消失。

B-4.資料分析(Data Analysis):
處理為了料理目標所準備的食材,透過不同的料理方式,產生不同的最終料理。
處理為了分析目標所準備的資料,透過不同的分析方法,得出不同的分析結果。其中,統計學上最常被用於分析的方法有三種:分群分析、迴歸分析、關聯分析。不過,得到分析結果只是最基本的門檻,往後還必須考慮許多相關因素......



數據分析 番外篇6

接續此番外篇...

「這種數據很難處理你懂不懂!你那麼厲害!不然你來啊!」
於是小馬我就來了。

「來了」之後,到底發生了什麼事,且再讓我娓娓道來。

你一定知道有這種工作內容:一名員工,早上到公司之後,進公司的系統下載數據,匯出Excel檔,然後開始剪剪貼貼,各種Excel公式,vlookup、sumif、if...,一份Excel檔下了滿滿的公式,動輒幾十mb,點開那份Excel檔,要跑個十來分鐘。然後將最終的數據、樞紐分析、做成長條圖折線圖,貼在信件上,把信件發給長官或相關同事。

隔天上班,重複一樣的動作,
日復一日,年復一年。

當年的IT協理(我還蠻喜歡這個主管的,雖然當年還沒去IT部門),稱她們為「報表小公主」。

這其實是非常不合理的現象,做出最終數據的過程,沒有人為加工或判斷,原始資料,也都是從系統得來的。既然如此,為什麼系統沒辦法幫他們做出最終的數據?縱使做不成圖表,至少透過邏輯或公式,由系統寫,也要比人工用Excel寫公式,來得更有效率不是嗎?

啊~原來就是因為「這種數據很難處理你懂不懂!你那麼厲害!不然你來啊!」
因此隨之而來,是一場該部門的面子之爭,也是小馬我職場中最大的一個轉捩點:PK!

我們被賦予了這樣的任務:業務單位有二份報表要系統化,即我所謂的做出最終數據,我當時既無資料庫也無SQL,唯一能使用的工具是Tableau(也算萬幸),上面長官給了我們兩個月的時間,兩個月後驗收。

我的作法說穿了也不稀奇,就是從公司系統下載出的Excel檔當作Tableau使用的底階資料,只是往後所有的運算,是透過Tableau的功能(有類似join和union的功能)及公式去寫的。

而我的對手是一整個部門,他們總共4人。

兩個月後驗收......

我完整做出兩份100%正確的系統化報表;
該部門,只做出了一份,而且數字還是錯的。

之後小馬雖稱不上「扶搖直上」,但至少在公司內的名號算打下來了;至於該部門,後續有些精彩的變化,在此就不落井下石了。

往後的幾年內,我老大與我,一直試圖想要做到一件事,使用Tableau徹底取代「報表小公主」的工作,畢竟Tableau已經是全球極佳的視覺化軟體。

殊不知我們仍是敗給了人的慣性。
我們從未想過這件事,推動是那麼的困難:

點開瀏覽器或App,登入帳號密碼,去看自己想看的報表。

明明只要大家願意做到這件事,就可以省下一堆「報表小公主」的人力支出,因為報表可以做到完整的系統化了啊!但相較於此,大家還是習慣:

用outlook收信看「報表小公主」發出來的報表。

其實這種看報表習慣的更改,要從最上層一路推動下來,才有機會執行,但若連最上層都改不了這習慣,又怎麼期待這件事能有所改變呢?因此直到我老大被自願離職、我後來離開,這件事的推動仍舊是半調子(舊人改不了老習慣,但我們有成功讓一些新進員工和新進主管以Tableau看報表)。

真是引以為憾啊......

話說回來,多年後的現在,赫然發現當年的思維,完全沒去考慮過這件事:如果真的被我們推動成功了,那這些「報表小公主」,何去何從?要fire他們嗎?在當時,我真的完全無法連結到這樣的考量,整件事對我來說只是一件「可以優化」的事,卻沒有想過道德層面的社會議題,對當時很稚嫩的我而言,太超現實而無法想像。

只是現在的我,會默默這樣猜想,如果我是個很照顧下屬且宅心仁厚的主管,或許會因為想到了這件事,而繼續使用outlook收信看報表,好讓這些報表小公主,有存在的價值吧?

一想到這,就覺得沒那麼遺憾了。


上一篇
資料分析(Data Analysis) -5.實際執行
下一篇
資料收集與處理過程 -回顧與總結
系列文
AI無法一步登天,讓我們先從專有名詞定義開始。31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言