iT邦幫忙

2022 iThome 鐵人賽

DAY 19
0
自我挑戰組

商業數據分析應用系列 第 19

[Day 19] 分析中常見偏誤(書摘/心得)

  • 分享至 

  • xImage
  •  

不知不覺也進入到第19天了,雖然感覺內容偏流水帳(XD),但看著自己每天慢慢累積起來的進度,其實還是蠻有成就感的,期望哪天技術更深時,也可以成為有能力幫助別人解答或是組團參加挑戰的人/images/emoticon/emoticon37.gif

今天想要來整理一下最一開始有提到過的 「資料故事時代」 這本書中,關於 分析常見偏誤 的部分。
我覺得這一部分對我的幫助還蠻大的,能讓我反思在過去的一些決定中,是否有過於偏頗之處,也希望藉由梳理,能夠讓我在未來面對決策時,有更深度層面的思考。/images/emoticon/emoticon13.gif


資料陷阱(資料偽造)

  1. 資料切割: 當發現對資料的有趣見解時,就此停下動作(略過了視覺化或整理的步驟),認為觀者應該也能從原始資料中獲取跟他一樣的想法。
  2. 資料客串: 在這陷阱中,資料並非是主角,故事才是(或者更精確地說:是「他想呈現的結果」)。所以他們僅採取支持敘事的資料,而忽略了全局。
  3. 資料裝飾: 在資料探索階段沒有太多見解而直接進行視覺化,太過著重在花俏的視覺化呈現,卻沒有深入的敘事內容。

在這邊,我就想到了以前在工作上,需要利用社群監測軟體來觀察過去團隊的經營成效,用以作為撰寫新一季企畫時的方向。當時其實可以很明顯地觀察到,以量化成效來看,其實整體(互動)沒有很大的成長;以質化成效來看,願意在留言處提供回饋的粉絲也不多。站在甲方的立場,他們的需求其實是有實際數字成果
我認為當時我們的處理方式是有點落入了「資料客串」的陷阱,的確有提出數據,但卻是很勉強地從數據中找出那一點可以用來解釋的地方。

大腦偏誤

  1. 驗證性偏誤: 只想尋找支持現有信念或觀點的資料,希望在這些數字中能夠找到支持你假設的證明。
  2. 倖存者偏誤: 只關注成功或倖存的事物,卻忽略了失敗或消亡的事物。書中舉例:假設在分析新門市的位置,卻只關注業績最好的門市,忘了業績最差的門市。
  3. 知識詛咒: 忘記你的目標對象可能不是那麼懂資料或資料領域的人,而用了不夠精簡扼要的方式向他們解釋。
  4. 相關性謬誤: 把巧合的事件視為相關,而忘了兩個變數的相關數有可能僅是偶然(在實際驗證前)。
  5. 德州神槍手謬誤: 賦予隨機的巧合重要的意義。書中舉例:處理大量資料時,將一小群異數賦予意義,將其他視為雜訊。
  6. 草率歸納謬誤: 提出通泛的結論,卻沒有充分的資料證明其合理性。

我覺得以過去的經驗來說,我比較常犯的錯是驗證性偏誤以及草率歸納謬誤。人要完全沒有偏見/完全客觀,老實說是有點困難的,在處理資料時,我總會習慣想一些自己的假設,比如說在我的認知中最後跑出來的結果應該要是什麼,這時就會不知不覺落入這樣的陷阱。
草率歸納的部分,我至今還在嘗試克服他,過去工作上,我有時彙報時會使用「感覺上還不錯、感覺有進步」這種非常籠統(沒有意義)的詞彙來形容業績/社群經營成效,也常常很簡單的將某個項目的成長歸因於單一項目,雖然影響的層面很多、也可能沒有標準答案,但在聽過同事的回饋以後,讓我會想練習在表達前能夠有更全面/多面向的思考。/images/emoticon/emoticon02.gif


以上就是今天的分享與整理,希望自己以後能夠慢慢練習,避免落入這些謬誤或陷阱之中而不自知。/images/emoticon/emoticon06.gif
明天見!


上一篇
[Day 18] 以Google Data Studio觀察地理資訊
下一篇
[Day20] 使用def()簡化重複操作步驟
系列文
商業數據分析應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言