[Day2] 資料故事與敘事結構

2022 iThome 鐵人賽

DAY 2

自我挑戰組

商業數據分析應用系列第 2 篇

14th鐵人賽

fang1023

2022-09-04 23:05:39

1137 瀏覽

分享至

在開始分析的旅程前，想要先針對整個流程中最重要的「故事」與「敘事」方法來做統整。
最近在閱讀「資料故事時代」這本書，讓我發現自己過去在工作或專題的數據解讀上太過淺薄與充滿偏誤。
這次的分析過程，將會借助受此書啟發的分析注意事項以及敘事架構來處理。

以下來整理/節錄幾點在這本書第五章節【打下資料故事的地基】和第六章節【說故事的技藝】中的內容，希望用自己的文字來梳理後能達到吸收的最佳化:

驗證資料故事基礎
我們處在一個資訊量爆炸的時代，承載過量的資訊時，很常會忽略了資料解釋的正確性。
一昧接受而不經過思考時，便有可能落入一些經過「特別設計」的偏誤資訊。

以近期的選舉議題來舉例，選前的民意調查是不少候選人都會做的，
但是有關注過選前與選後結果的你，是不是曾對於票數與選前支持度落差大而感到疑惑的經驗?
明明選前好像聲勢很大，然而結果卻大相逕庭。
這時就可以退一步來想想，當你是支持A黨派的選民，在接到A黨民調電話時會很樂意回答(有些可能還可愛地守在電話前XD)，但是接到B黨的電話時呢?是否還會有上述的現象呢?
另外，電話所針對的年齡層、涵蓋率以及是否表態也會影響最終結果，這就是為何民調常常僅能作為「參考」而不能過度樂觀的原因。

舉個在書中的例子。
在2015年時，一群德國的研究人員得出了「吃巧克力可以減重」的研究成果，並將論文刊載在「國際醫學檔案」中。這個實驗的年齡層包含19~67歲的成人，並分成低碳水組、低碳水+巧克力棒、對照組等，最後的實驗成果是低碳水+黑巧克力的組別體重下降的速度快了10%。

單就上面的敘述，你可能會覺得「沒問題啊?實驗中既包含不同年齡測試者、分了組別，而且又是專家團隊的研究」，但卻忽略了這個實驗究竟有多少人參與(樣本數多寡)?是否有其他外在因素沒被考慮進去?

資料的使用如果用在錯的地方，便有可能造成破壞你的資料故事。
書中指出可以用兩點來驗證自己的資料地基是否穩固: 相關性 和 可信度
1.相關性: 這個資料跟你想解決的問題關聯性高嗎?資料的時效性為何?
2.可信度: 資料的可靠度為何?在資料處理與整理的過程中是否盡量保持數據的純淨

敘事結構
有幸以非本科出身的履歷拿到幾次面試機會，但每次面談完都感到自己在描述過去數據應用經歷與問題點時，是以蠻表面的看法來敘述的，在這本書中也教了幾個敘述資料故事時的可用架構。
從亞里斯多德的劇本(簡單)到神話與寓言的結構(複雜)，脫離不了的流程都是「故事設定-見解鋪陳-頓悟時刻-後續步驟」。
本次我將跟著作者也認為較折衷的【弗萊塔克的金字塔】的五個階段來進行分析練習
1.說明
2.鋪陳
3.情節高潮
4.轉弱
5.結論

對於資料故事有興趣的人，很推薦看看這本【資料故事時代】
有機會再將想Highlight的地方分享在接下來的分析文章中
明天見!終於要正式的進入Data的世界了!